業務研究

當前位置:首頁 > 新聞中心> 業務研究

三維視覺,在實踐中大有可為

發布時間:2019/9/17 10:27:42   來源:原創  作者:admin  瀏覽量:

untitled 1.bmp


     不到一年時間,阿里、騰訊,這兩個國內首屈一指的超級經濟體全部入局了。這邊支付寶的“蜻蜓”二代刷臉支付機具剛剛上線創下一個月出貨一萬臺的數額,另一邊,微信便緊隨其后對其刷臉產品“青蛙”進一步升級,并將其作為了智慧零售戰略中的重要一環。金額上這邊支付寶剛宣布投入30億培育生態,那邊就有服務商透露,微信將補貼100億教育市場。盡管傳言的真實性還有待證實,但是對于市場而言,這些都無異于是一枚重磅炸彈,帶起了一場關于刷臉、關于視覺的浩蕩變革。未來,哪怕身處五線小城,刷臉也將成為企業標配。而在變革之后,三維視覺這一最重要的產業基礎則決定了刷臉行業的真實發展速度。通過將識別的維度從二維提升到三維,三維視覺技術一舉攻破了照片造假、化妝、面具等一眾原先二維視覺所無法應對的難題,進一步將刷臉,這一高隱私、高風險、高價值的技術正式帶向產業應用。當然,爭議也一直存在。就在不久前,兩大國產手機的老大哥,就因為三維視覺的使用在微博上開始了隔空掐架。這邊,榮耀副總裁熊軍民說搭載ToF(三維視覺的一種)方案的榮耀V20是行業標桿;另一邊,小米副總裁盧偉冰立刻回敬,此ToF是騙用戶瞎花錢的噱頭。更進一步,以商湯、曠視、云從、依圖為代表的四家AI明星企業在今年也紛紛大力布局起了三維視覺,而以奧比中光、華捷艾米為代表一眾上游硬件廠則已經摩拳擦掌數年只待今日爆發。那么,放眼如今,引起一眾阿里、騰訊、華為、小米、商湯等巨頭與明星企業們明爭暗奪的三維視覺技術究竟落地到了何處?在賽道之中,誰成為了最早的獲利者,誰又在賽程的前半局奮力搶奪下了入場的門票?而在這場狂歡背后,誰又成為了產業鏈背后默默收割紅利的一批玩家,他們又如何看待這個市場?通過走訪奧比中光、北京深視等代表性企業,以及對多位行業專家的資訊,我們試圖還原這場從技術蔓延到業界,從工業應用拓展到消費品,并逐漸走向千家萬戶的技術以及產業的發展始末與內在的變革驅動所在。技術落地的滾滾紅利已經開啟,誰會是最終贏家,答案,或許早已在多年前埋下了伏筆。

untitled 2.bmp

技術溯源:一場由蘋果Face ID引發的行業狂歡

前年發售的iPhoneX上搭載的Face ID,被普遍認為是開啟了三維視覺元年。使用Face ID作為手機“密碼”,我們不用擔心“拿照片就能解鎖”等安全問題,那是因為Face ID識別的人臉是三維的。所謂三維視覺技術,簡單說就是利用深度相機硬件及算法對物體進行識別,不僅識別事物的色彩和紋理,還能識別深度。利用三維視覺技術可以在三維空間中跟蹤事物的運動,使得識別更加準確、動態。不過相對而言,這一技術門檻高、量產化難度大,行業壁壘高,一般而言,即使強悍如蘋果也會采用收購的方式來進行相關方面的布局。2013年,蘋果收購了結構光方案先驅PrimeSense公司。根據歷史資料,這家公司的三維結構光方案曾應用于微軟Kinect一代,而Kinect系列則可以稱得上發展較早且最具代表性的主打三維視覺的體感游戲設備。蘋果將PrimeSense的三維視覺模組“小型化”到手機上,這是對三維視覺技術的潛能的大釋放。這不僅解決了三維視覺的手機端應用問題,還為之后的物聯網故事做好了鋪墊。雖然此前三維視覺技術由來已久,但是由于硬件體積大、集成度低以及算法局限等問題,該技術主要被粗放地應用于工業生成、三維打印、自動化駕駛、體感游戲等大場景中。現在,既然蘋果的一個“小劉海”就可以容納結構光三維視覺配件,那么可以推測以后各種物聯網的終端就問題不大了。

untitled 3.bmp

untitled 4.bmp

三派紛爭:結構光、ToF與雙目視覺的技術大PK

       盡管被統稱為三維視覺,但是如果從技術流派上來說,目前市場上主流的方案企業是由三種構成:結構光法、飛行速度計算法(TOF)和RGB雙目法。Face ID、支付寶刷臉支付等應用使用的是結構光法。結構光法不依賴于物體本身的顏色和紋理,而是采用主動投影已知圖案的方法來識別物體。這種方法識別分辨率較高,光線不足時也能識別;但容易受強光干擾,且測量距離受限,一般在10米以內。


untitled 5.bmp

      華為部分手機中所搭載的技術則是TOF方案。TOF是Time of flight的簡寫,直譯為飛行時間的意思,其基本原理是通過給目標連續發送光脈沖,然后用傳感器接收從物體返回的光,通過探測光脈沖的飛行往返時間得出目標物的距離信息。TOF的探測距離較遠、幀率高、二次開發成本低、資源消耗少,雖然目前來說分辨率相對較低,但應用于一定領域的工業生成中已經沒有問題。

untitled 6.bmp

華為部分手機中所搭載的技術則是TOF方案。TOF是Time of flight的簡寫,直譯為飛行時間的意思,其基本原理是通過給目標連續發送光脈沖,然后用傳感器接收從物體返回的光,通過探測光脈沖的飛行往返時間得出目標物的距離信息。TOF的探測距離較遠、幀率高、二次開發成本低、資源消耗少,雖然目前來說分辨率相對較低,但應用于一定領域的工業生成中已經沒有問題。

untitled 7.bmp

▲三種三維視覺技術的主要差異對比(圖片來自網絡)

untitled.bmp

風口之上,誰在真正起飛

       以人臉解鎖為練武場,產業鏈上下游的眾多玩家紛紛露臉。看硬件,有奧比中光、華捷艾米等深度攝像機硬件廠家;看算法,又不乏曠視、云從等AI算法明星企業;最后的落地,還閃現著騰訊、阿里等巨頭的身影。奧比中光副總裁孔博對智東西表示,“算法公司向硬件延伸,硬件公司向算法延伸”是產業玩家的新趨勢。目前中國的AI獨角獸大多聚焦在AI垂直領域的算法平臺或解決方案的市場中,也就是處于產業鏈中游或中上游,而硬件可以使軟件算法落地,軟硬件一體化可以讓客戶更省時便捷地采購與使用產品。相機硬件商與算法商聯合,將方案打包賣給互聯網巨頭、運營商,這成為上中下游三維視覺玩家典型的分工合作玩法。

untitled 8.bmp

▲國內市場中部分有代表性的三維視覺玩家

三維視覺還涉及到一系列更偏上游的硬件生產商。結構光方案的主要硬件包括四部分:TX紅外發射部分、RX紅外接收部分、可見光攝像頭、三維圖像處理芯片,這使得舜宇光學、水晶光電、光迅科技等配件提供商也嘗到了豐厚的市場紅利。但本文不對此進行詳細解讀。

untitled 9.bmp

最先火起來的手機刷臉:蘋果、華為、小米紛紛入局

       講完了技術,我們再來聊聊產業。2017年9月13日,蘋果Face ID發布,三維視覺正式走入大眾的視線之中,也自此帶起了一股手機行業的技術新浪潮。盡管此前人臉識別解鎖、支付,以及有部分廠家在進行嘗試,但是相對而言由于缺少三維信息,因此很容易受到攻擊以及欺騙。比如同年9月21日,VIVO發布的主打人臉解鎖功能的X20,使用的依然是二維的圖像解鎖,結果有網友用一張照片破解了它的解鎖功能。不過也有很多國內廠家及時的跟上了這一波浪潮,以華為以及小米為例,這兩家企業在此前的新品上,分別搭載了不同的三維視覺方案。其中,華為MATE和P系列用了結構光和TOF,而小米8透明探索版則使用的是結構光方案。一直以來,小米的8都被認為是首款配備三維人臉解鎖國產手機,不過其三維結構光技術來自以色列Mantis Vision公司。順便說一句,目前Mantis Vision的子公司螳螂慧視正在與百度大腦合計三維視覺的AI算法研究。而后發布的OPPO Find X采用了國內奧比中光的三維視覺硬件及曠視科技的算法;華為Mate 20 Pro上的三維結構光采用華為自研的算法。到2018年底,三維人臉解鎖幾乎成了中高端智能手機的標配。
untitled 10.bmp

場景蔓延:從人臉支付到安防、工業

       當上中下游的三維視覺玩家紛紛找到自己的伙伴,并達成一定默契,三維視覺技術的落地推進開始不斷切入到更多垂直領域和場景。如果說手機人臉解鎖是眾玩家的練兵試水領域,那么人臉支付則是互聯網巨頭主導下的矩陣式流量收割戰場。奧比中光副總裁孔博認為,除了人臉支付領域,三維視覺技術在安防、零售、工業質檢的應用將會是新的風口。為此,奧比中光已經布局輕量級智能安防市場,發力餐飲自助掃描、健身管理、服裝定制等智慧零售領域,還推出三維光學測量解決方案矩陣應用于汽車、航空航天、機械工程等多個工業質檢領域。

1、阿里、微信入局,聯合三維視覺企業搞刷臉支付2018年4月,就在OPPO和奧比中光合作Find X的人臉解鎖之際,奧比中光被支付寶挑中,共同成立了螞里奧公司開發“人臉支付”。支付寶還宣布,要在人臉支付領域投資30億。螞里奧在18年12月發布了一代“蜻蜓”刷臉支付終端,打響了刷臉支付落地的第一槍。今年年初,人們已經陸陸續續在高校宿舍、地鐵進站口看見人臉支付自動柜的身影,這意味著三維人臉識別技術已經具有相當的準確率、安全性及成本可行性。4月,二代“蜻蜓”發布,整機重量比一代減輕55%,經折疊和拆卸后如同書本般大小,可裝進大衣口袋里。在發布會現場,1000臺機器在10秒內被搶光,僅僅兩天之后,訂單量就突破了1萬臺。奧比中光成立于2013年,是一家提供三維傳感解決方案的企業,專注于結構光、TOF、雙目等技術方案,還有自研的三維圖像處理芯片。但支付寶一開始計劃合作的并非奧比中光,而是另一家企業華捷艾米。華捷艾米成立于2014年,以計算機三維視覺硬件及自研算法為核心,在新零售、智能家庭、消費電子、智能物流等領域提供三維視覺體感交互技術解決方案。東邊不亮西邊亮,華捷艾米最終和另一大支付大亨微信站在了一起,并于2019年3月發布了“青蛙”刷臉支付終端。據稱,就技術而言,目前兩大刷臉支付終端“青蛙”與“蜻蜓”并沒有特別大的區別。沒過多久,5月9日,云從科技宣布正式發布一款最新的刷臉支付終端產品“CF-FP-E1”。作為“CV四小龍”之一的以算法著稱的科技公司,云從終于按捺不住,橫刀植入刷臉支付戰局以參與市場PK。8月,云從科技的如意支付Pad作為全國首家通過了國家標準檢測,這代表著人臉支付產業在朝著更加標準化的方向發展。繼手機人臉識別之后,借助互聯網巨頭及三維視覺大廠推起的刷臉支付的風口,三維視覺識別迎來新風口。前瞻產業研究院報告顯示,到2022年全球人臉識別市場規模將達75.95億美元,增速達每年20%。同時,刷臉支付場景眾多。阿里和騰訊等企業爭奪的不僅是廣為人知的餐廳、商場、超市等場景,還有各種公共服務端口及垂直領域。在一些城市,地鐵刷臉受到了政府的支持,今年4月濟南已經開始實施三維刷臉進站;醫院也成為刷臉終端的棲息地,余杭區醫療已試點“蜻蜓”用于看診掛號。如果說人臉解鎖的興起,是人與手機設備的一種進一步融合,那么刷臉支付時代的到來,可以算是用戶和商家關系的再一次重構。顧客從繁雜的支付步驟中獲得“豁免”,但同時也把主動權交到了商家手上。在你進入商店被攝像頭識別的那刻起,你的消費愛好、購物習慣數據就已經被機器調用,至于如何運用這些數據,聰明的營銷家永遠不會使你失望。三維視覺技術雖然不直接帶來這些后果,卻在底層技術層面推動著這一切。

untitled 11.bmp

如果說依托三維視覺技術的刷臉支付正站在風口,那么新的風口在哪里呢?在智能貨柜、安防及工業應用領域,“精細化”的三維視覺展現出獨特的問題解決潛力。雖然在這些方面落地仍有一定的技術難度,賽道前景卻十分寬廣。

2、安防、工業應用在向三維視覺招手在安防領域,環境適應性差、場景理解受限、識別準確性不足等問題是AI應用中的主要痛點。三維視覺技術能夠解決遮擋、光照、角度等物體及環境的特征造成的誤識率高問題。目前,三維網絡安防攝像機主要應用于安防反恐領域,尤其在邊檢安防領域。部分省市的公安廳反恐項目中早已開始使用三維人臉識別技術,并建立了全國首個省級“三維人像數據庫”。2018 年10月通車的港珠澳大橋上更是首次大規模應用了三維人臉識別身份核驗技術,智慧關卡全面采用“刷臉通行”,據稱,車輛可在無感的條件下 8 秒通關。

untitled 12.bmp

       但總的來說,三維視覺技術在泛安防領域的應用基本上還是一片處女地。據了解,海康威視、的盧深視等多家企業已具備將三維視覺識別落地到安防的技術實力,但是安防硬件及方案的落地涉及整個安防生態,因此目前推進節奏并不及預期。在工業應用方面,三維視覺技術在工業領域具有廣闊的市場。據前瞻產業研究院統計數據顯示,單是工業質檢領域,中國每天在產線上進行目視檢查的工人超過350萬,若按照工人的薪資計算,這可以被形容為一個千億級的市場。就拿工業質檢來說,目前,由于環境復雜、2D視覺識別精度不達標等原因,工業質檢領域的機器視覺的覆蓋率不足5%。工業質檢的流程大致包括精準抓取、質量檢測、順暢傳遞等步驟,這就需要機器人不僅能識別產品的表面色彩和紋理,還要識別深度信息以及位置變化。三維視覺技術能夠有效提升產品良品率及生產效率,并有效降低人工成本。在國內,海康威視、阿丘科技、遠景智能等企業早已有所布局。海康威視的三維激光輪廓傳感器等產品能夠進行非接觸地高精度三維測量。另外,在智能零售領域,無人銷售貨柜及無人超市的發展依賴三維視覺技術的進步。深耕此領域的北京深視公司CEO張磊表示,三維視覺技術能有效解決普通二維動態視覺的高計算、背景難擦除等問題,也能順勢解決計算量的問題。雖然近期資本和運營商對無人貨柜的投入趨于冷靜,但在技術已經有較高的成熟度的情況下,隨著運營商落地流程和商業模式的進化,領域回暖指日可待。

3、TOF:三維視覺的下一個風口?雖然在三維視覺領域中結構光視覺技術應用最多,但TOF(飛行時間法)也越來越被關注。當手機前置的結構光深度相機的進步空間越來越小,玩家們把目光投向了后攝,而后攝更適合TOF。TOF的基本原理是通過發射器發射光脈沖到達物體所用的時間來計算被測物體離相機的距離,當測量點足夠多的時候就能實現三維物體描繪。這決定了TOF的特點是擅長遠距離地識別體感動作。TOF深度相機已被廣泛應用于自動駕駛、VR游戲等領域。當“濃縮”到手機等小型終端上,它能為我們帶來有趣的創作體驗,包括人物識別、MR游戲、體型測量、AR尺子、Emoji表情、三維摳圖、三維建模、體積測量等多種功能,甚至實現現場景置換、人物置換、人體部位置換等功能。但是,TOF的技術受光照環境影響大、硬件成本較高、反光微弱的深黑物體難以測量,不過這也成為技術進步和產品升級的突破點。據了解,TOF的主要門檻在芯片,隨著英飛凌、德州儀器等“大廠”發力手機端TOF方案,這為模組廠商乃至整個TOF產業的爆發醞釀了機會。近日,三星發布的Note10系列手機就配備了TOF后攝,它能夠拍攝“布娃娃”等事物的三維圖,并通過算法使得三維“布娃娃”模仿鏡頭里的人的動作,妙趣橫生。

untitled 13.bmp

▲用三星Note10系列手機建模的三維布娃娃在隨著人體舞動

其實早在18年12月,也就是結構光手機人臉識幾近成熟的時候,榮耀發布的V20手機后攝就加持了TOF深度鏡頭。通過TOF相機用戶能實現三維視頻瘦身、拍照優化等多功能。19年4月,華為發布的有史以來口碑最好的P30系列手機,因為配備了三維 TOF鏡頭,可以進行相機拍照景深優化、360°全景拍攝等多種功能。P30系列手機成為華為和蘋果市場比拼中的重要著陸。19年初小米9沒有搭載這一功能,但是小米副總裁盧偉冰就此和榮耀的發言人“榮耀老熊”展開了一場論戰。盧偉冰稱,TOF只是個噱頭沒有太大的實際效用,是來騙錢的,小米技術預研早就“Ready”卻沒有采用。但小米高管置身這場論戰之中這件事本身,恰恰證明了三維 TOF視覺技術是值得被討論的。“榮耀老熊”表示,榮耀認為三維TOF將是未來手機最重要的發展方向之一。他認為,未來TOF能夠突破性的將現實世界物體、人像、空間虛擬化,這是AR、VR應用場景的必備能力,這也必將是5G移動互聯網最重要的應用場景之一。如果說前攝結構光鏡頭帶來的人臉解鎖使人與手機終端的交互更加順暢,那么后攝TOF鏡頭則使得人與手機終端的關系變得妙趣橫生。雖然目前手機TOF相機主要用于測距、美顏、簡單建模等功能,但隨著TOF硬件的功耗及成本的優化,手機三維建模、AR應用將不再遙遠。在TOF三維視覺的發展中,目前深度信息的獲取能力和抓取精度仍是兩大瓶頸,且更適合小物體三維建模。隨著5G的來臨,三維深度相機硬件及三維圖像處理芯片及算法模型的進一步發展,三維視頻通話、手機遠程VR,虛景+實景的遠程AR等用戶使用量、需求量將迎來爆發式增長,這也預示著AR將不再是手機的附屬品。

untitled 14.bmp

結語:被低估的三維視覺將改變人類交互方式

        蘋果的Face ID像一顆火種,將三維視覺技術濃縮化、精細化,進而在手機人臉解鎖、人臉支付、三維視覺創作領域釋放出燎原之勢。而后,眾多玩家紛紛各顯神通,深度相機硬件商與算法商聯合,將方案打包賣給互聯網巨頭、運營商,這成為上中下游三維視覺玩家典型的分工合作玩法。精通三維人臉解鎖方案的奧比中光、云從科技等硬件和算法廠商們紛紛轉而關注人臉支付,和騰訊、阿里等互聯網巨頭在刷臉吃飯、刷臉進站、刷臉掛號等場景中淺唱共舞,讓三維視覺又火了一把。未來,安防、工業應用、智能零售等領域有望帶來三維視覺技術新的風口。而在智能手機領域,華為率先攻下三維TOF技術難題,并落地在其里程碑產品P30系列手機上,提供三維優化拍照、360°全景拍攝等功能,還引來三星等廠家的跟風比拼。這一發展趨勢為AR視頻通話、三維建模等手機功能帶來曙光,到時候AR還是手機的附加屬性嗎?奧比中光副總裁孔博表示:“目前三維視覺現在還在初級階段,未來還會不斷地迭代和提升,將被應用于AIoT多個領域,有非常大的發展空間。”三維視覺技術不僅孕育著一個被低估的市場,作為一種新的感知方式,它還有望顛覆性地改變人與機器、人與人的交互方式。
















分享到:
版權所有(C) 2019-2022 安徽康櫻網絡科技有限公司 皖ICP備19022243號 ?? 皖公網安備 34019202000744號 ?OA 后臺
下载现金棋牌游戏
福彩体彩走势图大全 777七乐彩走势图 网上投注体育彩票 大赢家比分直播是什么 吉林时时彩快三 老快3玩法规则说明 香澳三肖六码 山西泳坛夺金走势图 泡妞秘籍不赚钱了 36o彩票导航彩票走势图 呗店真的赚钱吗 棒球比分分析