計算機視覺:我們最需關(guān)注的前沿領(lǐng)域!

幾個星期前,紐約舉行了LDV視覺峰會。該峰會專注于計算機視覺的高潛力領(lǐng)域。它涵蓋了從3D成像,VR深入學(xué)習(xí)到Facebook實時視頻的各個領(lǐng)域(在峰會上,我還就增強現(xiàn)實領(lǐng)域發(fā)表了一個廣告形式的演講)。相信這個領(lǐng)域,是我們所有人,從廣告人、工程師、市場營銷到投資者,都應(yīng)密切關(guān)注的領(lǐng)域。這里簡述5個原因:

計算機視覺的潛力不可小視

LDV峰會創(chuàng)始人Evan Nisselson在LDV視覺峰會開場白中表示:現(xiàn)今,被鏈接在一起的相機和視覺傳感器可以說是無處不在。這些無處不在的錄像和實時大數(shù)據(jù),可組合成智慧建筑。其能夠根據(jù)人的運動量調(diào)節(jié)能量分配。這也將引領(lǐng)智能家園的到來。那時,你的鏡子可以告訴你體重是否增加,你喝了多少酒。這都得益于內(nèi)置的3D掃描儀和氣體傳感器。

而且,一旦這成為現(xiàn)實,鏡中廣告就可以讓你買到低熱量食物以及阿司匹林,并在幾分鐘內(nèi)直接送到浴室交付給你。

計算機能看到人類看不見的東西

計算機并不只通過我們現(xiàn)在這個領(lǐng)域所知道的圖像識別方式來“看”世界(計算機通過將圖像分解成像素來認(rèn)知世界)。計算機視覺依賴于可實時訪問的大數(shù)據(jù),地理定位,傳感器,超聲波,和其他類型的數(shù)據(jù)(如熱成像),可以讓一臺電腦“看到”人類無法看到的東西:例如氣體,熱量等。

計算機視覺的應(yīng)用遠(yuǎn)遠(yuǎn)超過處理大量圖像這個范疇。它除了快速識別那些人已經(jīng)可以看到的東西,真正的作用是處理那些人看不到的東西?;跀U充內(nèi)存(下一代谷歌眼鏡,很可能只需你看某人一眼,就能得到他的姓名和其他相關(guān)信息),可以“看”到氣體泄漏。計算機視覺通過多個實時渠道將使超人的感覺變?yōu)楝F(xiàn)實。

目前我們還沒有這種技術(shù)。正如康奈爾大學(xué)計算機視覺技術(shù)教授Serge Belongie所說的那樣:“正如你現(xiàn)在看到的計算機視覺領(lǐng)域中的狀態(tài),我們無法在人們沒有具象概念的情況下,告訴一個人某個東西是什么。我們真能告訴人們的是,像香蕉和自行車這種看見的東西?!钡?,這就是進(jìn)步,將來計算機視覺能夠而且將會通過照片中提取出來的信息,告訴人們更多的數(shù)據(jù)。

如果我們得不到足夠的訓(xùn)練數(shù)據(jù),我們會變得停滯不前

感謝深度學(xué)習(xí)網(wǎng)絡(luò),低成本以及更快計算能力的計算機,使得判定圖像識別能力的游戲規(guī)則已經(jīng)被改變。但除非它們有機會獲得大量的圖像訓(xùn)練數(shù)據(jù),否則這些輝煌的算法就什么也不是。就說醫(yī)學(xué)影像所面臨的問題:絕大多數(shù)可被用于訓(xùn)練數(shù)據(jù)的圖片是專有的,基本被這兩個龐然大物所持有:谷歌和Facebook??紤]到目前用戶共享和上載在這些公司消費平臺上的數(shù)據(jù)量,這一趨勢沒有明顯放緩的跡象。就像Greylock的合伙人Josh Elman接受記者采訪時提醒的一樣,它們會變成計算機視覺發(fā)展道路上的潛在障礙,如果兩家大公司一直持有所有的訓(xùn)練數(shù)據(jù)的話。

VR和AR需要計算機視覺

一些人認(rèn)為,現(xiàn)在虛擬現(xiàn)實(VR)和增強現(xiàn)實(AR)被過度炒作。而把計算機視覺帶入這兩項技術(shù)純屬能源浪費。不過,同我探討過的大多數(shù)人都認(rèn)為VR與AR這兩種技術(shù)都需要長期的發(fā)展。作為進(jìn)一步提升,它們都需要高品質(zhì)的計算機視覺功能來完善其技術(shù)(如使用圖像識別來提高VR 的“互動”形式)。

很多人把今天的VR技術(shù)比做90年代中期的互聯(lián)網(wǎng):或許它目前還不是主流可獲利的技術(shù),但在將來會被廣泛應(yīng)用。計算機視覺技術(shù)越是先進(jìn),它的功能將吸引更多的人們來關(guān)注VR和AR,也會使得其更加實用并變得可盈利化。畢竟,如果宜家可使用AR說明書,通過準(zhǔn)確的計算機視覺一步一步告訴你:你把書架上的螺釘放錯了地方,這是多么牛???

計算機視覺已經(jīng)在人身安全方面增加了投入力度

除了深度學(xué)習(xí)和AI,另一項大型科技的發(fā)展趨勢就是機器人。是的,大多數(shù)機器人會需要(并且絕對需要)計算機視覺。從掌管流水線檢驗到所做的一切,都會需要這項技術(shù)。例如,Nanotronics公司使用圖像識別來尋找計算機內(nèi)存晶圓的缺陷,這比使用人類更精確,更快速。

即使是小型企業(yè)和消費者,使用計算機視覺幫助下的碳機機器人卡蒂亞(Carbon Robotics’ Katia,5,000美金的機器人機械臂),也可確保它不會致人死命(機械臂事故可不是鬧著玩)。跟據(jù)碳機機器人(Carbon Robotics)所說,成本在5,000美金以下的機械臂是制作主流,這也是為什么碳機機器人能贏得LDV第2天的商業(yè)挑戰(zhàn)。

通過LDV視覺峰會我們可得知,現(xiàn)在仍然是計算機視覺發(fā)展的初期。但是,目前的創(chuàng)新有一個光明的未來,無論是在業(yè)務(wù)層面和更廣泛的社會層面。研究還證實,令年輕工程師興奮的是:相較以往,會有更多的機會來改變產(chǎn)業(yè)內(nèi)一部分的游戲規(guī)則。

加速會:加速你對世界的理解,內(nèi)幕全在這里!請關(guān)注加速會微信公號:jiasuhuihao

加速會主編微信:leaderweb

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2016-06-16
計算機視覺:我們最需關(guān)注的前沿領(lǐng)域!
幾個星期前,紐約舉行了LDV視覺峰會。該峰會專注于計算機視覺的高潛力領(lǐng)域。它涵蓋了從3D成像,VR深入學(xué)習(xí)到Facebook實時視頻的各個領(lǐng)域(

長按掃碼 閱讀全文