5月18日至20日,計算機視覺領(lǐng)域頂級盛會——ACM 中國圖靈大會在上海圓滿落幕。以“引領(lǐng)人工智能 創(chuàng)造無限可能”為主題,本屆大會匯聚了來自學術(shù)界與業(yè)界的全球最強大腦,包含三位圖靈獎得主谷歌副總裁兼首席互聯(lián)網(wǎng)專家 Vinton Cerf、哈佛大學 Leslie Valiant 教授、卡耐基梅隆大學 Raj Reddy,以及機器學習界泰斗 Michael I. Jordan、陽光媒體集團董事長楊瀾、百度副總裁王海峰、科大訊飛執(zhí)行總裁胡郁等。碼隆科技有幸與全球頂尖的專家學者和企業(yè)家們同臺,共同探討當今社會前沿科技的應(yīng)用。
美國計算機協(xié)會(ACM)于1966年設(shè)立“圖靈獎”,獎勵國際上對計算機事業(yè)作出重要貢獻的個人,并以此紀念“人工智能之父”艾倫·麥席森·圖靈(Alan Mathison Turing)對計算機科學的巨大貢獻。該獎項為計算機界最負盛名、最崇高的榮譽,素有“計算機界諾貝爾獎”之稱。繼去年ACM圖靈獎五十周年大會在中國成功舉辦之后,今年,中國圖靈大會再次于上海舉辦,邀請了眾多學術(shù)界和業(yè)界的豪華嘉賓,圍繞計算機各領(lǐng)域的創(chuàng)新和發(fā)展、技術(shù)的產(chǎn)業(yè)化應(yīng)用等多個話題展開探討。
會議期間,碼隆科技首席科學家黃偉林博士發(fā)表了以《Computer Vision in RetailAI:從物體識別到商品識別》為題的主題演講,與在場嘉賓學者、企業(yè)家和學生們共同探討計算機視覺的技術(shù)突破點和商業(yè)應(yīng)用。
碼隆科技黃偉林博士獲得由圖靈獎得主Vinton Cerf博士本人親自頒發(fā)的優(yōu)秀Keynote講者證書
黃偉林博士曾在牛津大學 Visual Geometry Group (VGG) 實驗室從事博士后研究工作,博士后期間師從 Andrew Zisserman 和 Alison Noble,研究方向主要集中在場景文本識別、場景分類和醫(yī)學視頻分析等領(lǐng)域。
演講中,首席科學家黃偉林博士簡單介紹了計算機視覺發(fā)展的幾個重要里程碑,從圖像分類談到商品識別,以及目前在現(xiàn)實商業(yè)場景中遇到的技術(shù)難題,并分享了碼隆科技如何通過獨創(chuàng)的弱監(jiān)督算法帶來技術(shù)突破。
首先,黃博士簡單介紹了對計算機視覺發(fā)展有著重要貢獻的 ImageNet 圖像識別競賽。在 2010年和 2011 年的時候,大家采用的是傳統(tǒng)特征的方法,錯誤率在 25% 以上。直到 2012 年,卷積神經(jīng)網(wǎng)絡(luò)被第一次應(yīng)用到 ImageNet 圖像識別比賽,使得錯誤率從 25.8% 降低到 16.4%,帶來巨大的性能提升。此項突破引發(fā)了計算機視覺技術(shù)的變革,從此,深度學習技術(shù)在整個計算機視覺領(lǐng)域中得到廣泛應(yīng)用。到了2017 年,錯誤率已降低到 2.2%,超過了人類識別錯誤率 5.1% 的表現(xiàn),證明了在 1000 類圖片分類這個任務(wù)上,機器可以做得比人類更好。
然而,碼隆科技所專注的商品識別這個領(lǐng)域,識別的種類多達幾十萬種,因為即使是同一款商品,不同品牌或不同款式的價格是不一樣的,故需要做到SKU(庫存量單位)級別的分類。由此可知,商品識別技術(shù)應(yīng)用在現(xiàn)實生活中的商品圖像識別難度,遠高于 ImageNet 比賽中1000種物體的識別難度。
值得關(guān)注的是,ImageNet 競賽對計算機視覺圖像識別技術(shù)發(fā)展起到了很大貢獻,擁有大規(guī)模人工標注數(shù)據(jù)集這一點十分關(guān)鍵。然而,人工標注數(shù)據(jù)的成本高昂,越來越多的研究者開始關(guān)注利用低成本數(shù)據(jù)(如不含人工注釋的數(shù)據(jù))來訓練圖像識別系統(tǒng)的方式。
碼隆科技通過自主研發(fā)的弱監(jiān)督學習算法,解決了人工標注的問題。黃博士深入淺出地分享了如何通過弱監(jiān)督學習和課程學習訓練策略,突破深度學習需大量人工標注數(shù)據(jù)來支持的技術(shù)難點。通過獨創(chuàng)的弱監(jiān)督學習算法,黃博士所帶領(lǐng)的團隊不僅僅在實際商用場景中處理了海量噪聲數(shù)據(jù),降低了人工標注的巨大成本,也因此在CVPR 2017上榮獲大規(guī)模視覺理解 WebVision 世界挑戰(zhàn)賽第一名的殊榮。此項比賽的結(jié)果也說明了,即便在更符合真實使用場景、沒有經(jīng)過人工清理和標注的數(shù)據(jù)中,碼隆科技算法團隊所達到的 94.78% 準確率表現(xiàn)(相當于接近5%左右的錯誤率),已經(jīng)可以達到比肩人類的性能。
黃博士還分享了目前碼隆科技商品識別技術(shù)在新零售、電商、服裝紡織、家具家居等行業(yè)的實際應(yīng)用,獲得在場嘉賓一致好評。在頒獎晚宴上,黃偉林博士獲得由圖靈獎得主Vinton Cerf博士本人親自頒發(fā)的優(yōu)秀Keynote講者證書。
碼隆科技首席科學家黃偉林博士發(fā)表了以《Computer Vision in RetailAI:從物體識別到商品識別》為題的主題演講
碼隆科技首席科學家黃偉林博士與兩位圖靈獎獲獎?wù)撸菏紫ヂ?lián)網(wǎng)專家 Vinton Cerf博士和哈佛大學 Leslie Valiant 教授合影
在會場的展位上,碼隆科技有幸與眾多優(yōu)秀的專家學者和學生進行交流,并展示其核心產(chǎn)品 ProductAI 在新零售、電商、服裝紡織、家具家居等行業(yè)的應(yīng)用。其中,“智能貨柜純視覺商品識別解決方案”獲得在場專家學者、教師和學生們的高度關(guān)注。該方案可助力傳統(tǒng)零售貨柜擺脫重力感應(yīng)模塊和 RFID 消耗的成本桎梏,高效解決新零售場景內(nèi)經(jīng)營方運營與消費者購物的實際痛點。這技術(shù)的落地正是基于碼隆科技核心產(chǎn)品 ProductAI 人工智能商品識別平臺高精準度的商品識別能力,其背后是碼隆科技算法團隊在海量數(shù)據(jù)訓練、精準算法模型設(shè)計上的不懈努力。
此次活動,碼隆科技與全球菁英齊聚本屆中國圖靈大會,共同勾勒人工智能的未來藍圖。未來,碼隆科技將持續(xù)專注計算機視覺技術(shù)創(chuàng)新與突破,并積極與學術(shù)界、產(chǎn)業(yè)界緊密合作,將最前沿的學術(shù)動態(tài)、最新研究成果呈現(xiàn)給更多致力于創(chuàng)新的科學工作者。
- 任天堂Switch 2亮度遭質(zhì)疑:HDR表現(xiàn)令人失望,玩家是否買單?
- 韋神抖音爆紅:三天吸粉2000萬,開號即頂流,究竟是何魅力?
- 特斯拉剎車失靈,車主滑行數(shù)分鐘才停下:疑云重重的安全之痛
- 車險單誤將保險寫成保障?小米提醒:別被迷惑,要擦亮眼睛!
- 肖戰(zhàn)新劇爆火!《藏海傳》播放量破紀錄,古裝劇霸主地位無可撼動!
- 華為Mate 80低調(diào)發(fā)布:避開旗艦大戰(zhàn),務(wù)實創(chuàng)新的新篇章
- 高考騎手速遞:合肥全職騎手助力考生,緊急取證順利開考
- 微軟聯(lián)手執(zhí)法跨國打擊印度電詐團伙,揭秘針對日本老年人的AI騙局新篇章
- 抖音重拳出擊,揭露虛假營銷套路:AI押題,別再被忽悠了
- 特斯拉Model S Plaid原型車挑戰(zhàn)紐北最快四門車紀錄:駕駛激情與性能科技的完美融合
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。