我國(guó)人臉識(shí)別的準(zhǔn)確率非常之高,已經(jīng)達(dá)到了百分之九十五以上,牛臉識(shí)別的準(zhǔn)確率是多少呢?能不能進(jìn)行商業(yè)化推廣?筆者從事多年面部識(shí)別,經(jīng)常有朋友問(wèn)到這個(gè)問(wèn)題,這里就做個(gè)科普性介紹。
十年前,隨著人臉識(shí)別的興起,國(guó)內(nèi)互聯(lián)網(wǎng)大廠蜂擁介入牛臉豬臉等畜臉識(shí)別,因?yàn)闇?zhǔn)確率難以提高導(dǎo)致的難以商業(yè)推廣,現(xiàn)在已經(jīng)基本停止。
牛臉識(shí)別的準(zhǔn)確率,與學(xué)習(xí)樣本數(shù)、基準(zhǔn)身份證的精確采集、特征點(diǎn)的選擇及數(shù)量、動(dòng)物的成長(zhǎng)時(shí)間差、比對(duì)動(dòng)物的數(shù)量等各種因素密切相關(guān)。一般類似實(shí)驗(yàn)室條件下,以上因素做到極致,并且比對(duì)動(dòng)物的數(shù)量在百頭以下,可能達(dá)到百分之九十左右。如果是實(shí)際場(chǎng)景,一般就在百分之七八十甚至更低。下面就各種影響因素與人臉識(shí)別進(jìn)行逐一對(duì)比討論:
首先,動(dòng)物基準(zhǔn)身份證的難以建立。臉部識(shí)別要有一個(gè)基準(zhǔn)身份證。人有身份證,動(dòng)物也要建立這個(gè)基準(zhǔn)身份證以選擇特征點(diǎn)。
人的身份證照片拍攝,相信大家都有體會(huì):具備資質(zhì)的照相館、布置后的白色背景、有經(jīng)驗(yàn)的攝影師,燈光的調(diào)整,身體及頭部的調(diào)整,拍攝好上傳公安系統(tǒng)審核是否合格。
這一切基于人是理性聽(tīng)話的,動(dòng)物怎么辦?而且動(dòng)物臉部識(shí)別要左中右三面,只能是圍繞動(dòng)物臉部拍攝一小段視頻,后臺(tái)盡可能抓取合適的照片來(lái)作為基準(zhǔn)。但動(dòng)物對(duì)人的恐懼,怎么能聽(tīng)話的任你拍攝?何況背景及光線怎么處理?拍攝者是否專業(yè)?拍攝的設(shè)備是否一致?所以動(dòng)物基準(zhǔn)身份證的準(zhǔn)確建立是個(gè)無(wú)比繁瑣的問(wèn)題?;鶞?zhǔn)身份證不準(zhǔn),下一步的比對(duì)怎么能準(zhǔn)?
其次,動(dòng)物的成長(zhǎng)性困擾。成長(zhǎng)就會(huì)發(fā)生變化,人一般也要根據(jù)成長(zhǎng),從青少年開(kāi)始,十年或二十年更換身份證。而動(dòng)物的成長(zhǎng)更快,幾年甚至幾個(gè)月就要長(zhǎng)大出欄或淘汰,幾個(gè)月或半年就做一次基準(zhǔn)身份證嗎?
第三,種群的區(qū)別以及大規(guī)模樣本數(shù)的模型學(xué)習(xí)帶來(lái)的問(wèn)題。人類也分黃白黑等人種,每個(gè)人種都要建立學(xué)習(xí)模型,要大規(guī)模的樣本數(shù)提供給模型學(xué)習(xí)。我國(guó)對(duì)白種人及黑種人的識(shí)別率就遠(yuǎn)遠(yuǎn)低于黃種人的識(shí)別率。而同一種動(dòng)物,比如牛的種群類要遠(yuǎn)遠(yuǎn)多于人類,肉牛、奶牛、肉奶兩用牛、牦牛等等,這些牛按產(chǎn)地不同又有很大不同,比如肉牛中的黃牛,相鄰省份就可能不同。再加上引進(jìn)的國(guó)外各種牛,比如西門(mén)塔爾牛、安格斯牛等等,還有國(guó)內(nèi)各地對(duì)這些?;ハ嘀g的雜交牛及二次三次雜交牛,種類如此繁雜,就要分別建立模型,進(jìn)行大規(guī)模的樣本數(shù)進(jìn)行學(xué)習(xí)。
我國(guó)對(duì)黃種人的人臉識(shí)別經(jīng)過(guò)了千萬(wàn)級(jí)別樣本數(shù)的學(xué)習(xí)。牛臉識(shí)別,某一種牛,樣本數(shù)幾千幾萬(wàn)的采集都不容易。種類如此之多,每一類都要建立模型收集樣本數(shù)來(lái)學(xué)習(xí),這如何能做到?
第四,動(dòng)物比對(duì)的近親屬相似性帶來(lái)的不準(zhǔn)。動(dòng)物一般是近親繁殖,比如豬的養(yǎng)殖,一個(gè)養(yǎng)殖場(chǎng)的某一代豬,基本就那幾個(gè)父親,一個(gè)欄里的一二十頭基本是同一個(gè)母親。而人類雙胞胎的人臉識(shí)別還沒(méi)有解決,豬雖然不是同卵,但也是極其相似,更何況其快速的成長(zhǎng)性。
所以,現(xiàn)在誰(shuí)來(lái)談豬臉識(shí)別,誰(shuí)就是騙子無(wú)疑了。 牛比豬的情況要好一些,一般是單胎。但種公牛也是那么幾頭,而種母牛又是高度近親。這高度的相似性,必然導(dǎo)致識(shí)別準(zhǔn)確率的極大降低。
第五,死活比對(duì)帶來(lái)的嚴(yán)重偏差。 以上四點(diǎn)是活活比對(duì)之難,而死活比對(duì)更是難上加難。比如牛臉識(shí)別在個(gè)別保險(xiǎn)公司的試用:承保時(shí)對(duì)動(dòng)物建立基準(zhǔn)身份證,動(dòng)物死了進(jìn)行理賠。這就要進(jìn)行死活比對(duì)了。
動(dòng)物死了,面部每時(shí)每刻都在發(fā)生變化,一個(gè)小時(shí)的變化已經(jīng)非常大了,何況保險(xiǎn)理賠到達(dá)現(xiàn)場(chǎng)的時(shí)間很難按小時(shí)計(jì),這識(shí)別率怎么能高?
最要命的是每頭死牛由于環(huán)境季節(jié),每時(shí)每刻的變化不同,怎么抓取樣本來(lái)學(xué)習(xí)?這已經(jīng)是無(wú)解問(wèn)題了。
綜上,我們已經(jīng)明白了牛臉識(shí)別的準(zhǔn)確率非常低。
而如此低的識(shí)別率,有些使用者,比如對(duì)準(zhǔn)確率要求近乎百分之百的保險(xiǎn)行業(yè),理賠時(shí)面對(duì)的還是死活比對(duì),但試用的個(gè)別公司卻感覺(jué)很準(zhǔn)。為什么?
技術(shù)提供方調(diào)整了相似度閾值! 為了看似高的準(zhǔn)確率,將相似度閾值從100調(diào)整到了50。這樣能不準(zhǔn)嗎?
但是,承保時(shí)候的牛叫張三,現(xiàn)在死的牛,可能是張三也可能是李四、王五、趙六等等。如果李四王五趙六等牛之前并不在承保范圍內(nèi)呢?保險(xiǎn)公司一樣要賠付。
目前,除了個(gè)別的商業(yè)性試用,規(guī)模的商業(yè)性推廣基本沒(méi)有。除了準(zhǔn)確率低,還有一個(gè)重大問(wèn)題即法律合規(guī)性問(wèn)題。人臉識(shí)別尚且不能作為法律依據(jù),牛臉識(shí)別遠(yuǎn)遠(yuǎn)低于人臉識(shí)別的準(zhǔn)確率,如何能作為依據(jù)?比如保險(xiǎn)公司承保的牛死了,養(yǎng)殖戶不認(rèn)可牛臉識(shí)別的結(jié)果,發(fā)生了法律糾紛,保險(xiǎn)公司必定敗訴,所以很少有公司敢進(jìn)行商業(yè)化推廣。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )