對于文字工作者而言,如何將演講者/被采訪人的語音轉(zhuǎn)化為文字是一個痛點、一個剛需。求助于速錄員是一個不錯的選擇,尤其是那些專業(yè)領(lǐng)域的速錄員,比如在科技行業(yè),不懂AI或者VR等專業(yè)名詞的速錄員很容易在速記中鬧出笑話。
在今年9月份錘子手機的發(fā)布會上,錘子科技產(chǎn)品總監(jiān)朱蕭木秀了一段語音識別,這也讓科大訊飛的語音識別技術(shù)一下子增加了眾多“錘粉”。借助語音識別,原本需要一點點聆聽的語音可以轉(zhuǎn)變成快速閱讀的文字,這無疑是文字工作者的一大福利;但似乎也是速錄員這一職業(yè)的終結(jié)者。
在著名資訊公司麥肯錫最新發(fā)布的一項全球研究發(fā)現(xiàn),約45%的工作可以實現(xiàn)自動化,這將影響到60%的崗位,其中三分之一的工作將被機器人替代。但與此同時,麥肯錫也安慰人們,技術(shù)變革往往需要幾十年的時間才能被整個社會廣泛接納,人們還有時間去慢慢適應(yīng)。
不過,語音識別并非替代速錄員那么簡單,與人們在過去用文字觸達虛擬世界的方式不同;未來,人們只需要通過語音就可以實現(xiàn)與虛擬世界的連接。因此,專注于語音識別的科大訊飛更有機會成為未來人工智能大爆發(fā)時代的領(lǐng)先者。
人類正在從文字時代進入語音時代
計算機出現(xiàn)以來,人們與計算機之間的交互幾乎都是通過文字來實現(xiàn)。即便是代碼階段,某種程度上也可以看作是文字的交互方式;如今,語音正在替代文字。對此,“互聯(lián)網(wǎng)女皇”瑪麗· 米克( Mary Meeker )認為,語音應(yīng)該是最有效的計算輸入形式。因為對于消費者,語音可以快速溝通、簡單方便、個性化并且無需鍵盤。
有統(tǒng)計數(shù)據(jù)顯示,機器對語音識別的正確率從2010年的約70%,提高到2016年的約90%。從這樣的速度看,語音時代可以說已經(jīng)到來,未來人們與智能終端的交互方式除了傳統(tǒng)的鍵盤文字輸入,語音將逐漸成為新的主流。
語音技術(shù)時代的開啟,所帶來的不僅僅是輸入的革命。在科大訊飛輪值總裁胡郁看來,語音技術(shù)將帶來7個層面的變革:1、輸入法,2、語音轉(zhuǎn)文字,3、翻譯,4、智能家居,5、自動駕駛,6、機器人,7、教育。
嚴格來說,在不同的領(lǐng)域,語音技術(shù)都是基礎(chǔ)所在,是語音技術(shù)在這些領(lǐng)域的應(yīng)用所帶來的變革,每一個領(lǐng)域都不容小覷。以機器人為例,語音將一改計算機時代的鍵盤錄入,成為人機互動的主流方式,這里所說的機器人不止是我們常見的人形機器人,很多時候,“系統(tǒng)”也可以稱之為機器人,而且不同的應(yīng)用場景可以誕生出不同類型的機器人,它們都能夠深入應(yīng)用到語音技術(shù)。
在不久的將來,IOT充分普及后,人們無需再通過手機這樣的智能終端與整個世界連接,只需要借助手表、紐扣等,你只需告訴他們:我想去吃飯,附近有什么好吃的?你就可以迅速獲得回復(fù),機器會告訴你附近有哪些好吃的地方,距離多遠,有沒有優(yōu)惠或者排隊人數(shù)多少的等信息。當(dāng)你確定去哪里時,系統(tǒng)會告訴你如何到達那里,需要多少時間,并為你安排預(yù)約甚至是提前點菜等等。
不過,我們也大可不必擔(dān)心語音會完全替代文字作為主要的輸入方式,畢竟有很多的應(yīng)用場景里并不適合語音輸入,比如在公共場所,每個人都在與機器互相交流、自言自語,這樣的場面也是蠻怪異的。
科大訊飛打算成為怎樣的領(lǐng)先者?
嚴格來說,語音技術(shù)在未來的人工智能時代更像是一種基礎(chǔ)技術(shù),單純推動技術(shù)的發(fā)展和應(yīng)用,最終很有可能只是為其他企業(yè)做嫁衣。如何在語音技術(shù)的基礎(chǔ)上孵化出更多的產(chǎn)品和應(yīng)用,才是像科大訊飛這樣的企業(yè)最大限度挖掘人工智能潛能的關(guān)鍵。
為此,日前科大訊飛基于“訊飛超腦”人工智能最新技術(shù)發(fā)布了一系列新品,包括萬物互聯(lián)輸入解決方案、訊飛聽見多語種翻譯、智能家居、智能服務(wù)機器人、智能車機、個性化語音合成、智慧教育等技術(shù)產(chǎn)品,更多是從科大訊飛人工智能技術(shù)在社會生活的創(chuàng)新應(yīng)用出發(fā)。
在翻譯領(lǐng)域,科大訊飛的中英互譯神器——“曉譯翻譯機”,可以快速、準確地實現(xiàn)了中英口語的即時互譯,并支持漢維互譯功能,未來科大訊飛還將為之增加更多語種,實現(xiàn)不同語言之間的便捷交流。
在汽車領(lǐng)域,科大訊飛的汽車智能車載系統(tǒng)——飛魚助理,則將遠場識別、全雙工、多輪交互、方言識別等技術(shù)應(yīng)用于汽車,可以在復(fù)雜的行車環(huán)境中輕松進行通訊、導(dǎo)航操作,收聽了解多媒體娛樂信息,對車身進行控制和信息查詢等服務(wù)。
在智能機器人領(lǐng)域,科大訊飛的智能客服機器人——曉曼,更是集合了科大訊飛的語音合成、語音識別、語義理解和人臉識別等多種技術(shù),結(jié)合麥克風(fēng)陣列、3D攝像頭、身份證讀卡器、取號小票機等外設(shè)應(yīng)用,以語音、觸屏、動作等多模態(tài)的交互方式為用戶服務(wù)。
在智能家居領(lǐng)域,科大訊飛的超腦魔盒打造了一個通過語音便捷控制家居設(shè)備的智能環(huán)境;而在教育領(lǐng)域,科大訊飛通過學(xué)業(yè)數(shù)據(jù)采集和教學(xué)過程性數(shù)據(jù)分析,實現(xiàn)多維度教學(xué)發(fā)展性評價和基于知識點的學(xué)生個性化學(xué)習(xí)。
從以上種種可以看出,科大訊飛的野心是以語音技術(shù)這一基礎(chǔ)技術(shù)作為切入點,由此衍生出更多的產(chǎn)品和應(yīng)用出來,在幫助人們視線智能生活的同時,謀求更大的市場空間。這也正是科大訊飛所倡導(dǎo)的“人工智能+”,嚴格來說應(yīng)該叫“語音技術(shù)+”。
不管怎樣,科大訊飛都在一定程度上掌握了語音技術(shù)的“核心科技”,正如科大訊飛董事長劉慶峰所說,在人工智能時代,各細分領(lǐng)域的創(chuàng)業(yè)英雄更容易成功,只要你有創(chuàng)意、有品位、有感覺,能夠精準滿足每一個人的個性化需求,你就再也不用擔(dān)心被別人的數(shù)據(jù)入口和資金瞬間血洗出場。
本文為科技新媒體“常言道”(微信公眾號:changyandao1)出品,作者丁常彥。原創(chuàng)作品,歡迎轉(zhuǎn)載,轉(zhuǎn)載或引用請注明作者及來源。
- 世間將再無松下電視:松下官宣解散家電子公司并徹底放棄電視機業(yè)務(wù)
- 雅迪集團與南都電源簽署協(xié)議:攜手共繪固態(tài)電池未來藍圖
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計劃瞄準AI機器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費引熱議
- 消息稱塔塔集團將收購和碩印度iPhone代工廠60%股份 并接管日常運營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。