重陽節(jié)推關愛阿爾茲海默癥項目,搜狗這輪操作要顛覆語音市場格局

在各個企業(yè)都大步奔向AI技術時,我們也能發(fā)現越來越多的企業(yè)開始關注技術與人文之間的聯系。就像搜狗重陽節(jié)推出的“以聲相伴”項目,就是以個性化語音合成為切入,讓廣大用戶嘗試利用自己的聲音合成語音,為阿爾茲海默癥患者讀書,喚起社會對于患者的關愛。

除去項目中體現出的人文關懷和公益精神以外,我們關注更多的是搜狗在小程序和短片展示的語音合成技術高度和結合語音識別的應用創(chuàng)新性,在當今語音市場群雄爭霸的格局下,搜狗可謂別樹一幟地亮了次肌肉,吸引了行業(yè)的關注。

被埋藏的寶藏:當語音合成成為整個市場的短板

如果說語音合成是一項不被重視的技術,顯然是不夠客觀的。如今BAT科技巨頭、AI獨角獸等紛紛入局,語音市場一片熱鬧,很難說有哪一項細節(jié)技術是沒有人關注的。

但從當前幾家典型AI技術企業(yè)的在語音方面的布局來看,的確很少有哪一家展示出了在語音合成方面較為深入的能力。

以百度為例,百度的DuerOS更加注重的是技術生態(tài)的打造。通過連接硬件,打通百度語音技術下達到現實應用場景的通路。因此,顯然DuerOS更注重語音技術API接口的耦合與整合,包括百度對于AI技術的整體化關注,DuerOS技術體系中也融合了一部分結合了視覺等等方面的多模態(tài)識別。

另一種典型是科大訊飛等專注于單項語音技術研究的技術型企業(yè)。因此對于主攻B端市場的AI技術企業(yè)來說,語音合成技術的打造更傾向于“一招鮮吃遍天”,比如大家很熟悉的林志玲語音,就是邀請林志玲前來錄制了四千多個字,才能搭建成今天聲音和語氣都高度相似的林志玲語音合成。但這種高成本高投入的技術,顯然只能適用于B端市場,不具有普遍性。

裂隙是光透進來的地方:搜狗將如何利用技術撬動語音市場格局?

而搜狗在宣傳片中展示出了自己在業(yè)內推出的個性化生成語音和情感遷移兩項技術。

通過利用聲音數據訓練神經網絡,從聲音樣本中抓取音色、音調這樣的關鍵特征,再把音節(jié)數據還原成聲音,就可以在短時間內復制一個人的語氣和聲調。像很多地圖產品推出的明星版語音包,其實是找了明星錄入上千個字的讀音加上幾十句短語,拼接起來才能實現。但搜狗的個性化生成技術,只需要用戶上傳少量音頻,即可合成高質量的個性化音色。

而情感遷移技術則是將相聲貫口、唱歌、繞口令等等不同的說話風格抽象化,將語速、停頓方式、語調等特征構成神經網絡模型,再對文本信息進行處理,進而可以模仿各種發(fā)音風格。如同視頻中老奶奶的聲音一樣,老年人說話特有的慢條斯理和和藹,都是通過情感遷移才能實現,而不能僅僅依靠音色。

首先,市場中呈現出了敏捷開發(fā)與敏捷應用之間的空隙。打造平臺化生態(tài)的技術企業(yè),關注的更多是如何幫助開發(fā)者進行敏捷開發(fā),讓語音技術能力可以快速進入智能音箱、IOT設備、汽車等等硬件場景。但作為C端用戶和消費者,同樣需要敏捷的應用語音技術。就像宣傳片中體現的,只需幾十秒的對話就能完美復制一個人的聲音和語氣,對于用戶來說是一種十分實用的應用方式。例如用戶可以用自己的聲音替換有聲書聲音、用家人朋友的聲音進行地圖導航等等。這種敏捷應用的廣闊市場是無法被平臺中的開發(fā)者所代勞的,也就為搜狗提供了更加貼近用戶的途徑。

其次,市場中呈現了B端到C端語音商業(yè)化的空白。AI獨角獸們雖然每一輪融資都數額巨大,但這也證明專項投入于AI技術會造成巨大的變現壓力。而企業(yè)通常會選擇將這種壓力釋放于B端市場,在同傳、語音客服等等業(yè)務中收費。至于面對C端用戶的服務,又往往是免費的。但搜狗在短片中展示出的個性化語音合成,以及伴隨語音識別交互可以實現的陪伴,展現出了一種定制化的C端商業(yè)場景。未來用戶或許可以通過付費打造一套擁有自己聲音的兒童陪伴語音系統,幫助遠離家鄉(xiāng)的父母陪伴孩子,或是學校可以為教師合成一套語音家教系統,讓學生熟悉的聲音在課后仍然可以為他們解答問題。搜狗用強大的語音識別能力,結合起個性化生成語音和情感遷移兩項獨特的差異化技術,讓搜狗可以觸及到他人難以抵達的語音商業(yè)市場。

通往未知的任意門:語音市場的下一章如何書寫?

在今年7月的“Blizzard Challenge 2018 ”語音合成大賽上,第一次參賽的搜狗戰(zhàn)勝了大量國際頂尖科研機構,獲得了可懂度和語音停頓兩項任務中排名第一的優(yōu)異成績。在這樣權威性極強的國際賽事中獲得這樣的成績,也進一步證明了搜狗在語音合成上的能力。不僅是語音合成,搜狗在機器翻譯上的高度投入,同樣也涉及語音識別,像搜狗旅行翻譯寶這類產品的熱銷和高度啟用率,也給搜狗累積了大量的語音交互書。在WMT2017國際機器翻譯大賽上,搜狗在語音識別上的準確率達到了驚人的97%。

如今搜狗展示出的不光是語音交互和語音合成的技術能力,更多的則是體現出搜狗進一步深入語音市場時,獨有的技術優(yōu)勢和商業(yè)化前景。C端個性化語音合成與交互,可以說是當今語音市場的無人之地。搜狗所擁有的優(yōu)勢是技術上不可替代性,幫助搜狗從一種競品中脫穎而出,有如高塔一般,展示出更多差異化優(yōu)勢也能輻射更多發(fā)展可能。

現如今的語音市場,已經基本完成了最初的市場培養(yǎng),越來越多的企業(yè)開始應用起智能客服,越來越多的用戶開始習慣和手機、音箱對話。正是在這樣市場格局之下,才是比拼差異化、比拼細節(jié)的關鍵時刻。用戶剛剛學會了接納,接下來即將學會分辨優(yōu)劣并進行選擇。搜狗這時發(fā)揮出了多年的技術累積,打出了場景應用創(chuàng)新與差異化大旗。搜狗此舉是否會刺激市場更多的向打造差異化優(yōu)勢發(fā)展?或者破壞當下微妙的平衡,吸引來大量用戶?通往未知的任意門已經打開,一切可能都在醞釀之中,搜狗與語音市場的故事,值得期待。

免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2018-10-17
重陽節(jié)推關愛阿爾茲海默癥項目,搜狗這輪操作要顛覆語音市場格局
在各個企業(yè)都大步奔向AI技術時,我們也能發(fā)現越來越多的企業(yè)開始關注技術與人文之間的聯系。

長按掃碼 閱讀全文