訊飛輸入法發(fā)布行業(yè)首個(gè)輸入法認(rèn)知大模型:生成式AI全面賦能

10月24日,第六屆世界聲博會(huì)暨2023全球1024開發(fā)者節(jié)開幕,各行各業(yè)的大咖云集于此,共同探討通用人工智能的最新進(jìn)展和廣闊應(yīng)用前景。訊飛輸入法舉辦了主題為“星火閃耀·輸入未來”的生成式AI輸入法論壇,重磅推出訊飛首個(gè)輸入法認(rèn)知大模型,并現(xiàn)場(chǎng)發(fā)布訊飛輸入法13.0,定義面向下一代的生成式AI輸入法。

訊飛輸入法總經(jīng)理程坤在演講中提到,當(dāng)時(shí)間的指針指向21世紀(jì)第三個(gè)十年,伴隨00后的涌入,整個(gè)行業(yè)催生了更多新生需求;與此同時(shí),人工智能迎來“智慧涌現(xiàn)”的大模型時(shí)代。未來十年,大模型的應(yīng)用會(huì)深入各個(gè)領(lǐng)域,生產(chǎn)生活都將發(fā)生顛覆性變革。尤其是大模型展現(xiàn)出強(qiáng)大的生成能力,使人機(jī)交互更加自然流暢。因此,輸入法團(tuán)隊(duì)密切跟進(jìn)AI技術(shù)的新進(jìn)展,探索研究在中文輸入領(lǐng)域的應(yīng)用,不斷思考如何賦能輸入生態(tài)。

隨著AI大模型浪潮席卷全球,搶占布局生成式AI,有助于推動(dòng)行業(yè)發(fā)展。科大訊飛AI研究院副院長丁克玉在《面向下一代輸入法的生成式AI》演講中表示,基于星火大模型“1+N+X”產(chǎn)業(yè)發(fā)展生態(tài)體系,同時(shí)也為更好地發(fā)揮大模型在輸入法應(yīng)用中的潛力,訊飛量身定制了下一代輸入法認(rèn)知大模型,涵蓋文本生成、多語言語音、多模態(tài)生成的生成式AI能力矩陣,做更靠近業(yè)務(wù)的AI基座。

丁克玉特別提到,當(dāng)前一代的輸入法基于編解碼模式預(yù)測(cè)輸出,對(duì)用戶意圖理解能力有限。然而面向下一代的輸入法認(rèn)知大模型能夠基于大量場(chǎng)景數(shù)據(jù)、不同用戶畫像信息、多類型外部知識(shí)庫等進(jìn)行訓(xùn)練,并通過獎(jiǎng)勵(lì)模型的優(yōu)劣打分和獨(dú)家算法,深入理解用戶需求和偏好,更準(zhǔn)確地識(shí)別用戶意圖,從而生成更個(gè)性化的內(nèi)容,滿足用戶表達(dá)訴求。

對(duì)于以AI語音見長的訊飛輸入法,每年迭代語音識(shí)別效果已成慣例。去年在1024開發(fā)者節(jié)上,訊飛輸入法首發(fā)的“語音個(gè)性化方言免切換”帶動(dòng)了方言語音使用的快速增長。例如,閩南語、蘇州話、長沙話、南昌話、客家語、上海話、云南話等方言使用率分別增長1177%、727%、518%、412%、372%、362%、199%,在人機(jī)交互方面發(fā)揮巨大作用。今年,訊飛構(gòu)建多語言語音大模型,創(chuàng)新將識(shí)別、翻譯、語種分類多任務(wù)聚合,達(dá)到信息共享互通目的,實(shí)現(xiàn)語種免切換識(shí)別、語音到目標(biāo)語種自動(dòng)翻譯以及領(lǐng)域識(shí)別效果增強(qiáng)。

丁克玉補(bǔ)充道,“基于訊飛星火多模態(tài)大模型,輸入法認(rèn)知大模型將多模態(tài)對(duì)齊到統(tǒng)一語義空間中,實(shí)現(xiàn)多模態(tài)協(xié)同涌現(xiàn)。”目前,訊飛輸入法已經(jīng)逐步開始落地應(yīng)用多模態(tài)生成式AI能力,例如AI皮膚、AI頭像、AI造字……為輸入法的個(gè)性化帶來了全新的可能性,也將成為輸入法未來新的增長點(diǎn)。

值得一提的式,科大訊飛新發(fā)布的訊飛星火認(rèn)知大模型V3.0,七大能力持續(xù)提升,整體超越ChatGPT,重點(diǎn)升級(jí)式啟發(fā)式對(duì)話、AI人設(shè)功能,能打造更個(gè)性化的AI助手。依托星火大模型,訊飛將AI普惠更多用戶。

展望下一個(gè)十年,新一代的輸入法是怎樣的?訊飛輸入法產(chǎn)品總監(jiān)趙明路認(rèn)為,數(shù)字化時(shí)代的我們,對(duì)輸入法的要求全面升維,比如輸入內(nèi)容形態(tài)更加多元,輸入交互方式更加便捷。站在新時(shí)代的新起點(diǎn)上,訊飛輸入法13.0全新來襲,用生成式AI重塑輸入法,闡釋了“從輸入到生成表達(dá),從工具到助手服務(wù)”的新變化。

作為面向下一代生成式AI輸入法,訊飛輸入法13.0首先革新人機(jī)交互界面,對(duì)于傳統(tǒng)輸入推薦區(qū)賦以全新的“活力視界”設(shè)計(jì),在屏幕與按鍵之間獨(dú)創(chuàng)雙行顯示,創(chuàng)新卡片式推薦,支持自由組合卡片功能,實(shí)現(xiàn) Feed流式交互體驗(yàn),展示更高效、使用更便捷。

訊飛輸入法13.0內(nèi)置生成式AI能力矩陣,以滿足用戶復(fù)雜的需求。例如,輸入法認(rèn)知大模型賦能的“AI創(chuàng)作助手”,升級(jí)覆蓋更多實(shí)用場(chǎng)景,幫助用戶更好地表達(dá)自己;“智能回復(fù)”實(shí)現(xiàn)用戶不用打字也能回消息;“整句聯(lián)想”支持用戶說上句,AI生成下一句。事實(shí)上,輸入這件事早已不是“打出正確的字”這么簡(jiǎn)單。

趙明路還表示,“隨著大模型正在走向通用人工智能(AGI),走向無所不能。輸入法代表了對(duì)未來的理解,好的服務(wù)需要在正確的時(shí)機(jī)向正確的人提供。”訊飛輸入法13.0基于認(rèn)知智能的情景連接,已然“用戶為中心”,在合適的場(chǎng)景和時(shí)機(jī)推薦最佳輸入方案。在一定程度上,生成式AI輸入法全面顛覆原有的輸入模式,突破輸入法的應(yīng)用范圍,擴(kuò)大了服務(wù)邊界。

正如科大訊飛董事長劉慶峰所說的,“大模型時(shí)代的大幕才剛剛揭開,讓我們一起共創(chuàng)、共享、共進(jìn)化。”

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )