4月26日消息(田小夢)隨著元宇宙概念的推出,數(shù)字人也逐漸出圈,應(yīng)用于傳媒、文旅等各行各業(yè),但高昂的制作和運(yùn)營成本讓不少企業(yè)望而卻步。因此,“如何讓數(shù)字人成為小微企業(yè)經(jīng)營的‘可選項(xiàng)’,甚至成為個(gè)人創(chuàng)作者的創(chuàng)作工具?”成為致力于數(shù)字人領(lǐng)域企業(yè)關(guān)注的焦點(diǎn)。
4月25日,騰訊云智能推出了騰訊云智能小樣本數(shù)智人生產(chǎn)平臺(tái),可以輕松實(shí)現(xiàn)“自助式”數(shù)智人生產(chǎn)制作。
通過騰訊云智能小樣本數(shù)智人生產(chǎn)平臺(tái),用戶只需要3分鐘真人口播視頻、100句語音素材,便可通過音頻、文本多模態(tài)數(shù)據(jù)輸入,實(shí)時(shí)建模并生成高清人像,在24小時(shí)內(nèi)制作出與真人近似的“數(shù)智人”。
千元級(jí)別的成本、小時(shí)級(jí)的制作時(shí)長,大幅降低數(shù)字人使用門檻。騰訊云智能小樣本數(shù)智人為短視頻創(chuàng)作、知識(shí)分享、帶貨直播等場景應(yīng)用提供了更多可能性。
奔向“更智慧、更懂行”
從騰訊數(shù)智人的發(fā)展脈絡(luò)來看,騰訊一直在致力于數(shù)字人發(fā)展。
據(jù)介紹,從2016年開始,騰訊就已經(jīng)開始接觸對話式AI,也就是早期的數(shù)字人,之后是語音對話方向。2018年,騰訊正式投入數(shù)智人研發(fā)和服務(wù),成為國內(nèi)最早投入數(shù)字人領(lǐng)域的企業(yè)之一,目前騰訊已發(fā)布數(shù)百篇相關(guān)技術(shù)頂會(huì)、期刊論文、專利近百份。騰訊云智能數(shù)智人已經(jīng)覆蓋3D寫實(shí)、3D半寫實(shí)、3D卡通、2D真人、2D卡通五種形象風(fēng)格。
一路走來,在騰訊云智能數(shù)智人產(chǎn)品總經(jīng)理陳磊看來,騰訊數(shù)智人主要追求兩大方向——更智能、更懂行。
以此次騰訊重點(diǎn)推介的2D真人小樣本數(shù)智人為例,小樣本數(shù)智人不僅支持半身、全身形象展示,手勢動(dòng)作會(huì)根據(jù)內(nèi)容靈活調(diào)整,也支持錄制背景任意更換,適用于直播帶貨等更廣泛的商用場景。
在技術(shù)解讀中,騰訊優(yōu)圖實(shí)驗(yàn)室研究總監(jiān)汪鋮杰表示,2D小樣本技術(shù)的背后是3D技術(shù)。“小樣本數(shù)智人從直觀上感受是2D視頻,背后其實(shí)是3D人像在做支撐。從‘文本/音頻’信息到‘3D人像驅(qū)動(dòng)’再到‘2D人像視頻’的模式,通3D人臉結(jié)構(gòu)的先驗(yàn)信息引入,使數(shù)智人口型、表情更到位,讓小樣本數(shù)智人形象實(shí)現(xiàn)‘皺紋級(jí)’還原?!?/p>
另一方面,“?。颖荆?的背后是"大”?;谧员O(jiān)督機(jī)制的通用多模態(tài)模型經(jīng)過大規(guī)模數(shù)據(jù)訓(xùn)練,可以將語音、文本與人像的表情、口型進(jìn)行關(guān)聯(lián)?!?分鐘”的訓(xùn)練視頻正是基于這個(gè)模型,學(xué)習(xí)每個(gè)人個(gè)性化的發(fā)音和口型特征。
除了數(shù)字人外形、交互等智能外,要看懂行,則離不開真實(shí)的落地應(yīng)用。
陳磊坦言稱:“騰訊數(shù)智人從2018年到2023年,我們一直追求的目標(biāo)是‘我們更懂行’?!蹦壳?,騰訊云智能數(shù)智人從金融、傳媒,到文旅、出行、政務(wù)等十余個(gè)行業(yè),上百個(gè)具體的業(yè)務(wù)場景均已落地。
實(shí)現(xiàn)數(shù)智人快速普及的“背后”
使用門檻和運(yùn)營成本是數(shù)字人發(fā)展過程中的兩座“大山”。
為加速數(shù)智人服務(wù)普及,騰訊云智能提出自動(dòng)化“AI+數(shù)智人工廠”的方向。開箱即用的數(shù)智人生產(chǎn)服務(wù),依托騰訊云TI平臺(tái),內(nèi)置超過10項(xiàng)AI算法能力。未來,無需任何算法、研發(fā)經(jīng)驗(yàn),只要在平臺(tái)導(dǎo)入視頻、語音訓(xùn)練素材,即可通過“自助式”服務(wù),完成大批量數(shù)智人形象、音色定制。
針對數(shù)智人運(yùn)營,騰訊云智能提供播報(bào)數(shù)智人平臺(tái)、交互數(shù)智人平臺(tái)服務(wù)。播報(bào)數(shù)智人平臺(tái)支持通過文字、語音輸入快速生成數(shù)智人視頻;交互數(shù)智人平臺(tái)可打造“超長待機(jī)”的數(shù)智員工,可定制專屬問答庫,提供7*24小時(shí)人機(jī)雙向交互服務(wù)。同時(shí),也可實(shí)現(xiàn)數(shù)智人直播服務(wù),直播間7*24小時(shí)不斷檔,自由切換真人語音接管,與用戶問答互動(dòng)。
陳磊表示,騰訊云智能專注做厚aPaaS數(shù)智人平臺(tái),以API接口形式向合作伙伴開放“產(chǎn)、銷、服”一體化服務(wù),支持合作伙伴開發(fā)更多適用于垂直行業(yè)、垂直場景的數(shù)智人SaaS服務(wù)。目前,已經(jīng)有數(shù)十家合作伙伴依托平臺(tái),向行業(yè)提供數(shù)智人直播SaaS、知識(shí)口播SaaS應(yīng)用,覆蓋醫(yī)療、傳媒、金融多個(gè)行業(yè)。
作為騰訊云智能的生態(tài)集成伙伴,醫(yī)微訊創(chuàng)始人、CEO潘耿表示,騰訊云智能數(shù)智人生產(chǎn)及運(yùn)營能力的開放,助力我們?yōu)榭蛻舸蛟炝诉m用于醫(yī)療行業(yè)的數(shù)字人服務(wù)。微媒數(shù)字會(huì)議CEO天狐表示,微媒將全力和云智能共創(chuàng)數(shù)字分身解決方案,形成可持續(xù)發(fā)展的品牌營銷生態(tài),為企業(yè)與個(gè)人進(jìn)行IP打造。
此外,騰訊研究院高級(jí)研究員宋揚(yáng)對未來數(shù)字人的發(fā)展給予了厚望。他認(rèn)為,數(shù)字人的本質(zhì)是降本增效,它將會(huì)成為交互的新入口,在深度上和應(yīng)用上會(huì)有深度的挖掘。同時(shí),數(shù)字人未來的應(yīng)用是非常廣泛的,技術(shù)+行業(yè)會(huì)擦出有深度的應(yīng)用。
- 美科技七巨頭遭特朗普關(guān)稅血洗 市值蒸發(fā)14萬億
- 特斯拉市值一夜蒸發(fā)超6400億元,美股科技“七巨頭”陷入調(diào)整區(qū)間
- 阿里巴巴于上海新設(shè)智信普惠科技公司,布局多領(lǐng)域技術(shù)服務(wù)
- 馬化騰短暫登頂中國富豪榜,騰訊科技與股價(jià)雙輪驅(qū)動(dòng)成關(guān)鍵
- 本地生活賽道:2025年紅海變“血?!?,平臺(tái)競逐白熱化
- 義烏哪吒小商品熱賣:緊跟《哪吒2》熱潮,一天賣幾百套
- 美恢復(fù)接收中國包裹,貿(mào)易政策突變引發(fā)物流界震蕩
- DeepSeek或再掀波瀾,可能對美股市場造成新一輪打擊
- 谷歌股價(jià)暴跌:收入增長放緩,人工智能支出引投資者擔(dān)憂
- 華為去年銷售收入超8600億元:ICT基礎(chǔ)設(shè)施穩(wěn)健,新業(yè)務(wù)快速發(fā)展
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。