日前,我們從華為云官方了解到,華為推出了一款基于華為云AI技術的全新產品,來自華為諾亞方舟實驗室新推出的寫詩AI“樂府”,其不僅能寫詩、作詞,而且還能寫藏頭詩。自產品問世以來,就引發(fā)了不少網友的關注,不少網友更是為強大的華為云AI技術點贊。
針對這款基于華為云AI技術打造的產品,華為諾亞方舟實驗室語音語義首席科學家劉群也講述了華為云AI背后的故事,其表示,我們不懂詩,且在這個系統中,并沒有用詩的規(guī)矩去訓練,這一切都是系統自己學到的。
那么,華為云AI技術是如何實現寫詩的呢?對此,一位負責華為云AI研發(fā)的負責人給出了答案。據其介紹,生成中國的古詩詞與自由生成文本不同,通常需要滿足內容和形式兩個方面的要求。中國的古詩詞有各種各樣的形式,比如五律、七律、五絕、七絕、滿江紅、西江月、水調歌頭等各種詞牌以及對聯,每一種都有相應的押韻、平仄、字數、對仗等規(guī)定;內容方面,一首詩要圍繞著一個主題展開,同時還要保證內容的連貫性,它的要求相對而言是比較復雜的。
華為提出的“樂府”系統,與當前大多數解決方案不同,它是基于華為云AI打造的,不需要任何特性或者人工設定規(guī)則,也沒有設計任何額外的神經元組件。在研究的過程中,華為云AI技術需要做的是把訓練用的詩詞序列化為格式化的文本序列,作為訓練數據。并通過對語言模型token的抽樣,生成滿足內容和形式要求的詩詞,比如律詩、絕句、對聯以及詞等等。
值得注意的是,樂府AI是首個基于GPT打造的作詩系統,而且與谷歌提出的BERT息息相關。整體的GPT模型是在BERT的源代碼基礎上實現的,Transformer大小的配置也采用了BERT中發(fā)布的中文 vocab和tokenization 腳本,與BERT-Base相同。
整個模型訓練過程一共有兩個階段: 微調和預訓練。其中,預訓練是在華為云AI上完成的,一共耗費了90個小時,期間共訓練了4個echo,使用8塊英偉達V100(16G) GPU。微調的過程是將所有詩歌序列輸入Transformer,并訓練一個自回歸語言模型。而當整個訓練完成之后,需要將通過華為云AI技術生成的詩歌格式和主題轉化為一個初始序列,并將其輸入到模型中,最后再進行解碼即可。
中國古詩詞生成AI,基于華為云AI打造的“樂府”并不是第一個,也不是最后一個。未來,華為將不斷研發(fā)出更多基于華為云AI技術打造的創(chuàng)新產品,致力為更多領域、更多客戶提供全新的體驗方式。
- 任天堂Switch 2亮度遭質疑:HDR表現令人失望,玩家是否買單?
- 韋神抖音爆紅:三天吸粉2000萬,開號即頂流,究竟是何魅力?
- 特斯拉剎車失靈,車主滑行數分鐘才停下:疑云重重的安全之痛
- 車險單誤將保險寫成保障?小米提醒:別被迷惑,要擦亮眼睛!
- 肖戰(zhàn)新劇爆火!《藏海傳》播放量破紀錄,古裝劇霸主地位無可撼動!
- 華為Mate 80低調發(fā)布:避開旗艦大戰(zhàn),務實創(chuàng)新的新篇章
- 高考騎手速遞:合肥全職騎手助力考生,緊急取證順利開考
- 微軟聯手執(zhí)法跨國打擊印度電詐團伙,揭秘針對日本老年人的AI騙局新篇章
- 抖音重拳出擊,揭露虛假營銷套路:AI押題,別再被忽悠了
- 特斯拉Model S Plaid原型車挑戰(zhàn)紐北最快四門車紀錄:駕駛激情與性能科技的完美融合
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。