隨著大模型的飛速發(fā)展,行業(yè)各界對大模型的核心疑問,已經從“有沒有大模型”,轉變?yōu)榉e極投入建設之后,中國AI產業(yè)如何實現(xiàn)大模型落地?巨大的建設投資應該如何獲得確定性、可持續(xù)的回報?
事實上,中國AI最強的特征一直是落地。
技術落地的一個重要指標是技術密度,即一項技術在社會和經濟中的普及程度和應用密度。過去幾年里,AI技術已經在中國的農田、工廠、港口、礦山、校園、城市等遍地開花,是全球其他地區(qū)都極少見到的景象。
產業(yè)革命的發(fā)生不可能一蹴而就,擁有大量業(yè)務場景和AI落地經驗的中國,也應該是大模型落地的前哨站。
果不其然,外界對中國AI和大模型落地的疑問與好奇,已經可以在文心的最新進展中,得到解答。
7月6日,在2023世界人工智能大會(WAIC)上,百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰,解讀文心大模型3.5版核心技術,同時發(fā)布了飛槳生態(tài)最新進展,首次披露了飛槳深度學習平臺最新數據,闡述人工智能產業(yè)模式。
文心和飛槳的協(xié)同發(fā)展,組成了一個雙螺旋結構,讀懂這個DNA 片段,可以更清晰地理解中國AI技術持續(xù)走向落地的方法與路徑。
一、產業(yè)AI的無形之墻
一個技術走向產業(yè),有三個因素構成了影響其市場格局的制約點:一是技術領先性,二是市場需求度,三是產品可靠與可用程度。
大模型技術的領先性和市場需求度,自然毋庸置疑,那么產品能否經受得住產業(yè)用戶的考驗呢?中國AI場景多、落地早、實踐多,所以已經可以清晰地看到一堵產業(yè)AI的無形之墻,各行各業(yè)普遍存在的“三高”要求,是大模型落地所必須跨越的挑戰(zhàn):
能力要求高。一些IT基礎好的產業(yè)會率先應用AI、落地大模型,但這些領域往往有著復雜的業(yè)務場景,以及使用多年的傳統(tǒng)算法,因此產業(yè)對AI大模型的基礎能力,要求會比較苛刻,超出現(xiàn)有技術手段,才有升級替換的必要性。
專業(yè)性要求高。通用大模型進入垂直細分的業(yè)務場景,會面臨非常復雜的業(yè)務狀況,要注意哪些問題和細節(jié),需要哪些數據,目標是什么,需要大模型能夠像行業(yè)專家一樣,掌握專有知識和行業(yè)Know-How。
開發(fā)成本高。行業(yè)場景的龐雜和差異化廣泛,大模型落地需要有針對性的訓練、精調,而很多行業(yè)和企業(yè)缺乏充足的IT人才、算力資源等來進行定制開發(fā),延緩了大模型落地的速度。
“三高”要求制約著AI技術落地,這也使得大模型走向產業(yè),還處于初級階段。
二、中國大模型的強落地范本
鑿穿產業(yè)AI 的圍墻,需要筑重器。在世界人工智能大會上,王海峰分享了文心大模型3.5的核心技術創(chuàng)新。
與文心大模型3.0版本相比,文心大模型3.5版本在效果、功能、性能上全面提升,實現(xiàn)了基礎模型升級、精調技術創(chuàng)新、知識點增強、邏輯推理增強等能力升級。
更值得關注的是,文心大模型在應用層面,展現(xiàn)出了掙脫制約、指向落地的一系列方法,可以成為產業(yè)示范。
文心大模型3.5的幾大技術創(chuàng)新,就滿足了產業(yè)各界對大模型的三種強期待:
一是對先進生產力的期待。
歸根結底,大模型要可靠、可用,為行業(yè)提質增效。文心大模型3.5的兩大升級點,就著眼于此:
首先,基礎模型升級,基于飛槳加快模型迭代,提升模型效果和安全性,模同時,百度文心大模型研發(fā)團隊創(chuàng)新了多類型多階段有監(jiān)督精調、多層次多粒度獎勵模型、多損失函數混合優(yōu)化策略、雙飛輪結合的模型優(yōu)化等技術,使模型效果及場景適配能力進一步提升。
此外,文心大模型3.5的邏輯推理提升,在語義理解、數學計算、代碼生成等領域表現(xiàn)更好,這些任務是實際業(yè)務中高頻出現(xiàn)的。王海峰舉了個例子,百度每天有大量工程師在寫代碼,文心一言發(fā)揮大模型的代碼生成能力,可以更好地幫助工程師提升寫代碼的效率,切實提高生產力。
二是對行業(yè)專家的期待。
大模型需要與行業(yè)場景適配,解決業(yè)務中更具專業(yè)性的實際問題,已經成為共識。此次3.5版本,就通過“精調”+“知識點增強”兩大技術創(chuàng)新,讓大模型具備行業(yè)專家一樣的專精能力。
有監(jiān)督的精調技術,可以針對性地適配業(yè)務場景,讓結果更加可靠,從而更好地滿足業(yè)務場景對模型效果和安全性的需求。知識點增強技術,則在此前的知識增強和檢索增強的基礎上,為大模型注入更具體、更詳細、更專業(yè)的知識點,顯著提升大模型對世界知識的掌握和運用,更好地完成專業(yè)任務。比如在生成報告時,文心大模型就能夠對用戶輸入的查詢、問題等進行分析理解,并解析生成答案所需要的相關知識點,生成更匹配業(yè)務特點的內容。
三是對豐富應用的期待。
智能手機中豐富多彩的應用,是移動互聯(lián)網產業(yè)繁榮的前提。用戶使用大模型也需要多樣、豐富、易用的各種應用工具,這就需要插件機制來滿足。
文心大模型3.5新增的插件機制,可以擴展大模型的能力邊界,細致高效地應用于各類場景。比如文心一言的長文本摘要和問答插件ChatFile,支持超長文本輸入,可以在辦公場景下,形成會議議題、摘要及總結等關鍵信息,幫助提升工作效率。
王海峰也表示,文心一言將發(fā)布更多優(yōu)質的百度官方和第三方插件,讓用戶能夠更好地應用文心大模型,同時也將逐步開放插件生態(tài),幫助開發(fā)者基于文心大模型打造自己的應用。
隨著大量優(yōu)秀的開發(fā)者和軟件工程師,基于文心大模型來打造專屬插件,不僅大模型的可用性和產業(yè)適配性會進一步提高,所帶來的應用市場空間也是巨大的。
文心大模型3.5的升級曲線,緊密貼合產業(yè)期待。從中可以看到,文心大模型時刻準備著落地千行百業(yè)。
三、大模型落地需要可持續(xù)動力
僅有大模型還不夠,王海峰提出,在文心一言這類大模型產業(yè)落地的進程中,可以采用“集約化生產,平臺化應用”的模式,即具有算法、算力和數據綜合優(yōu)勢的企業(yè)將模型生產的復雜過程封裝起來,通過低門檻、高效率的生產平臺,為千行百業(yè)提供大模型服務。
文心大模型能夠率先卡位在大模型落地的關鍵位置,離不開背后的另一條上升曲線:飛槳的聯(lián)合優(yōu)化。
飛槳對文心的全面賦能,有四個層面:
首先,飛槳支撐大模型開發(fā)、訓練和推理部署,全面提升大模型落地效率。大模型的訓練、迭代要消耗大量訓練成本、訓練時間,經過飛槳與文心大模的協(xié)同優(yōu)化,最新升級的文心大模型3.5的模型效果提升50%,訓練速度提升2倍,推理速度提升30倍。
其次,文心大模型成為飛槳模型庫的重要組成部分,通過飛槳平臺進行精調、推理部署,就可以有效支持千行百業(yè)的應用,降低行業(yè)獲取大模型門檻。
再次,飛槳提供了全流程產業(yè)化工具與平臺,解決大模型開發(fā)中的卡點、堵點,比如模型體積大、訓練難度高、算力消耗大等,更好地滿足企業(yè)開發(fā)應用大模型的需求。
此外,大模型落地產業(yè)離不開人才,飛槳已經凝聚了750萬開發(fā)者,也支持了大量企業(yè)產生了大量的模型,為中國AI培養(yǎng)了大量新型人才,是大模型落地的有生力量。
可以看到,飛槳的技術和生態(tài)積累,正在為文心大模型走向產業(yè),注入了源源不斷的動力。
四、中國AI,憑借這樣的DNA落地生根
在大會現(xiàn)場,王海峰也展現(xiàn)了文心一言在辦公、會議、編碼等場景的應用??梢哉f,文心一言已經有了豐富的新落地場景,這種強勁的落地表現(xiàn),應該能夠打消外界對中國大模型可持續(xù)發(fā)展的擔憂。
從文心與飛槳組成了雙螺旋結構的DNA,從中可以看出中國AI以實用為先,以產業(yè)為向的底色,中國大模型產業(yè)也開始呈現(xiàn)出這樣的發(fā)展趨勢:
1.低門檻。通過各個端口的技術創(chuàng)新,形成了AI技術全面低門檻化的特征,讓模型的開發(fā)、獲取和應用,都更加便捷、易得。
2.高效率。芯片、框架、模型、應用的全棧協(xié)同,帶來了效率持續(xù)增長的乘法效應,大大加快了模型的落地速度。
3.通行業(yè)。AI開發(fā)、訓練、部署、應用的全鏈路得到越來越飽滿的支撐,“集約化生產,平臺化應用”讓大模型更適配產業(yè)和行業(yè)的現(xiàn)實需要,賦能產業(yè)智能化。
落地成為中國AI的DNA,大模型也不例外。以大模型為代表的AI技術和先進生產力在各行各業(yè)落地生根,這是為什么智能革命一定會發(fā)生在中國。
免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。