突圍與蝶變——?中國(guó)大模型發(fā)展方興未艾
2024-06-18 15:35 來源:法人雜志 作者:李遼

◎文 《法人》雜志全媒體記者 李遼

與以往任何一場(chǎng)顛覆性的技術(shù)革新相比,大模型似乎都來得更為猛烈,影響也更為深遠(yuǎn)。經(jīng)過了2023年的大模型“元年”,如今,它正站在爆發(fā)前夜,探尋著商業(yè)落地的路徑。

在這個(gè)賽道,中國(guó)處于世界第一梯隊(duì),特別是中國(guó)的千行百業(yè),市場(chǎng)需求大、場(chǎng)景多、數(shù)據(jù)豐富,使垂直大模型展現(xiàn)出了顯著優(yōu)勢(shì),為效率提升、產(chǎn)業(yè)升級(jí)賦能。諸多廠商也已經(jīng)布局,“百模大戰(zhàn)”正在上演,相關(guān)應(yīng)用“破圈”頻繁引發(fā)熱議。

但算力、數(shù)據(jù)、資本、人才的普遍不足仍是未來大模型發(fā)展的掣肘,而技術(shù)的突破也帶來了新的風(fēng)險(xiǎn)挑戰(zhàn),大模型產(chǎn)生的爭(zhēng)議與法律糾紛也讓人們看到了它背后的隱憂。

2024年,大模型的競(jìng)爭(zhēng)愈發(fā)激烈。近日,斯坦福大學(xué)某AI團(tuán)隊(duì)被曝疑似抄襲中國(guó)大模型創(chuàng)業(yè)公司面壁智能的創(chuàng)新成果,引發(fā)廣泛關(guān)注。人們這才意識(shí)到,幾年的時(shí)間里,中國(guó)在大模型這條賽道上已不再是單純的追隨者,而是展現(xiàn)出了與世界一流團(tuán)隊(duì)一較高下的底氣和實(shí)力。

在人工智能技術(shù)演進(jìn)中,大模型是一個(gè)重要分支。在2022年11月OpenAI公司發(fā)布GPT-3.5之前,大模型還在黑暗中不知前路。但隨著以ChatGPT為代表的生成式人工智能產(chǎn)品成為現(xiàn)象級(jí)應(yīng)用,人們終于意識(shí)到,這條探索之路走得通,也可以走得遠(yuǎn)。

如今,人工智能的發(fā)展邁入新階段,千行百業(yè)迫切與之深度融合。全球都試圖搭上這趟時(shí)代的列車,而中國(guó)以自身獨(dú)特的方式,拉開了大模型商業(yè)化變現(xiàn)的大幕。

百模大戰(zhàn)

1956年夏天,美國(guó)達(dá)特茅斯學(xué)院的一場(chǎng)閉門會(huì)議首次提出了“人工智能”概念,被認(rèn)為是人工智能誕生的標(biāo)志。進(jìn)入20世紀(jì)八十年代,人們開始涉足人工智能背后的核心——神經(jīng)網(wǎng)絡(luò)算法的研究,但受限于算力和數(shù)據(jù)資源,人工智能并未如預(yù)期一般迎來大規(guī)模發(fā)展。

人工智能的浪潮在2017年達(dá)到高峰。谷歌大腦團(tuán)隊(duì)發(fā)表了一篇著名的論文,提出了全新的transformer架構(gòu)。也正是這個(gè)架構(gòu),最終成就了OpenAI和ChatGPT。

6月4日,中歐國(guó)際工商學(xué)院決策科學(xué)與管理信息系統(tǒng)教授譚寅亮在接受《法人》記者采訪時(shí)稱:“數(shù)據(jù)量越多,參數(shù)量越高,模型性能提升越明顯,這正是大模型的特點(diǎn),被形象地稱為‘大力出奇跡’?!?/p>

▲CFP

“大模型的技術(shù)進(jìn)步并非線性發(fā)展,而是跳躍式、跨越式發(fā)展?!北本┤鸩纯毓桑瘓F(tuán))創(chuàng)始人乙壤月稱,OpenAI的每一次產(chǎn)品發(fā)布,都不是小幅度的改進(jìn),而是大膽的飛躍,足以震撼世界,這是一種“暴力美學(xué)”。

2024年4月16日,斯坦福大學(xué)以人為本人工智能研究所發(fā)布《2024年人工智能指數(shù)報(bào)告》,揭示了全球人工智能最新動(dòng)態(tài)。報(bào)告顯示,2023年,全球共發(fā)布149個(gè)通用大模型(大模型分通用大模型和垂類大模型,前者指具有廣泛適用性的大型生成式人工智能模型,可以表現(xiàn)出類似于人類智能的通用性和適應(yīng)性,后者是指針對(duì)特定行業(yè)或領(lǐng)域進(jìn)行訓(xùn)練的大模型),這一數(shù)量是2022年的兩倍有余。

在這輪生成式人工智能的競(jìng)賽中,中美處于世界第一梯隊(duì)。根據(jù)上述報(bào)告,2023年,美國(guó)共研發(fā)了61個(gè)通用大模型,中國(guó)緊隨其后,發(fā)布了15個(gè),法國(guó)、德國(guó)和加拿大分別為8個(gè)、4個(gè)和4個(gè)。這些數(shù)字從側(cè)面反映出不同國(guó)家在人工智能領(lǐng)域的整體科技實(shí)力、資金投入和人才培養(yǎng)情況。

其實(shí),中國(guó)早在2017年便開始發(fā)展人工智能產(chǎn)業(yè),其熱度在2019年達(dá)到頂峰,之后出現(xiàn)回落。當(dāng)時(shí),市場(chǎng)對(duì)其可能性提出質(zhì)疑。但當(dāng)生成式人工智能的浪潮席卷全球后,國(guó)內(nèi)發(fā)展熱情被迅速被點(diǎn)燃,科技巨頭、初創(chuàng)企業(yè)、研究院等紛紛躬身入局。2023年上半年,百度發(fā)布“文心一言”,商湯科技發(fā)布日日新,阿里巴巴發(fā)布通義千問,同年下半年,華為云推出盤古大模型3.0……各方力量爭(zhēng)奇斗艷,被形象地稱為“百模大戰(zhàn)”。

截至2024年4月2日,國(guó)家網(wǎng)信辦發(fā)布公告稱,目前已有117款生成式人工智能服務(wù)通過備案,其中北京51款、上海24款、廣東19款,大部分為垂類大模型。

在談到當(dāng)前市場(chǎng)格局時(shí),中國(guó)信通院華東分院人工智能事業(yè)部主任常永波給記者列舉了百度、阿里巴巴、字節(jié)跳動(dòng)、華為和騰訊等互聯(lián)網(wǎng)領(lǐng)軍企業(yè),“它們具有雄厚的技術(shù)積累和創(chuàng)新能力,研發(fā)的產(chǎn)品在行業(yè)中處于領(lǐng)先地位”。此外,他還特別指出,一批新興獨(dú)角獸企業(yè),如智譜AI、百川智能、月之暗面、MiniMax和零一萬(wàn)物等,成立時(shí)間雖短,但已憑借超過10億美元的融資規(guī)模和卓越的研發(fā)成果,在大模型領(lǐng)域嶄露頭角。

四大掣肘

當(dāng)前,中國(guó)大模型發(fā)展熱火朝天,但無(wú)法回避算力、數(shù)據(jù)、人才和資金方面我們存在的問題。

大模型算力的增強(qiáng)需要依賴強(qiáng)大的硬件支持,即高性能的AI芯片?!澳壳?,美國(guó)在算力方面擁有領(lǐng)先優(yōu)勢(shì),一些高性能芯片被禁止向中國(guó)大陸市場(chǎng)出售,因此,國(guó)內(nèi)算力被卡脖子,企業(yè)只能使用本土芯片?!睆V東民營(yíng)投資股份有限公司副總裁歐文志稱,“從中長(zhǎng)期發(fā)展來看,國(guó)產(chǎn)算力自主是大模型發(fā)展的核心,其底層是國(guó)產(chǎn)高端芯片產(chǎn)業(yè)鏈的發(fā)展,相信今年正式官宣的國(guó)家大基金三期會(huì)在這個(gè)方向重點(diǎn)投入?!?/p>

數(shù)據(jù)的質(zhì)量和數(shù)量對(duì)大模型優(yōu)化至關(guān)重要。現(xiàn)代大模型對(duì)數(shù)據(jù)的渴求已經(jīng)到了前所未有的高度,它們需要的數(shù)據(jù)量是過去的十倍甚至百倍。常永波強(qiáng)調(diào):“無(wú)論數(shù)據(jù)的數(shù)量還是質(zhì)量,都需要在特定行業(yè)或場(chǎng)景中進(jìn)行長(zhǎng)期積累。此外,還需要行業(yè)機(jī)構(gòu)愿意分享其擁有的數(shù)據(jù)。但由于目前數(shù)據(jù)流通環(huán)節(jié)不可控,導(dǎo)致很多數(shù)據(jù)擁有者不敢開放數(shù)據(jù)?!睂?duì)此,乙壤月也表示,雖然中國(guó)的數(shù)據(jù)總量超過美國(guó),但數(shù)據(jù)質(zhì)量不夠好,這對(duì)中國(guó)大模型的發(fā)展形成了一定掣肘。

大模型技術(shù)的爆發(fā)期與人才培養(yǎng)周期之間存在時(shí)間差,這導(dǎo)致具備高級(jí)人工智能素養(yǎng)和深入理解大模型技術(shù)路線的人才十分稀少。乙壤月說:“大模型火爆之前,國(guó)內(nèi)真正從事大模型的專業(yè)技術(shù)人員只有數(shù)百人,人才短缺并非中國(guó)獨(dú)有,全球范圍都面臨這個(gè)問題。甲方在尋找優(yōu)秀大模型人才時(shí),往往需要付出巨大的人力成本?!睋?jù)悉,一位具備專業(yè)技能的大模型技術(shù)人員,年薪也要100萬(wàn)元以上,技術(shù)負(fù)責(zé)人則接近千萬(wàn)元。

隨著大模型規(guī)模的擴(kuò)大,訓(xùn)練成本上升也成為不可避免的趨勢(shì)。據(jù)業(yè)內(nèi)估計(jì),大模型一次訓(xùn)練費(fèi)用可能高達(dá)數(shù)千萬(wàn)元,這無(wú)疑對(duì)企業(yè)的資金實(shí)力提出了嚴(yán)峻考驗(yàn)。在大模型企業(yè)的成本結(jié)構(gòu)中,算力成本通常約占總成本的六成。因此,大模型本質(zhì)上是一個(gè)需要巨額資本投入的領(lǐng)域。

眼下,大模型給中國(guó)帶來了一場(chǎng)資本盛宴,這條賽道在當(dāng)下國(guó)內(nèi)的股權(quán)投資市場(chǎng)屬于一股清流。歐文志稱,當(dāng)前,大模型是為數(shù)不多的、資本仍愿意投資的“高景氣、高虧損”賽道,類似于當(dāng)年的芯片、創(chuàng)新藥,背后代表著投資人對(duì)其發(fā)展前景的高度預(yù)期。“大模型產(chǎn)業(yè)發(fā)展如此之快,一時(shí)間涌現(xiàn)了這么多獨(dú)角獸企業(yè),競(jìng)爭(zhēng)如此激烈,背后正是資本對(duì)該賽道的快速押注。”

如今,對(duì)于很多大企業(yè)來說,AI或是一張續(xù)命的船票,或是企業(yè)變革的關(guān)鍵。以阿里巴巴為代表,該公司押注了國(guó)內(nèi)6家獨(dú)角獸中的5家,而騰訊擔(dān)心錯(cuò)失機(jī)會(huì),除投資光年之外、MiniMax、智譜AI和百川智能,自己也在研發(fā)大模型,投資與自研并行。

肉眼可見,對(duì)通用大模型的投資,資方緊盯著頭部的幾家企業(yè)。常永波也坦言:“通用大模型不是一般的初創(chuàng)企業(yè)、小型資本能玩得轉(zhuǎn)的,這讓一些創(chuàng)業(yè)企業(yè)面臨很大的資金壓力?!?/p>

另辟蹊徑

中國(guó)需求規(guī)模大、產(chǎn)業(yè)配套全、應(yīng)用場(chǎng)景多,業(yè)內(nèi)普遍認(rèn)為,垂類大模型是將來中國(guó)最具競(jìng)爭(zhēng)力的方向。譚寅亮稱:“人工智能要實(shí)現(xiàn)對(duì)生產(chǎn)力的提升,需要通過應(yīng)用,而應(yīng)用離不開數(shù)據(jù),中國(guó)的場(chǎng)景更豐富,場(chǎng)景帶來的不僅是產(chǎn)業(yè)的動(dòng)力,還有數(shù)據(jù)的多樣性?!?/p>

垂類大模型需要針對(duì)特定行業(yè)和場(chǎng)景進(jìn)行定制化和優(yōu)化。東方財(cái)富人工智能首席科學(xué)家劉志毅觀察到,越來越多的金融企業(yè)、醫(yī)院、律師在積極尋找與大模型的結(jié)合點(diǎn),“從這個(gè)角度看,我認(rèn)為中國(guó)在大模型方面的發(fā)展?jié)摿Ω蟆薄?/p>

劉志毅將大模型技術(shù)創(chuàng)新者的研究比喻成攀登珠穆朗瑪峰:“美國(guó)的技術(shù)創(chuàng)新者選擇了一條充滿挑戰(zhàn)的路線,即通用人工智能的研發(fā),這如同攀登珠峰的北坡,技術(shù)難度極高。他們追求的是技術(shù)極客的理想,致力于創(chuàng)造能與人類相媲美的人工智能。而中國(guó)的大部分創(chuàng)新者則選擇了南坡,在底層技術(shù)積累相對(duì)較少的情況下,走上一條更為務(wù)實(shí)的道路——產(chǎn)業(yè)智能化和應(yīng)用產(chǎn)品化。盡管南北坡路線不同,但最終都將到達(dá)一個(gè)頂峰,就是整個(gè)社會(huì)的智能化。就像《月亮與六便士》,我們追求的是‘六便士’,但并不妨礙我們欣賞‘月亮’?!?/p>

▲在上海召開的世界人工智能大會(huì)吸引了眾多參觀者 CFP

對(duì)此,他預(yù)言:“由于中國(guó)大模型與產(chǎn)業(yè)結(jié)合得更加緊密,未來5到10年,除了出現(xiàn)獨(dú)立的人工智能行業(yè)以外,還將出現(xiàn)與具體產(chǎn)業(yè)結(jié)合的智能化趨勢(shì),例如可能會(huì)涌現(xiàn)非常出色的智能金融產(chǎn)業(yè)、智能醫(yī)療產(chǎn)業(yè)、智能教育產(chǎn)業(yè)等?!彼J(rèn)為,這將是中國(guó)人工智能發(fā)展的一個(gè)顯著特點(diǎn)。

目前,中國(guó)還處在人工智能產(chǎn)業(yè)化階段,但再過幾年,常永波認(rèn)為,應(yīng)該會(huì)走向產(chǎn)業(yè)人工智能化,各行各業(yè)的產(chǎn)品、管理、服務(wù)都會(huì)深入運(yùn)用人工智能,全面融入人工智能,提升效率,進(jìn)行產(chǎn)業(yè)迭代升級(jí)。根據(jù)大模型之家的數(shù)據(jù),預(yù)計(jì)2028年,中國(guó)大模型市場(chǎng)規(guī)模將達(dá)到1179億元;2022年至2028年,復(fù)合增長(zhǎng)率約為60.11%。

構(gòu)建生態(tài)

毋庸置疑,中國(guó)大模型生態(tài)很卷。企業(yè)忙著卷新產(chǎn)品的研發(fā)、典型的應(yīng)用場(chǎng)景、落地的商業(yè)模式,誰(shuí)能突出重圍,推出一個(gè)可以形成示范效應(yīng)的殺手級(jí)應(yīng)用,誰(shuí)就能脫穎而出。

如今,從“卷”參數(shù)到“卷”價(jià)格,多家企業(yè)大模型應(yīng)用價(jià)格動(dòng)輒下調(diào)90%以上,有的甚至直接免費(fèi)??梢姡竽P捅绕匆呀?jīng)進(jìn)入白熱化階段?!按竽P褪褂贸杀窘档?,趨近于免費(fèi),是未來的趨勢(shì),隨之而來的是大模型快速普及?!币胰涝抡J(rèn)為,這給一些規(guī)模較小、實(shí)力較弱的大模型企業(yè)帶來了生存壓力。

在國(guó)內(nèi)“卷到極致”的發(fā)展趨勢(shì)下,常永波敏銳地觀察到了人工智能企業(yè)出海的現(xiàn)象。“一些企業(yè)家說,國(guó)內(nèi)大模型賽道太卷了,能夠在中國(guó)生存下來的企業(yè),如果走向東南亞、歐美等其他市場(chǎng),會(huì)顯現(xiàn)出強(qiáng)大的競(jìng)爭(zhēng)力?!?/p>

目前,美國(guó)眾議院正在推進(jìn)大模型出口限制法案,如果法案最終落地實(shí)施,譚寅亮認(rèn)為,將影響中國(guó)企業(yè)在美國(guó)開源的大模型上進(jìn)行二次開發(fā)?!耙虼?,中國(guó)必須加強(qiáng)大模型自主研發(fā)能力,確保人工智能系統(tǒng)研發(fā)的自主性。大模型本土化替代顯得尤為迫切?!彼ㄗh,行業(yè)領(lǐng)軍企業(yè)應(yīng)擔(dān)起重任,開發(fā)開源的通用模型。

隨著生成式人工智能的發(fā)展,其帶來的模型幻覺、數(shù)據(jù)安全、個(gè)人信息保護(hù)以及科技倫理等方面的風(fēng)險(xiǎn)和挑戰(zhàn)引發(fā)了全球關(guān)注,人工智能的全球治理正在被各國(guó)緊鑼密鼓地提上議程。

2023年10月,在第三屆“一帶一路”國(guó)際合作高峰論壇上,中國(guó)提出了《全球人工智能治理倡議》;同年11月,中國(guó)、美國(guó)、英國(guó)等28國(guó)和歐盟簽署了全球第一份針對(duì)人工智能的國(guó)際性聲明《布萊切利宣言》;2024年3月,聯(lián)合國(guó)大會(huì)通過了由美國(guó)牽頭提出的決議案《抓住安全、可靠和值得信賴的人工智能系統(tǒng)帶來的機(jī)遇,促進(jìn)可持續(xù)發(fā)展》;5月14日,中美人工智能政府間對(duì)話首次會(huì)議在瑞士日內(nèi)瓦舉行;5月21日,韓國(guó)和英國(guó)在首爾共同主辦了第二屆人工智能安全峰會(huì);同日,歐盟理事會(huì)正式批準(zhǔn)了全球首個(gè)用于人工智能領(lǐng)域監(jiān)管的法案《人工智能法案》,該法案不僅適用于所有歐盟境內(nèi)的人工智能使用者,還包括位于歐盟以外的人工智能設(shè)備供應(yīng)商。

可見,主要國(guó)家正致力于人工智能生態(tài)的打造,加強(qiáng)自身在國(guó)際舞臺(tái)上的話語(yǔ)權(quán)。畢竟,在人工智能這一關(guān)鍵技術(shù)領(lǐng)域,擁有話語(yǔ)權(quán)意味著能夠參與制定全球規(guī)則,引領(lǐng)技術(shù)發(fā)展方向,保護(hù)國(guó)家利益。

“人工智能這條路不僅需要技術(shù)本身的創(chuàng)新,還需要學(xué)者、企業(yè)、公眾、國(guó)家的共同努力,需要整個(gè)組織架構(gòu)、商業(yè)環(huán)境和文化生態(tài)的全面調(diào)整和創(chuàng)新。”譚寅亮說,“我們正處在人工智能的關(guān)鍵時(shí)刻,但這條路一定不會(huì)漫長(zhǎng)。”

編審|渠 洋

責(zé)編|白 馗

校對(duì)|張波 張雪慧

編輯:劉曉瑩