來源:人民日報海外版 發(fā)布時間:2023-12-25 9:56
近日,《聯(lián)合國氣候變化框架公約》第二十八次締約方大會(COP28)在阿聯(lián)酋迪拜舉行。大會期間,中國研究團(tuán)隊展示的人工智能氣候大模型引發(fā)廣泛關(guān)注。此款名為“伏羲”的大模型,對氣象進(jìn)行預(yù)報的時間范圍長、精度高。
當(dāng)前,中國國產(chǎn)大模型進(jìn)入高速發(fā)展期,千行百業(yè)加速擁抱大模型?萍疾啃乱淮斯ぶ悄馨l(fā)展研究中心發(fā)布的《中國人工智能大模型地圖研究報告》顯示,中國研發(fā)的大模型數(shù)量排名全球第二,涌現(xiàn)出一批具有行業(yè)影響力的預(yù)訓(xùn)練大模型。
工業(yè)和信息化部新聞發(fā)言人陶青表示:“以大模型為代表的人工智能發(fā)展呈現(xiàn)出技術(shù)創(chuàng)新快、應(yīng)用滲透強(qiáng)、國際競爭激烈等特點(diǎn),深刻改變制造業(yè)生產(chǎn)模式和經(jīng)濟(jì)形態(tài),展現(xiàn)出強(qiáng)大的賦能效應(yīng)!
垂直大模型密集“上新”
專家認(rèn)為,大模型的長期價值將通過行業(yè)應(yīng)用實現(xiàn)。隨著技術(shù)不斷迭代更新,大模型的應(yīng)用場景日益廣泛。
在北京經(jīng)濟(jì)技術(shù)開發(fā)區(qū)(北京亦莊),不少駕車的市民發(fā)現(xiàn),遇到紅燈的次數(shù)明顯變少了,經(jīng)常是“一路綠燈”。這背后,是全域信控與交通大模型在發(fā)揮作用。
據(jù)了解,北京亦莊聯(lián)手百度,將路側(cè)感知數(shù)據(jù)、互聯(lián)網(wǎng)數(shù)據(jù)等多源時空數(shù)據(jù)進(jìn)行融合。在此基礎(chǔ)上,利用交通大模型研判擁堵發(fā)生的可能性,疊加仿真推演,生成全域信控方案,并自動優(yōu)化信號燈配時方案,由“車看燈行”變?yōu)椤盁綦S車動”。據(jù)測算,北京亦莊布局全域信控后,路口的平均通過時間縮短28%。
從交通到文旅,從教育到醫(yī)療,近期,垂直領(lǐng)域的各類大模型密集“上新”。相較于通用大模型,垂直大模型具有更強(qiáng)的專業(yè)性,能夠更好地解決特定領(lǐng)域的問題和提供更加精準(zhǔn)的服務(wù)。
攜程集團(tuán)發(fā)布的旅游行業(yè)垂直大模型“攜程問道”,支持自然語言交互,可以輔助用戶進(jìn)行酒店、景點(diǎn)預(yù)定以及行程規(guī)劃決策等。
科大訊飛發(fā)布的“訊飛曉醫(yī)”APP,基于訊飛星火醫(yī)療大模型,可實現(xiàn)健康自查、體檢報告解讀、健康檔案管理等功能,為用戶提供健康咨詢。
南京農(nóng)業(yè)大學(xué)科研團(tuán)隊發(fā)布的古籍大語言模型,能夠?qū)崿F(xiàn)詞法分析、信息抽取、智能作詩等功能,有望應(yīng)用推廣到古籍整理、數(shù)字文娛等領(lǐng)域。
數(shù)據(jù)顯示,截至今年10月,中國擁有10億參數(shù)規(guī)模以上大模型的廠商及高校院所超過250家,垂直行業(yè)應(yīng)用成為大模型產(chǎn)業(yè)落地的關(guān)鍵賽道。上海財經(jīng)大學(xué)校長劉元春認(rèn)為,中國作為世界第二大經(jīng)濟(jì)體,擁有超大規(guī)模市場和數(shù)字資源優(yōu)勢,為大模型提供了更深入、更豐富的落地場景以及能夠持續(xù)訓(xùn)練的環(huán)境。
“當(dāng)前,大模型‘基礎(chǔ)設(shè)施—底層技術(shù)—基礎(chǔ)通用—垂直應(yīng)用’的發(fā)展路線逐漸清晰。”中國工程院院士、湘江實驗室主任陳曉紅表示,大模型技術(shù)與實體經(jīng)濟(jì)加速融合,應(yīng)用場景十分廣泛。
數(shù)據(jù)“燃料”加快共建共享
數(shù)據(jù)是大模型訓(xùn)練的“燃料”,數(shù)據(jù)質(zhì)量對大模型至關(guān)重要。國內(nèi)大模型快速發(fā)展對高質(zhì)量數(shù)據(jù)的迫切需求,推動中文語料數(shù)據(jù)資源加快共建共享。
今年7月,2023世界人工智能大會發(fā)起成立了中國大模型語料數(shù)據(jù)聯(lián)盟。8月,上海人工智能實驗室宣布,聯(lián)合中國大模型語料數(shù)據(jù)聯(lián)盟成員單位共同開源發(fā)布“書生·萬卷”1.0多模態(tài)預(yù)訓(xùn)練語料。本次開源的數(shù)據(jù)總量超過2TB,包含超5億個文本、2200萬個圖文交錯文檔、1000個影像視頻。
在11月舉行的2023人工智能計算大會上,智源研究院聯(lián)合阿里云、中科創(chuàng)達(dá)、螞蟻集團(tuán)等17家企業(yè)發(fā)布《“中文互聯(lián)網(wǎng)語料庫”共建共享倡議書》。
數(shù)據(jù)交易日益興起,為大模型獲取語料資源提供了新途徑!渡虾J型苿尤斯ぶ悄艽竽P蛣(chuàng)新發(fā)展若干措施(2023—2025年)》提出:“依托上海數(shù)據(jù)交易所建立語料數(shù)據(jù)交易板塊。”當(dāng)前,上海數(shù)據(jù)交易所掛牌的語料數(shù)據(jù)產(chǎn)品包含文本、音頻、圖像等多模態(tài),覆蓋金融、交通、醫(yī)療等領(lǐng)域。上海數(shù)據(jù)交易所總經(jīng)理湯奇峰表示:“語料庫采購已經(jīng)在不少大模型企業(yè)成本中占據(jù)重要比重,上海數(shù)交所希望以市場配置的方式組織數(shù)據(jù)要素、推動語料庫建設(shè)!
建設(shè)智算中心增加算力供給
大模型進(jìn)行訓(xùn)練和推理時,對算力的需求量巨大。算力是大模型的底座。算力通常分為通用算力、智能算力和超算算力,大模型需要的是智能算力。如何破解智能算力緊缺問題,成為大模型發(fā)展路上的必答題。
電信運(yùn)營商、互聯(lián)網(wǎng)企業(yè)等積極投入智算中心建設(shè)之中。去年至今,重慶移動智算中心、阿里云張北超級智算中心等陸續(xù)投入運(yùn)營。今年以來,中國聯(lián)通長三角(蕪湖)智算中心、河北石家莊智算中心等相繼啟動建設(shè)。
當(dāng)前,各地加速推動算力基礎(chǔ)設(shè)施建設(shè),提升算力供給能力!侗本┦写龠M(jìn)通用人工智能創(chuàng)新發(fā)展的若干措施》提出,加快推動海淀區(qū)、朝陽區(qū)建設(shè)北京人工智能公共算力中心、北京數(shù)字經(jīng)濟(jì)算力中心,形成規(guī);冗M(jìn)算力供給能力,支撐千億級參數(shù)量的大型語言模型、大型視覺模型、多模態(tài)大模型、科學(xué)計算大模型、大規(guī)模精細(xì)神經(jīng)網(wǎng)絡(luò)模擬仿真模型、腦啟發(fā)神經(jīng)網(wǎng)絡(luò)等研發(fā)!逗幽鲜≈卮笮滦突A(chǔ)設(shè)施建設(shè)提速行動方案(2023—2025年)》提出,實施高性能算力提升工程,加快建設(shè)鄭州、洛陽等全棧國產(chǎn)化智能計算中心,構(gòu)建中原智能算力網(wǎng)。
在“東數(shù)西算”戰(zhàn)略背景下,西部智算中心建設(shè)迎來發(fā)展機(jī)遇期。11月30日,青藏高原第一座智算中心——青海昆侖人工智能算力中心正式揭牌,依托三江源國家大數(shù)據(jù)基地,實現(xiàn)算力資源的托管運(yùn)營。12月7日,寧夏回族自治區(qū)首個大規(guī)模集群智算中心建設(shè)項目簽約,該中心以國產(chǎn)全功能GPU為底座,為大模型訓(xùn)練與推理、3D圖形渲染等提供算力支撐。
今年10月,工業(yè)和信息化部等6部門印發(fā)《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計劃》,提出到2025年,算力規(guī)模超過300EFLOPS(EFLOPS是指每秒百億億次浮點(diǎn)運(yùn)算次數(shù)),智能算力占比達(dá)到35%。京津冀、長三角、粵港澳大灣區(qū)、成渝等節(jié)點(diǎn)面向重大區(qū)域發(fā)展戰(zhàn)略實施需要,有序建設(shè)算力設(shè)施;貴州、內(nèi)蒙古、甘肅、寧夏等節(jié)點(diǎn)推進(jìn)數(shù)據(jù)中心集群建設(shè)的同時,著力提升算力設(shè)施利用效率,促進(jìn)東西部高效互補(bǔ)和協(xié)同聯(lián)動。
“算力尤其是智能算力已經(jīng)成為驅(qū)動大模型進(jìn)化的核心引擎。智算力就是創(chuàng)新力,已經(jīng)成為產(chǎn)業(yè)共識!崩顺毙畔⒍麻L彭震表示,應(yīng)大力發(fā)展普適普惠的智算中心,使智能算力成為城市的公共基礎(chǔ)資源,用戶可以選擇自建算力集群,也可以采用智算中心提供的算力服務(wù)來完成大模型開發(fā)。