久久国产精品98,色综合国产精品视频,国产亚洲成AⅤ人片在线奶水,久久伊人中文字幕

<small id="uehxv"></small>

<td id="uehxv"></td>

<small id="uehxv"></small>

<pre id="8sfnd"></pre>

<th id="8sfnd"></th>

<pre id="8sfnd"></pre>

中國電商物流網(wǎng)-電子商務(wù)與物流行業(yè)融合媒體！電子商務(wù)物流行業(yè)門戶網(wǎng)站！

快遞網(wǎng)點(diǎn) 郵編查詢行政區(qū)劃高鐵時刻高鐵票價高鐵車次免費(fèi)注冊登錄

中國電商物流網(wǎng) > 資訊中心 > 電商零售 > 內(nèi)容

“技術(shù)升級+一站構(gòu)建”助大模型降本增效

來源：科技日報發(fā)布時間：2023-12-4 9:34

　　◎本報記者羅云鵬

　　如何在算力緊缺的背景下提升大模型訓(xùn)練和推理的效率，并降低成本？這已成為一眾大模型企業(yè)不得不面對的難題之一。

　　日前，騰訊披露，騰訊混元大模型背后的自研機(jī)器學(xué)習(xí)框架Angel再次升級�！白匝袡C(jī)器學(xué)習(xí)框架升級后，騰訊大模型訓(xùn)練效率可提升至主流開源框架的2.6倍，用該框架訓(xùn)練千億級大模型可節(jié)省50%算力成本，大模型推理速度提高了1.3倍。”11月30日，騰訊機(jī)器學(xué)習(xí)平臺部總監(jiān)陶陽宇向科技日報記者表示。

　　不只是騰訊，在提升大模型訓(xùn)練效率、加速大模型落地應(yīng)用方面，一批中國企業(yè)交出了自己的“答卷”。

　　雙管齊下節(jié)約算力成本

　　在大型模型訓(xùn)練和推理過程中，需要消耗大量算力資源。因此，提高硬件資源利用率，對國產(chǎn)大模型技術(shù)的發(fā)展至關(guān)重要。

　　陶陽宇介紹，面向大模型訓(xùn)練，騰訊自研了機(jī)器學(xué)習(xí)框架Angel。該框架針對預(yù)訓(xùn)練、模型精調(diào)和強(qiáng)化學(xué)習(xí)等全流程進(jìn)行了加速和優(yōu)化。據(jù)悉，它采用FP8混合精度訓(xùn)練技術(shù)，并深度優(yōu)化了4D混合并行訓(xùn)練策略，還在ZeROCache技術(shù)基礎(chǔ)上減少了冗余模型存儲和內(nèi)存碎片，提升了內(nèi)存的利用率。同時，該框架還可兼容適配多款國產(chǎn)化硬件。

　　而據(jù)媒體披露，除了提高硬件資源利用率，針對通信策略、AI框架、模型編譯等進(jìn)行系統(tǒng)級優(yōu)化，亦可大幅節(jié)約訓(xùn)練調(diào)優(yōu)和算力成本。

　　此外，隨著模型參數(shù)的增大，大模型推理的成本也隨之攀升。陶陽宇介紹，騰訊自研的大模型機(jī)器學(xué)習(xí)框架Angel通過擴(kuò)展并行、向量數(shù)據(jù)庫、批處理等多種優(yōu)化手段，提高了吞吐能力，達(dá)到了更快的推理性能，降低了成本。

　　不只是騰訊，在第二十屆中國計算機(jī)大會上，百度首席技術(shù)官王海峰就公開透露，文心大模型4.0從今年3月發(fā)布至今，其訓(xùn)練算法效率已提升3.6倍；通過百度飛槳與文心大模型的協(xié)同優(yōu)化，文心大模型周均訓(xùn)練有效率超過98%，推理性能提升50倍。

　　此外，據(jù)公開資料顯示，阿里云通義大模型則聚焦于規(guī)模定理，基于小模型數(shù)據(jù)分布、規(guī)則和配比，研究大規(guī)模參數(shù)規(guī)模下如何提升模型能力，并通過對底層集群的優(yōu)化，將模型訓(xùn)練效率提升了30%，訓(xùn)練穩(wěn)定性提升了15%。

　　讓大模型“開箱即用”成為可能

　　不難看出，調(diào)整和優(yōu)化模型的訓(xùn)練和推理方式，其最終目的都指向使模型更好地適應(yīng)實(shí)際應(yīng)用場景、降低在終端應(yīng)用中的額外成本�！按竽Ｐ偷膽�(yīng)用和研發(fā)同樣重要�！彬v訊機(jī)器學(xué)習(xí)平臺專家工程師姚軍說，只有提供方便、強(qiáng)大的接入平臺，才能讓大模型真正走向應(yīng)用。

　　百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏也曾表示，大模型本身是不直接產(chǎn)生價值的，基于大模型開發(fā)出來的應(yīng)用才是大模型存在的意義。然而，很多大模型落地的難度很大，因?yàn)橐粋€大模型往往會對應(yīng)著很多不同種類的應(yīng)用，這需要大量的接口和流量支持。

　　如何破解這道難題？據(jù)悉，基于自研機(jī)器學(xué)習(xí)框架Angel，騰訊打造了大模型接入和應(yīng)用開發(fā)的一站式平臺，讓針對業(yè)務(wù)場景的數(shù)據(jù)處理、模型微調(diào)、評測部署和應(yīng)用構(gòu)建等多個環(huán)節(jié)，從以往“散裝”的多團(tuán)隊(duì)協(xié)作方式，轉(zhuǎn)化成流水線平臺上自動化生產(chǎn)方式，讓大模型的“開箱即用”成為可能�！伴_箱即用”的關(guān)鍵在于預(yù)訓(xùn)練基礎(chǔ)模型的泛化能力，高性能框架提供的微調(diào)或擴(kuò)展工程能力，以及應(yīng)用平臺的靈活構(gòu)建能力等支撐。據(jù)媒體披露，目前騰訊會議、騰訊新聞、騰訊視頻等超過300個騰訊產(chǎn)品及場景均已接入騰訊混元大模型進(jìn)行內(nèi)測，數(shù)量相比10月份翻了一倍，覆蓋文本總結(jié)、摘要、創(chuàng)作、翻譯、代碼等多個場景。比如，騰訊混元大模型就可支持智能化的廣告素材創(chuàng)作，滿足“千人千面”的需求。

　　《北京市人工智能行業(yè)大模型創(chuàng)新應(yīng)用白皮書（2023年）》數(shù)據(jù)顯示，截至2023年10月，我國10億參數(shù)規(guī)模以上的大模型廠商及高校院所共計254家，分布于20余個省市/地區(qū)。

　　“未來大模型產(chǎn)品的發(fā)展趨勢可能是通用大模型與垂直領(lǐng)域細(xì)分模型的結(jié)合�！敝袊嗣翊髮W(xué)數(shù)字經(jīng)濟(jì)研究中心主任李三希此前表示，這不僅需要具備堅實(shí)的技術(shù)基礎(chǔ)，如大規(guī)模、高質(zhì)量、多樣化的語料庫，創(chuàng)新的大模型算法，自研的機(jī)器學(xué)習(xí)框架和強(qiáng)大的算力基礎(chǔ)設(shè)施等，也需要大模型產(chǎn)品具有堅實(shí)的基于場景的應(yīng)用。未來，從實(shí)踐中來，到實(shí)踐中去的“實(shí)用級”大模型將成為趨勢。

上一篇：數(shù)智時代呼喚新的教育治理體系

下一篇：開源助推AI技術(shù)落地

相關(guān)資訊

圖文資訊

頭條資訊

價值重塑，煥新而來！時代汽車全新FORLAND車標(biāo)量產(chǎn)車型即將上市

價值重塑，煥新而來！時代汽車全新FORLAND車標(biāo)量產(chǎn)車型即將上市

天貓“千星計劃”再升級，助力潛力商家618爆發(fā)增長

天貓“千星計劃”再升級，助力潛力商家618爆發(fā)增長

無界·護(hù)航——2025年第三屆貨車司機(jī)關(guān)愛日公益行動圓滿舉辦

無界·護(hù)航——2025年第三屆貨車司機(jī)關(guān)愛日公益行動圓滿舉辦

熱門資訊

五一假期在即，準(zhǔn)備好和楊紫一起全國巡吃了嗎？
2025-4-30
2025國內(nèi)物流品牌深度觀察：跨越速運(yùn)以全能模式引領(lǐng)行業(yè)新潮
2025-4-27
跨越速運(yùn)以全方位員工關(guān)懷，構(gòu)筑行業(yè)人才培育生態(tài)
2025-4-27
任小姐出海戰(zhàn)略咨詢：如何抓住亞馬遜Cosmo算法紅利？
2025-4-27
山海無阻同頻共振｜山特×順豐：以智慧解鎖物流新速度
2025-4-25

最新資訊

Copyright © 2012-2025 sd56.net.cn All Rights Reserved 中國電商物流網(wǎng) 版權(quán)所有

<pre id="mwgly"></pre>

<center id="mwgly"></center>