久久国产精品98,色综合国产精品视频,国产亚洲成AⅤ人片在线奶水,久久伊人中文字幕

<small id="uehxv"></small>
    <td id="uehxv"></td>

      <small id="uehxv"></small>

    1. 中國電商物流網(wǎng)-電子商務(wù)與物流行業(yè)融合媒體!電子商務(wù)物流行業(yè)門戶網(wǎng)站!
      快遞網(wǎng)點(diǎn) 郵編查詢 行政區(qū)劃 高鐵時(shí)刻 高鐵票價(jià) 高鐵車次
      貿(mào)易資訊
      免費(fèi)注冊(cè) 登錄
      中國電商物流網(wǎng)
      企 業(yè)
      產(chǎn) 品
      商 務(wù)

      百川智能發(fā)布Baichuan 2 大模型開源生態(tài)更加繁榮

      來源:中國經(jīng)濟(jì)網(wǎng)  發(fā)布時(shí)間:2023-9-11 9:30

        中國經(jīng)濟(jì)網(wǎng)北京9月7日訊 (記者 劉芃)昨日,在北京市科學(xué)技術(shù)委員會(huì)、中關(guān)村科技園區(qū)管理委員會(huì)、北京市海淀區(qū)政府的指導(dǎo)下,百川智能召開主題為“百川匯海,開源共贏”的大模型發(fā)布會(huì)。會(huì)上,百川智能宣布正式開源微調(diào)后的Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat與其4bit量化版本,并且均為免費(fèi)可商用。

      中科院院士張鈸親臨現(xiàn)場(chǎng)并發(fā)表致辭

        百川智能此次還開源了模型訓(xùn)練的Check Point,并宣布將發(fā)布 Baichuan 2技術(shù)報(bào)告,詳細(xì)介紹Baichuan 2的訓(xùn)練細(xì)節(jié),幫助大模型學(xué)術(shù)機(jī)構(gòu)、開發(fā)者和企業(yè)用戶更深入的了解其訓(xùn)練過程,更好地推動(dòng)大模型學(xué)術(shù)研究和社區(qū)的技術(shù)發(fā)展。

         文理兼?zhèn),性能大幅?yōu)于同尺寸模型

        Baichuan2-7B-Base 和 Baichuan2-13B-Base,均基于 2.6萬億高質(zhì)量多語言數(shù)據(jù)進(jìn)行訓(xùn)練,在保留了上一代開源模型良好的生成與創(chuàng)作能力,流暢的多輪對(duì)話能力以及部署門檻較低等眾多特性的基礎(chǔ)上,兩個(gè)模型在數(shù)學(xué)、代碼、安全、邏輯推理、語義理解等能力有顯著提升。其中Baichuan2-13B-Base相比上一代13B模型,數(shù)學(xué)能力提升49%,代碼能力提升46%,安全能力提升37%,邏輯推理能力提升25%,語義理解能力提升15%。

        本次開源的兩個(gè)模型在各大評(píng)測(cè)榜單上的表現(xiàn)優(yōu)秀,相比其他同等參數(shù)量大模型,表現(xiàn)亮眼,性能大幅度優(yōu)于LLaMA2等同尺寸模型競品。

        更值得一提的是,根據(jù)MMLU等多個(gè)權(quán)威英文評(píng)估基準(zhǔn)評(píng)分 Baichuan2-7B以70億的參數(shù)在英文主流任務(wù)上與130億參數(shù)量的LLaMA2持平。

        Baichuan2-7B和Baichuan2-13B不僅對(duì)學(xué)術(shù)研究完全開放,開發(fā)者也僅需郵件申請(qǐng)獲得官方商用許可后,即可以免費(fèi)商用。

        國內(nèi)首創(chuàng)全程開源模型訓(xùn)練Check Point,助力學(xué)術(shù)研究

        大模型訓(xùn)練包含海量高質(zhì)量數(shù)據(jù)獲取、大規(guī)模訓(xùn)練集群穩(wěn)定訓(xùn)練、模型算法調(diào)優(yōu)等多個(gè)環(huán)節(jié)。每個(gè)環(huán)節(jié)都需要大量人才、算力等資源的投入,從零到一完整訓(xùn)練一個(gè)模型的高昂成本,阻礙了學(xué)術(shù)界對(duì)大模型訓(xùn)練的深入研究。

        百川智能本次開源了模型訓(xùn)練從220B到2640B全過程的 Check Ponit。這對(duì)于科研機(jī)構(gòu)研究大模型訓(xùn)練過程、模型繼續(xù)訓(xùn)練和模型的價(jià)值觀對(duì)齊等極具價(jià)值,將極大推動(dòng)國內(nèi)大模型的科研進(jìn)展,開源訓(xùn)練模型過程對(duì)國內(nèi)開源生態(tài)尚屬首次。

        技術(shù)報(bào)告揭示訓(xùn)練細(xì)節(jié),繁榮開源生態(tài)

        為幫助從業(yè)者深入了解Baichuan 2的訓(xùn)練過程和相關(guān)經(jīng)驗(yàn),更好地推動(dòng)大模型社區(qū)的技術(shù)發(fā)展。百川智能在發(fā)布會(huì)上宣布,公開Baichuan 2的技術(shù)報(bào)告。技術(shù)報(bào)告將詳細(xì)介紹Baichuan 2 訓(xùn)練的全過程,包括數(shù)據(jù)處理、模型結(jié)構(gòu)優(yōu)化、Scaling law、過程指標(biāo)等。

        百川智能自成立之初,在不到四個(gè)月的時(shí)間內(nèi)相繼發(fā)布了Baichuan-7B、Baichuan-13B兩款開源免費(fèi)可商用的中文大模型,以及一款搜索增強(qiáng)大模型Baichuan-53B,兩款開源大模型在多個(gè)權(quán)威評(píng)測(cè)榜單均名列前茅,目前下載量超過500萬次。

        不僅如此,在今年創(chuàng)立的大模型公司中,百川智能是唯一一家通過《生成式人工智能服務(wù)管理暫行辦法》備案,可以正式面向公眾提供服務(wù)的企業(yè)。憑借行業(yè)領(lǐng)先的基礎(chǔ)大模型研發(fā)和創(chuàng)新能力,此次開源的兩款Baichuan 2大模型,得到了上下游企業(yè)的積極響應(yīng),騰訊云、阿里云、火山方舟、華為、聯(lián)發(fā)科等眾多知名企業(yè)均參加了本次發(fā)布會(huì)并與百川智能達(dá)成了合作。

        未來,百川智能將在開源大模型領(lǐng)域持續(xù)深耕,將更多的技術(shù)能力、前沿創(chuàng)新開放出來,與更多的合作伙伴們共同助力中國大模型生態(tài)蓬勃發(fā)展。

      Copyright © 2012-2025 sd56.net.cn All Rights Reserved 中國電商物流網(wǎng) 版權(quán)所有