來源:億歐網(wǎng) 發(fā)布時間:2018-9-25 8:47
從2009年2月飛天寫下第一行代碼,如今這套阿里云的核心操作系統(tǒng)已經(jīng)走過9年的發(fā)展歷程。在9月19日舉行的云棲大會開幕會上,身穿飛天第一行代碼文化衫的阿里云產(chǎn)品總監(jiān)何云飛信步上臺,向外界宣布阿里云有史以來最大規(guī)模的技術(shù)升級——飛天系統(tǒng)2.0上線。
飛天2.0是一套面向未來萬物智能時代的云操作系統(tǒng),不僅可滿足百億級設(shè)備的計算需求,而且可實現(xiàn)1EB數(shù)據(jù)存儲以及支持IPv6等重大更新,更大的變革來源于飛天2.0是對未來物理世界與數(shù)字世界必將融合的判斷,從而推出的分布式云管端融合的解決方案。
何云飛提到“飛天1.0”和“2.0版本”最大的區(qū)別,是飛天1.0擁有大規(guī)模數(shù)據(jù)中心調(diào)度能力,但是今天2.0的發(fā)展來自于業(yè)務(wù)更多的需求,更強調(diào)面向物聯(lián)網(wǎng)時代的分布式計算。“飛天2.0支撐了阿里云遍布全球的基礎(chǔ)設(shè)施,針對億萬個端進(jìn)行廣泛適配,可覆蓋最后一公里的計算。計算是心臟,AI是大腦,IoT是神經(jīng)網(wǎng)絡(luò),這是我們對萬物智能時代的構(gòu)想,也是飛天2.0的設(shè)計理念。”
在發(fā)布會上,阿里巴巴集團副總裁周明提到今天的阿里云已經(jīng)能夠提供18個區(qū)域、49個可用區(qū)、200個以上的數(shù)據(jù)中心服務(wù)客戶。并建設(shè)了全球骨干網(wǎng)連接全球的數(shù)據(jù)中心,它還接入了上百個海外的POP以及1500多家運營商。龐大的規(guī)模也在督促阿里云保持創(chuàng)新進(jìn)步,以更好得滿足客戶需求。
這次飛天2.0系統(tǒng)就是阿里云多年創(chuàng)新的一次集中亮相,阿里云創(chuàng)始員工、阿里云技術(shù)研發(fā)總經(jīng)理蔣江偉向大家介紹了阿里云新版本在計算、存儲、網(wǎng)絡(luò)、安全四大方面的進(jìn)步,并介紹了阿里云在物聯(lián)網(wǎng)、AI、專有云等層面的發(fā)展:
百億級計算解決方案:
在計算層面已經(jīng)實現(xiàn)秒級啟動ECI、彈性計算(ESC)、異構(gòu)計算(FPGA )、高性能計算(E-HPC)等多種計算方式,同時實現(xiàn)了更彈性的部署方案,能夠在10分鐘內(nèi)啟動10000臺服務(wù)器。神龍云服務(wù)器架構(gòu)實現(xiàn)了虛擬機和物理機的融合。“計算進(jìn)入可隨意配置的時代,一行代碼即可啟動。”
10倍性能存儲產(chǎn)品:
存儲方面阿里巴巴自研了SSD——AliFlash,目前AliFlash已經(jīng)發(fā)布三個版本。阿里云為此定制了一款SSD控制芯片,這個芯片支持了阿里巴巴Open Channel協(xié)議,這個協(xié)議可以讓本地軟件存儲引擎對SSD直接進(jìn)行讀寫等操作,可將整個傳輸延遲降低10倍,并且讀寫速度放大5倍。
加上阿里云另一款本地的存儲引擎——Fusionengie引擎,再配上低延時的RDMA網(wǎng)絡(luò),阿里云形成了從底層芯片到部件、到本地的規(guī)模分布式傳輸?shù)牡脱訒r能力,促進(jìn)上層整個性能放大。比如說本地盤通過這樣的結(jié)合,能力提高了50%;對于上層的云產(chǎn)品比如ESSD,可以放大到5倍的性能提升。
規(guī);脱訒r網(wǎng)絡(luò):
目前已經(jīng)在阿里巴巴規(guī)模部署了雙25G、雙100G到服務(wù)器的網(wǎng)絡(luò),同時也在研發(fā)400G的網(wǎng)絡(luò)。在低延時方面,阿里通過對RDMA協(xié)議的支持,通過對運維管理的研發(fā)、流量控制、運算算法的研發(fā),成功部署了規(guī);牡脱訒r網(wǎng)絡(luò)。
另外發(fā)布新一代的vswitch虛擬網(wǎng)絡(luò),性能提升58倍。同時飛天2.0支持IPv6,海量地址幫助企業(yè)解決邊緣設(shè)備接入難題。
AI推動阿里云智能化
阿里云正在推動AI芯片AliNPU的研發(fā)。除此以外,阿里云還根據(jù)FPGA非常靈活的特點進(jìn)行了研發(fā)。阿里云通過軟硬件結(jié)合,設(shè)計了全棧的系統(tǒng);針對神經(jīng)網(wǎng)絡(luò)CNN inference吞吐能力與GPU相比不足,阿里云的硬件架構(gòu)師和算法工程師進(jìn)行了一體化設(shè)計,尤其是針對具體的架構(gòu)進(jìn)行了針對性的算法設(shè)計,然后再加上低精度、稀疏化,讓整個性能得到顯著提升。
DC大腦的智能運營化系統(tǒng)也在云棲大會亮相。這套系統(tǒng)通過阿里云的數(shù)據(jù)、算法、模型,可以在供應(yīng)鏈領(lǐng)域、服務(wù)器、網(wǎng)絡(luò)、數(shù)據(jù)中心及應(yīng)用運維領(lǐng)域、故障排查領(lǐng)域應(yīng)用,不斷地進(jìn)行優(yōu)化提升運營水平。
全面布局邊緣計算和物聯(lián)網(wǎng):
為布局物聯(lián)網(wǎng)時代,阿里云在芯片、聯(lián)網(wǎng)、管理平臺三個層面進(jìn)行了布局。發(fā)布的低功耗LoRa芯片,具有小尺寸、低功耗、超低啟動電流的特點。阿里云對發(fā)布的另一款聯(lián)網(wǎng)產(chǎn)品——天空物聯(lián)網(wǎng)寄予厚望,“現(xiàn)在每個人都通過WiFi上網(wǎng),未來每個企業(yè)都通過天空物聯(lián)網(wǎng)聯(lián)網(wǎng)”。LoRa與飛艇和無人機結(jié)合可布設(shè)高機動性大網(wǎng),物聯(lián)網(wǎng)絡(luò)管理平臺管理百萬臺以上的網(wǎng)關(guān)、億級以上的終端。阿里云希望推動物聯(lián)網(wǎng)時代盡快來臨。
邊緣計算也是促進(jìn)物聯(lián)網(wǎng)時代來臨的重要推動力,這方面阿里云發(fā)布了邊緣節(jié)點服務(wù)ENS,可實現(xiàn)分鐘級創(chuàng)建,節(jié)省30%帶寬。Link IoT Edge在智能設(shè)備上部署邊緣計算,使得萬物智聯(lián)。
把公有云“抱回家”的阿里專有云:
阿里云專有云是阿里云一種部署模式,它和阿里云公有云是一樣的架構(gòu)。很多大企業(yè)希望把公有云的能力完整部署在自己的數(shù)據(jù)中心,這便是阿里專有云的模式。
這次云棲大會上,阿里專有云帶來一種新的收費模式。過去阿里專有云是購買服務(wù)模式,現(xiàn)在可以通過License模式使用阿里專有云,新的模式可以通過訂閱使用,這樣做可以更加靈活,初期的投資更低,整體擁有成本也會降低。
會后阿里云技術(shù)研發(fā)總經(jīng)理蔣江偉、阿里云產(chǎn)品總監(jiān)何云飛、阿里云專有云事業(yè)部總經(jīng)理三位接受了包括億歐在內(nèi)的多家媒體專訪:
Q:飛天2.0相比飛天1.0有哪些跨越,飛天2.0賦予阿里云過去沒有的哪些能力?
何云飛:飛天1.0和2.0最大的區(qū)別,是飛天1.0擁有面向全球的大規(guī)模調(diào)度能力,能夠?qū)⑷驍?shù)據(jù)中心都調(diào)動起來。但是飛天2.0更多需求發(fā)展來自于業(yè)務(wù)。我們看到原來的計算都要集中計算,未來的計算是分布式計算,我們不希望把數(shù)據(jù)拖來拖去計算,我們希望計算就直接發(fā)生在更靠近數(shù)據(jù)產(chǎn)生的地方,這樣數(shù)據(jù)計算效率更高,實施性更高,體驗更好。所以飛天系統(tǒng)在往客戶端推進(jìn),面向未來海量的互聯(lián)網(wǎng)設(shè)備,飛天可以延伸到每一個計算的地方,這是飛天2.0最本質(zhì)的區(qū)別。
我舉一個例子,比如說現(xiàn)在視頻數(shù)據(jù)計算要傳到云端計算完,然后再回到客戶那邊觀看,造成延時非常大的。那我能不能在靠近數(shù)據(jù)視頻產(chǎn)生那一端,直接把這個數(shù)據(jù)計算上傳。未來廣電行業(yè)的視頻數(shù)據(jù)處理量非常大,利用分布式的云端處理成本將更低,這是一個非常好的可能。
蔣江偉:我從產(chǎn)品層面介紹下,飛天是一個持續(xù)迭代的產(chǎn)品,就像安卓迭代產(chǎn)品一樣。包括神龍?zhí)幚砥黢R上推出1.5版本,神龍是一個底層架構(gòu),會外化出來很多產(chǎn)品,比如說發(fā)布會上提到的超算。其他的儲如洛神2.0版本、盤古2.0版本等產(chǎn)品的各方面指標(biāo)都會更好,性價比更高。所以這里面需要我們工程師越來越多去掌控整個軟硬件。飛天1.0時代基本上以軟件為主,到2.0軟硬件都要結(jié)合起來深度定制,這也是飛天2.0版本的重要變化。
Q:飛天從9年前發(fā)展到現(xiàn)在的規(guī)模,什么原因促成阿里云的成功?
蔣江偉:第一個關(guān)鍵點,還是馬云、王堅博士這樣有理想、有堅持的人,他們始終認(rèn)為這個方向是正確的。像我是因為看見了就相信了,剛開始我也不相信的。包括阿里巴巴眾多技術(shù)、產(chǎn)品人才,也跟阿里云原來那批一起“看見的人”,一起沉淀出了飛天的整個技術(shù)。
第二個是由于阿里巴巴集團本身的業(yè)務(wù)非常廣,很多業(yè)務(wù)線都能夠幫助試錯。阿里云現(xiàn)在的總裁胡曉明就是阿里云第一個客戶,胡總當(dāng)時是阿里金融CEO,經(jīng)常把我們飛天工程師抓到他們的辦公室,給他們修bug,改不好就別想回去,飛天就是這么一個過程走過來的。
另外規(guī)模效應(yīng)也造就了阿里云產(chǎn)品的技術(shù)紅利。因為阿里云的每一行代碼都是細(xì)細(xì)推敲的,它的代碼都是金子、都是鉆石。我們用最好的工程師去摳每一行代碼,由于阿里云平臺的放大器作用,使得寫的每一行代碼被放大到幾百萬客戶的使用,這就是價值。
Q:今天看到阿里云公布了很多前沿布局產(chǎn)品,比如超算、深度學(xué)習(xí)平臺、物聯(lián)網(wǎng)等,另一方面也看到阿里云正在深入工業(yè)、農(nóng)業(yè)等傳統(tǒng)產(chǎn)業(yè)。阿里云如何獲得市場需求?以及如何平衡技術(shù)與市場驅(qū)動產(chǎn)品發(fā)展?
何云飛:做云計算平臺是一個技術(shù)活,但是你會發(fā)現(xiàn),我們寫算法的工程師,高級科學(xué)家,工作在客戶的廠房里,需求就是在那里產(chǎn)生,需求是同時被挖掘出來的。今天阿里發(fā)布了很多智能時代產(chǎn)品,但正如AI產(chǎn)品負(fù)責(zé)人在臺上提到,我們的AI不一樣的地方在于比較“冷”,阿里云將AI通用的能力,通過API低成本、低門檻的分享給客戶;面向產(chǎn)業(yè)的AI是真正走進(jìn)行業(yè),幫助企業(yè)走出去看到業(yè)務(wù)的機會,這是非常關(guān)鍵的。
Q:邊緣計算正在實現(xiàn)云和端的融合,阿里云如何定義未來的計算服務(wù)形態(tài)?
何云飛:未來的計算一定是從端開始,一部分計算到端上,另一部分是數(shù)據(jù)上來之后到邊緣網(wǎng)關(guān)發(fā)生計算,然后再到云端發(fā)生計算。這里根據(jù)不同業(yè)務(wù)場景的需要,每個點完成計算的量是不一樣的。但是它一定是一個大網(wǎng),把云、端以及端跟大數(shù)據(jù)中心中間還會有一個類似于中心點的這三個點,通過網(wǎng)絡(luò)傳輸連成一張大網(wǎng),來滿足企業(yè)不同的業(yè)務(wù)需求。所以計算這個概念是什么?就像互聯(lián)網(wǎng)是什么,很難梳理出一個邊界。但是在這里看,它的每一次拓展都是在離客戶的需求更近。
Q:阿里專有云新版本升級以后,針對客戶的需求做了哪些部署?
馬勁:阿里專有云的能力是來自阿里云的公有云,同樣的架構(gòu)但是部署的模式不同。其實對于升級這件事情,客戶的需求很簡單:一個是升級過程當(dāng)中業(yè)務(wù)不要中斷,第二個是升級了之后版本之間要兼容。阿里專有云是從V3這個版本開始支持熱升級(V3的熱升級我們叫柔性升級),所有的升級都是不中斷業(yè)務(wù)的。因為我們現(xiàn)在專有云已經(jīng)有多達(dá)60個產(chǎn)品,所有的產(chǎn)品升級,他有很多的依賴關(guān)系,包括和專有云的底座。我們可以做到某一個模塊升級,然后對其他的所有的應(yīng)用都不影響,我們可以單獨的時間升單獨的模塊。