來源:中國電商物流網(wǎng) 發(fā)布時間:2019-11-7 9:4
上周,當(dāng)全球最大的存儲芯片制造商之一美光科技(Micron Technology)收購人工智能硬件和軟件初創(chuàng)公司Fwdnxt時,我一直在關(guān)注此事。
此舉可能會非常有趣,如果成功的話,F(xiàn)wdnxt可能會讓美光與英特爾和英偉達(dá)等合作伙伴展開直接競爭,因為美光相信,內(nèi)存和人工智能計算正在融合到同一個架構(gòu)中。
美光負(fù)責(zé)這個項目的其中一位高管是Steve Pawlowski,并非偶然,他曾是英特爾的芯片設(shè)計師,擁有數(shù)十項專利。Pawlowski現(xiàn)在在美光公司擔(dān)任高級計算解決方案副總裁。
Fwdnxt將與美光的存儲芯片進(jìn)行結(jié)合,幫助美光探索數(shù)據(jù)分析所需的深度學(xué)習(xí)人工智能解決方案,特別是在物聯(lián)網(wǎng)和邊緣計算方面。也許美光也會生產(chǎn)基于人工智能的內(nèi)存芯片,或者包括人工智能在內(nèi)的內(nèi)存芯片。
總部位于博伊西的美光公司正在做這項工作,該公司首席執(zhí)行官Sanjay Mehrotra說,因為“曾經(jīng)的計算架構(gòu)并不適合未來的發(fā)展趨勢……從長遠(yuǎn)來看,我們認(rèn)為計算最好在內(nèi)存中完成。”
外媒在上周Micron Insights的活動上采訪了Steve Pawlowski,以下是經(jīng)過編輯整理的采訪實錄,由獵云網(wǎng)編譯。
Steve Pawlowski:2014年我離開英特爾的時候,我來到了美光,他們問我:“你想做什么?”我說:“我認(rèn)為,為了提高性能效率和降低延遲,計算和內(nèi)存的融合是必要的。你們是一家存儲公司,你們有技術(shù),DRAM即將到來,我想在這一領(lǐng)域作出改變。”然后他們說:“好吧!”
我有一個小團(tuán)隊,專注于在計算和內(nèi)存方面發(fā)現(xiàn)問題——我們可以開始測試概念,然后將概念引入產(chǎn)品,但不會增加成本。我在英特爾學(xué)習(xí)到的,一件我永遠(yuǎn)都不會忘記的事情,我們曾經(jīng)有算數(shù)協(xié)同處理器,80287,80387,然后我們在387上賺了一大筆錢。當(dāng)時我們有了一個聰明的想法,如果我們把協(xié)處理器集成到486中,我們可以做得更快更好。我們做到了,但突然間我們就沒有足夠的足跡了。那些不需要它的人說:“你不會為了那個死亡區(qū)域向我收費(fèi)”,而那些需要它的人說:“會像其他人一樣付給我錢,因為我是一個受歡迎的顧客。”然后,整個業(yè)務(wù)就歸零了。
這件事給我的一個教訓(xùn)是,你不能增加更多的復(fù)雜性和成本,然后指望人們馬上為它買單,除非,有大多數(shù)人能從中獲得真正的價值。我們現(xiàn)在重點(diǎn)關(guān)注的是,找到人們今天可以從中獲得價值的關(guān)鍵因素,然后看看你能否隨著時間的推移擴(kuò)大這個泡沫。我認(rèn)為這是一個8到10年的旅程。在那些年的最后,當(dāng)我回首往事時,我可能會意識到我浪費(fèi)了它們;蛘呶铱梢曰仡^看看,然后說:“哇,我們可能沒有做到這一點(diǎn),但我們做得很好。”
Q:這引發(fā)了很多關(guān)于這會導(dǎo)致什么后果的想象,你會給出一些具體的暗示嗎?
Steve Pawlowski:有一件事,你肯定已經(jīng)聽過很多次了,那就是AI正處在邊緣。我們關(guān)注這個問題的原因是,沒有一個現(xiàn)成的編程模型或現(xiàn)成的架構(gòu)可以讓你與市場競爭。可以說,每個人都在為進(jìn)入同一個戰(zhàn)場而斗爭,F(xiàn)在,我們有機(jī)會去那里做點(diǎn)什么了。人們不會看著你說:“美光是一家內(nèi)存公司,你為什么要談這個?”事實上,他們是這樣認(rèn)為:美光在FPGA上有這種能力,我們的高性能內(nèi)存和架構(gòu)映射在FPGA之上。我們會負(fù)責(zé)所有的抽象,所以你不必成為一個VHDL程序員,那么你愿意開始處理數(shù)據(jù)集的問題嗎?
有趣的是,我并不需要主動去推動它。我們經(jīng)常會參加FPGA會議。很多政府機(jī)構(gòu)也會參加然后說:“我們在這里有個問題,我們想在這方面多做些嘗試。”政府的問題是,他們很早就興奮了,但如果你想做成什么事情,那就得花很長時間。因為采購周期很長,合同也是長期的,其他的一切都是長期的。
我們決定看看普通市場。有一家汽車公司來了,他們說:“我們還沒有達(dá)到第五級,但我們肯定可以達(dá)到第三級、第四級的自動駕駛汽車,我們希望能夠利用網(wǎng)絡(luò)告訴我們正在發(fā)生什么。這看起來是有趣的,你愿意和我們一起工作嗎?”還有很多人說:“他們?yōu)槭裁磳εc你們展開合作感興趣?”這是因為我不會直接告訴他們需要做什么,我會說“這就是我們所擁有的,然后我們能為你做些什么呢?”他們會說:“好吧,你愿意聽我們的,這是我們的問題。”
不管你信不信,我從2005年AMD推出的Opteron中吸取了教訓(xùn)。我們?nèi)栽谕茝V7g處理器、33-stage管道,但無人問津。我們?nèi)チ巳A爾街,我說:“你能再給我們一次機(jī)會嗎?我們能坐下來了解一下我們的工作量嗎?讓我們一起合作,我們可以創(chuàng)造更好的產(chǎn)品嗎?”事實證明,我們做到了。
我們找了很多人。瑞銀,我記得他們寫的一篇評論文章,他們說:“你可能不會制造最大的芯片或最好的芯片,但你來了,理解了我的問題。”這就是所謂的,真正理解客戶和他們的問題,以及你能做什么。如果你這樣做對他們沒有幫助,也沒關(guān)系,至少你學(xué)到了一些東西。
Q:就縮小范圍而言,它是在開發(fā)一種新的內(nèi)存,還是在計算處理過程是在哪里完成的?
Steve Pawlowski:答案是肯定的,但它是對動態(tài)真正的理解。順便說一下,這取決于型號。我剛才和下面的人聊了聊有些語言模型需要100g的參數(shù)。當(dāng)你看到有人說:“嘿,我有兩個千兆字節(jié),四個千兆字節(jié)。”那會適合大多數(shù)型號,但不是所有的型號,型號確實在不斷發(fā)展。
這也取決于解決方案的延遲。我不知道你們是否看過OHSU的視頻,那位女士患了乳腺癌,他們需要大量的數(shù)據(jù),因為他們想把所有的電子顯微鏡圖像放在一起,建立一個三維卷積模型,一個針對腫瘤的三維顯示。他們沒有足夠的時間去了解,因為他們想要在一天甚至一個小時內(nèi)獲得切實可行的洞察力。我們在歐洲核子研究中心做的工作,我們現(xiàn)在需要數(shù)據(jù)。我們必須在幾微秒內(nèi)做出決定。這是什么有趣的東西,還是我們把它放棄。
不同的解決方案需要不同類型的內(nèi)存,這也是我們正在學(xué)習(xí)的。我一直喜歡英特爾的一點(diǎn)是,用戶知道程序的指令是什么。我了解它們是如何在機(jī)器上執(zhí)行的,然后逐漸進(jìn)入系統(tǒng)。當(dāng)我來到美光的時候,我看到的只有地址和命令,就是單純的讀/寫命令和地址。我完全不明白,這個東西是把15個不同的東西復(fù)制到不同的元素上,還是覆蓋上去,還是什么?有了我們在6月合作和收購的這些公司,我們就可以構(gòu)建這些算法、運(yùn)行它們,看看整體效果如何。
我們的第一個目標(biāo)是,我們能在內(nèi)存中做些什么來提高解決方案的運(yùn)行時間?我們可以建立更高的帶寬,但那不一定能讓用戶達(dá)到目的。如果我們能建立一個緩沖區(qū),引入一個矩陣,讓我們一下子就能把矩陣移過來,而不是讓這個東西去找它,這可能會帶來巨大的好處。
最后,我們還會看到:其中大多數(shù)是乘法和累加的架構(gòu),以及非常簡單的一些架構(gòu)。它們只是被復(fù)制了幾千次。一旦晶體管變得更好,你就可以在存儲設(shè)備上做一個很好的乘法和累加。最終,設(shè)想一下采用這種架構(gòu),然后把它放在一個內(nèi)存設(shè)備本身中,這是一個長期的愿景。
我想說的是,無論我們做什么,我們都要建立一個編程基礎(chǔ)設(shè)施和一個范例,這樣人們就不必每次遷移時都重寫他們的代碼。在我看來,這就是英特爾的巨大成功。當(dāng)我們做386的時候,還沒有32位的軟件。但它確實能很好地運(yùn)行16位代碼,人們買它就是為了這個。你可以有很多平臺,然后人們說:“好吧,現(xiàn)在我們?nèi)?yōu)化32位。”6到8年后,當(dāng)486問世時,有很多軟件可以利用它,然后它就變成了一臺永不回頭的機(jī)器。
先從內(nèi)存開始,先從存儲開始,看看我們能做什么。然后我們將看到什么可以隨著時間的推移而真正地遷移,答案可能是什么都不能,答案也可能是一切都能。我想答案是在中間的某個地方,這取決于你把針移到哪里。
Q:是什么讓這個項目變得如此困難,以至于可能成為一個歷時10年的項目?
Steve Pawlowski:困難的是,這將是一個為期10年的項目。提出一種編程范式,社區(qū)就開始使用它,這樣你就可以開始把編程帶到社區(qū)。我不知道你是否知道Steve Wallach(來自Tracy Kidder的一本書),他是多年前的Tracy Kidder的靈魂。他剛退休,但他曾為我工作了一段時間。每次一對一的時候,他都說:“如果我要教你什么的話,就是這個。最容易編程的東西就是獲勝的關(guān)鍵,屢試不爽。”底線是,你必須讓編程社區(qū)參與進(jìn)來。你不能只是去做一些花哨的硬件,然后把它們丟在一邊,因為它們不會碰它,這是個難題。
我們還不是軟件公司。我剛開始創(chuàng)業(yè)的時候,英特爾還不是一家軟件公司。他們就像Nvidia,有很多軟件工程師,在某些情況下甚至超過了他們的硬件工程師。你只是看不到他們。
Q:你們拿下了Fwdnxt,它是一個很全面的產(chǎn)品了,那么你們還需要找很多合作伙伴嗎?
Steve Pawlowski:我們需要大量的合作伙伴和數(shù)據(jù)科學(xué)家,他們的推理機(jī)架構(gòu)已經(jīng)開發(fā)了5年,10年,12年了。優(yōu)化它們的人來自不同的公司和不同的學(xué)術(shù)環(huán)境,它的創(chuàng)始人是普渡大學(xué)的教授,他們一直在優(yōu)化這個架構(gòu)。他們有一個相當(dāng)好的編譯器,采用了一個開放的網(wǎng)絡(luò)交換前端,然后將其映射到他們的硬件上。
我需要的是數(shù)據(jù)科學(xué)家,是應(yīng)用程序。我還認(rèn)為我們需要一個動態(tài)運(yùn)行時/調(diào)度程序。如果你真的有這個模型,如果我今天在硬件上寫一個網(wǎng)絡(luò),在英特爾處理器上,三年后你仍然可以運(yùn)行同樣的程序,所有的東西都是通過指令集抽象出來的。因此,在這里我要做的是抽象網(wǎng)絡(luò),這意味著我們需要某種類型的動態(tài)運(yùn)行時。也就是說,“啊,這個東西有8000個乘法和累加單位,這個有1000個,那我可以把那東西再分散一點(diǎn)。哦,這150個單位死了。我不想在這些方面做任何安排,但我仍然希望能夠使用該部分。”
有幾個實體一直在尋找解決動態(tài)運(yùn)行時問題的方法,我認(rèn)為這是非常重要的,尤其是我聽說過估計值。一年前,我在機(jī)場遇到了一個在英特爾公司經(jīng)營Litho的人。他說,他們相信當(dāng)達(dá)到5nm以下時,30%的設(shè)備在制造時會不合格。
Q:你是說有缺陷,還是什么?
Steve Pawlowski:只是不符合規(guī)格。我們把所有的東西都裝在護(hù)欄里,假設(shè)它的壽命是7年,而且質(zhì)量會下降。基于這個特殊的原因,你甚至無法護(hù)衛(wèi)它,它甚至也不能在guardrail里正常工作。
我找到了一篇由巴西研究者寫的論文,上面說如果你有,假設(shè)你可以做512個核,那么你會降低20%。與峰值性能相比,總體性能下降約4%。32核芯片已經(jīng)失效,在64核芯片中,只有一個內(nèi)核處于活動狀態(tài)。他們只是假設(shè)這些值是隨機(jī)分布的。如果我們要使用比7更好的幾何圖形,那么為這些大型應(yīng)用程序提供動態(tài)運(yùn)行時將同樣重要。
多年來,內(nèi)存系統(tǒng)一直存在冗余。他們在測試,會在一個冗余塊中交換,如果壞塊比冗余塊多,這就變成了一個密鑰鏈。
Q:這是否意味著與英特爾和英偉達(dá)等公司的競爭很激烈?
Steve Pawlowski:這樣會更有合作精神。美光在數(shù)據(jù)中心很難與英特爾和英偉達(dá)競爭,英偉達(dá)已經(jīng)鎖定了訓(xùn)練。即使有人提出了新的解決方案,至少有一家初創(chuàng)公司告訴我,超級計算者告訴他們:“很難把我們的訓(xùn)練算法從GPU上轉(zhuǎn)移出來。它做得很好,仍在提高我們的業(yè)績。不要把你的時間花在這上面。”我最后聽到的統(tǒng)計數(shù)據(jù),很大一部分推論仍然在Xeon上運(yùn)行。
我們一直在關(guān)注——如果我們要在數(shù)據(jù)中心做些什么,那就是幫助我們的客戶,比如英偉達(dá)和英特爾。但是如果從內(nèi)存存儲的角度來看有什么創(chuàng)新,讓我們來看看它的邊緣。我們將在那里獲得最大的效率和規(guī)模經(jīng)濟(jì)。
Q:摩爾定律的部分還可以嗎?你們會準(zhǔn)時嗎?
Steve Pawlowski:這是一個挑戰(zhàn),但這并沒有阻止我們繼續(xù)擴(kuò)大規(guī)模。老實說,我必須永遠(yuǎn)活在摩爾定律里。不許說摩爾定律的壞話!這是第十一誡。因此當(dāng)人們問我的時候,我的回答是:Dennard規(guī)模增長的放緩和停止才是真正推動創(chuàng)新的原因。現(xiàn)在,我們可能不會每兩年得到兩倍的晶體管,也許是每三四年一次。但我們會在第三維度成長。這一切并沒有阻止我們。問題是怎樣做最經(jīng)濟(jì),工程師們會為難題找到真正有創(chuàng)意的解決方案。
Q:英特爾今天強(qiáng)調(diào),他們將在2021年推出7nm圖形芯片。他們似乎回到了預(yù)定的時間。
Steve Pawlowski:我希望如此。在我離開的時候,那是5年前的事了,4年的領(lǐng)先優(yōu)勢消失得如此之快,令人驚訝。
Q:從這個意義上說,似乎整個行業(yè)都在同步前進(jìn)。
Steve Pawlowski:我認(rèn)為這個行業(yè)還在繼續(xù)他們的步調(diào):“我們?nèi)匀豢梢钥吹揭粭l通往規(guī)模化的道路。”就像我說的,我不知道這是否是摩爾預(yù)測的激進(jìn)的兩年,但想想過去40年來,由于摩爾定律,我們在能力方面取得了哪些進(jìn)展。太不可思議了!我仍然認(rèn)為會出現(xiàn)規(guī)模擴(kuò)張,我們會像其他人一樣利用它。
Q:Fwdnxt交易給你帶來了什么?是更多的軟件方面的業(yè)務(wù),還是也有芯片制造領(lǐng)域的人才?
Steve Pawlowski:不是真正的芯片制造天才,并不是的。他們是建筑天才,他們有硬件架構(gòu)方面的天賦。他們已經(jīng)翻譯了FPGA。在采取這方面,使ASIC和做前端和后端,這不是他們的專業(yè)知識,但是是他們現(xiàn)在在做的地方。他們帶來了軟件和體系結(jié)構(gòu),不僅是硬件的體系結(jié)構(gòu),還有卷積神經(jīng)網(wǎng)絡(luò)的體系結(jié)構(gòu)知識。如果有人向他們提出一個問題,他們?nèi)绾文軌驅(qū)υ摼W(wǎng)絡(luò)進(jìn)行優(yōu)化,然后使用他們的數(shù)據(jù)對其進(jìn)行訓(xùn)練,以獲得他們想要的精度水平。一旦他們達(dá)到了他們想要的精度,他們就把訓(xùn)練好的算法映射到FPGA上進(jìn)行分類。
Q:所以它會給你提供多種選擇,讓你選擇想做什么。
Steve Pawlowski:我完全把它看作是,我們正在學(xué)習(xí)這些東西是如何相互作用的,以及這些不同的網(wǎng)絡(luò)是如何進(jìn)化的。好的方面是,我可以放一個有一百萬個參數(shù)的網(wǎng)絡(luò),就是說我可以放一個100gig的網(wǎng)絡(luò)參數(shù)。它的運(yùn)行速度較慢,但我能夠理解那些大型網(wǎng)絡(luò)將如何發(fā)展,以及我們將做些什么。
我在小組里討論了我們是如何與歐洲核子研究中心合作的。我們從原型設(shè)計中學(xué)到的東西是驚人的。他們以如此快的速度把數(shù)據(jù)扔給它,他們需要如此快的洞察力。準(zhǔn)確性是好的,但他們不需要像癌癥患者那樣緊迫的東西,而你需要99.999%的準(zhǔn)確性。他們會問,“這70%或80%好嗎?這很有趣嗎?沒有?那就不要了。把它扔出去。我們有更多的東西要對付,最終我們會得到一些達(dá)到這個門檻的東西,那將會很有趣。”他們每秒會發(fā)生4000萬次碰撞。
Q:你對這種方法能解決的問題的一般描述是怎樣的?
Steve Pawlowski:這兩個問題,衛(wèi)生保健和歐洲核子研究中心,基本上他們是用2D傳感器圖像構(gòu)建一個3D模型。在歐洲核子研究中心一號上,粒子相互碰撞,產(chǎn)生了大量其他粒子。他們想要做的是快速測量這些粒子然后問:“所有的能量加起來了嗎?”如果能量是X,你得到Y(jié),它小于X,然后有一些能量沒有被考慮進(jìn)去,這是很有趣的科學(xué),因為能量守恒定律說沒有任何東西應(yīng)該被創(chuàng)造或毀滅。一旦他們這樣做了,他們就會想要獲得不同的圖像并構(gòu)建一個關(guān)于衰減的3D模型,因為它不會全部顯示在相同的2D圖像中。
可視化腫瘤需要很多很多二維圖像,X光,等等,并創(chuàng)建一個三維的體積模型。我們使用相同的3D卷積神經(jīng)網(wǎng)絡(luò)樣式,因為它們是不同的網(wǎng)絡(luò),它們有不同的內(nèi)層做不同的事情,但是我們用它們來解決一個類似的問題,即創(chuàng)建一個3D的表現(xiàn)。
Q:我不知道你是否聽說過MediView公司。他們來自克利夫蘭診所,剛剛籌集了450萬美元的風(fēng)險投資。他們對病人的身體進(jìn)行核磁共振成像,所有的東西都在里面,然后他們把數(shù)據(jù)放入微軟全息眼鏡。然后醫(yī)生就可以用3D技術(shù)將其可視化。你把手術(shù)刀放到病人身上,他看到手術(shù)刀穿過小孔,進(jìn)入他想要的地方,否則他就不會看到里面的情況。以前,他必須根據(jù)他所看到的所有2D屏幕進(jìn)行猜測。
Steve Pawlowski:那太棒了。幾年前,俄勒岡健康科學(xué)大學(xué)的外科主任說:“你需要來這里。”當(dāng)時我在英特爾,他們給我們洗了全身,給我們做了雙疝氣手術(shù),他說:“我想給你們展示我們現(xiàn)在是怎么做手術(shù)的。”他們仔細(xì)檢查了一切。當(dāng)然,這個人并不是完全開放的,否則我就不會去做手術(shù)了。手術(shù)結(jié)束后,他說:“現(xiàn)在,讓我向你們展示如何訓(xùn)練我們的外科醫(yī)生。”就工具而言,它就像石器時代。這將是一個完美的教學(xué)工具。
特別提醒:本網(wǎng)內(nèi)容轉(zhuǎn)載自其他媒體,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關(guān)內(nèi)容。本站不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系我們,本站將會在24小時內(nèi)處理完畢。