一個晶圓大小的芯片,會成為主流嗎?
已有23521次閱讀2021-08-18標(biāo)簽:
在之前,Cerebras用單個晶圓做了個芯片,這引起了廣泛討論。因?yàn)闃?gòu)建這些巨大的未來機(jī)器站點(diǎn)的概念證明很有可能為某些最苛刻的計(jì)算環(huán)境中的下一步做好準(zhǔn)備。但從通用的角度來看,這似乎又有點(diǎn)不切實(shí)際。目前的選擇也似乎是乘著摩爾定律的衰落或登上量子計(jì)算列車。第一個是不可避免的。第二個遠(yuǎn)非通用目的,特別是對于擁有數(shù)十年之久的核和其他關(guān)鍵任務(wù)模擬代碼庫的最大政府實(shí)驗(yàn)室而言,這些模擬是為傳統(tǒng)計(jì)算量身定制的。但實(shí)際上有一條中間路線。雖然它有它的挑戰(zhàn)和它自己的擴(kuò)展限制,但它可以將超級計(jì)算的性能在未來很長一段時間內(nèi)持續(xù)提升,同時世界(表面上)為實(shí)際量子或任何真正的下一個方案做好準(zhǔn)備。這就是為什么這個中間選項(xiàng),一個超異構(gòu)、可定制的晶圓級平臺有意義。讓我們從技術(shù)和市場的角度來看:在市場方面,世界在很大程度上要?dú)w功于 AI 系統(tǒng)初創(chuàng)公司 Cerebras,因?yàn)樗粌H重新引入了晶圓級的概念,而且還證明了它們可以工作。其實(shí)這個概念并不新鮮,早在 1980 年代它就是一個熱門話題,并在 90 年代重新出現(xiàn)。但因?yàn)樵谶@么多晶體管(當(dāng)時)中出現(xiàn)故障太常見了,因此開發(fā)者們在運(yùn)行這些芯片時,產(chǎn)生了無用的挫敗感。市場基本原理也僅到此為止。Cerebras 專注于人工智能訓(xùn)練和推理,可以選擇做一些我們在這里討論的通用工作。但計(jì)算考量的是數(shù)字上的能力,SRAM 很小并且在內(nèi)核之間共享。它非常適合 AI,但對于有能力投資、試驗(yàn)和圍繞新晶圓級構(gòu)建的 HPC 而言,則不那么完美。這就是技術(shù)準(zhǔn)備就緒的地方。Cerebras 已經(jīng)證明這是可以做到的,并且有一些客戶愿意看一看(主要是國家實(shí)驗(yàn)室),但他們沒有證明,在所有大型計(jì)算中,互連是使用晶圓級芯片的最大瓶頸,這也是釋放主流潛力的關(guān)鍵。另一方面,AMD 正在證明小芯片方法是持續(xù)擴(kuò)展的最有希望的途徑。在其他方面,英特爾、IBM 和 AMD 也在展示互連級別的可能性。那么為什么不把這些東西放在一起,構(gòu)建一個可以利用小芯片實(shí)現(xiàn)超異構(gòu)的晶圓級互連,創(chuàng)建大型系統(tǒng)來消除最緊迫的瓶頸,達(dá)成增加可擴(kuò)展性和可定制性的方案呢?這樣的話就可以使底層的晶圓級互連開放標(biāo)準(zhǔn),以便所有可能的小芯片或(小芯片)都可以參與其中,包括大小處理器、DRAM、HBM,所有配置都可以適合工作負(fù)載。當(dāng)然,這不會便宜。但是,在量子計(jì)算上押下 10 億美元的賭注不也是為了在后摩爾定律時代有所期待?隨著主要供應(yīng)商致力于從 EMIB 到 AMD 的小芯片戰(zhàn)略,這些都是有可能實(shí)現(xiàn)的。現(xiàn)在,有一些開創(chuàng)性的工作表明,從設(shè)計(jì)、可靠性和可制造性的角度來看,這一切都是實(shí)用的。2015 年,加州大學(xué)洛杉磯分校的 Saptadeep Pal 與一個團(tuán)隊(duì)合作研究晶圓級的概念。這發(fā)生在 Cerebras 出現(xiàn),并向市場證明他們的方案是有效之前。Pal 告訴 The Next Platform,他的團(tuán)隊(duì)中的一些人飛到圣何塞與 Andrew Feldman 和 Cerebras 團(tuán)隊(duì)會面,但他們沒有交換技術(shù),只是交談。“主要想法是構(gòu)建一個具有許多核心的系統(tǒng)。不僅僅是計(jì)算核心;內(nèi)存和不同類型的內(nèi)存都緊密互連,不像今天的系統(tǒng),而是通過在晶圓上構(gòu)建互連。”Pal 說,過去,晶圓級因?yàn)榫w管故障而被駁回,但答案根本不是構(gòu)建晶體管,而是創(chuàng)建互連,然后采用可以單獨(dú)構(gòu)建和測試的普通芯片,獲取已知好的芯片來自不同來源(處理器、DRAM、閃存等)的數(shù)據(jù),并將它們打包到晶圓級互連中,以捕捉所有世界中最好的東西。“在晶圓上,我們已經(jīng)知道如何構(gòu)建元層。我們可以看到如何將這些小芯片連接到晶圓上以獲得真正的異質(zhì)晶圓,這是我們 2015 年的起點(diǎn)。”強(qiáng)調(diào) Cerebras 所做的與 Pal 和團(tuán)隊(duì)提出的建議之間的差異對于此類設(shè)備的特定與主流未來很重要。從物理上講,Cerebras 正在構(gòu)建一個帶有連接數(shù)千個內(nèi)核的晶體管的晶圓。Pal 的團(tuán)隊(duì)正在做的是從不同來源獲取芯片,將它們放在互連晶圓上,然后互連芯片。這導(dǎo)致密度相同,但異質(zhì)性更大。“Cerebras 所做的對于 ML 來說非常有用,在一個晶圓上有如此多的內(nèi)核,而所有的小 SRAM 都連接在一個網(wǎng)狀網(wǎng)絡(luò)中。每幾個內(nèi)核共享一些 SRAM。但是我們正在采用這么多不同的芯片,現(xiàn)在每個芯片上的 Arm 內(nèi)核和 DRAM 作為許多可能的實(shí)驗(yàn)之一,現(xiàn)在我們可以擁有具有 100k 或 200k 內(nèi)核和 TB 內(nèi)存的晶圓。這些存儲器可以堆疊以提高密度,例如,我們可以在晶圓上看到每毫米邊緣 1TB/s 的速度。”我們需要考慮的事情是混合和匹配的可能性。適用于 HPC 的強(qiáng)勁 X86 內(nèi)核、適用于特定工作負(fù)載的加速器、堆疊內(nèi)存、高密度。選擇是無窮無盡的。“而 Cerebras 通過展示如何為這些設(shè)備供電和冷卻方面,確實(shí)做了令人印象深刻的工作。”盡管 Pal 和團(tuán)隊(duì)取得了成功,并且 Cerebras 解決了制造/市場/可靠性問題,但將其推入更廣泛的 HPC 領(lǐng)域仍然存在一些廣泛的挑戰(zhàn)(因?yàn)樗仨殢哪抢镩_始)。軟件挑戰(zhàn)是其中一個方面。另外,此類設(shè)備上可能的芯片組合數(shù)量如此之多,這可能會引致無窮無盡的問題,因此我們暫時不會為您解決這些問題。除了軟件之外,僅在硬件方面將它們推向市場將需要更好的生態(tài)系統(tǒng)來測試小芯片的可靠性等。“測試小芯片,將它們放在晶圓上,這樣您就可以在鍵合后獲得 99.9% 的成功?這絕對是一個挑戰(zhàn)。但與此同時,因?yàn)槲覀兪腔谛⌒酒模覀兛梢詼y試單獨(dú)的設(shè)備,并且已經(jīng)學(xué)會了一些技巧,可以在 Cerebras 必須在其架構(gòu)中構(gòu)建的冗余之外獲得更高的信心。”他說真正的困難在于,一旦擁有它,一切都非常昂貴,即使使用軟件堆棧,您如何應(yīng)對這個市場?“現(xiàn)在,我們只是在構(gòu)建 Arm,我們還沒有接觸到編譯器級別的東西。現(xiàn)在是讓人們知道這種方案可以提供 100 倍以上性能,并給他們證明方案是否可靠。” 他補(bǔ)充說,人們對現(xiàn)在的系統(tǒng)構(gòu)建方式感到滿意。他們可以替換系統(tǒng)中的元素。有什么可以處理這樣的系統(tǒng)上的故障,尤其是會影響整體功能的故障?“系統(tǒng)越來越大;HPC 運(yùn)行在數(shù)百個相距很遠(yuǎn)的節(jié)點(diǎn)上,互連就是瓶頸。我們需要一個統(tǒng)一的系統(tǒng)。將它們?nèi)糠旁谝粔K負(fù)責(zé)互連的硅片上就是答案。摩爾定律將發(fā)展到 2nm 或 1nm,而且成本也會很高。但是,正如 AMD 所展示的那樣,轉(zhuǎn)向小芯片是有效的。也顯示了用晶圓級擴(kuò)展它。找到一個今天每個人都可以接受的通用軟件堆棧是我們接下來將首先使用 X86 和 Arm 做的事情,”Pal 補(bǔ)充道。伊利諾伊大學(xué)與 Pal 的晶圓級合作伙伴 Rakesh Kumar 補(bǔ)充說:“基于小芯片的方法允許在晶圓上進(jìn)行異構(gòu)技術(shù)集成。這意味著基于小芯片的晶圓級處理器可以將高密度存儲器(例如 DRAM、閃存等)駐留在同一處理器上。與無法在處理器上支持異構(gòu)技術(shù)的 Cerebras 方法相比,這可以實(shí)現(xiàn)更好的內(nèi)存容量特性,從而限制了處理器的內(nèi)存容量。這對于許多應(yīng)用程序(包括許多 ML 模型)來說至關(guān)重要,其應(yīng)用程序要求遠(yuǎn)遠(yuǎn)超過 Cerebras 處理器提供的要求。正如 Kumar 解釋的那樣,“基于小芯片的晶圓級處理器也可能具有良率優(yōu)勢,因?yàn)榕c Cerebras 方法不同,不需要制造大型單片芯片。”AMD 在構(gòu)建這些方面處于有利地位。英特爾和 IBM 也可以做到。Cerebras 展示了一家初創(chuàng)公司也可以設(shè)法實(shí)現(xiàn)這一目標(biāo),但無法進(jìn)入任何大市場或獲得美國能源部的大型交易,如果可以展示后摩爾時代的能力,這些交易將在那里進(jìn)行。有需求,有能力,有制造和市場的角度。時機(jī)恰到好處,與超級計(jì)算等領(lǐng)域的量子不同,這些部分都具有讓代碼運(yùn)行的已知機(jī)制。歸根結(jié)底,這就是后百億億級/后摩爾的 HPC 領(lǐng)域所需要的答案。