秋霞人成在线观看免费视频,欧美毛片一区二区三区福利,国产乱辈通伦影片在线播放亚洲,无码人妻精品中文字幕免费,无码人妻精品中文字幕免费

中自數(shù)字移動(dòng)傳媒

您的位置:首頁 >> 綜合新聞 >> 存儲(chǔ)與GPU性能皆已成倍增長(zhǎng),IO表現(xiàn)為何遲遲不見好轉(zhuǎn)?

存儲(chǔ)與GPU性能皆已成倍增長(zhǎng),IO表現(xiàn)為何遲遲不見好轉(zhuǎn)?

已有24879次閱讀2021-07-09標(biāo)簽:
 
伴隨著HPC、自動(dòng)駕駛、深度學(xué)習(xí)和VR/AR需求的不斷增加,IO性能也在逐步凸顯瓶頸,尤其是GPU與存儲(chǔ)之間的讀寫。處理器速度已經(jīng)從KHz進(jìn)化至了GHz,VRAM從KB進(jìn)化至了GB,IO速度也從KB/s進(jìn)化至了GB/s,然而GB/s的大幅度改善從直觀角度來看依然像是MB/s。

比如在有線連接的VR應(yīng)用中,圖形需要經(jīng)過電腦進(jìn)行處理,再經(jīng)有線傳輸顯示在VR屏幕上,這就引發(fā)了高延遲和長(zhǎng)讀取時(shí)間等問題。這不禁讓人開始遐想,在CPU、GPU和存儲(chǔ)都已經(jīng)革新?lián)Q代的情況下,我們是否真正有效地應(yīng)用了硬件性能?為此微軟和英偉達(dá)都提出了直接存儲(chǔ)的概念來改善IO的現(xiàn)狀。

微軟:Windows上的DirectStorage

 

微軟在不久前的Windows 11發(fā)布會(huì)上重點(diǎn)提到了DirectStorage技術(shù),這是一個(gè)最初為主機(jī)設(shè)計(jì)的DirectX API,如今微軟也將把這一技術(shù)帶到PC上。

在當(dāng)前NVMe SSD和PCIe技術(shù)的演進(jìn)下,存儲(chǔ)帶寬遠(yuǎn)超舊式的硬盤存儲(chǔ)技術(shù),過去10MB每秒的速度已經(jīng)達(dá)到數(shù)GB每秒。但PC上的圖形工作量也在逐步進(jìn)化,數(shù)據(jù)量的增加對(duì)于讀取提出了更高的要求。過去大量數(shù)據(jù)的讀取只需要少量的IO請(qǐng)求,但如今的圖形渲染會(huì)將材質(zhì)等資源分成小塊,只有在場(chǎng)景提出要求時(shí)載入所需的部分,如此一來雖然提高了效率,卻引入了更多IO請(qǐng)求。

當(dāng)前的GPU資源讀取流程 微軟

而目前的存儲(chǔ)API并沒有對(duì)大量IO請(qǐng)求作出優(yōu)化,因此拖累了NVMe,使得讀寫瓶頸愈發(fā)明顯。即便采用高端的PC硬件,也無法飽和利用存儲(chǔ)帶寬優(yōu)勢(shì)。除此之外,這些數(shù)據(jù)往往需要經(jīng)過壓縮傳輸下一個(gè)環(huán)節(jié),傳入內(nèi)存后,還要CPU進(jìn)行一部分解壓工作,最后再傳入GPU顯存里,這樣一來每個(gè)節(jié)點(diǎn)都存在效率損失。

而DirectStorage采用了全新的路徑,從存儲(chǔ)讀取的數(shù)據(jù)傳給內(nèi)存后,直接傳給GPU顯存。而GPU對(duì)于這些數(shù)據(jù)的解壓速度遠(yuǎn)快于CPU,所以極大地優(yōu)化了IO性能。

英偉達(dá):RTX IO和Magnum IO GPUDirect Storage

 

英偉達(dá)在RTX 30系列顯卡上引入了RTX IO,面向消費(fèi)市場(chǎng),提升游戲場(chǎng)景下的讀取速度。英偉達(dá)稱RTX IO將與微軟的DirectStorage結(jié)合,與傳統(tǒng)硬盤下的存儲(chǔ)API相比,可將IO性能提高百倍。過去需要數(shù)十個(gè)CPU內(nèi)核的工作全部交由RTX GPU來處理。

值得一提的是,英偉達(dá)的RTX IO雖然也用到了微軟的DirectStorage,但該技術(shù)并沒有將數(shù)據(jù)傳輸?shù)絻?nèi)存,而是直接由SSD轉(zhuǎn)向GPU。微軟一名圖形開發(fā)者在GSL 2021大會(huì)上表示,未來DirectStorage的目標(biāo)也是繞過系統(tǒng)內(nèi)存。

GDS技術(shù) / 英偉達(dá)

除了消費(fèi)市場(chǎng)外,英偉達(dá)在HPC市場(chǎng)也推出了對(duì)應(yīng)的直接存儲(chǔ)技術(shù),Magnum IO GPUDirect Storage(GDS)。GDS技術(shù)同樣是一個(gè)繞過CPU的技術(shù),與消費(fèi)級(jí)GPU不同,HPC場(chǎng)景下往往要用到多塊GPU,如此一來受IO延遲和CPU的影響更大。GDS在本地存儲(chǔ)與GPU顯存之間建立直接的數(shù)據(jù)通道,消除了CPU引入的延遲和讀寫瓶頸。

GDS與CPU傳輸至GPU讀取性能對(duì)比 / 英偉達(dá)

在運(yùn)用GDS后,帶寬提升達(dá)到1.5倍,與傳統(tǒng)CPU回彈緩沖的數(shù)據(jù)路徑相比,CPU利用率也有2.8倍的提升。

目前英偉達(dá)已經(jīng)將這一技術(shù)加入到其HGX AI超算中,DDN、VAST和WEKA三家公司已經(jīng)開始了相關(guān)產(chǎn)品的量產(chǎn),而IBM、美光等五家廠商也在積極引入這一技術(shù)。三星、鎧俠、西數(shù)和戴爾等廠商也開始了GDS的早期集成與認(rèn)證計(jì)劃。

小結(jié)

 

直接存儲(chǔ)技術(shù)進(jìn)一步放大了GPU廠商與存儲(chǔ)廠商的優(yōu)勢(shì),目前HPC市場(chǎng)前景巨大,英偉達(dá)在相關(guān)業(yè)務(wù)上的盈利已經(jīng)讓其看到了商機(jī)。不僅是GPU,英偉達(dá)采用Arm架構(gòu)的Grace CPU同樣引入了NVLink這樣的數(shù)據(jù)傳輸改善方案。在這樣的性能改善下,即便存儲(chǔ)方案不同,英偉達(dá)的GPU也很可能成為HPC應(yīng)用的首選。

分享到:

[ 新聞搜索 ]  [ ]  [ 告訴好友 ]  [ 打印本文 ]  [ 關(guān)閉窗口 ]  [ 返回頂部 ]

移動(dòng)互聯(lián)

2010年,中國(guó)移動(dòng)互聯(lián)網(wǎng)用戶規(guī)模達(dá)到3.03億人2011年,中國(guó)移動(dòng)互聯(lián)網(wǎng)行業(yè)進(jìn)入了更加快速發(fā)展的一年,無論是用戶規(guī)模還是手機(jī)應(yīng)用下載次數(shù)都有了快速的增長(zhǎng)。在移動(dòng)互聯(lián)網(wǎng)發(fā)展的大的趨勢(shì)下,中自傳媒已經(jīng)開始進(jìn)行區(qū)別于傳統(tǒng)互聯(lián)網(wǎng)的運(yùn)營(yíng)模式探索,伴隨著產(chǎn)業(yè)鏈和產(chǎn)業(yè)格局的變化提供創(chuàng)新的服務(wù)

更多>>推薦視頻

工業(yè)轉(zhuǎn)型升級(jí)-中國(guó)電器工業(yè)協(xié)會(huì)電力電子分會(huì) 秘書長(zhǎng) 肖向鋒

工業(yè)轉(zhuǎn)型升級(jí)-中國(guó)電器工業(yè)協(xié)會(huì)

在本次2012北京國(guó)際工業(yè)自動(dòng)化展上,我們將全面剖析在新...
中國(guó)高壓變頻器產(chǎn)業(yè)發(fā)展之路——走過十三年 李玉琢

中國(guó)高壓變頻器產(chǎn)業(yè)發(fā)展之路——

中國(guó)高壓變頻器產(chǎn)業(yè)發(fā)展之路走過十三年 李玉琢
從企業(yè)家角度 談行業(yè)的未來發(fā)展——匯川技術(shù)股份有限公司

從企業(yè)家角度 談行業(yè)的未來發(fā)展

從企業(yè)家角度 談行業(yè)的未來發(fā)展匯川技術(shù)股份有限公司
現(xiàn)代能源變換的核心技術(shù)——電力電子 李崇堅(jiān)

現(xiàn)代能源變換的核心技術(shù)——電力

中國(guó)電工技術(shù)學(xué)會(huì)常務(wù)理事---李崇堅(jiān),電力電子是先進(jìn)能源...
打造專業(yè)電力電子元器件品牌 助力變頻器產(chǎn)業(yè)發(fā)展

打造專業(yè)電力電子元器件品牌 助

聯(lián)合主辦單位深圳市智勝新電子有限公司領(lǐng)導(dǎo)嘉賓致辭 7月...