個(gè)人和組織使用的設(shè)備收集了大量數(shù)據(jù),這使人工智能成為技術(shù)顛覆的核心。如果沒(méi)有數(shù)據(jù)分析和人工智能,每天產(chǎn)生的大量數(shù)據(jù)幾乎毫無(wú)用處。企業(yè)對(duì)人工智能的使用正在增加,這推動(dòng)了對(duì)高性能機(jī)器的需求。對(duì)HPC的重新關(guān)注在很大程度上是因?yàn)樾枰獮槿斯ぶ悄芄ぷ髫?fù)載計(jì)算大量數(shù)據(jù)。
人工智能和HPC之間的聯(lián)系是共生的,因?yàn)镠PC為人工智能工作負(fù)載提供動(dòng)力,但人工智能可以識(shí)別HPC數(shù)據(jù)中心的改進(jìn)。例如,人工智能可以?xún)?yōu)化加熱和冷卻系統(tǒng),降低電力成本并提高效率。AI系統(tǒng)還可以監(jiān)控服務(wù)器、存儲(chǔ)和網(wǎng)絡(luò)設(shè)備的健康狀況,檢查系統(tǒng)是否保持正確配置,并預(yù)測(cè)設(shè)備何時(shí)會(huì)出現(xiàn)故障。
此外,人工智能可以用于安全目的,篩選和分析進(jìn)出的數(shù)據(jù),檢測(cè)惡意軟件,并實(shí)施行為分析來(lái)保護(hù)數(shù)據(jù)。
游戲是gpu最初的使用案例,技術(shù)革新了高分辨率游戲。gpu的其他用例已經(jīng)變得很明顯,包括HPC。gpu執(zhí)行數(shù)據(jù)密集型工作,應(yīng)用范圍從機(jī)器學(xué)習(xí)到自動(dòng)駕駛汽車(chē)。它們已經(jīng)被證明是處理HPC工作負(fù)載的超級(jí)芯片,因?yàn)樗鼈儗?zhuān)注于數(shù)據(jù)計(jì)算。
圖形處理器的崛起使英偉達(dá)成為高性能計(jì)算領(lǐng)域的關(guān)鍵玩家,因?yàn)樵摴臼菆D形處理器制造的領(lǐng)導(dǎo)者。然而,谷歌的tpu已經(jīng)開(kāi)始威脅到gpu的統(tǒng)治地位。tpu是用于特定應(yīng)用的集成電路(asic),可以加速人工智能計(jì)算和算法。
谷歌專(zhuān)門(mén)為神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)開(kāi)發(fā)了它們,包括它的TensorFlow軟件。GPU在高性能計(jì)算領(lǐng)域的角色目前仍將是核心,但像谷歌這樣有影響力的公司的內(nèi)部芯片開(kāi)發(fā)意味著,如果英偉達(dá)想要在高性能計(jì)算領(lǐng)域保持地位,就不能滿足于現(xiàn)有的成就。
舊的中央處理器(cpu)、gpu、asic和現(xiàn)場(chǎng)可編程門(mén)陣列(fpga)之間的處理多樣性正在不斷增長(zhǎng)。工作負(fù)載可以有很大的差異,因此,為不同的用例提供不同計(jì)算的靈活性是必不可少的。
HPC玩家越來(lái)越多地允許定制他們的產(chǎn)品,這超出了處理能力。華為為其客戶(hù)提供三種不同的HPC架構(gòu),而IBM允許數(shù)據(jù)存儲(chǔ)定制,HPE根據(jù)靈活的消費(fèi)模式向客戶(hù)收費(fèi)。
客戶(hù)可以選擇將他們的HPC數(shù)據(jù)中心放在本地、云中,或者部署在邊緣。一些供應(yīng)商在一個(gè)包中提供針對(duì)不同工作負(fù)載的混合解決方案。
許多供應(yīng)商已經(jīng)從銷(xiāo)售設(shè)備轉(zhuǎn)向提供HPCaaS。HPCaaS的興起與云作為HPC解決方案的出現(xiàn)有關(guān)。因此,HPCaaS的發(fā)展趨勢(shì)使Amazon Web Services (AWS)、谷歌和阿里巴巴等云服務(wù)提供商受益,盡管傳統(tǒng)的HPC供應(yīng)商也在提供HPCaaS。
HPCaaS對(duì)于終端用戶(hù)來(lái)說(shuō)可能是一個(gè)很有吸引力的選擇,因?yàn)樗鼘⑿枰咝阅艿臄?shù)據(jù)處理和工作負(fù)載放在那些缺乏必要資金來(lái)雇傭熟練員工和投資硬件的公司的手邊。HPCaaS為那些無(wú)力在內(nèi)部開(kāi)發(fā)HPC知識(shí)和基礎(chǔ)設(shè)施的公司帶來(lái)了HPC能力。然而,訂閱HPCaaS而不是在內(nèi)部開(kāi)發(fā)HPC,會(huì)帶來(lái)部署在云中的HPC的所有限制。
HPC誕生于內(nèi)部數(shù)據(jù)中心,但在2010年下半年,云計(jì)算開(kāi)始改變HPC。該優(yōu)勢(shì)最近作為一種新的HPC部署平臺(tái)出現(xiàn)了。隨著高性能解決方案領(lǐng)域的擴(kuò)展,供應(yīng)商已經(jīng)開(kāi)始提供混合選項(xiàng)?;旌系腍PC解決方案通常涉及補(bǔ)充現(xiàn)有內(nèi)部數(shù)據(jù)中心的云能力。
內(nèi)部云和私有云托管的結(jié)合克服了公共云的一些弱點(diǎn),包括性能差和許多行業(yè)特定的、數(shù)據(jù)密集型的HPC工作負(fù)載的多樣性和復(fù)雜性所帶來(lái)的優(yōu)化挑戰(zhàn)。相比之下,混合解決方案可以定制,往往是可伸縮的,同時(shí)提供云的靈活性。
向混合動(dòng)力的轉(zhuǎn)變將使戴爾和惠普這樣的供應(yīng)商受益。如果云計(jì)算的發(fā)展允許其缺點(diǎn)得到修正,AWS和微軟等公司將處于更有利的地位。
靈活性、HPCaaS和混合解決方案的出現(xiàn)都成為HPC的一個(gè)主要趨勢(shì):民主化。這一趨勢(shì)與HPC更廣泛的使用有關(guān),并與更多終端用戶(hù)能夠接觸到的技術(shù)定位有關(guān)。
超級(jí)計(jì)算機(jī)曾經(jīng)屬于研究、學(xué)術(shù)或軍事領(lǐng)域。然后HPC擴(kuò)展到股票交易,銀行,石油和天然氣。使用HPC的業(yè)務(wù)范圍很廣,包括汽車(chē)、航空航天,甚至食品加工。高性能計(jì)算在邊緣的部署將進(jìn)一步擴(kuò)大高性能計(jì)算的范圍。
百億億次計(jì)算是一種計(jì)算系統(tǒng)每秒執(zhí)行十億次計(jì)算的能力,以exaFLOPS而不是FLOPS來(lái)衡量性能。第一臺(tái)百億億次計(jì)算機(jī)預(yù)計(jì)最早將于2022年問(wèn)世。
百億億次計(jì)算并不是像量子計(jì)算那樣的一種新的計(jì)算形式,而是指現(xiàn)有技術(shù)可能實(shí)現(xiàn)的下一個(gè)級(jí)別的處理能力。然而,百億億次高性能計(jì)算機(jī)勢(shì)必會(huì)在高級(jí)模擬和建模方面帶來(lái)一些改進(jìn),這些改進(jìn)將應(yīng)對(duì)各種挑戰(zhàn),如預(yù)測(cè)自然災(zāi)害和推進(jìn)科學(xué)發(fā)現(xiàn),特別是在醫(yī)學(xué)領(lǐng)域。
百億億次計(jì)算是HPC整體處理能力的一大進(jìn)步,然而,性能的提高越來(lái)越多地來(lái)自于較小的設(shè)計(jì)創(chuàng)新,這些創(chuàng)新可能不那么引人注目,但仍然很重要。
微架構(gòu)層面的進(jìn)展包括更快的互連速度、更高的計(jì)算密度、可擴(kuò)展的存儲(chǔ)、更高效的基礎(chǔ)設(shè)施、生態(tài)友好性、空間管理和更好的安全性。在未來(lái)幾年里,諸如此類(lèi)的進(jìn)步將繼續(xù)成為高性能計(jì)算的趨勢(shì)。