如果你出售大量硬件來支持人工智能工作負(fù)載,那么最好的方法就是讓全球各國都相信人工智能是如此重要,以至于他們必須在自己的境內(nèi)擁有大量人工智能。以防某些政治或經(jīng)濟(jì)危機(jī)導(dǎo)致人工智能技術(shù)無法通過遍布全球的云構(gòu)建者獲得。
將大量GPU送到超大規(guī)模和云計算構(gòu)建者手中是擴(kuò)展GenAI模型以展示其能力的最佳方式,同時也說明了GenAI對所有國家的戰(zhàn)略重要性。
隨著英偉達(dá)提高其“Hopper”和“Blackwell”GPU的產(chǎn)量,并找到了一種方法來增加其制造產(chǎn)量,以滿足超大規(guī)模和云以及政府和企業(yè)的需求,主權(quán)人工智能云的整個概念已經(jīng)開始流行起來。英偉達(dá)將是這一趨勢的最大受益者。
上個月,英偉達(dá)首席執(zhí)行官黃仁勛印度闡述了這種“主權(quán)人工智能”的觀點,宣布與印度信實工業(yè)(Reliance Industries)、印孚瑟斯(Infosys)、Yotta Data Services、塔塔通信(Tata Communications)和Tech Mahindra等主要IT公司和云提供商建立合作關(guān)系,以促進(jìn)印度在整個經(jīng)濟(jì)中對人工智能的使用。
黃仁勛當(dāng)時說,“印度應(yīng)該制造自己的人工智能是完全有道理的,你不應(yīng)該輸出數(shù)據(jù)來導(dǎo)入情報?!?/span>
這對這些國家來說是一件好事,讓它們控制了一項新興技術(shù),這項技術(shù)可能在很多方面從根本上改變商業(yè)運(yùn)作和社會運(yùn)作的方式。主權(quán)人工智能也將是英偉達(dá)的一大勝利,因為它將在全球范圍內(nèi)傳播自己的信息,更重要的是。英偉達(dá)預(yù)計,到今年年底,其在印度的GPU部署將增長近10倍。
本周,在這家GPU制造商在東京舉行的人工智能峰會上,黃仁勛與軟銀董事長兼首席執(zhí)行官孫正義坐下來討論了軟銀和日本利用人工智能以及使用英偉達(dá)硬件和軟件來實現(xiàn)這一目標(biāo)的遠(yuǎn)大抱負(fù)。
據(jù)報道,日本官員希望通過寬松的監(jiān)管方式使日本對人工智能友好,從而吸引人工智能公司來到日本。黃和其他英偉達(dá)高管贊揚(yáng)了日本的創(chuàng)新歷史,以及該國廣泛的技術(shù)和人工智能技能。
英偉達(dá)電信高級副總裁Ronnie Vasishta在視頻電話中告訴記者:“日本處于這一轉(zhuǎn)型的最前沿,采用英偉達(dá)人工智能基礎(chǔ)設(shè)施的日本云計算領(lǐng)導(dǎo)者將幫助日本轉(zhuǎn)型其最重要的行業(yè),并推進(jìn)其主權(quán)人工智能的雄心。”
英偉達(dá)指出,它與許多日本公司在人工智能項目上有合作,但它與日本跨國公司軟銀(SoftBank)的合作占據(jù)了中心位置。軟銀將成為第一家使用英偉達(dá)的Blackwell平臺建造其第一臺超級計算機(jī),也是該國最強(qiáng)大的超級計算機(jī)公司。
該公司將使用英偉達(dá)的DGXB200系統(tǒng)作為其英偉達(dá)DGX SuperPOD超級計算機(jī)的基礎(chǔ),該計算機(jī)將用于其自己的生成式人工智能雄心,其他企業(yè)以及日本的大學(xué)和研究機(jī)構(gòu)也將能夠訪問。DGXB200系統(tǒng)于3月份首次推出,包括8個BlackwellGPU,這些GPU與供應(yīng)商的第五代NVLink互連連接,每個GPU提供1.8TB/秒的雙向吞吐量。
該平臺還包括一個專用的RAS(可靠性、可用性和可服務(wù)性)引擎和一個用于更快數(shù)據(jù)庫查詢的解壓縮引擎。根據(jù)英偉達(dá)的說法,該平臺的人工智能模型訓(xùn)練性能是其前身的3倍,推理性能是其前身的15倍。
軟銀的超級計算機(jī)還將包括英偉達(dá)的人工智能企業(yè)軟件和Quantum-2 InfiniBand網(wǎng)絡(luò),這將使大型語言模型(LLM)的開發(fā)更加容易,這些模型可以為講日語的用戶構(gòu)建,與主權(quán)人工智能的推動保持一致。
軟銀還計劃使用英偉達(dá)的Grace-Blackwell平臺制造另一臺基于英偉達(dá)的超級計算機(jī),該平臺包括其GB200NVL72液冷機(jī)架級系統(tǒng),該系統(tǒng)同時使用BlackwellGPU和基于arm的GraceCPU。該系統(tǒng)將用于高度計算密集型的工作負(fù)載。
兩家公司之間的另一個項目涉及軟銀和英偉達(dá)共同開發(fā)的AI-ran,這是一個同時運(yùn)行人工智能和5G工作負(fù)載的電信網(wǎng)絡(luò)。
英偉達(dá)的Vasishta說,“人工智能民主化需要建立一個全國性的人工智能基礎(chǔ)設(shè)施。需要人工智能工廠來創(chuàng)造智能,建立和培訓(xùn)服務(wù)于日本工業(yè)的新模型。不過,還需要一個傳輸網(wǎng)絡(luò)來分發(fā)智能,使人工智能推理盡可能接近端點。人工智能應(yīng)用程序需要通過人工智能本地端點來消耗智能?!?/span>
該網(wǎng)絡(luò)使用軟件定義的5G無線電堆棧,其中包括基于英偉達(dá)Aerial加速平臺的L1軟件。兩家公司在日本某地區(qū)對AI-ran網(wǎng)絡(luò)進(jìn)行了室外測試,測試了運(yùn)營商級5G性能,并對網(wǎng)絡(luò)的剩余容量進(jìn)行了AI推理工作。軟銀估計,傳統(tǒng)電信網(wǎng)絡(luò)的設(shè)計初衷是處理高峰負(fù)荷,通常只使用了三分之一的容量。
軟銀表示,將整合到環(huán)境中的英偉達(dá)Aeria RAN計算機(jī)-1系統(tǒng)將比運(yùn)行傳統(tǒng)5G網(wǎng)絡(luò)的基礎(chǔ)設(shè)施節(jié)省40%的電力。孫正義在與黃仁勛表示:“有了我們緊密相連的這個智能網(wǎng)絡(luò),它將成為日本基礎(chǔ)設(shè)施智能的一個大神經(jīng)大腦?!?/span>
對于電信公司來說,它開辟了其他收入來源,因為能夠在相同的網(wǎng)絡(luò)上運(yùn)行這些人工智能工作負(fù)載。英偉達(dá)和軟銀都估計,在新的AI-ran基礎(chǔ)設(shè)施上每投資1美元,電信公司就能從AI推理收入中獲得約5美元的回報。軟銀集團(tuán)估計,每增加一臺AI-RAN服務(wù)器,它將獲得高達(dá)291%的回報。
英偉達(dá)還與GMO互聯(lián)網(wǎng)集團(tuán)、KDDI和櫻花互聯(lián)網(wǎng)等云計算公司建立了合作伙伴關(guān)系,以建立一個基于英偉達(dá)硬件和軟件的全國性人工智能基礎(chǔ)設(shè)施網(wǎng)絡(luò),推動日本機(jī)器人、醫(yī)療保健和藥物研究等領(lǐng)域的人工智能創(chuàng)新。