国产精品v片在线观看不卡,亚洲乱码卡一卡二卡新区仙踪林,屁屁影院ccyy备用地址,人妻熟女αⅴ一区二区三区,亚洲国产精品成人久久久

OpenAITriton已開(kāi)始合并AMDROCm代碼,9月20日舉行開(kāi)發(fā)

時(shí)間:2023-09-04 08:57:03 來(lái)源:IT之家 閱讀量:6978

,Triton 是一種類似于 Python 的開(kāi)源編程語(yǔ)言,它可以使沒(méi)有 CUDA 經(jīng)驗(yàn)的研究人員順利編寫(xiě)高效的 GPU 代碼,而且號(hào)稱小白也可以寫(xiě)出與專業(yè)人士相媲美的代碼,就是讓用戶用相對(duì)較少的努力實(shí)現(xiàn)最高的硬件性能,但 Triton 初期只支持英偉達(dá) GPU。

OpenAI 聲稱:Triton 只要 25 行代碼,就能在 FP16 矩陣乘法上達(dá)到與 cuBLAS 相當(dāng)?shù)男阅堋?/p>

從 Github 我們可以看到,OpenAI 已經(jīng)開(kāi)始在最新的Triton 版本中合并 AMD ROCm 相關(guān)分支代碼,也正因此暴露了很多東西。也就是說(shuō),最新 Triton 后端已適配 AMD 平臺(tái),可謂意義重大。

通過(guò)官方的說(shuō)法來(lái)看,他們已經(jīng)通過(guò)了“test_core.py”上的大多數(shù)單元測(cè)試環(huán)節(jié),但由于各種原因跳過(guò)了一些測(cè)試。

IT之家注意到,OpenAI 還宣布將于 9 月 20 日上午 10 點(diǎn)至下午 4 點(diǎn)在加利福尼亞州山景城的微軟硅谷園區(qū)舉行 Triton 開(kāi)發(fā)者大會(huì),而日程安排中就包括“將 Triton 引入 AMD GPU”和“Triton 的英特爾 XPU”兩大環(huán)節(jié),預(yù)計(jì) Triton 將很快擺脫英偉達(dá) CUDA 壟斷的歷史。

值得一提的是,Triton 是開(kāi)源的,比起閉源的 CUDA,其他硬件加速器能直接集成到 Triton 中,大大減少了為新硬件建立 AI 編譯器棧的時(shí)間。

在此前發(fā)布的 PyTorch 2.0 版本中,TorchInductor 便引入了 OpenAI Triton 支持,可為多個(gè)加速器和后端自動(dòng)生成快速代碼,同時(shí)實(shí)現(xiàn)用 Python 取代 CUDA 編程來(lái)寫(xiě)底層硬件的代碼。也就是說(shuō),Triton 已經(jīng)是PyTorch2.0 后端編譯器關(guān)鍵構(gòu)成部分。

實(shí)際上,此前 AMD ROCm 則主要是采用 Hipify 工具實(shí)現(xiàn)CUDA 兼容,而隨著 AMD 開(kāi)始為 RDNA 3 消費(fèi)級(jí)顯卡提供 ROCm 支持,預(yù)計(jì)后續(xù)將會(huì)有更多平臺(tái)選擇適配 AMD 硬件。

相關(guān)閱讀:

《AMD 將為 RDNA 3 消費(fèi)級(jí)顯卡提供 ROCm 支持,從 Radeon RX 7900 XTX 和 Pro W7900 開(kāi)始》

《AMD 正式推出 HIP SDK:拓展 ROCm 生態(tài),支持運(yùn)行英偉達(dá) CUDA 應(yīng)用》

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接,用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。



聲明:本網(wǎng)轉(zhuǎn)發(fā)此文章,旨在為讀者提供更多信息資訊,所涉內(nèi)容不構(gòu)成投資、消費(fèi)建議。文章事實(shí)如有疑問(wèn),請(qǐng)與有關(guān)方核實(shí),文章觀點(diǎn)非本網(wǎng)觀點(diǎn),僅供讀者參考。
hhx6 精彩圖片