伊人开心综合网,欧美日韩国产成人在线,久草在线在线精品观看

天天快播：穩(wěn)定擴(kuò)散基準(zhǔn)測(cè)試哪個(gè)GPU運(yùn)行AI最快

2023-04-06 10:50:06 來(lái)源：互聯(lián)網(wǎng)

(資料圖片僅供參考)

如今，人工智能和深度學(xué)習(xí)不斷成為頭條新聞，無(wú)論是ChatGPT生成糟糕的建議、自動(dòng)駕駛汽車(chē)、被指控使用人工智能的藝術(shù)家、人工智能的醫(yī)療建議等等。這些工具中的大多數(shù)都依賴于具有大量硬件的復(fù)雜服務(wù)器來(lái)進(jìn)行訓(xùn)練，但是可以在您的PC上使用其顯卡通過(guò)推理使用經(jīng)過(guò)訓(xùn)練的網(wǎng)絡(luò)。但是消費(fèi)類(lèi)GPU進(jìn)行AI推理的速度有多快?

我們?cè)谧钚碌腘vidia、AMD甚至英特爾GPU上對(duì)流行的AI圖像創(chuàng)建器StableDiffusion進(jìn)行了基準(zhǔn)測(cè)試，以了解它們的性能如何。如果您偶然嘗試在您自己的PC上啟動(dòng)并運(yùn)行StableDiffusion，您可能對(duì)它的復(fù)雜性或簡(jiǎn)單性略有了解!-可以。簡(jiǎn)短的總結(jié)是Nvidia的GPU占據(jù)主導(dǎo)地位，大多數(shù)軟件都是使用CUDA和其他Nvidia工具集設(shè)計(jì)的。但這并不意味著您無(wú)法在其他GPU上運(yùn)行StableDiffusion。

我們最終使用三個(gè)不同的StableDiffusion項(xiàng)目進(jìn)行測(cè)試，主要是因?yàn)闆](méi)有一個(gè)包適用于每個(gè)GPU。對(duì)于Nvidia，我們選擇了Automatic1111的webui版本(在新標(biāo)簽頁(yè)中打開(kāi));它表現(xiàn)最好，有更多選擇，而且很容易上手。AMDGPU使用Nod.ai的Shark版本進(jìn)行了測(cè)試(在新標(biāo)簽頁(yè)中打開(kāi))—我們檢查了NvidiaGPU的性能(在Vulkan和CUDA模式下)，發(fā)現(xiàn)它……缺乏。由于缺乏支持，讓英特爾的ArcGPU運(yùn)行起來(lái)有點(diǎn)困難，但StableDiffusionOpenVINO(在新標(biāo)簽頁(yè)中打開(kāi))給了我們一些非?；镜墓δ?。

免責(zé)聲明是有序的。我們沒(méi)有編寫(xiě)任何這些工具的代碼，但我們確實(shí)在尋找易于運(yùn)行(在Windows下)并且似乎也經(jīng)過(guò)合理優(yōu)化的東西。我們相對(duì)有信心Nvidia30系列測(cè)試在提取接近最佳性能方面做得很好——尤其是在啟用xformers時(shí)，它提供了大約20%的額外性能提升(盡管精度降低可能會(huì)影響質(zhì)量)。同時(shí)，RTX40系列結(jié)果最初較低，但GeorgeSV8ARJ提供了此修復(fù)(在新標(biāo)簽頁(yè)中打開(kāi))，其中替換PyTorchCUDADLLs給性能帶來(lái)了健康的提升。

AMD的結(jié)果也有點(diǎn)喜憂參半：RDNA3GPU表現(xiàn)非常好，而RDNA2GPU似乎相當(dāng)平庸。Nod.ai讓我們知道他們?nèi)栽跒镽DNA2開(kāi)發(fā)“調(diào)整”模型，一旦可用，它們應(yīng)該會(huì)大大提高性能(可能翻倍)。最后，在英特爾GPU上，盡管最終性能似乎與AMD選項(xiàng)相當(dāng)，但實(shí)際上渲染時(shí)間要長(zhǎng)得多——實(shí)際生成任務(wù)開(kāi)始需要5-10秒，而且可能需要很多額外的背景東西正在發(fā)生，這會(huì)減慢它的速度。

由于軟件項(xiàng)目的選擇，我們還使用了不同的穩(wěn)定擴(kuò)散模型。Nod.ai的Shark版本使用SD2.1，而Automatic1111和OpenVINO使用SD1.4(盡管可以在Automatic1111上啟用SD2.1)。同樣，如果您對(duì)StableDiffusion有一些內(nèi)部知識(shí)，并且想推薦可能比我們使用的運(yùn)行得更好的不同開(kāi)源項(xiàng)目，請(qǐng)?jiān)谠u(píng)論中告訴我們(或者發(fā)送電子郵件給Jarred(在新標(biāo)簽頁(yè)中打開(kāi))).

我們的測(cè)試參數(shù)對(duì)于所有GPU都是相同的，盡管在Intel版本上沒(méi)有否定提示選項(xiàng)的選項(xiàng)(至少，我們找不到)。上面的圖庫(kù)是在NvidiaGPU上使用Automatic1111的webui生成的，具有更高分辨率的輸出(需要更長(zhǎng)、更長(zhǎng)時(shí)間才能完成)。這是相同的提示，但目標(biāo)是2048x1152而不是我們用于基準(zhǔn)測(cè)試的512x512。請(qǐng)注意，我們選擇的設(shè)置適用于所有三個(gè)SD項(xiàng)目;一些可以提高吞吐量的選項(xiàng)僅適用于Automatic1111的構(gòu)建，但稍后會(huì)提供更多。以下是相關(guān)設(shè)置：

肯定提示：

后世界末日蒸汽朋克城市，探索，電影，逼真，超詳細(xì)，逼真最大細(xì)節(jié)，體積光，(((focus)))，廣角，(((brightlylit)))，(((vegetation)))，閃電,藤蔓,破壞,破壞,wartorn,廢墟

標(biāo)簽：

業(yè)界