天天快播:穩(wěn)定擴(kuò)散基準(zhǔn)測(cè)試哪個(gè)GPU運(yùn)行AI最快

2023-04-06 10:50:06 來(lái)源:互聯(lián)網(wǎng)


(資料圖片僅供參考)

如今,人工智能和深度學(xué)習(xí)不斷成為頭條新聞,無(wú)論是ChatGPT生成糟糕的建議、自動(dòng)駕駛汽車(chē)、被指控使用人工智能的藝術(shù)家、人工智能的醫(yī)療建議等等。這些工具中的大多數(shù)都依賴于具有大量硬件的復(fù)雜服務(wù)器來(lái)進(jìn)行訓(xùn)練,但是可以在您的PC上使用其顯卡通過(guò)推理使用經(jīng)過(guò)訓(xùn)練的網(wǎng)絡(luò)。但是消費(fèi)類(lèi)GPU進(jìn)行AI推理的速度有多快?

我們?cè)谧钚碌腘vidia、AMD甚至英特爾GPU上對(duì)流行的AI圖像創(chuàng)建器StableDiffusion進(jìn)行了基準(zhǔn)測(cè)試,以了解它們的性能如何。如果您偶然嘗試在您自己的PC上啟動(dòng)并運(yùn)行StableDiffusion,您可能對(duì)它的復(fù)雜性或簡(jiǎn)單性略有了解!-可以。簡(jiǎn)短的總結(jié)是Nvidia的GPU占據(jù)主導(dǎo)地位,大多數(shù)軟件都是使用CUDA和其他Nvidia工具集設(shè)計(jì)的。但這并不意味著您無(wú)法在其他GPU上運(yùn)行StableDiffusion。

我們最終使用三個(gè)不同的StableDiffusion項(xiàng)目進(jìn)行測(cè)試,主要是因?yàn)闆](méi)有一個(gè)包適用于每個(gè)GPU。對(duì)于Nvidia,我們選擇了Automatic1111的webui版本(在新標(biāo)簽頁(yè)中打開(kāi));它表現(xiàn)最好,有更多選擇,而且很容易上手。AMDGPU使用Nod.ai的Shark版本進(jìn)行了測(cè)試(在新標(biāo)簽頁(yè)中打開(kāi))—我們檢查了NvidiaGPU的性能(在Vulkan和CUDA模式下),發(fā)現(xiàn)它……缺乏。由于缺乏支持,讓英特爾的ArcGPU運(yùn)行起來(lái)有點(diǎn)困難,但StableDiffusionOpenVINO(在新標(biāo)簽頁(yè)中打開(kāi))給了我們一些非?;镜墓δ?。

免責(zé)聲明是有序的。我們沒(méi)有編寫(xiě)任何這些工具的代碼,但我們確實(shí)在尋找易于運(yùn)行(在Windows下)并且似乎也經(jīng)過(guò)合理優(yōu)化的東西。我們相對(duì)有信心Nvidia30系列測(cè)試在提取接近最佳性能方面做得很好——尤其是在啟用xformers時(shí),它提供了大約20%的額外性能提升(盡管精度降低可能會(huì)影響質(zhì)量)。同時(shí),RTX40系列結(jié)果最初較低,但GeorgeSV8ARJ提供了此修復(fù)(在新標(biāo)簽頁(yè)中打開(kāi)),其中替換PyTorchCUDADLLs給性能帶來(lái)了健康的提升。

AMD的結(jié)果也有點(diǎn)喜憂參半:RDNA3GPU表現(xiàn)非常好,而RDNA2GPU似乎相當(dāng)平庸。Nod.ai讓我們知道他們?nèi)栽跒镽DNA2開(kāi)發(fā)“調(diào)整”模型,一旦可用,它們應(yīng)該會(huì)大大提高性能(可能翻倍)。最后,在英特爾GPU上,盡管最終性能似乎與AMD選項(xiàng)相當(dāng),但實(shí)際上渲染時(shí)間要長(zhǎng)得多——實(shí)際生成任務(wù)開(kāi)始需要5-10秒,而且可能需要很多額外的背景東西正在發(fā)生,這會(huì)減慢它的速度。

由于軟件項(xiàng)目的選擇,我們還使用了不同的穩(wěn)定擴(kuò)散模型。Nod.ai的Shark版本使用SD2.1,而Automatic1111和OpenVINO使用SD1.4(盡管可以在Automatic1111上啟用SD2.1)。同樣,如果您對(duì)StableDiffusion有一些內(nèi)部知識(shí),并且想推薦可能比我們使用的運(yùn)行得更好的不同開(kāi)源項(xiàng)目,請(qǐng)?jiān)谠u(píng)論中告訴我們(或者發(fā)送電子郵件給Jarred(在新標(biāo)簽頁(yè)中打開(kāi))).

我們的測(cè)試參數(shù)對(duì)于所有GPU都是相同的,盡管在Intel版本上沒(méi)有否定提示選項(xiàng)的選項(xiàng)(至少,我們找不到)。上面的圖庫(kù)是在NvidiaGPU上使用Automatic1111的webui生成的,具有更高分辨率的輸出(需要更長(zhǎng)、更長(zhǎng)時(shí)間才能完成)。這是相同的提示,但目標(biāo)是2048x1152而不是我們用于基準(zhǔn)測(cè)試的512x512。請(qǐng)注意,我們選擇的設(shè)置適用于所有三個(gè)SD項(xiàng)目;一些可以提高吞吐量的選項(xiàng)僅適用于Automatic1111的構(gòu)建,但稍后會(huì)提供更多。以下是相關(guān)設(shè)置:

肯定提示:

后世界末日蒸汽朋克城市,探索,電影,逼真,超詳細(xì),逼真最大細(xì)節(jié),體積光,(((focus))),廣角,(((brightlylit))),(((vegetation))),閃電,藤蔓,破壞,破壞,wartorn,廢墟

標(biāo)簽:

上一篇:
下一篇:
業(yè)界
更多
手機(jī)
更多
測(cè)評(píng)
軟件
數(shù)碼