精品国内产的精品视频在线观看,亚洲在线观看视频,国产欧美日韩在线

當前熱議!小羊駝：訓練成本僅300美元的斯坦福開源模型，適合創業公司打造自己的AI模型

2023-04-13 11:14:07 來源：阿爾法工場

導語：小羊駝的邏輯叫“知識蒸餾”，即通過將大型模型的知識轉移到小型模型中，從而快速達到想要的模型質量，同時減少計算成本。

不久前，斯坦福公開了一個名為 Alpaca 的新模型。（俗稱“羊駝”）它使用了 GPT3.5 生成的 52k 個指令訓練，訓練費用只花了 500 美元，但是性能可以與 GPT-3.5 相媲美。

【資料圖】

然而由于使用了 GPT3.5 的指令數據，使用條款禁止開發與 OpenAI 競爭的模型，因此 AIpaca 禁止了商用。

而近日，斯坦福學者與 CMU、UC 伯克利等人合作推出了一個全新的模型——Vicuna，它有 130 億個參數，俗稱“小羊駝”。 初步評估小羊駝

其實 Vicuna 說白了就是一款新的“ChatGPT”，它和 Google Bard、ChatGPT 還有 New Bing 都一樣，都是聊天機器人（Chatbots）。

初步評估上，Vicuna-13B 達到了 ChatGPT 能力的 92%；幾乎要比 Google Bard 更強；同時遠遠甩開其他模型，如 LLaMA 和它的前輩——斯坦福的 Alpaca。

而訓練 Vicuna-13B 的成本是僅僅 300 美元。可能還沒有屏幕前的你游戲顯卡的價格高。

Vicuna 在推出后面臨的一個問題是，自己的模型質量究竟如何。顯然作為學術機構沒辦法像大公司養著幾百上千的測試團隊進行大量測試，于是他們另辟蹊徑——既然人力太貴，那就用剛剛推出的 GPT-4 來評測嘛。

具體操作上，他們提出了一個評估框架。設計了九大主題下共計八十條測試問題，然后把由其他模型和自家 Vicuna 的回答交給 GPT-4 進行評估（“哪個虛擬助理的回答更好”）。

驚人的是在這八十個問題的評估上，Vicuna 已經能微微贏下 Google 重注的 Bard，更是把自己的“祖父模型”LLaMA-13B、AIpaca-13B 殺得片甲不留。

盡管問題的勝出數量上比不過 ChatGPT，但以 10 分制的角度切入，Vicuna 也已經實現了 ChatGPT 超過 90%的質量。

不得不說，“羊駝”AIpaca用 GPT-3.5 生成的指令訓練模型，而“小羊駝”Vicuna在此基礎上又用 GPT-4 評估模型，斯坦福他們是懂人工智能的。

進入Vicuna主頁，不必注冊登錄；直接輸入想要的內容，然后等待Vicuna為你生成。全程一分鐘，行云流水絲毫不卡頓。

作為大語言模型，中英文自然是通吃。

“知識蒸餾”

ChatGPT 訓練費用高企甚至一次訓練就要接近上億美金，然而 Vicuna 只花了 300 美元。從效果上看就達到了 GPT3.5 質量的 90%。這是怎么做到的？

其實Vicuna的邏輯在人工智能領域叫做“知識蒸餾”（knowledge distillation），即通過將大型模型的知識轉移到小型模型中，從而快速達到想要的模型質量，同時減少計算成本。

通常，大型模型（即“Teacher”）會生成訓練數據，小型模型（即“Student”）則使用這些數據來學習大型模型的知識和能力。

通過這種方式，小型模型可以在自己的場景下獲得大型模型90%甚至99%的能力，這意味著，可用于生成模型的領域將呈指數級增長。

在Vicuna公布的訓練過程里，一開始，開發團隊是從 ShareGPT （與 ChatGPT 對話內容的UGC網站）上收集了七萬條對話。這恰恰是“知識蒸餾”里最重要的“訓練數據”。

而訓練方法上則是選擇了在“羊駝”AIpaca（成本已降低至500美元）上優化。

這兩個最重要的環節就使得Vicuna同時在訓練成本和訓練質量上均有突出優勢。

而理論上你也可以花300美元租云計算資源然后訓練出你的“小羊駝”。 全華人團隊

一個小插曲是，作者在撰寫稿件搜集資料時，看到小羊駝的開發團隊不禁虎軀一震。

包括 Wei-Lin Chiang、Zhuohan Li、Zi Lin、Ying Sheng、Zhanghao Wu、Hao Zhang、Lianmin Zheng、Siyuan Zhuang 和 Yonghao Zhuang，這學生團隊是清一色的全員華人，不免讓人感慨。

總結：遍地AI的世界就在眼前

從本質上來說，ChatGPT這種大語言模型就是通過燒錢燒算力燒數據達到"大力出奇跡"的效果。

而這也帶來了一個問題，即這樣的大語言模型燒錢的程度會讓很多小公司望而卻步，只能加入霸權壟斷的圈子。

而對于像小紅書/B站這樣不上不下的公司，既承擔不起自己訓練大模型的成本，也不愿意將自己內容池的數據拱手讓人，其實是陷入蠻尷尬的境地。

Vicuna展現了另一種可能性，即通過“知識蒸餾”的方式，以極低的價格復刻大語言模型90%甚至99%的能力。

而這就意味著哪怕是剛剛創業的小公司也完全負擔得起一個獨屬于自己體系的AI的訓練成本。

換句話說，ChatGPT拉開了AI落地的序幕，而Vicuna告訴我們，遍地AI的世界也許就在眼前。

標簽：

業界

手機

破解手機屏幕使用時的一大難題蘋果新專利曝光

使用墨鏡或太陽鏡看手機屏幕時，常常會出現部分屏幕變得黑漆漆一片的情況，給使用帶來了不便。蘋果最近獲得了一項專利，可以解決這個問題。

2023-03-24

蘋果考慮將iPhone系列進一步延伸 2024年上市？

蘋果正在考慮將iPhone的Pro系列進一步向上延伸，一位可靠的泄密者的報告堅稱它可能會在2024年上市。自 2022 年年中以來的傳言提出了蘋果

2023-02-07

卷出一塊好曲屏真我10系列新品發布會舉行

11月17日下午，真我realme舉行主題為卷出一塊好曲屏的真我10系列新品發布會，正式推出全新一代科技越級代表作真我10系列的三款新品以及真我

2022-11-17

英國猴痘病例數預計將大幅上升

人民網倫敦5月22日電（余穎）截至5月20日，英國確診猴痘病例總數上升至20例。由于猴痘病毒在英國已經開始社區傳

2022-05-24

上海：視情適當延長畢業生在校生身份時間

人民網北京5月23日電（記者孫競）據上海市教委政務微信"上海教育"消息，為做好2022屆高校畢業生就業創業工作，

2022-05-24

國家電網確定新型電力系統科技攻關十大重點項目

5月19日，國家電網新型電力系統科技攻關行動計劃2022專項重大科技項目責任狀簽訂視頻會議在京召開。國家電網公司

2022-05-24

比亞迪發布CTB電池車身一體化技術

5月20日，比亞迪發布了CTB電池車身一體化技術及首款搭載了CTB技術的e平臺3 0車型。比亞迪CTB電池車身一體化技術簡

2022-05-24

商務部：堅定致力于實現全面、高水平的亞太自貿區

人民網北京5月23日電（記者趙竹青）據商務部網站消息，21至22日，亞太經合組織（APEC）舉行第二十八屆貿易部長

2022-05-24

中辦國辦印發《意見》推進實施國家文化數字化戰略

新華社北京5月22日電近日，中共中央辦公廳、國務院辦公廳印發了《關于推進實施國家文化數字化戰略的意見》（以下

2022-05-24

初夏看市場：“菜籃子”產品生產供應充足蔬菜在田面積達9877.2萬畝

人民網北京5月23日電（記者李棟）據農業農村部最新發布，我國主要“菜籃子”產品生產供應充足，當前蔬菜在田面

2022-05-24

上海浦東重點生產企業復工復產超1100家

新華社上海5月22日電（記者楊有宗）記者22日從上海市浦東新區獲悉，浦東新區企業復工復產持續推進，截至目前，在

2022-05-24

測評

軟件

Win12原型系統的用戶界面曝光微軟正測試下代桌面操作系統

2023-03-28

微信Mac版迎來2023年首次更新正式發布3.7.0升級

2023-02-09

微軟更新Windows官方文檔音頻同步Bug影響視頻錄制應用

2022-11-14

習言道 | 治國必治邊、治邊先穩藏

2022-05-24

學習關鍵詞丨為有源頭活水來

2022-05-24

Win12原型系統的用戶界面曝光微軟正測試下代桌面操作系統

微信Mac版迎來2023年首次更新正式發布3.7.0升級

微軟更新Windows官方文檔音頻同步Bug影響視頻錄制應用

習言道 | 治國必治邊、治邊先穩藏

學習關鍵詞丨為有源頭活水來

如何加快推進氣象現代化建設——權威解讀《氣象高質量發展綱要（2022－2035年）》

上海：有序恢復老人新冠疫苗和兒童計劃免疫接種服務

交通銀行：全力護航滬上企業復工復產

中國文化節活動在莫斯科舉行

專訪：金磚合作助益新型全球化——訪俄羅斯金磚國家研究國家委員會專家沃爾洪斯基

數碼

索尼發布最新全畫幅ZV系列Vlog相機相機參數曝光

佳能新專利公示：F1.4大光圈超廣角鏡頭或將發布

佳能全畫幅旗艦相機EOSR50或2023年2月發布

上海市崇明生態環島防汛工程正式復工

民航局向東航MU772航班發出熔斷指令

1-4月我國軟件業務收入27735億元同比增長10.8%

當前熱議!小羊駝：訓練成本僅300美元的斯坦福開源模型，適合創業公司打造自己的AI模型

13

世界焦點！蘇墾農發（601952）：技術指標出現看漲信號-KDJ 低位金叉（04-13）

13

速看：“周杰倫”又來！第四次沖擊IPO，減肥咖啡銷售腰斬，真有效還是“智商稅”？

13

事業單位招聘面試流程_事業單位面試流程

13

環球信息:螃蟹不熟吃了會怎樣?

13

世界新動態：商湯科技概念股板塊4月12日漲2.1%，科大訊飛領漲，主力資金凈流入1.01億元

13

速遞！男的都喜歡什么禮物

13

環球熱消息：皇馬此前15次歐冠淘汰賽首回合主場贏兩球，最終12次晉級

13

被吳磊倒追的快樂，誰懂啊？

12

【天天熱聞】BR記者：若獨行俠能留下歐文他們將會關注艾頓&特納&科林斯

12

當前快報:明星買房“跳單”風波追蹤：謝娜、張杰因名譽權起訴中介公司

12

當前報道:04.12盤后

12

當前短訊！前20席位凈持倉較長時間內處于凈空態勢空頭第一占市場20%

破解手機屏幕使用時的一大難題蘋果新專利曝光

蘋果考慮將iPhone系列進一步延伸 2024年上市？

卷出一塊好曲屏真我10系列新品發布會舉行

英國猴痘病例數預計將大幅上升

上海：視情適當延長畢業生在校生身份時間

國家電網確定新型電力系統科技攻關十大重點項目

比亞迪發布CTB電池車身一體化技術

商務部：堅定致力于實現全面、高水平的亞太自貿區

中辦國辦印發《意見》推進實施國家文化數字化戰略

初夏看市場：“菜籃子”產品生產供應充足蔬菜在田面積達9877.2萬畝

上海浦東重點生產企業復工復產超1100家

當前熱議!小羊駝：訓練成本僅300美元的斯坦福開源模型，適合創業公司打造自己的AI模型

13

世界焦點！蘇墾農發（601952）：技術指標出現看漲信號-KDJ 低位金叉（04-13）

13

速看：“周杰倫”又來！第四次沖擊IPO，減肥咖啡銷售腰斬，真有效還是“智商稅”？

13

事業單位招聘面試流程_事業單位面試流程

13

環球信息:螃蟹不熟吃了會怎樣?

13

世界新動態：商湯科技概念股板塊4月12日漲2.1%，科大訊飛領漲，主力資金凈流入1.01億元

13

速遞！男的都喜歡什么禮物

13

環球熱消息：皇馬此前15次歐冠淘汰賽首回合主場贏兩球，最終12次晉級

13

被吳磊倒追的快樂，誰懂啊？

12

【天天熱聞】BR記者：若獨行俠能留下歐文 他們將會關注艾頓&特納&科林斯

12

當前快報:明星買房“跳單”風波追蹤：謝娜、張杰因名譽權起訴中介公司

12

當前報道:04.12盤后

12

當前短訊！前20席位凈持倉較長時間內處于凈空態勢 空頭第一占市場20%

破解手機屏幕使用時的一大難題 蘋果新專利曝光

蘋果考慮將iPhone系列進一步延伸 2024年上市？

卷出一塊好曲屏 真我10系列新品發布會舉行

英國猴痘病例數預計將大幅上升

上海：視情適當延長畢業生在校生身份時間

國家電網確定新型電力系統科技攻關十大重點項目

比亞迪發布CTB電池車身一體化技術

商務部：堅定致力于實現全面、高水平的亞太自貿區

中辦國辦印發《意見》 推進實施國家文化數字化戰略

初夏看市場：“菜籃子”產品生產供應充足 蔬菜在田面積達9877.2萬畝

上海浦東重點生產企業復工復產超1100家

【天天熱聞】BR記者：若獨行俠能留下歐文他們將會關注艾頓&特納&科林斯

當前短訊！前20席位凈持倉較長時間內處于凈空態勢空頭第一占市場20%

破解手機屏幕使用時的一大難題蘋果新專利曝光

卷出一塊好曲屏真我10系列新品發布會舉行

中辦國辦印發《意見》推進實施國家文化數字化戰略

初夏看市場：“菜籃子”產品生產供應充足蔬菜在田面積達9877.2萬畝