首頁 > 財經 >

斯坦?！安菽囫R”火了：100美元就能比肩GPT-3.5，手機都能運行的那

發布時間：2023-03-16 11:47 來源：IT之家閱讀量：17493

一夜之間，大模型界又炸出個 big news！

斯坦福發布 Alpaca:

只花 100 美元，人人都可微調 Meta 家 70 億參數的 LLaMA 大模型，效果竟可比肩 1750 億參數的 GPT-3.5。

而且還是單卡就能運行的那種，甚至樹莓派、手機都能 hold ??！

還有一個更絕的“騷操作”。

研究所涉及到的數據集，是斯坦福團隊花了不到 500 美元用 OpenAI 的 API 來生成的。

所以整個過程下來，就等同于 GPT-3.5 自己教出了個旗鼓相當的對手 AI。

然后團隊還說，用大多數云計算平臺去微調訓練好的模型，成本也不到 100 美元:

復制一個 GPT-3.5 效果的 AI，很便宜，很容易，還很小。

而且團隊還把數據集、代碼統統都給開源了，這下子人人都能去微調個效果炸裂的對話 AI:

項目在 GitHub 發布才半天時間，便已經狂攬 1800 + 星，火爆程度可見一斑。

Django 聯合開發者甚至對斯坦福的新研究用“驚天大事”來形容:

不僅如此，斯坦福團隊還搞了個 demo，在線可玩的那種。

話不多說，我們現在就來看看這個“草泥馬”的效果。

比肩 davinci-003 的草泥馬 Aplaca

在斯坦福官方的演示中，他們先小試牛刀地提了一個問題:

什么是羊駝？它和美洲駝的區別是什么？

草泥馬 Aplaca 給出的答案較為干練:

羊駝是一種小型駱駝科動物，原產于秘魯、玻利維亞、厄瓜多爾和智利；它比美洲駝小，羊毛更細，也沒有駝峰。

而后又簡單的介紹了二者群居生活的不同。

同樣的問題若是交給 ChatGPT，則答案就不會像草泥馬 Aplaca 那般簡潔:

對此，團隊給出的解釋是:

Alpaca 的答案通常比 ChatGPT 短，反映出 text-davinci-003 的輸出較短。

而后團隊演示了讓草泥馬 Alpaca 寫郵件:

寫一封 e-mail 祝賀被斯坦福大學錄取的新生，并提到你很高興能親自見到他們。

草泥馬 Alpaca 對于這個任務也是信手拈來，直接給出了一個像模像樣的郵件模板:

難度再次進階，團隊這次提出了讓草泥馬 Alpaca 寫論文摘要的需求:

寫一篇經過深思熟慮的機器學習論文摘要，證明 42 是訓練神經網絡的最優 seed。

草泥馬 Alpaca 給出的答案從內容上來看，非常符合大多數論文的摘要形式:試圖回答什么問題、用了什么方法、結果如何，以及未來展望。

當然，也有迫不及待的網友親自下場試驗，發現草泥馬 Alpaca 寫代碼也是不在話下。

不過即便草泥馬 Alpaca 能夠 hold 住大部分問題，但這并不意味著它沒有缺陷。

例如團隊便演示了一個例子，在回答“坦桑尼亞的首都是哪里”的問題時，草泥馬 Alpaca 給出的答案是“達累斯薩拉姆”。

但實際上早在 1975 年便被“多多馬”取代了。

除此之外，若是親自體驗過草泥馬 Alpaca 就會發現，它…… 巨慢:

對此，有網友認為可能是使用的人太多的原因。

筆記本、手機、樹莓派都能跑

Meta 開源的 LLaMA 大模型，剛發布幾周就被大家安排明白了，單卡就能運行。

所以理論上，基于 LLaMA 微調的 Alpaca 同樣可以輕松在本地部署。

沒有顯卡也沒關系，蘋果筆記本甚至樹莓派、手機都可以玩。

在蘋果筆記本部署 LLaMA 的方法來自 GitHub 項目 llama.cpp，使用純 C / C++ 做推理，還專門對 ARM 芯片做了優化。

作者實測，M1 芯片的 MacBook Pro 上即可運行，另外也支持 Windows 和 Linux 系統。

還是這個 C++ 移植版本，有人成功在 4GB 內存的樹莓派 4 上成功運行了 LLaMA 的 70 億參數版本。

雖然速度非常慢，大約 10 秒生成一個 token。

更離譜的是僅僅 2 天之后，有人把 LLaMA 模型量化壓縮后成功在 Pixel 6 安卓手機上運行(26 秒一個 token)。

Pixel 6 使用谷歌自研處理器 Google Tensor，跑分成績在驍龍 865 + 到 888 之間，也就是說新一點的手機理論上都能勝任。

微調數據集也開源

斯坦福團隊微調 LLaMA 的方法，來自華盛頓大學 Yizhong Wang 等去年底提出的 Self-Instruct。

以 175 個問題作為種子任務，讓 AI 自己從中組合出新的問題以及生成配套答案實例，人工過濾掉低質量的，再把新任務添加到任務池里。

所有這些任務，之后可以采用 InstructGPT 的方法讓 AI 學會如何遵循人類指令。

套娃幾圈下來，相當于讓 AI 自己指導自己。

斯坦福版 Alpaca，就是花了不到 500 美元使用 OpenAI API 生成了 5.2 萬個這樣的示例搞出來的。

這些數據同樣開源了出來，并且比原論文的數據多樣性更高。

同時還給出了生成這些數據的代碼，也就是說如果有人還嫌不夠，可以再去自行擴充微調數據，繼續提高模型的表現。

微調代碼也會在 HuggingFace 官方支持 LLaMA 后放出。

不過 Alpaca 最終的模型權重需要 Meta 許可才能發布，并且繼承了 LLaMA 的非商用開源協議，禁止任何商業用途。

并且由于微調數據使用了 OpenAI 的 API，根據使用條款也禁止用來開發與 OpenAI 形成競爭的模型。

One More Thing

還記得 AI 繪畫的發展歷程嗎？

2022 年上半年還只是話題熱度高，8 月份 Stable Diffusion 的開源讓成本下降到可用，并由此產生爆炸式的工具創新，讓 AI 繪畫真正進入各類工作流程。

語言模型的成本，如今也下降到了個人電子設備可用的程度。

最后還是由 Django 框架創始人 Simon Willison 喊出:

大語言模型的 Stable Diffusion 時刻到了。

（責編：李陳默）

鄭重聲明：此文內容為本網站轉載企業宣傳資訊，目的在于傳播更多信息，與本站立場無關。僅供讀者參考，并請自行核實相關內容。

版權聲明：凡注明“來源：“生活消費網”的所有作品，版權歸生活消費網 | 專注于國內外今日生活資訊網站所有。任何媒體轉載、摘編、引用，須注明來源生活消費網 | 專注于國內外今日生活資訊網站和署著作者名，否則將追究相關法律責任。

相關閱讀

投資提速穩經濟政策顯效
一攬子穩經濟政策持續釋放效能，投資消費增速回暖，國民經濟運行企穩回升。3月15日，國新辦舉行新聞發布會。會上，國家統計局新聞發言人、國民經濟綜合統計司司長付凌暉在介紹2023年1-2月國民經濟運行情況......

2023-03-16 11:23
云南咖啡品牌化向上突破，四葉咖完成數千萬元天使輪融資
據悉,以云南咖啡為特色的精品咖啡連鎖品牌「CLOVESCOFFEE四葉咖」(以下簡稱「四葉咖」)已完成數千萬元天使輪融資,本輪由天圖投資和內向基金聯合投資?！杆娜~咖」于2021年6月26日在昆明公園1......

2023-03-16 11:20
從Canary頻道回到其它頻道只能重裝系統，微軟給WindowsInsi
，本月早些時候，微軟擴展了WindowsInsider計劃，增加了一個新的Canary頻道。其工作方式類似于現已消亡的SkipAheadRing，為愛好者提供更早的體驗Windows最新功能的機會，當......

2023-03-16 11:17
保險業協會副秘書長馬曉偉：將探索保險業消保從業人員資格認證體系研究
“3·15”將近，中國保險行業協會也針對2022年保險業消保工作給出了答案。 3月13日，保險業協會黨委委員、副秘書長馬曉偉接受采訪時表示，2022年，保險業勇于擔當，落實保險機構的主體責任，緊緊抓......

2023-03-16 11:03
中國平安2022年歸母凈利潤837.74億同比下降17.6%
:3月15日晚間，中國平安發布2022年業績公告。報告期內，中國平安實現歸屬于母公司股東的營運利潤1483.65億元，同比增長0.3%；歸屬于母公司股東的凈利潤837.74億元，同比下降17.6%......

2023-03-16 10:46

財經

s01

s05

旅游

國內的十條網紅公路

國內的十條網紅公路

云南優壹文旅聯合文旅行業共同成立 2022文旅夜游生態產業創新發展由中聯路海承監的第四師可克達拉市玩在千島湖，吃在我姐家國內的十條網紅公路

教育

快樂暑假健康成長

快樂暑假健康成長

孩子中學學習陷瓶頸？優學派AI學線下大校區教學！積云教育讓IT職 23年中級會計考生購課享雙十一冰 2022初級會計職稱考試成績公布樂友第六屆“913新生兒節”，開

文史

河北唐山：又到東方白鸛沿海育雛時

河北唐山：又到東方白鸛沿海育雛時

河北唐山：又到東方白鸛沿海育雛時第30屆中國廚師節開幕展示餐飲人《狼圖騰》推手安波舜推出長篇成長 “萬里千言話長城”主題征文活動正孔子學院迎來“改制”：民間基金會

最新

生活消費網

關于我們| 網站地圖| 廣告服務| 免責聲明|

生活消費網 | 專注于國內外今日生活資訊網站版權所有，未經書面授權禁止使用

生活消費網 | 專注于國內外今日生活資訊網站主辦版權所有：生活消費網 | 專注于國內外今日生活資訊網站 Copyright © 2007- by http://www.orangecountyfilmmakers.com/ All Rights Reserved

違法和不良信息舉報請電郵聯系，合作洽談也可聯系相關人員。皖ICP備2023007381號在線客服:znx177@sina.com

欧美人与性动交α欧美精品|国产自产一线在线视频|晚上你懂在线一区二区|久久狠狠中文字幕2020|亚洲中文字幕在线第二页