國內首個類ChatGPT模型:復旦大學MOSS今日正式開源,超100萬條
感謝IT之家網友 Colorful M 的線索投遞!
,復旦大學自然語言處理實驗室開發的新版 MOSS 模型今日正式上線,成為國內首個插件增強的開源對話語言模型。
目前,MOSS 模型已上線開源,相關代碼、數據、模型參數已在 Github 和 Hugging Face 等平臺開放,供科研人員下載。
據介紹,MOSS 是一個支持中英雙語和多種插件的開源對話語言模型,moss-moon 系列模型具有 160 億參數,在 FP16 精度下可在單張 A100 / A800 或兩張 3090 顯卡運行,在 INT4/8 精度下可在單張 3090 顯卡運行。MOSS 基座語言模型在約七千億中英文以及代碼單詞上預訓練得到,后續經過對話指令微調、插件增強學習和人類偏好訓練具備多輪對話能力及使用多種插件的能力。
MOSS 來自復旦大學自然語言處理實驗室的邱錫鵬教授團隊,名字與《流浪地球》電影中的 AI 同名,已發布至公開平臺,邀請公眾參與內測。
MOSS 用例:
-
moss-moon-003-base: MOSS-003 基座模型,在高質量中英文語料上自監督預訓練得到,預訓練語料包含約 700B 單詞,計算量約 6.67x1022 次浮點數運算。
-
moss-moon-003-sft: 基座模型在約 110 萬多輪對話數據上微調得到,具有指令遵循能力、多輪對話能力、規避有害請求能力。
-
moss-moon-003-sft-plugin: 基座模型在約 110 萬多輪對話數據和約 30 萬插件增強的多輪對話數據上微調得到,在 moss-moon-003-sft 基礎上還具備使用搜索引擎、文生圖、計算器、解方程等四種插件的能力。
-
moss-moon-003-pm: 在基于 moss-moon-003-sft 收集到的偏好反饋數據上訓練得到的偏好模型,將在近期開源。
-
moss-moon-003: 在 moss-moon-003-sft 基礎上經過偏好模型 moss-moon-003-pm 訓練得到的最終模型,具備更好的事實性和安全性以及更穩定的回復質量,將在近期開源。
-
moss-moon-003-plugin: 在 moss-moon-003-sft-plugin 基礎上經過偏好模型 moss-moon-003-pm 訓練得到的最終模型,具備更強的意圖理解能力和插件使用能力,將在近期開源。
-
moss-002-sft-data: MOSS-002 所使用的多輪對話數據,覆蓋有用性、忠實性、無害性三個層面,包含由 text-davinci-003 生成的約 57 萬條英文對話和 59 萬條中文對話。
-
moss-003-sft-data:moss-moon-003-sft 所使用的多輪對話數據,基于 MOSS-002 內測階段采集的約 10 萬用戶輸入數據和 gpt-3.5-turbo 構造而成,相比 moss-002-sft-data,moss-003-sft-data 更加符合真實用戶意圖分布,包含更細粒度的有用性類別標記、更廣泛的無害性數據和更長對話輪數,約含 110 萬條對話數據。目前僅開源少量示例數據,完整數據將在近期開源。
-
moss-003-sft-plugin-data:moss-moon-003-sft-plugin 所使用的插件增強的多輪對話數據,包含支持搜索引擎、文生圖、計算器、解方程等四個插件在內的約 30 萬條多輪對話數據。目前僅開源少量示例數據,完整數據將在近期開源。
-
moss-003-pm-data:moss-moon-003-pm 所使用的偏好數據,包含在約 18 萬額外對話上下文數據及使用 moss-moon-003-sft 所產生的回復數據上構造得到的偏好對比數據,將在近期開源。
MOSS 的 GitHub 頁面:點此查看
鄭重聲明:此文內容為本網站轉載企業宣傳資訊,目的在于傳播更多信息,與本站立場無關。僅供讀者參考,并請自行核實相關內容。
版權聲明:凡注明“來源:“生活消費網”的所有作品,版權歸生活消費網 | 專注于國內外今日生活資訊網站所有。任何媒體轉載、摘編、引用,須注明來源生活消費網 | 專注于國內外今日生活資訊網站和署著作者名,否則將追究相關法律責任。
-
探路者擬收購國外芯片設計公司芯片板塊收入占比有望提高2023年3月30日晚間,探路者發布公告稱,公司擬以自有資金3852.02萬美元收購國外觸控芯片公司G2Touch72.79%的股權。 2021年9月,探路者收購了北京芯能60%股權,標志著探路者正......2023-04-21 14:15
-
vivoPad2安卓平板發布:12.1英寸屏+天璣9000,2399元起,vivoPad2安卓平板今日正式發布,搭載12.1英寸屏和天璣9000處理器,首發2399元起。 8GB+128GB:首發2399元 8GB+256GB:首發2799元 12GB+......2023-04-21 14:00
-
《高級戰爭1+2復刻版》4月21日登陸任天堂Switch平臺,《高級戰爭1+2復刻版》是一款由WayForward開發,任天堂發行的回合制策略游戲,將于4月21日正式發售,目前已經可以在SwitcheShop上預訂,售59.99美元。不過很可惜,這款游戲暫無亞......2023-04-21 13:57
-
微星RTX3060Ti“超龍”高端顯卡即將推出,僅供中國香港/臺灣地區,微星日前公布了新款GeForceRTX3060TiSUPER3X8GD6XOC顯卡,采用了超龍外觀。這款顯卡不會大范圍上市,僅供中國香港和中國臺灣地區。 超龍是微星顯卡的旗艦型號。消息稱,微星RT......2023-04-21 13:52
-
拉勾招聘:25%AIGC算法工程師崗位月薪超68K,超4成數字科技人才在,拉勾招聘發布《2023第一季度AIGC人才供需報告》顯示,2023年3月,AIGC人才崗位需求量環比增加42%,其中,25%的AIGC算法工程師崗位月薪超68K。 《報告》顯示,今年以來,AIGC......2023-04-21 13:37