應該有人敢挑戰GPT—3的壟斷地位!
應該有人敢挑戰GPT—3的壟斷地位!
GPT—3自問世以來已經成為最大的AI語言模型之一。
不僅可以為Python深度學習寫郵件,寫文章,創建網站,甚至生成代碼。
最近,一個侏羅紀模型聲稱能夠擊敗GPT—3。
誰這么有勇氣,居然敢喊。
不是侏羅紀公園的恐龍!是侏羅紀—1 Jumbo,還在測試中!
現在,您還可以免費體驗它:
除了能夠將Python代碼轉換成Javascript之外,這種語言模型還有什么了不起的。
大膽,但強大
在機器學習中,參數是模型的一部分,從歷史訓練數據中學習。
一般來說,在語言領域,參數越多,模型越復雜。
侏羅紀—1巨型模型包含1780億個參數。
突然之間,GPT—3有了30億個參數!
GPT有5萬個詞匯項目。
可是,侏羅紀—1可以識別25萬個表情,單詞和短語。
覆蓋范圍比包括GPT—3在內的大多數現有型號都大。
侏羅紀—1模型已經過云訓練,一個公共服務上有幾百個分布式GPU。
Token是一種在自然語言中將文本片段分成更小單元的方法,這些單元可以是單詞,字符或單詞的一部分。
侏羅紀—1訓練數據集有3000億個token,都是從維基百科,新聞出版物,StackExchange等英文網站編譯而來。
模型的訓練采用傳統的自監測和自回歸形式,從公共資源中訓練3000億代幣。
在優化程序方面,研究人員對J1—Large和J1—Jumbo分別使用了1.2次10—4和0.6倍,10—4,批量大小為200萬和320萬代幣
每個字節的平均對數概率表明該模型在不同領域的適用性
研究人員說,在幾乎所有的語料庫中,侏羅紀—1模型都領先于GPT—3。
在小樣本學習的測試上,各有輸贏,但兩個模型的平均分是相等的。
在基準測試中,侏羅紀1號在回答學術和法律問題上的表現與GPT 3號相當,甚至更好。
GPT—3需要11個令牌,而侏羅紀—1只需要4個令牌,大大提高了樣本效率。
當然,對于語言模型來說,最難的問題是邏輯和數學。
而侏羅紀—1 Jumbo可以解決兩個大數相加這個非常簡單的算術問題。
侏羅紀可以解釋一個詞的意思
面對各種語言模式,侏羅紀—1 Jumbo只能算是后起之秀,并不是什么新奇的模式。
但是和它的前輩類似,如果問題不清楚,大概率的答案不是你想要的。
堪稱產品經理的終結者。
即使是自己的人在有偏見時也會戰斗
侏羅紀—1模型由AI21實驗室開發,將通過AI21實驗室的Studio平臺提供服務。
開發人員可以在公共測試版中構建應用程序原型,如虛擬代理和聊天機器人。
此外,在公測版中,侏羅紀—1模型和Studio也可以用于解釋和總結,例如從產品描述中生成簡短的產品名稱。
根據內容對新聞進行分類
同時,開發者也可以訓練自己的侏羅紀—1模型,甚至只需要50—100個訓練實例。
經過培訓,可以通過AI21 Studio使用這個自定義模型。
可是,《侏羅紀—1》也面臨著其他語言模式的痛點:對性別,種族,宗教的偏見。
由于模型訓練數據集在一定程度上存在偏差,訓練出來的模型也會學壞。
一些研究人員指出,GPT—3和其他類似語言模型生成的文本可能會強化極端右翼極端主義的意識形態和行為。
侏羅紀模型的輸出面臨預設場景的問題
有鑒于此,AI2實驗室正在限制公共測試版中可以生成的文本量,并打算手動審查每個微調模型。
可是,即使是微調的模型也無法擺脫訓練過程中的壞習慣。
就像Open AI的Codex一樣,它仍然會生成種族主義或其他令人反感的可執行代碼。
雖然是以色列研究人員開發的,但很可能受到訓練數據集的影響《侏羅紀—1》似乎比《GPT—3》更歧視猶太人
在偏見和歧視的問題上,所有的模式都是釜底抽薪。
可是,AI21實驗室的工程師表示,侏羅紀—1模型的偏差小于GPT—3。
鄭重聲明:此文內容為本網站轉載企業宣傳資訊,目的在于傳播更多信息,與本站立場無關。僅供讀者參考,并請自行核實相關內容。
版權聲明:凡注明“來源:“生活消費網”的所有作品,版權歸生活消費網 | 專注于國內外今日生活資訊網站所有。任何媒體轉載、摘編、引用,須注明來源生活消費網 | 專注于國內外今日生活資訊網站和署著作者名,否則將追究相關法律責任。
-
實現種源自主可控中國兩部門聯合印發現代種業提升規劃下決心打一場種業翻身仗記者12日從中國農業農村部獲悉,最近幾天,國家發展改革委,農業農村部聯合發布《十四五現代種業提升工程建設規劃》,對十四五期間我國現代種業升級工程建設進行全面部署種業是農業的芯片,是否先進關系到農業現代......2021-08-12 19:08
-
機器學習等人工智能項目優秀的求職者在求職時更有競爭力更容易被企業追捧全球專業招聘集團軒尼詩最近幾天發布2021年《中國大陸科技行業報告》,稱中國在人工智能領域處于領先地位,擁有全球近60%的大數據專家可是,伴隨著行業的不斷細分和新賽道的快速發展,人才的供給側和需求側存......2021-08-12 19:02
-
本次減持的王南斌不屬于公司控股股東或實際控制人8月11日晚間,三生公告稱,公司于當日收到王南斌的《關于股份減持計劃實施結果的告知函》,截至公告日,王南斌減持計劃期限已屆滿。 2021年5月25日至2021年8月10日,王南斌減持公司股份432萬......2021-08-12 18:59
-
中國人壽保險公告公司2021年1—7月累計原保險保費收入約4689億元寧波云升:7月以來,公司使用的主要原材料價格持續上漲 連續三日跌停的寧波云升公布,今年7月以來,公司使用的主要原材料價格持續上漲,其中金屬鐠釹價格較一個月前上漲超過30%,其價格波動直接影響公司生產......2021-08-12 18:58
-
2.中國智能汽車行業目前的市場形勢和企業日益激烈的競爭格局仍不穩定1.DJI進入汽車行業提供自動駕駛系統 日前,DJI正式推出智能駕駛業務品牌DJI汽車,致力于用空間智能技術賦能出行,專注于R&D智能駕駛系統及其核心零部件的生產和銷售DJI汽車將于4月19日在上海......2021-08-12 18:56