首頁 > 生活 >

通過在該方法上施加一個小trick將Transformer的推理速度提高4.5倍！

發布時間：2022-01-04 11:46 來源：TechWeb 閱讀量：11153

最近，NLP明星公司Hugging Face發布了一個叫做Infinity的產品，可以以1ms延時完成Transformer的推理，性能相當高了。

通過在該方法上施加一個小trick將Transformer的推理速度提高4.5倍！

但是，厲害歸厲害，還是有點貴mdash，mdash，1年至少要十幾萬塊。

那有沒有什么平替的方法呢。

有的！還是開源的，不費吹灰之力就可以達到Infinity一些公共基準的那種。

并且現在，通過在該方法上施加一個小trick，將Transformer的推理速度提高4.5倍！

帖子發布不到一天就收獲了250+熱度

那么，一個平替到底為什么能達到付費的效果呢。

一個trick讓Transformer推理速度提高4.5倍

先來認識一下這個方法:Transformer—deploy。

它可以用一行命令優化和部署Hugging Face上的Transformer模型，并支持大多數基于Transformer編碼器的模型，比如Bert，Roberta，miniLM，Camembert，Albert，XLM—R，Distilbert等。

Transformer—deploy推理服務器用的是Nvidia Triton。

推理引擎為Microsoft ONNX Runtime和Nvidia TensorRT。

如果想在GPU上獲得一流的性能，Nvidia Triton+Nvidia TensorRT這樣的組合無疑是最佳選擇。

雖然TensorRT用起來有點難，但它確實能比用Pytorch快5～10倍。

在實際性能測試中，Transformer—deploy在batch size為1，token分別為16和128的輸入序列中的推理速度，都比付費的Hugging Face Infinity要快:

Transformer—deploy在token為16時要1.52ms，Infinity則需要1.7ms，token為128時需要1.99ms，Infinity則需要2.5ms。

那前面說的能讓Transformer的推理性能進一步提高的小trick是什么呢。

GPU量化。不過，和其他很多Transformer變體的論文一樣，這篇論文的標題也引發了一些吐槽：。

據我所知，目前任何OOS云服務都還沒用到過這個方法。

不過執行GPU量化需要修改模型源代碼，既容易出錯，又很無聊，并且還需自己維護修改后的代碼。

后來，他們又發現似乎只需修補模型模塊的抽象語法樹也可以自動完成。

在用戶端，在GPU上執行模型的基本量化類似這樣:

最終，該方法在Roberta—base模型和MNLI數據集上實現了4.53倍的推理速度。

當然這也犧牲了0.4個點的精度，如果一點不犧牲的話，也可以加速3.2倍左右。

最終他們用Albert，Bert，Distilbert，Roberta，Electra測試了該trick。

結果是對于任何可以導出為ONNX格式的Transformer模型，都可以開箱即用。

。

（責編：顧曉蕓）

鄭重聲明：此文內容為本網站轉載企業宣傳資訊，目的在于傳播更多信息，與本站立場無關。僅供讀者參考，并請自行核實相關內容。

版權聲明：凡注明“來源：“生活消費網”的所有作品，版權歸生活消費網 | 專注于國內外今日生活資訊網站所有。任何媒體轉載、摘編、引用，須注明來源生活消費網 | 專注于國內外今日生活資訊網站和署著作者名，否則將追究相關法律責任。

相關閱讀

國潮有溫度新年送吉祥中信銀行信用卡“虎虎生威”新春活動暖心上線
在虎年新春來臨之際，中信銀行信用卡創新助力文化傳承，從生肖寓意出發，特別推出“虎虎生威”新春主題活動，送上一份有溫度的開年好禮。此次新春活動將金融服務與新春文化相結合，在提供生活權益、滿足節日消費需求......

2022-01-04 11:43
在孩子心中播下科學種子
新年第一天，神舟十三號航天員乘組的翟志剛，王亞平，葉光富，在中國空間站為來自北京，香港和澳門的青年學子送上了一份特殊的新年禮物——天宮對話這是一次別開生面的互動，也是一次直擊心靈的交流作為國家太空......

2022-01-04 11:35
開盤：A股三大指數集體高開滬指漲0.26%，中藥板塊領漲，報29098.41點
今日A股迎來2022年第一個交易日，早盤三大指數集體高開，滬指漲0.26%，報3649.15點，深成指漲0.52%，報14935.23點，創業板指漲0.77%，報3348.13點，盤面上，中藥，商湯概......

2022-01-04 11:30
由省文物局主辦的全省文博人才名師帶徒計劃啟動儀式在省博物館舉行
師徒傳承，守正創新日前，由省文物局主辦的全省文博人才名師帶徒計劃啟動儀式在省博物館舉行此計劃分三期第一期的籌備工作歷時3個月，得到各設區市文廣新旅局的積極響應和各級文博單位的配合支持，全省有30位......

2022-01-04 11:05
中國概念股周一收盤漲跌互現新能源車股普漲怪獸充電漲超24％Moderna跌7.45%
，投資者持續關注奧密克戎變異病毒，通脹與央行政策前景帶來的影響，美股集體收漲，道指漲近250點，新能源車股，旅行概念股漲幅居前，部分抗疫概念股，黃金股，白銀股走弱，特斯拉收漲13.5%，法拉第未來收漲......

2022-01-04 10:53

財經

s01

s05

旅游

國內的十條網紅公路

國內的十條網紅公路

云南優壹文旅聯合文旅行業共同成立 2022文旅夜游生態產業創新發展由中聯路海承監的第四師可克達拉市玩在千島湖，吃在我姐家國內的十條網紅公路

教育

快樂暑假健康成長

快樂暑假健康成長

孩子中學學習陷瓶頸？優學派AI學線下大校區教學！積云教育讓IT職 23年中級會計考生購課享雙十一冰 2022初級會計職稱考試成績公布樂友第六屆“913新生兒節”，開

文史

河北唐山：又到東方白鸛沿海育雛時

河北唐山：又到東方白鸛沿海育雛時

河北唐山：又到東方白鸛沿海育雛時第30屆中國廚師節開幕展示餐飲人《狼圖騰》推手安波舜推出長篇成長 “萬里千言話長城”主題征文活動正孔子學院迎來“改制”：民間基金會

最新

生活消費網

關于我們| 網站地圖| 廣告服務| 免責聲明|

生活消費網 | 專注于國內外今日生活資訊網站版權所有，未經書面授權禁止使用

生活消費網 | 專注于國內外今日生活資訊網站主辦版權所有：生活消費網 | 專注于國內外今日生活資訊網站 Copyright © 2007- by http://www.orangecountyfilmmakers.com/ All Rights Reserved

違法和不良信息舉報請電郵聯系，合作洽談也可聯系相關人員。皖ICP備2023007381號在線客服:znx177@sina.com

欧美人与性动交α欧美精品|国产自产一线在线视频|晚上你懂在线一区二区|久久狠狠中文字幕2020|亚洲中文字幕在线第二页