《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業界動態 > 昆侖萬維開源2千億稀疏大模型天工MoE

昆侖萬維開源2千億稀疏大模型天工MoE

全球首創能用4090推理
2024-06-04
來源:極客網

2024年6月3日,昆侖萬維宣布開源 2 千億稀疏大模型 Skywork-MoE , 性能強勁, 同時推理成本更低。Skywork-MoE 基于之前昆侖萬維開源的 Skywork-13B 模型中間 checkpoint 擴展而來,是首個完整將 MoE Upcycling 技術應用并落地的開源千億 MoE大模型,也是首個支持用單臺 4090 服務器推理的開源千億 MoE大模型。

開源地址:

Skywork-MoE 的模型權重、技術報告完全開源,免費商用,無需申請:

?模型權重下載:

?https://huggingface.co/Skywork/Skywork-MoE-base

?https://huggingface.co/Skywork/Skywork-MoE-Base-FP8

?模型開源倉庫:https://github.com/SkyworkAI/Skywork-MoE

?模型技術報告:https://github.com/SkyworkAI/Skywork-MoE/blob/main/skywork-moe-tech-report.pdf

?模型推理代碼:(支持 8x4090 服務器上 8 bit 量化加載推理) https://github.com/SkyworkAI/vllm

模型架構:

本次開源的 Skywork-MoE 模型隸屬于天工 3.0 的研發模型系列,是其中的中檔大小模型(Skywork-MoE-Medium),模型的總參數量為 146B,激活參數量 22B,共有 16 個 Expert,每個 Expert 大小為 13B,每次激活其中的 2 個 Expert。

天工 3.0 還訓練了 75B (Skywork-MoE-Small) 和 400B (Skywork-MoE-Large)兩檔 MoE 模型,并不在此次開源之列。

模型能力:

我們基于目前各大主流模型評測榜單評測了 Skywork-MoE,在相同的激活參數量 20B(推理計算量)下,Skywork-MoE 能力在行業前列,接近 70B 的 Dense 模型。使得模型的推理成本有近 3 倍的下降。同時 Skywork-MoE 的總參數大小比 DeepSeekV2 的總參數大小要小 1/3,用更小的參數規模做到了相近的能力。


技術創新:

為了解決 MoE 模型訓練困難,泛化性能差的問題,相較于 Mixtral-MoE, Skywork-MoE 設計了兩種訓練優化算法:

1.Gating Logits 歸一化操作

我們在 Gating Layer 的 token 分發邏輯處新增了一個 normalization 操作,使得 Gating Layer 的參數學習更加趨向于被選中的 top-2 experts,增加 MoE 模型對于 top-2 的置信度:


2.自適應的 Aux Loss

有別于傳統的固定系數(固定超參)的 aux loss, 我們在 MoE 訓練的不同階段讓模型自適應的選擇合適的 aux loss 超參系數,從而讓 Drop Token Rate 保持在合適的區間內,既能做到 expert 分發的平衡,又能讓 expert 學習具備差異化,從而提升模型整體的性能和泛化水平。在 MoE 訓練的前期,由于參數學習不到位,導致 Drop Token Rate 太高(token 分布差異太大),此時需要較大的 aux loss 幫助 token load balance;在 MoE 訓練的后期,我們希望 Expert 之間仍保證一定的區分度,避免 Gating 傾向為隨機分發 Token,因此需要較低的 aux loss 降低糾偏。


訓練 Infra

如何對 MoE 模型高效的進行大規模分布式訓練是一個有難度的挑戰,目前社區還沒有一個最佳實踐。Skywork-MoE 提出了兩個重要的并行優化設計,從而在千卡集群上實現了 MFU 38% 的訓練吞吐,其中 MFU 以 22B 的激活參數計算理論計算量。

1. Expert Data Parallel

區別于 Megatron-LM 社區已有的 EP(Expert Parallel)和 ETP(Expert Tensor Parallel)設計,我們提出了一種稱之為 Expert Data Parallel 的并行設計方案,這種并行方案可以在 Expert 數量較小時仍能高效的切分模型,對 Expert 引入的 all2all 通信也可以最大程度的優化和掩蓋。相較于 EP 對 GPU 數量的限制和 ETP 在千卡集群上的低效, EDP 可以較好的解決大規模分布式訓練 MoE 的并行痛點,同時 EDP 的設計簡單、魯棒、易擴展,可以較快的實現和驗證。


一個最簡單的 EDP 的例子,兩卡情況下 TP = 2, EP = 2, 其中 Attention 部分采用 Tensor Parallel , Expert 部分采用 Expert Parallel

2.非均勻切分流水并行

由于 first stage 的 Embedding 計算和 last stage 的 Loss 計算,以及 Pipeline Buffer 的存在, 流水并行下均勻切分 Layer 時的各 stage 計算負載和顯存負載均有較明顯的不均衡情況。我們提出了非均勻的流水并行切分和重計算 Layer 分配方式,使得總體的計算/顯存負載更均衡,約有 10% 左右的端到端訓練吞吐提升。


比較均勻切分和非均勻切分下的流水并行氣泡:對于一個 24 層 Layer 的 LLM, (a) 是均勻切分成 4 個 stage,每個 stage 的 layer 數量是:[6, 6, 6, 6].(b) 是經過優化后的非均勻切分方式,切成 5 個 stage, 每個 stage 的 layer 數量是:[5, 5, 5, 5, 4] , 在中間流水打滿的階段,非均勻切分的氣泡更低。

MoE Know-how

此外,Skywork-MoE 還通過一系列基于 Scaling Laws 的實驗,探究哪些約束會影響 Upcycling 和 From Scratch 訓練 MoE 模型的好壞。


一個可以遵循的經驗規則是:如果訓練 MoE 模型的 FLOPs 是訓練 Dense 模型的 2 倍以上,那么選擇 from Scratch 訓練 MoE 會更好,否則的話,選擇 Upcycling 訓練 MoE 可以明顯減少訓練成本。

4090 推理

Skywork-MoE 是目前能在 8x4090 服務器上推理的最大的開源 MoE 模型。8x4090 服務器一共有 192GB 的 GPU 顯存,在 FP8 量化下(weight 占用 146GB),使用我們首創的非均勻 Tensor Parallel 并行推理方式,Skywork-MoE 可以在合適的 batch size 內達到 2200 tokens/s 的吞吐。天工團隊完整開源了相關的推理框架代碼和安裝環境,詳情參見:https://github.com/SkyworkAI/Skywork-MoE

結語

我們希望本次開源的 Skywork-MoE 模型、技術報告和相關的實驗結果可以給開源社區貢獻更多的 MoE 訓練經驗和 Know-how,包括模型結構、超參選擇、訓練技巧、訓練推理加速等各方面, 探索用更低的訓練推理成本訓更大更強的模型,在通往 AGI 的道路上貢獻一點力量。


Magazine.Subscription.jpg

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
热re99久久精品国产66热_欧美小视频在线观看_日韩成人激情影院_庆余年2免费日韩剧观看大牛_91久久久久久国产精品_国产原创欧美精品_美女999久久久精品视频_欧美大成色www永久网站婷_国产色婷婷国产综合在线理论片a_国产精品电影在线观看_日韩精品视频在线观看网址_97在线观看免费_性欧美亚洲xxxx乳在线观看_久久精品美女视频网站_777国产偷窥盗摄精品视频_在线日韩第一页
  • <strike id="ygamy"></strike>
  • 
    
      • <del id="ygamy"></del>
        <tfoot id="ygamy"></tfoot>
          <strike id="ygamy"></strike>
          日韩一区二区福利| 亚洲高清视频在线| 国产精品xxx在线观看www| 久久成人av少妇免费| 欧美freesex8一10精品| 午夜久久资源| 日韩一级裸体免费视频| 欧美黄色片免费观看| 国产精品二区三区四区| 亚洲综合色噜噜狠狠| 国内精品福利| 欧美日韩精品是欧美日韩精品| 亚洲激情网站免费观看| 亚洲精品国产精品国自产观看浪潮| 欧美不卡一卡二卡免费版| 欧美一区二区三区免费观看视频| 欧美xart系列在线观看| 欧美日韩免费高清一区色橹橹| 欧美日韩精品二区第二页| 欧美性jizz18性欧美| 亚洲欧美另类久久久精品2019| 国产精品网红福利| 国产午夜精品一区二区三区视频| 欧美揉bbbbb揉bbbbb| 91久久精品一区二区三区| 国产精品a级| 亚洲一二三级电影| 亚洲人成在线观看| 国产欧美亚洲一区| 国产精品久久7| 国产农村妇女毛片精品久久莱园子| 国产日韩欧美自拍| 国产精品一级二级三级| 午夜精品久久久久久久99热浪潮| 久久女同精品一区二区| 一区二区91| 亚洲永久字幕| 亚洲欧美中文日韩在线| 老牛嫩草一区二区三区日本| 99精品国产99久久久久久福利| 一区二区动漫| 亚洲影视综合| 欧美三级日本三级少妇99| 亚洲韩国一区二区三区| 国产精品国产三级欧美二区| 欧美日韩大片一区二区三区| 日韩亚洲一区二区| 午夜天堂精品久久久久| 欧美裸体一区二区三区| 亚洲欧美日韩中文播放| 国产精品hd| 亚洲视频在线观看一区| 国产日本欧美一区二区三区在线| 原创国产精品91| 久久精品女人的天堂av| 美日韩精品视频| 国产亚洲福利社区一区| 国产亚洲欧美另类一区二区三区| 国产精品电影网站| 欧美成人情趣视频| 伊伊综合在线| 久久久久久婷| 亚洲欧洲一级| 老色鬼精品视频在线观看播放| 亚洲三级电影全部在线观看高清| 久久人人爽人人爽爽久久| 国产精品久久久久永久免费观看| 国产午夜一区二区三区| 一区二区不卡在线视频 午夜欧美不卡在| 亚洲精品日韩综合观看成人91| 国产日韩精品一区二区三区在线| 亚洲午夜国产成人av电影男同| 136国产福利精品导航网址应用| 欧美日韩视频在线| 欧美日韩一区二区三区在线观看免| 亚洲制服欧美中文字幕中文字幕| 欧美一区二区三区精品| 在线欧美亚洲| 黑人巨大精品欧美黑白配亚洲| 国产偷自视频区视频一区二区| 欧美一区二区免费| 欧美国产综合视频| 亚洲一区二区少妇| 在线视频欧美日韩| 欧美88av| 亚洲专区一区二区三区| 欧美一级久久久| 免费久久99精品国产自在现线| 国产亚洲成年网址在线观看| 国产日韩精品久久久| 国产一区二区| 好吊妞**欧美| 亚洲尤物精选| 久久一区二区三区国产精品| 亚洲欧美日韩系列| 在线观看欧美| 欧美日韩中文精品| 国产视频观看一区| 在线日本欧美| 亚洲一级特黄| 亚洲一区二区三区视频播放| 亚洲伦理中文字幕| 老司机精品导航| 国产一区二区精品在线观看| 亚洲精品国产精品久久清纯直播| 国产精品国产三级国产aⅴ入口| 亚洲亚洲精品在线观看| 亚洲一区三区视频在线观看| 亚洲韩国青草视频| 欧美日韩另类综合| 亚洲国产一区二区三区青草影视| 亚洲精品社区| 欧美一区二区黄色| 日韩午夜av| 美女主播一区| 亚洲综合色婷婷| 蜜桃av综合| 午夜精品国产更新| 亚洲国产高清一区二区三区| 久久久九九九九| 亚洲国产日韩欧美在线99| 久久精品在线播放| 亚洲美女av黄| 日韩亚洲国产精品| 国产九九视频一区二区三区| 激情成人av在线| 精品99一区二区| 99精品欧美一区二区三区综合在线| 亚洲精品亚洲人成人网| 国产欧美日韩三级| 久久久久欧美精品| 亚洲最快最全在线视频| 免费在线亚洲| 一区二区三区波多野结衣在线观看| 国产精品毛片高清在线完整版| 国产精品综合视频| 欧美日本一区二区三区| 美女诱惑黄网站一区| 在线视频你懂得一区| 国产精品专区第二| 久久久久国色av免费看影院| 国产主播在线一区| 亚洲高清久久| 亚洲手机在线| 女人色偷偷aa久久天堂| 国产日韩欧美亚洲一区| 老色批av在线精品| 夜夜嗨一区二区三区| 欧美日韩综合视频网址| 欧美一区二区三区免费视| 国产精品性做久久久久久| 欧美日韩精品免费观看| 欧美日韩一区二区三区| 国产性色一区二区| 免费不卡在线观看| 亚洲性视频网站| 精品88久久久久88久久久| 亚洲国产精品成人精品| 影音先锋中文字幕一区二区| 国产精品一区久久久| 欧美一区91| 国产精品欧美风情| 国产精品热久久久久夜色精品三区| 亚洲四色影视在线观看| 久久久久免费视频| 亚洲一区二区动漫| 国产一区在线视频| 亚洲日本va午夜在线电影| 午夜欧美大尺度福利影院在线看| 国产乱码精品一区二区三区av| 国产精品日韩在线一区| 亚洲综合成人婷婷小说| 日韩视频在线永久播放| 国产精品久久久久久久久免费樱桃| 国产自产精品| 国产午夜精品一区理论片飘花| 亚洲视频播放| 午夜免费久久久久| 亚洲一区日韩| 国产欧美日韩不卡免费| 亚洲影院高清在线| 国产日本欧美一区二区三区| 噜噜噜久久亚洲精品国产品小说| 欧美一区二区在线| 欧美日韩另类一区| 久久久久久综合网天天| 国产欧美另类| 一区二区高清视频| 欧美丝袜第一区| 亚洲第一精品影视| 黄色精品网站| 国产精品久久久爽爽爽麻豆色哟哟| 国产亚洲成精品久久| 亚洲高清视频一区二区| 亚洲精选中文字幕| 欧美国产在线视频| 91久久精品国产91久久性色| 国产日韩综合一区二区性色av| 国产日韩欧美黄色| 亚洲愉拍自拍另类高清精品| 欧美日韩综合在线免费观看| 在线视频日韩精品| 欧美啪啪成人vr| 亚洲精品美女91| 99视频精品全部免费在线| 欧美国产一区二区三区激情无套| 亚洲成色最大综合在线| 久久天堂av综合合色| 国产日韩一区二区三区| 亚洲黄色一区二区三区| 一区二区三区国产在线| 99热在线精品观看| 亚洲第一中文字幕在线观看| 国内精品免费在线观看| 狠狠狠色丁香婷婷综合久久五月| 影音先锋日韩精品| 在线看欧美视频| 国产精品一区二区久激情瑜伽| 猛男gaygay欧美视频| 亚洲电影在线播放| 精品福利免费观看| 国产精品女同互慰在线看| 亚洲一级二级在线| 亚洲一级片在线观看| 久久这里有精品15一区二区三区| 一区二区三区福利| 99综合视频| 国产精品白丝jk黑袜喷水| 亚洲一区二区三区激情| 午夜伦理片一区| 亚洲视频第一页| 狠狠色综合网站久久久久久久| 久久九九国产精品怡红院| 欧美日韩国产91| 久久综合九色| 久久精品水蜜桃av综合天堂| 亚洲国产综合在线看不卡| 国产精品亚洲一区| 国产亚洲一二三区| 免费h精品视频在线播放| 久久精品综合网| 欧美性视频网站| 亚洲午夜性刺激影院| 午夜精品久久久久久久久久久久久| 欧美成黄导航| 另类酷文…触手系列精品集v1小说| 国产精品九九| 欧美另类videos死尸| 欧美精品久久久久久久久老牛影院| 国内一区二区三区| 国产欧美一区二区三区国产幕精品| 欧美国产三级| 欧美日韩一区二区三区四区五区| 欧美影院成年免费版| 新片速递亚洲合集欧美合集| 久久婷婷成人综合色| 91久久精品一区二区三区| 久久综合给合久久狠狠色| 亚洲国产日韩欧美在线图片| 一本久久知道综合久久| 亚洲成人在线视频网站| 1024成人| 精品成人久久| 国产精品区二区三区日本| 一本色道久久综合亚洲二区三区| 欧美国产日本| 久久av一区二区三区漫画| 亚洲韩日在线| 亚洲日本乱码在线观看| 一区二区三区欧美视频| 一区二区三区四区国产| 亚洲视频一二| 欧美日一区二区三区在线观看国产免| 久久高清免费观看| 欧美日韩高清免费| 亚洲国产精品va| 一色屋精品视频免费看| 亚洲午夜久久久久久久久电影网| 亚洲欧美乱综合| 欧美日韩国产色站一区二区三区| 久久久久成人精品免费播放动漫| 久久伊人亚洲| 一区二区亚洲精品国产| 国产在线不卡视频| 欧美大片免费看| 欧美日本韩国在线| 欧美一区二区三区免费视频| 一本久久a久久精品亚洲| 国产精品久久久久一区二区三区| 狠狠色狠色综合曰曰| 正在播放欧美视频| 女仆av观看一区| 亚洲一区国产一区| 欧美一区二区视频免费观看| 国产精品网曝门| 国产精品嫩草99a| 日韩午夜在线观看视频| 亚洲一区国产精品| 久久精品日产第一区二区三区| 亚洲免费高清| 欧美不卡视频一区| 久久人人爽人人| 欧美激情精品久久久久久大尺度| 国产精品久久777777毛茸茸| 日韩视频在线你懂得| 国产精品亚洲综合色区韩国| 午夜精品www| 国产亚洲精品美女| 欧美极品aⅴ影院| 9人人澡人人爽人人精品| 国产欧美日韩不卡免费| 亚洲综合日本| 国产精品一区二区在线观看| 欧美高清视频www夜色资源网| 国产精品普通话对白| 久久久午夜精品| 激情小说另类小说亚洲欧美| 免费一区二区三区| 一色屋精品视频免费看| 欧美另类变人与禽xxxxx| 欧美精品成人一区二区在线观看| 午夜精彩视频在线观看不卡| 欧美视频一区二区三区四区| 欧美日韩色一区| 国产精品99久久久久久久久| 欧美日韩精品中文字幕| 国产欧美日韩另类一区| 亚洲欧美视频在线|