《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業界動態 > 【ChatGPT專題】解讀 ChatGPT 背后的技術重點:RLHF、IFT、CoT、紅藍對抗

【ChatGPT專題】解讀 ChatGPT 背后的技術重點:RLHF、IFT、CoT、紅藍對抗

2023-02-15
來源: Hugging Face

  近段時間,ChatGPT 橫空出世并獲得巨大成功,使得 RLHF、SFT、IFTCoT 等這些晦澀的縮寫開始出現在普羅大眾的討論中。這些晦澀的首字母縮略詞究竟是什么意思?為什么它們如此重要?我們調查了相關的所有重要論文,以對這些工作進行分類,總結迄今為止的工作,并對后續工作進行展望。

  我們先來看看基于語言模型的會話代理的全景。ChatGPT 并非首創,事實上很多組織在 OpenAI 之前就發布了自己的語言模型對話代理 (dialog agents),包括 Meta 的 BlenderBot,Google 的 LaMDA,DeepMind 的 Sparrow,以及 Anthropic 的 Assistant (Anthropic 的 Claude 就是部分基于 Assistant 繼續開發而得的)。

  語言模型對話代理產品論文鏈接:

  Meta 的 BlenderBot:

  https://arxiv.org/abs/2208.03188

  Google 的 LaMDA:

  https://arxiv.org/abs/2201.08239

  DeepMind 的 Sparrow:

  https://arxiv.org/abs/2209.14375

  Anthropic 的 Assistant:

  https://arxiv.org/abs/2204.05862

  其中一些團隊還公布了他們構建開源聊天機器人的計劃,并公開分享了路線圖 (比如 LAION 團隊的 Open Assistant),其他團隊肯定也有類似的內容,但尚未宣布。你可以在 Open Assistant 的 GitHub 倉庫中找到其愿景 & 路線圖文檔: https://github.com/LAION-AI/Open-Assistant

  下表根據是否能公開訪問、訓練數據、模型架構和評估方向的詳細信息對這些 AI 聊天機器人進行了比較。ChatGPT 沒有這些信息的記錄,因此我們改為使用 InstructGPT 的詳細信息,這是一個來自 OpenAI 的指令微調模型,據信它是 ChatGPT 的基礎。

微信截圖_20230215173810.png微信截圖_20230215173836.png

  我們觀察到,盡管在訓練數據、模型和微調方面存在許多差異,但也存在一些共性。上述所有聊天機器人的一個共同目標是「指令依從 (instruction following)」,即遵循用戶指定的指令。例如,要求 ChatGPT 寫一首關于微調的詩。

 微信截圖_20230215173855.png

  從預測文本到遵循指令

  通常,基礎模型的語言建模目標不足以讓模型學會以有用的方式遵循用戶的指令。模型創建者使用「指令微調 (Instruction Fine-Tuning,IFT)」方法來達到該目的,該方法除了使用情感分析、文本分類、摘要等經典 NLP 任務來微調模型外,還在非常多樣化的任務集上向基礎模型示范各種書面指令及其輸出,從而實現對基礎模型的微調。這些指令示范由三個主要部分組成 —— 指令、輸入和輸出。輸入是可選的,一些任務只需要指令,如上文使用 ChatGPT 做開放式文本生成的示例。當存在輸入時,輸入和輸出組成一個「實例 (instance)」。給定指令可以有多個輸入和輸出實例。如下例 (摘自 Wang 等,'22):

微信截圖_20230215173912.png

  IFT 的訓練數據通常是人工編寫的指令及用語言模型自舉 (bootstrap) 生成的實例的集合。在自舉時,先使用少樣本技術輸入一些樣本給 LM 用于提示它 (如上圖所示),隨后要求 LM 生成新的指令、輸入和輸出。每一輪都會從人工編寫的樣本和模型生成的樣本中各選擇一些送給模型。人類和模型對創建數據集的貢獻構成了一個譜圖,見下圖:

 微信截圖_20230215173926.png

  譜圖的一端是純模型生成的 IFT 數據集,例如 Unnatural Instructions (Honovich 等,'22);另一端是經由社區的大量努力精心制作的指令如 Super-natural instructions (Wang 等,'22)。在這兩者之間的工作是使用一小組高質量的種子數據集,然后進行自舉生成最終數據集,如 Self-Instruct (Wang 等,'22)。為 IFT 整理數據集的另一種方法是將現有的用于各種任務 (包括提示)的高質量眾包 NLP 數據集使用統一模式或不同模板轉換為指令。這一系列工作包括 T0 (Sanh 等,'22)、Natural instructions 數據集 (Mishra 等,'22)、FLAN LM (Wei 等,'22) 和 OPT-IML (Iyer 等,'22)。

  論文鏈接:

  Unnatural Instructions (Honovich 等, '22):

  https://arxiv.org/abs/2212.09689

  Super-natural instructions (Wang 等, '22):

  https://arxiv.org/abs/2204.07705

  Self-Instruct (Wang 等, '22):

  https://arxiv.org/abs/2212.10560

  T0 (Sanh 等, '22):

  https://arxiv.org/abs/2110.08207

  Natural instructions 數據集 (Mishra 等, '22):

  https://arxiv.org/abs/2104.08773

  FLAN LM (Wei 等, '22):

  https://arxiv.org/abs/2109.01652

  OPT-IML (Iyer 等, '22):

  https://arxiv.org/abs/2212.12017

  安全地遵循指令

  然而,經過指令微調的 LM 并不總是能生成 有幫助的 和 安全的 響應。這種行為的例子包括通過總是給出無益的回應來逃避,例如 “對不起,我不明白?!?或對敏感話題的用戶輸入生成不安全的響應。為了減輕這種行為,模型開發人員使用 有監督微調 (Supervised Fine-tuning, SFT),在高質量的人類標注數據上微調基礎語言模型,以提高有用性和無害性。例如,請參閱下面的表格(摘自 Sparrow 論文的附錄 F)。

  SFT 和 IFT 聯系非常緊密。指令微調可以看作是有監督微調的一個子集。在最近的文獻中,SFT 階段經常被用于提高響應的安全性,而不是接在 IFT 后面提高指令相應的具體性。將來,這種分類和劃分應該日臻成熟,形成更清晰的使用場景和方法論。

微信截圖_20230215173953.png

  谷歌的 LaMDA 也根據一組規則 (論文附錄 A) 在帶有安全標注的對話數據集上進行微調。這些規則通常由模型創建者預先定義和開發,涵蓋廣泛的主題,包括傷害、歧視、錯誤信息。

  微調模型

  同時,OpenAI 的 InstructGPT、DeepMind 的 Sparrow 和 Anthropic 的 Constitutional AI 使用 人類反饋強化學習 (Reinforcement Learning From Human Feedback,RLHF) 來微調模型,該方法使用基于人類偏好的標注數據。在 RLHF 中,根據人類反饋來對模型的響應進行排序標注 (如,根據人類偏好選擇文本簡介)。然后,用這些帶標注的響應來訓練偏好模型,該模型用于返回 RL 優化器的標量獎勵。最后,通過強化學習訓練對話代理來模擬偏好模型。有關更多詳細信息,請參閱我們之前關于 RLHF 的文章: ChatGPT 背后的“功臣”——RLHF 技術詳解。

  思維鏈 (Chain-of-thought,CoT) 提示 (Wei 等,'22) 是指令示范的一種特殊情況,它通過引發對話代理的逐步推理來生成輸出。使用 CoT 微調的模型使用帶有逐步推理的人工標注的指令數據集。這是 Let’s think step by step 這一著名提示的由來。下面的示例取自 Chung 等,'22,橙色高亮的部分是指令,粉色是輸入和輸出,藍色是 CoT 推理。

微信截圖_20230215174015.png

  如 Chung 等,'22 中所述,使用 CoT 微調的模型在涉及常識、算術和符號推理的任務上表現得更好。

  如 Bai 等,'22 的工作所示,CoT 微調也顯示出對無害性非常有效 (有時比 RLHF 做得更好),而且對敏感提示,模型不會回避并生成 “抱歉,我無法回答這個問題” 這樣的回答。更多示例,請參見其論文的附錄 D。

  微信截圖_20230215174045.png

  論文鏈接:

  思維鏈提示 (Wei 等, '22):

  https://arxiv.org/abs/2201.11903

  Let’s think step by step:

  https://arxiv.org/abs/2205.11916

  CoT 圖解示例 (Chung 等, '22):

  https://arxiv.org/abs/2210.11416

  CoT 微調也顯示出對無害性非常有效 (Bai 等, '22):

  ttps://www.anthropic.com/constitutional.pdf

  要點

  與預訓練數據相比,您只需要非常小的一部分數據來進行指令微調 (幾百個數量級);

  使用人工標注的有監督微調使模型輸出更安全和有用;

  CoT 微調提高了模型在需要逐步思考的任務上的性能,并使它們在敏感話題上不那么回避。

  對話代理的進一步工作

  這個博客總結了許多關于使對話代理有用的現有工作。但仍有許多懸而未決的問題有待探索。我們在這里列出了其中的一些。

  RL 在從人類反饋中學習有多重要?我們能否通過在 IFT 或 SFT 中使用更高質量的數據進行訓練來獲得 RLHF 的性能?

  為了安全的角度看,Sparrow 中的 SFT+RLHF 與 LaMDA 中僅使用 SFT 相比如何?

  鑒于我們有 IFT、SFT、CoT 和 RLHF,預訓練有多大的必要性?如何折衷?人們應該使用的最佳基礎模型是什么 (公開的和非公開的)?

  本文中引用的許多模型都經過 紅藍對抗 (red-teaming) 的精心設計,工程師特地搜尋故障模式并基于已被揭示的問題改進后續的訓練 (提示和方法)。我們如何系統地記錄這些方法的效果并重現它們?

  紅藍對抗 (red-teaming) 論文地址:

  https://arxiv.org/abs/2209.07858

  P.s. 如果您發現本博客中的任何信息缺失或不正確,請告知我們。

  引用:

  Rajani et al.,"What Makes a Dialog Agent Useful?", Hugging Face Blog, 2023.

  BibTeX 引用:

  @article {rajani2023ift,

  author = {Rajani, Nazneen and Lambert, Nathan and Sanh, Victor and Wolf, Thomas},

  title = {What Makes a Dialog Agent Useful?},

  journal = {Hugging Face Blog},

  year = {2023},

  note = {https://huggingface.co/blog/dialog-agents},

  }


敬請關注電子技術應用2023年2月22日==>>商業航天研討會<<

微信圖片_20230210170337.jpg

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
热re99久久精品国产66热_欧美小视频在线观看_日韩成人激情影院_庆余年2免费日韩剧观看大牛_91久久久久久国产精品_国产原创欧美精品_美女999久久久精品视频_欧美大成色www永久网站婷_国产色婷婷国产综合在线理论片a_国产精品电影在线观看_日韩精品视频在线观看网址_97在线观看免费_性欧美亚洲xxxx乳在线观看_久久精品美女视频网站_777国产偷窥盗摄精品视频_在线日韩第一页
  • <strike id="ygamy"></strike>
  • 
    
      • <del id="ygamy"></del>
        <tfoot id="ygamy"></tfoot>
          <strike id="ygamy"></strike>
          久久精品一区二区三区不卡牛牛| 亚洲精品极品| 国产精品一区二区欧美| 亚洲人永久免费| 亚洲一区在线播放| 美脚丝袜一区二区三区在线观看| 亚洲精品久久| 国内外成人免费视频| 美女亚洲精品| 极品少妇一区二区三区精品视频| 亚洲精品综合久久中文字幕| 美日韩精品视频| 欧美日韩国产成人在线免费| 欧美一区二区三区四区高清| 国产精品欧美激情| 午夜精品久久久久久久久久久久久| 久久天天综合| 欧美日韩在线播放一区| 国产一区自拍视频| 欧美二区在线播放| 亚洲黄色成人| 国产日韩欧美一区二区三区四区| 99精品国产在热久久下载| 欧美一区二区三区四区高清| 亚洲高清毛片| 欧美日韩在线免费观看| 久热精品视频在线| 亚洲激情啪啪| 国产精品久久久久77777| 亚洲每日更新| 久久久蜜桃一区二区人| 亚洲一卡久久| 欧美日韩中文| 一区二区视频欧美| 精品成人乱色一区二区| 玖玖视频精品| 国产有码在线一区二区视频| 亚洲欧洲一区二区在线播放| 一区二区三区高清视频在线观看| 欧美成人一区二区三区片免费| 久久久精品国产免费观看同学| 136国产福利精品导航| 久久久久久久综合日本| 欧美涩涩网站| 国产女主播在线一区二区| 国产精品日韩欧美| 在线一区日本视频| 亚洲高清久久网| 在线日韩视频| 午夜精品美女自拍福到在线| 欧美理论片在线观看| 欧美11—12娇小xxxx| 亚洲第一区中文99精品| 国内精品美女av在线播放| 久久手机免费观看| 欧美一二三区精品| 国产精品一区2区| 午夜欧美精品| 亚洲欧美日韩一区二区三区在线观看| 国产精品一区免费在线观看| 麻豆久久久9性大片| 久久高清免费观看| 欧美日韩中国免费专区在线看| 欧美freesex8一10精品| 欧美日韩日本视频| 欧美日韩免费区域视频在线观看| 一本色道久久综合亚洲精品不卡| 日韩视频不卡中文| 国产自产高清不卡| 香蕉久久夜色精品| 尤物yw午夜国产精品视频| 久久婷婷丁香| 午夜精品一区二区三区电影天堂| 欧美二区不卡| 国产午夜精品全部视频播放| 91久久精品国产91久久性色| 日韩午夜在线视频| 欧美人妖另类| 在线视频免费在线观看一区二区| 久久精品国产综合| 亚洲精品欧美精品| 美女啪啪无遮挡免费久久网站| 精品69视频一区二区三区| 日韩视频免费在线观看| 国产欧美日韩综合一区在线播放| 国产精品va在线| 久久精品人人| 欧美日韩在线播放一区| 久久久久久色| 国产精品久久久久7777婷婷| 亚洲综合欧美| 国产日韩欧美一区在线| 欧美日韩色婷婷| 欧美怡红院视频一区二区三区| 欧美国产一区二区在线观看| 亚洲美女av网站| 欧美激情区在线播放| 久久精品首页| 亚洲国产精品小视频| 国产精品成人一区二区| 欧美大片在线看| 国产精品欧美日韩一区| 欧美三级电影大全| 欧美午夜国产| 亚洲性感激情| 亚洲国产精品视频一区| 欧美在线视频导航| 亚洲激情女人| 国产欧美日本在线| 亚洲精品在线免费观看视频| 久久综合伊人77777麻豆| 麻豆成人在线| 国产精品一页| 亚洲香蕉在线观看| 亚洲欧洲精品一区二区三区不卡| 亚洲欧美日韩精品一区二区| 欧美日韩精品久久| 欧美日韩亚洲不卡| 亚洲综合精品自拍| 久久综合免费视频影院| 久久精品午夜| 亚洲精品欧美日韩专区| 欧美在线免费视屏| 欧美韩国一区| 亚洲国产精品久久久久| 欧美一区二区精品| 亚洲理论电影网| 一区二区三区成人| 欧美激情精品久久久久| 狠狠做深爱婷婷久久综合一区| 欧美一区二区三区视频在线观看| 国产精品r级在线| 毛片基地黄久久久久久天堂| 久久精品国产精品亚洲| 久久国产手机看片| 国产手机视频精品| 亚洲国产精品久久91精品| 欧美理论电影网| 国产精品久久久久久久久久免费| 久久国产精品亚洲77777| 激情成人av| 激情视频一区二区| 久久综合九色综合欧美就去吻| …久久精品99久久香蕉国产| 久久综合色天天久久综合图片| 国语精品中文字幕| 99精品欧美一区| 黄色日韩在线| 久久久亚洲一区| 亚洲精品国精品久久99热| 欧美黄色精品| 亚洲精品免费在线| 欧美激情亚洲自拍| 欧美风情在线| 欧美一区二区性| 香蕉av777xxx色综合一区| 久久精品91久久久久久再现| 亚洲大胆在线| 99国产一区| 亚洲免费综合| 亚洲欧美第一页| 欧美激情四色| 欧美不卡视频| 国产精品久久久久7777婷婷| 欧美日韩成人免费| 亚洲新中文字幕| 日韩亚洲视频在线| 亚洲黄色免费| 亚洲视频自拍偷拍| 99精品欧美| 亚洲午夜一区二区| 牛牛影视久久网| 国产日韩欧美亚洲一区| 久久阴道视频| 欧美成人精品一区二区三区| 午夜伦欧美伦电影理论片| 欧美肉体xxxx裸体137大胆| 欧美一区成人| 欧美极品一区| 亚洲一区二区三区乱码aⅴ| 中日韩美女免费视频网址在线观看| 一本久久知道综合久久| 香蕉成人啪国产精品视频综合网| 亚洲黄色大片| 欧美性理论片在线观看片免费| 久久综合一区二区| 99精品99久久久久久宅男| 亚洲一区二区精品在线观看| 亚洲激情一区| 国产日韩欧美一区| 欧美va天堂va视频va在线| 国产精品jvid在线观看蜜臀| 国产精品美女久久久久aⅴ国产馆| 欧美色精品天天在线观看视频| 欧美v日韩v国产v| 黄色一区三区| 久久国产黑丝| 国产片一区二区| 亚洲人成网站在线播| 欧美在线视频观看| 在线观看视频一区二区欧美日韩| 国产精品夜夜夜一区二区三区尤| 激情欧美一区| 久久久久亚洲综合| 欧美精品日日鲁夜夜添| 亚洲国产中文字幕在线观看| 欧美久久久久| 欧美大片在线看| 国产三级精品在线不卡| 午夜精品久久99蜜桃的功能介绍| 欧美国产日产韩国视频| 久久丁香综合五月国产三级网站| 一区二区三区欧美在线| 亚洲精品日韩欧美| 国产欧美日韩一区二区三区| 亚洲免费电影在线| 亚洲国产精品女人久久久| 欧美激情欧美狂野欧美精品| 国产日韩欧美电影在线观看| 亚洲综合清纯丝袜自拍| 先锋影音国产精品| 一本色道久久综合狠狠躁篇怎么玩| 欧美精品激情blacked18| 亚洲精品日韩一| 午夜亚洲精品| 欧美在线视频在线播放完整版免费观看| 国产欧美日韩| 美日韩精品视频免费看| 欧美日韩和欧美的一区二区| 欧美日韩在线直播| 欧美在线观看天堂一区二区三区| 国产亚洲精品久久久久久| 亚洲黄网站黄| 在线精品一区| 国产亚洲成精品久久| 亚洲国产天堂网精品网站| 久久久精品五月天| 亚洲黄色成人久久久| 亚洲国产欧美国产综合一区| 国产精品青草久久久久福利99| 亚洲欧美一区二区三区极速播放| 欧美精品色综合| 国产婷婷色一区二区三区在线| 亚洲每日更新| 亚洲免费网站| 欧美ab在线视频| 欧美精品色综合| 国产日产欧美精品| 久久久精品一区| 亚洲精品女人| 日韩午夜激情电影| 亚洲国产精选| 亚洲日本va午夜在线影院| 欧美一级专区免费大片| 激情国产一区二区| 欧美激情按摩在线| 欧美有码在线视频| 亚洲精选在线观看| 欧美日韩视频在线一区二区观看视频| 国产视频一区欧美| 欧美日韩中国免费专区在线看| 亚洲国产另类精品专区| 欧美激情在线狂野欧美精品| 蜜臀av性久久久久蜜臀aⅴ| 久久久国际精品| 国产精品系列在线播放| 先锋影音一区二区三区| 亚洲第一页自拍| 国产精品综合色区在线观看| 欧美日韩国产123| 亚洲一区一卡| 亚洲女人天堂av| 欧美激情精品久久久久久免费印度| 国产一区再线| 国产精品久久久久久久久久三级| 午夜日韩在线观看| 欧美大成色www永久网站婷| 久久久久久伊人| 亚洲女爱视频在线| 亚洲欧美日韩成人| 亚洲欧美日本视频在线观看| 国产精品人成在线观看免费| 日韩视频免费观看高清完整版| 亚洲国产精品高清久久久| 久久aⅴ国产紧身牛仔裤| 午夜精品久久久久久99热| 午夜亚洲福利| 亚洲——在线| 国产自产v一区二区三区c| 国产日韩欧美日韩| 久久夜色精品亚洲噜噜国产mv| 女女同性精品视频| 欧美高清在线精品一区| 国产三区二区一区久久| 久久综合久久综合久久| 久久天堂国产精品| 久久久久9999亚洲精品| 亚洲欧美激情在线视频| 99热免费精品在线观看| 免费观看成人| 老妇喷水一区二区三区| 久久丁香综合五月国产三级网站| 亚洲一区自拍| 欧美一级理论片| 在线观看欧美| 欧美韩国一区| 久久久久一区二区三区四区| 一区二区三区视频免费在线观看| 在线观看视频免费一区二区三区| 亚洲福利久久| 久久久久久一区二区三区| 老牛国产精品一区的观看方式| 亚洲福利视频免费观看| 国产婷婷成人久久av免费高清| 欧美手机在线视频| 国产精品香蕉在线观看| 亚洲高清在线| 先锋影音国产一区| 国产视频综合在线| 亚洲欧美日韩一区二区| 欧美高清你懂得| 免费观看一区| 裸体丰满少妇做受久久99精品| 欧美色视频日本高清在线观看| 国产精品久久国产三级国电话系列| 久久久五月天| 亚洲伦理在线观看| 国产精品一区二区男女羞羞无遮挡|