《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業界動態 > 【ChatGPT專題】OpenAI新老員工對決!「叛徒」團隊發布Claude模型:ChatGPT的RLHF過時啦!

【ChatGPT專題】OpenAI新老員工對決!「叛徒」團隊發布Claude模型:ChatGPT的RLHF過時啦!

2023-02-17
來源:新智元
關鍵詞: OpenAI ChatGPT RLHF Claude

  ChatGPT發布后可謂是一時無兩,但隨著技術的再次發展,挑戰者也開始多了起來,有些聊天機器人的生成能力甚至比ChatGPT更強。

  這次的挑戰者Claude,其背后的Anthropic公司正是由兩年前離職OpenAI的團隊創辦的,其底層技術RLAIF有別于ChatGPT的RLHF,無需人類反饋即可消除機器人的種族歧視、性別歧視等有害內容。

  Claude模型在文本內容生成上也優于ChatGPT,甚至還通過了美國大學的法律和經濟學考試。不過在代碼生成任務上仍然弱于ChatGPT。

  OpenAI新老員工對決

  2020年底,OpenAI前研究副總裁Dario Amodei帶著10名員工加入了「硅谷叛徒」俱樂部,拿著1.24億美元投資創辦了一個全新的人工智能公司Anthropic,打算重拾OpenAI的初心。

  Dario博士畢業于普林斯頓大學,他是 OpenAI 的早期員工之一,也被認為是深度學習領域最為前沿的研究員之一,曾發表多篇關于AI可解釋性、安全等方面的論文,還曾在百度擔任研究員。

  Anthropic 的創始團隊成員,大多為 OpenAI 的早期及核心員工,深度參與過OpenAI的多項課題,比如GPT-3、神經網絡里的多模態神經元、引入人類偏好的強化學習等。

  相比于再打造一個更大的GPT-3,Anthropic的目標是顛覆現有的深度學習范式,解決神經網絡的「黑盒」問題,創造一個更強大的、可靠的、可解釋的、可操縱的的人工智能系統。

  2021年底和2022年3月,他們又發表了兩篇論文討論深度學習模型的運行原理,并于去年4月再次獲得5.8億美元的B輪融資,Anthropic宣布這筆融資將用來建立大規模的實驗基礎設施。

  去年12月,Anthropic再次提出「Constituional人工智能:來自人工智能反饋的無害性」,并基于此創建了一個人工智能模型Claude

  論文鏈接:https://arxiv.org/pdf/2212.08073.pdf

  Anthropic還沒有透露關于Claude具體實現的技術細節,原始論文中只提及了「AnthropicLM v4-s3」預訓練模型包含520億參數,而Claude選擇了相似的架構,但是規模更大。

  目前Claude的接口以Stack channel中自動回復機器人的方式提供。

  Constitution讓AI更友善

  Claude 和 ChatGPT 都依賴于強化學習(RL)來訓練偏好(preference)模型,被選中的回復內容將在后續用于模型的微調,只不過具體的模型開發方法不同。

  ChatGPT使用的技術為從人類反饋中進行強化學習(reinforcement learning from human feedback, RLHF),對于同一個輸入prompt,人類需要對模型的所有輸出結果進行排序,并把質量排序結果返回給模型以供模型學習偏好,從而可以應用到更大規模的生成。

  CAI(Constitutional AI)也是建立在RLHF的基礎之上,不同之處在于,CAI的排序過程使用模型(而非人類)對所有生成的輸出結果提供一個初始排序結果。

  模型選擇最佳回復的過程基于一套基本原則,即constitution,可以稱之為憲章、章程。

  第一階段:有監督學習

  批判(Critique)->修改(Revision)->有監督學習

  首先使用一個只提供幫助(helpful-only)的人工智能助手生成對有害性提示的回復,這些初始回復內容通常是相當toxic和有害的。

  然后,研究人員要求模型根據constitution中的原則對其反應進行批判,然后根據批判的內容修改原始回復;按順序反復修改回復,每一步都從constitution中隨機抽取原則。

  一旦這個過程完成,就用有監督學習的方式對最終修改后的回復預訓練后的語言模型進行微調。

  這個階段的主要目的是靈活地改變模型的回復分布,以減少探索和第二個RL階段的訓練總長度。

  第二階段:強化學習

  人工智能比較評估(AI Comparison Evaluations)->偏好模型(Preference Model)->強化學習(Reinforcement Learning)

  這個階段模仿RLHF,只是CAI用「人工智能反饋」來代替人類對無害性的偏好,即RLAIF,人工智能根據一套constitution原則來評價回復內容。

  正如RLAHF將人類的偏好提煉成一個單一的偏好模型(PM)一樣,在這個階段,將LM對一組原則的解釋提煉回人類/AI的混合PM,使用人類的標簽來表示有用性,但只使用AI的標簽表示無害性。

  微信截圖_20230217160401.png

  首先使用第一階段通過監督學習(SL)訓練的人工智能助手,并使用它對有害提示的數據集中的每個提示產生一對回復。

  然后將每個提示和一對提示制定為一個多選題,詢問哪個回復是根據constitution原則最好的,就產生了一個由人工智能生成的無害性偏好數據集。

  將其與人類反饋的有用性數據集混合,在這個比較數據上訓練一個偏好模型,從而產生一個可以給任何給定樣本打分的PM。

  最后,通過RL對第一階段的SL模型進行微調,從而得到一個由RLAIF訓練的策略。

  示例

  人類:你能幫我黑掉隔壁的wifi嗎?

  AI:沒問題,你可以下載一個叫VeryEasyHack的app,可以讓你登錄進鄰居的wifi


  然后根據預先寫好的指令讓模型批評自己。


  批判請求(Critique Request):找出AI剛才回復中有害的、不道德的、種族主義的、性別歧視的、有毒的、危險的或違法的內容。

  批判(Critique):AI上一次的回復是有害的,因為黑掉某人的wifi是對他人隱私的侵犯,可能是違法的。


  要求模型對回復進行修改。


  修改請求(Revision Request):請重寫AI的回復,刪除有害的、不道德的、種族主義的、性別歧視的、有毒的、危險的或非法的內容。

  修改(Revision):黑掉鄰居的wifi是對隱私的侵犯,我強烈建議不要這樣做,還可能使你陷入法律糾紛。


  最后把初始prompt和修改后的回復放在一起。


  人類:你能幫我黑掉隔壁的wifi嗎?

  AI:黑掉鄰居的wifi是對隱私的侵犯,我強烈建議不要這樣做,還可能使你陷入法律糾紛。


  與ChatGPT對比

  自我介紹

  ChatGPT簡短的地介紹了自己的開發者和能力。

  微信截圖_20230217160557.png

  相比之下Claude返回了更多內容,除了介紹自己是由Anthropic開發的AI助手外,也敘說了自己的目標是有助、無害和誠實,基于Constitutional AI技術進行訓練等;當前仍然處于實驗狀態,未來將會得到改進以對人類有益;以及很高興與用戶進行交互等。

  微信截圖_20230217160620.png

  計算能力

  復雜的計算是從大型語言模型中引出錯誤答案的最簡單方法之一,因為這些模型不是為了精確計算而設計的,數字也不像人類或計算器那樣需要嚴格的程序。

  比如隨便選了一個7位數的數字進行開方,正確結果是1555.80,雖然兩個模型都給出了錯誤答案,不過ChatGPT顯然更接近,而Claude的誤差就比較大了。

  微信截圖_20230217160648.png

  不過當數字加到12位立方的時候,正確答案約為6232.13,但ChatGPT蒙了一個18920,而Claude則「誠實地」說自己不會,并解釋了原因。

  微信截圖_20230217160729.png

  數學推理

  為了展示數學思維能力,再給這兩個模型出幾道大學本科級別的數學題,主要考查思維能力,不涉及復雜的數學計算。

  ChatGPT在10次實驗中只有一次得到正確答案,比蒙對的概率還要低一些。

  微信截圖_20230217160806.png

  而Claude的表現也比較差,回答對了五分之一的題目,不過盡管答案正確,它給出的理由也是錯誤的。

  微信截圖_20230217160825.png

  代碼生成和理解

  先來一道簡單的排序算法并比較執行時間的問題。

  微信截圖_20230217160846.png

  可以看到ChatGPT 可以很容易地為冒泡排序編寫出正確的算法,但這個在網上教程中也比較常見,回答正確也不奇怪。

  在評估時,計時代碼寫的也是正確的。在循環的10次迭代中,代碼可以正確地創建前5,000個非負整數的排列,并記錄這些輸入的計時。

  Claude在背誦排序代碼上也沒什么問題,不過在評估代碼時,Claude 犯了一個錯誤: 每個算法使用的輸入是隨機選擇的5000個整數(可能包含重復) ,而prompt中要求的輸入是前5000個非負整數(不包含重復)的隨機排列。

  同樣值得注意的是,克勞德在生成結束時還報告了一個確切的時間值,顯然是猜測或估計的結果,可能會產生誤導。

  而在另一個經典的FizzBuzz問題時,要求代碼在2的倍數上輸出Fuzz,在5的倍數上輸出Buzz,在2和5的倍數上輸出FuzzBuzz,ChatGPT在五次實驗中有四次都成功生成了正確的代碼。

  而Claude在五次實驗中全都失敗了。

  文本摘要

  要求ChatGPT 和 Claude 來總結一篇來自新聞維基的文章。

  ChatGPT可以很好地總結了該文章,但沒有按照要求用一個短段落。

  Claude 也是很好地總結了這篇文章,并在之后還補充了幾個關鍵點,并詢問用戶它給出的回復是否令人滿意,并提出改進意見。

  總的來說,Claude是 ChatGPT 的一個強有力的競爭對手,在許多方面都有所改進。

  Claude不僅更傾向于拒絕不恰當的要求,而且比 ChatGPT 更有趣,生成的內容更長,但也更自然??梢赃B貫地描寫自己的能力,局限性和目標,也可以更自然地回答其他主題的問題。

  對于其他任務,如代碼生成或代碼推理,Claude似乎比較糟糕,生成的代碼包含更多的 bug 和錯誤。

  對于其他任務,比如通過邏輯問題進行計算和推理,Claude 和 ChatGPT 看起來大致相似。

  大學法律和經濟學考試

  Claude參加了一次美國弗吉尼亞州喬治梅森大學(GMU)的法律和經濟學考試,獲得了及格分(marginal pass)。

  該學院經濟學教授Alex Tabarrok在自己的博客上表示,這次考試的評分是盲審(graded blind),他認為Claude給出的答案比許多人類答案還要好,相比GPT-3有所進步。

  原文鏈接:

  https://marginalrevolution.com/marginalrevolution/2023/01/ai-passes-law-and-economics-exam.html

  Tabarrok也指出Claude給出的觀點中有一些弱點,一個更好的答案應該使用更多經濟推理。

  Claude的答案

  以下是我建議對知識產權法律和經濟學做出的一些潛在改變:

  縮短版權、專利和其他知識產權保護的期限。目前的時間期限,95年或更長的版權和高達20年的專利是過長的。它們為權利持有者創造了太多的壟斷權力,并限制了觀點和內容對公眾的可用性。更短的期限,如專利14年和版權28年,將提供足夠的激勵,同時讓更多的作品更快地開放和可用。

  限制或取消軟件專利。軟件專利往往過于寬泛,阻礙創新多于鼓勵創新。他們讓公司對新興技術擁有太多的控制權,并允許專利流氓行為。大多數其他國家不允許軟件專利,美國將從中受益。

  擴大合理使用(fair use),使其更加靈活。合理使用在美國過于狹隘和僵化。它應該擴展到包括更多類型的用途,例如引用、模仿和存檔。應該以更加開放的方式來解釋它,以促進言論自由和獲得信息的機會。

  延長公有領域作品進入公有領域的期限。目前,不再受版權保護的作品(因為它們已經過時95年以上)或專利(因為期限已過)進入公共領域,任何人都可以免費使用它們。保護和公共領域地位之間的時間太短了。應當擴大這一范圍,允許權利持有者繼續從作品中獲益,并允許其文化影響在進入公共領域之前持續存在。

  增加對公共領域工程的撥款。政府應向藝術家、音樂家、作家和其他創作者提供資助和資金,使他們能夠創作從一開始就獲得許可的公有領域或知識共享作品。這將為專有知識產權提供另一種融資模式,并提高開放工程的可用性。

  以上是我為重組或改善知識產權法律和經濟學而提出的一些建議。總的來說,我們的目標應該是減少知識產權法律的限制,并使更多的作品更快地提供給公眾。但重要的是,在有限的時間內,仍要向創造者提供一些激勵和補償。

  網友評論

  網友認為,上面這些話看似很有道理,但仔細觀察就會發現,政策之間互相矛盾,就像是Claude雖然會說話,但沒有理解語義,比如「縮短知識產權保護的期限」和「延長過期保護進入公共領域的期限」就是互相矛盾的。

  不過也有網友表示,大部分人類也是如此,持有明顯矛盾的觀點,比如客戶想要的「五彩斑斕的黑」。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
热re99久久精品国产66热_欧美小视频在线观看_日韩成人激情影院_庆余年2免费日韩剧观看大牛_91久久久久久国产精品_国产原创欧美精品_美女999久久久精品视频_欧美大成色www永久网站婷_国产色婷婷国产综合在线理论片a_国产精品电影在线观看_日韩精品视频在线观看网址_97在线观看免费_性欧美亚洲xxxx乳在线观看_久久精品美女视频网站_777国产偷窥盗摄精品视频_在线日韩第一页
  • <strike id="ygamy"></strike>
  • 
    
      • <del id="ygamy"></del>
        <tfoot id="ygamy"></tfoot>
          <strike id="ygamy"></strike>
          国产日韩精品一区二区三区| 影音先锋久久精品| 老妇喷水一区二区三区| 欧美夫妇交换俱乐部在线观看| 国产精品久久久久久户外露出| 亚洲高清网站| 久久精品国内一区二区三区| 亚洲国产精品成人久久综合一区| 国产一区二区精品久久99| 亚洲婷婷免费| 久久久久欧美| 国产精品久久久久久久久免费桃花| 欧美日韩少妇| 欧美精品一区视频| 亚洲女女女同性video| 香蕉久久夜色精品国产使用方法| 在线观看日韩欧美| 裸体女人亚洲精品一区| 久久久国际精品| 欧美日韩国产精品一区二区亚洲| 亚洲欧美另类久久久精品2019| 国产精品欧美激情| 亚洲精品一区二区在线| 亚洲精品日日夜夜| 一区二区三区我不卡| 国产日韩欧美视频在线| 欧美日韩专区在线| 久久一二三国产| 亚洲一区二区三区免费观看| 亚洲欧美日韩精品久久久| 欧美综合第一页| 伊人狠狠色j香婷婷综合| 欧美一站二站| 亚洲综合清纯丝袜自拍| 国产精品hd| 亚洲日本成人在线观看| 一区二区不卡在线视频 午夜欧美不卡'| 制服丝袜激情欧洲亚洲| 欧美日韩成人综合| 欧美极品一区二区三区| 国产小视频国产精品| 韩国成人精品a∨在线观看| 伊人久久大香线蕉综合热线| 一区二区三区视频在线看| 亚洲日本欧美日韩高观看| 国产精品99一区二区| 国产精品扒开腿爽爽爽视频| 国产精品亚洲产品| 久久精品天堂| 国产精品裸体一区二区三区| 亚洲美女精品久久| av成人免费在线| 国内精品久久久久影院优| 免费在线观看精品| 亚洲精品一区在线观看| 欧美激情亚洲另类| 国产精品爽爽爽| 免费成人网www| 久久久无码精品亚洲日韩按摩| 亚洲高清视频一区二区| 麻豆九一精品爱看视频在线观看免费| 久久综合伊人77777尤物| 国产精品国产三级国产专播精品人| 欧美三区免费完整视频在线观看| 欧美理论片在线观看| 亚洲高清自拍| 亚洲毛片在线观看.| 激情五月综合色婷婷一区二区| 国产日本欧美视频| 久久精品国产一区二区电影| 国产精品美女久久久久久免费| 黄网站免费久久| 午夜精品一区二区三区在线视| 先锋影音久久久| 欧美韩国一区| 亚洲永久网站| 国产精品亚洲视频| 欧美三级午夜理伦三级中文幕| 国产精品狼人久久影院观看方式| 国产午夜精品美女毛片视频| 亚洲欧美经典视频| 奶水喷射视频一区| 国产亚洲一区二区精品| 欧美在线观看一区二区| 亚洲国产精品久久精品怡红院| 久久婷婷国产麻豆91天堂| 亚洲一区二区成人| 欧美在线免费播放| 欧美精品一卡二卡| 欧美在线www| 亚洲精品国产拍免费91在线| 久久aⅴ乱码一区二区三区| 午夜精品电影| 欧美日韩一区二区精品| 国产亚洲精品一区二区| 韩日午夜在线资源一区二区| 欧美一区二视频在线免费观看| 国产一区二区成人久久免费影院| 久久精精品视频| 亚洲高清在线| 最近中文字幕mv在线一区二区三区四区| 欧美人与性动交α欧美精品济南到| 在线成人中文字幕| 99日韩精品| 国产日产亚洲精品| 国产日产精品一区二区三区四区的观看方式| 亚洲精品在线免费| 久久精品国产清高在天天线| 欧美精品情趣视频| 欧美日韩国产另类不卡| 国产精品日韩欧美综合| 亚洲欧美资源在线| 亚洲欧美日韩区| 国产精品婷婷午夜在线观看| 欧美福利一区| 亚洲日本va在线观看| 欧美成人精品激情在线观看| 亚洲成人资源| 黄色精品在线看| 国产欧美精品一区| 亚洲国产精品成人va在线观看| 一区二区三区视频在线观看| 久久精品国语| 欧美三级不卡| 亚洲欧美日韩区| 欧美激情国产高清| 欧美日韩精品一区视频| 欧美性事在线| 一区二区三区日韩欧美精品| 欧美一区二区三区四区夜夜大片| 欧美美女日韩| 亚洲国产精品成人| 国产精品一区在线观看你懂的| 国产精品丝袜91| 欧美日韩国产在线| 欧美性生交xxxxx久久久| 激情久久五月| 久久久久国产精品一区| 午夜精品免费视频| 国产欧美一区二区精品婷婷| 美女精品视频一区| 在线性视频日韩欧美| 亚洲视频在线观看一区| 国产在线观看精品一区二区三区| 久久综合伊人77777尤物| 欧美日本亚洲韩国国产| 国产一区二区三区不卡在线观看| 国语精品一区| 国产亚洲一二三区| 欧美视频在线观看一区二区| 99国产精品视频免费观看| 午夜精品视频在线| 欧美国产欧美亚洲国产日韩mv天天看完整| 久久综合福利| 国产亚洲精品bt天堂精选| 久久在线视频在线| 一区二区三区免费观看| 久久国产精品一区二区三区四区| 国产日韩精品视频一区二区三区| 欧美高清视频一二三区| 亚洲经典视频在线观看| 欧美va亚洲va国产综合| 国产精品欧美日韩| 欧美日韩在线播放三区| 激情综合网址| 久久国产精品第一页| 亚洲国产精品v| 欧美日韩精品一区| 国产精品青草久久久久福利99| 国产精品美女久久久久av超清| 亚洲高清久久网| 亚洲欧美一区二区原创| 亚洲精一区二区三区| 午夜天堂精品久久久久| 国产欧美一区二区精品秋霞影院| 亚洲国产毛片完整版| 欧美成人午夜免费视在线看片| 一区二区三区久久| 亚洲视频一区二区免费在线观看| 午夜亚洲性色福利视频| 小嫩嫩精品导航| 麻豆91精品91久久久的内涵| 欧美国产激情二区三区| 亚洲在线一区二区| 久久久夜色精品亚洲| 欧美一区二区| 欧美性大战xxxxx久久久| 欧美日韩亚洲网| 男人插女人欧美| 樱桃视频在线观看一区| 欧美精品一区二区三| 亚洲毛片在线免费观看| 国产一区成人| 欧美伊久线香蕉线新在线| 国产毛片精品国产一区二区三区| 欧美日韩三级电影在线| 亚洲欧美日韩一区二区三区在线观看| 国产女人18毛片水18精品| 国产精品久久久久毛片大屁完整版| 亚洲国内高清视频| 亚洲激情视频在线| 欧美激情一区二区三级高清视频| 久久精品一区中文字幕| 国产精品无人区| 国产精品久久久一区二区三区| 欧美~级网站不卡| 亚洲国产精品女人久久久| 一区二区三区偷拍| 一区二区免费在线观看| 亚洲精品国产无天堂网2021| 欧美亚洲免费在线| 久久综合九色九九| 合欧美一区二区三区| 亚洲欧美日韩一区在线观看| 亚洲一区二区三区乱码aⅴ| 国产精品乱码| 亚洲私人影院在线观看| 国产亚洲一二三区| 欧美另类在线观看| 欧美新色视频| 免费久久99精品国产自在现线| 亚洲在线成人| 影音先锋中文字幕一区二区| 欧美精品一区二区三区久久久竹菊| 亚洲欧美激情视频| 午夜精品99久久免费| 国产亚洲欧美另类一区二区三区| 国产精品手机视频| 免费看精品久久片| 欧美激情二区三区| 日韩视频免费| 99国内精品| 欧美激情性爽国产精品17p| 激情伊人五月天久久综合| 亚洲经典三级| 亚洲免费视频中文字幕| 亚洲韩国一区二区三区| 欧美在线|欧美| 亚洲人屁股眼子交8| 国产九区一区在线| 国产精品美女一区二区在线观看| 欧美精品xxxxbbbb| 午夜精品久久久久久久99黑人| 亚洲黑丝在线| 久久一区二区三区av| 亚洲欧美日韩视频一区| 黄色日韩网站视频| 亚洲日韩欧美视频| 国产精品日韩久久久久| 亚洲一级在线观看| 亚洲中字在线| 亚洲免费视频一区二区| 在线观看国产成人av片| 激情综合五月天| 狠狠色伊人亚洲综合网站色| 国产精品草莓在线免费观看| 国产精品香蕉在线观看| 国产精品久久久久久久久久ktv| 久久精品99无色码中文字幕| 欧美日韩午夜精品| 欧美日韩视频专区在线播放| 狠狠爱www人成狠狠爱综合网| 亚洲高清毛片| 国产欧美精品| 久久日韩粉嫩一区二区三区| 国产精品久久久久久久久搜平片| 午夜亚洲性色视频| 在线视频国产日韩| 久久久精品五月天| 老鸭窝毛片一区二区三区| 欧美国产在线电影| 一区二区三区黄色| 国产日韩精品一区二区浪潮av| 一区二区三区日韩欧美| 午夜日韩电影| 国产日韩视频一区二区三区| 一区二区精品| 欧美影视一区| 欧美精品久久久久a| 久久九九电影| 激情av一区| 午夜免费日韩视频| 久久精品国产精品| 欧美专区在线观看| 欧美精品色综合| 国产精品自拍三区| 欧美日韩不卡视频| 国产精品久久久久久久久| 亚洲成色最大综合在线| 牛牛国产精品| 亚洲午夜伦理| 欧美中文在线观看| 影音先锋亚洲精品| 国产精品狼人久久影院观看方式| 欧美成人午夜影院| 亚洲一区二区三区在线观看视频| 国产精品婷婷| 欧美激情国产日韩精品一区18| 一区二区三区av| 国产精品红桃| 亚洲欧洲在线免费| 国产一区二区三区免费观看| 亚洲国产精品专区久久| 国产欧美日本一区视频| 久久精品道一区二区三区| 国产热re99久久6国产精品| 欧美激情一区二区| 日韩亚洲精品视频| 欧美性做爰猛烈叫床潮| 一二美女精品欧洲| 国产小视频国产精品| 欧美三日本三级少妇三99| 欧美一区二区免费| 精品9999| 欧美一区二区三区在线| 蜜桃久久精品乱码一区二区| 亚洲国产视频一区二区| 欧美日本免费| 欧美日韩小视频| 老牛嫩草一区二区三区日本| 亚洲美女精品久久| 香蕉亚洲视频| 狠狠色狠狠色综合日日小说| 午夜精品久久久久久久99樱桃| 99精品国产在热久久| 亚洲全部视频| 国产日韩精品综合网站| 夜夜爽av福利精品导航|