《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業界動態 > 【ChatGPT專題】為什么AI忽然變得這么強?—— 一文讀懂ChatGPT原理!

【ChatGPT專題】為什么AI忽然變得這么強?—— 一文讀懂ChatGPT原理!

2023-02-08
來源: 架構師
關鍵詞: AI ChatGPT 機器學習

  前言

  最近一周多的時間,只要不是生活在火星,喜歡技術的同學一定都被OpenAIChatGPT給刷屏了。ChatGPT與以往的公開提供服務的對話機器人相比,性能有了顯著的提高。它可以相對可靠地提供一些日常對話、知識獲取的功能,也可以它根據人類提供的需求幫忙寫文檔、寫代碼,甚至可以修改文本中的各類錯誤或者代碼中的Bug。我相信很多非AI圈的同學肯定會有一種“為什么AI突然變得這么強?“的感受。這篇文章的目的也是為了回答這個問題。在開始之前,我覺得有必要先表達一下我自己的看法:NLP技術發生跨越式發展的標志并不是ChatGPT本身,而應該是2017年-2018年間相繼被提出的Transforme1r[1]和GPT[2]。

  ChatGPT是Transformer和GPT等相關技術發展的集大成者。總體來說,ChatGPT的性能卓越的主要原因可以概括為三點:

  使用的機器學習模型表達能力強。

  訓練所使用的數據量巨大。

  訓練方法的先進性。我們接下來將會針對這三點進行探討。

  機器學習模型

  在步入正題之前,我們可以先梳理一下NLP發展的歷史。

  基于文法的模型

  這個階段,大家處理自然語言的主要思路就是利用語言學家的智慧嘗試總結出一套自然語言文法,并編寫出基于規則的處理算法進行自然語言處理。這個方法是不是乍聽起來還行?其實我們熟悉的編譯器也是通過這種方法將高級語言編譯成機器語言的??上У氖?,自然語言是極其復雜的,基本上不太可能編寫出一個完備的語法來處理所有的情況,所以這套方法一般只能處理自然語言一個子集,距離通用的自然語言處理還是差很遠。

  基于統計的模型

  在這個階段,大家開始嘗試通過對大量已存在的自然語言文本(我們稱之為語料庫)進行統計,來試圖得到一個基于統計的語言模型。比如通過統計,肯定可以確定“吃”后面接“飯”的概率肯定高于接其他詞如“牛”的概率,即P(飯|吃)>P(牛|吃)。

  雖然這個階段有很多模型被使用,但是本質上,都是對語料庫中的語料進行統計,并得出一個概率模型。一般來說,用途不同,概率模型也不一樣。不過,為了行文方便,我們接下來統一以最常見的語言模型為例,即建?!耙粋€上下文后面接某一個詞的概率“。剛才說的一個詞后面接另一個詞的概率其實就是一元語言模型。

  模型的表達能力

  在這里,我們很適合插播一下模型表達能力這個概念。

  微信截圖_20230208155323.png

  模型表達能力簡單來說就是模型建模數據的能力,比如上文中的一元語言模型就無法建模“牛吃草”和“我吃飯”的區別,因為它建模的本質統計一個詞后面跟另一個詞的概率,在計算是選“草”還是選“飯”的時候,是根據“吃”這個詞來的,而“牛”和“我”這個上下文對于一元語言模型已經丟失。你用再多的數據讓一元語言模型學習,它也學不到這個牛跟草的關系。

  模型參數數量

  有人說,既然如此,為啥我們不基于更多的上下文來計算下一個詞的概率,而僅僅基于前一個詞呢?OK,這個其實就是所謂的n元語言模型??傮w來說,n越大,模型參數越多,表達能力越強。當然訓練模型所需要的數據量越大(顯然嘛,因為需要統計的概率的數量變多了)。

  模型結構

  然而,模型表達能力還有另一個制約因素,那就是模型本身的結構。對于基于統計的n元語言模型來說,它只是簡單地統計一個詞出現在一些詞后面的概率,并不理解其中的各類文法、詞法關系,那它還是無法建模一些復雜的語句。比如,“我白天一直在打游戲”和“我在天黑之前一直在玩游戲“兩者語義很相似,但是基于統計的模型卻無法理解兩者的相似性。因此,就算你把海量的數據喂給基于統計的模型,它也不可能學到ChatGPT這種程度。

  基于神經網絡的模型

  上文提到,統計語言模型的主要缺點是無法理解語言的深層次結構。曾有一段時間,科學家們嘗試將基于文法的模型和基于統計的模型相結合。不過很快,風頭就被神經網絡搶了過去。

  RNN & LSTM

  剛開始,流行的神經網絡語言模型主要是循環神經網絡(RNN)以及它的改良版本LSTM。

  微信截圖_20230208155401.png

  RNN的主要結構如下, x是輸入,o是輸出,s是狀態。

  微信截圖_20230208155416.png

  如果RNN作為語言模型的話,那x可以作為順序輸入進去的詞匯,而o就可以作為輸出的詞匯,而s就是通過x計算o的過程中生成的狀態變量,這個狀態變量可以理解為上下文,是對計算當前詞匯時前文所有出現過的所有單詞的濃縮并在一次次的計算中不斷迭代更新。這也是為啥RNN可以建模詞與詞關系的根本原理。

  微信截圖_20230208155454.png

  與簡單的基于統計的模型相比,循環神經網絡的主要亮點就是能夠對一段文字中不同詞之間的關系進行建模,這種能力在一定程度上解決了基于統計的模型無法理解深層次的問題。

  微信截圖_20230208155512.png

  Attention Mechanisms

  在更進一步之前,我們不得不提一下注意力(Attention)機制。

  微信截圖_20230208155533.png

  這個機制主要針對RNN語言模型中狀態S作為上下文這一機制進行改進。。在RNN中計算當前詞后的狀態Si主要是通過計算上一個詞時的狀態Si-1迭代出來的。它的主要缺點就是它假設了距離較近的詞匯之間的關系更密切。但是我們都知道,在自然語言中,這一假設并不是一直成立的。引入Attention之后,計算第i個詞后的狀態從單純的Si變成了S0,S1...Si的組合,而具體“如何組合”,即哪個狀態比較重要,也是通過數據擬合出來的。在這樣的情況下,模型的表達能力又得到了進一步的提高,它可以理解一些距離較遠但是又非常密切的詞匯之間的關系,比如說代詞和被指代的名詞之間的關系。

  微信截圖_20230208155552.png

  Transformer

  接下來,我們終于可以祭出之前提過的NLP跨越式發展的標志之一,Transformer的提出!

  其實在有了Attention之后,Transformer的提出已經是順理成章了。Transformer的主要貢獻在于

  將Multi-Head Self-Attention直接內建到網絡中。所謂Multi-Head Self-Attention其實就是多套并行的Self-Attention,可以用于建模的詞與詞之間的多類不同地關系。

  利用專用位置編碼來替代之前RNN用輸入順序作為次序,使得并行計算成為了可能。

  微信截圖_20230208155613.png

  舉一個形象但不準確的例子,對于句子I often play skating board which is my favorite sport. 如果使用Multi-Head Self-Attention,那就可以有一套Attention專門用來建模play和skating board的謂賓關系,有一套Attention用來建模skating board與favorite的修飾關系。從而使得模型的表達能力又得到了提高。

  微信截圖_20230208155652.png

  ChatGPT所依賴GPT3.5語言模型的的底層正是Transformer。

  訓練數據

  OK,我們現在有一個名為Transformer模型了,這個模型通過Multi-head Self-Attention,使得建立詞與詞之間的復雜關系成為了可能。因此可以說是一個表達力很強的語言模型了。然而,單有語言模型沒有數據就是巧婦難為無米之炊。

  GPT-3.5的相關數據并未被公開。我們就只說說它的上一代GPT-3。GPT-3整個神經網絡就已經有1750億個參數了。這不難理解,想一想Attention憑什么確定在當前上下文下哪些詞比較重要?而網絡又怎樣通過Attention和輸入生成輸出?這些都是由模型里面的參數決定的。這也是為啥模型結構一樣的情況下參數越多表達能力越強。那這些模型的參數怎么拿到?從數據中學習!其實大多數所謂的神經網絡的學習就是在學參數。

  好家伙,要訓練1750億個參數的神經網絡要喂多少數據呢?這么多!(from wikipedia)

 微信截圖_20230208155652.png

  可以預想的是,表達能力如此之強的模型,在喂入萬億級的數據之后,其對語言本身的理解已經開始接近人類了。比如它處理句子的時候,會通過訓練Attention參數理解到句子中哪些詞之間存在關系的?哪些詞和哪些詞之間是同義的?等一系列比較深度的語言問題。

  這還只是2020年的GPT-3。如今已經2022年了,相信GPT-3.5的模型表達能力比GPT-3又有相當大地提升。

  訓練方法

  監督學習 vs 無監督學習

  簡單來說,監督學習就是在“有答案”的數據集上學習。如果我們要用監督學習(supervised learning)訓練一個中文到英文的機器翻譯模型,我們就需要有中文以及其對應的英文。整個訓練過程就是不斷地將中文送入到模型中,模型會給出一個英文的輸出,這個時候我們對比一下英文的輸出與標準答案的差距遠不遠(Measured by Loss Function),如果差距比較大,那我們就調整模型參數。這也成為早期針對機器翻譯模型的主要訓練方法。

  微信截圖_20230208155718.png

  遷移學習

  然而,“有答案”的數據終究是有限的。這也是限制之前很多自然語言學習的模型設計復雜度的原因。不是不想提高模型的表達能力,而是提上去之后,參數太多,我們沒有足量的“有答案”的數據來訓練這個模型。

  2018年,另一個我認為NLP跨越式發展的標志來了,那就是GPT的提出。

  微信截圖_20230208155740.png

  GPT的主要貢獻在于,它提出了自然語言的一種新的訓練范式。即現通過海量的數據的無監督學習來訓練一個語言模型。正如我們之前提到過的,所謂語言模型即是在一個上下文中預測下一個詞,這個顯然是不需要帶有標注的數據的,現有的任何語料都可以作為訓練數據的。由于GPT的底層借用了表達能力很強的Transformer,互聯網經過長時間的發展,海量的無標記的自然語言數據也并不再是稀缺的事物。導致了訓練出來的模型其實對語言有了相當深入地理解。

  這個時候,如果你想讓這個語言模型能夠陪你聊天,那在一個已經理解語言的模型的基礎上,你只需要喂一些聊天的對話數據,使用監督學習來對模型進行針對性的微調(fine-tune),就可以使它學會如何聊天了。這個操作也叫做遷移學習(Transfer Learning)。

  在遷移學習的過程中,微調一般是通過簡單的監督學習來進行。簡單來說,ChatGPT通過構建一些聊天的Prompt,讓人類標注一些想要的回復,并用這些數據進行監督學習來微調。

  強化學習

  ChatGPT在使用進行微調之外,還使用了一種叫做reinforcement learning from human feedback (RLHF)的技術。這個技術在ChatGPT的主要作用是將預訓練的模型的目標對齊到聊天這一具體的下游應用上。它也較大地提升了ChatGPT的聊天能力。

  其總體原理如下圖所示,在完成模型微調之后,先在人類的幫助下訓練一個獎賞網絡,這個獎賞網絡具有對多個聊天回復好壞進行排序的能力。接著,利用這個獎賞網絡,進一步通過強化學習(reinforcement learning)優化了聊天模型。該訓練方法的細節可以參考論文[3]

  微信截圖_20230208155803.png

  在這一通操作之后,ChatGPT就變成了我們現在看到的這樣子。

  其他

  至此,我們基本上就已經能明白為什么ChatGPT這么強了,但是我相信很多同學肯定會表示“就這?我不信,它都會改bug了,給他一段代碼他都知道代碼是干什么的了?!?/p>

  Okay,我們可以首先解釋一下為什么它可以做到修改代碼中的bug,根據OpenAI提供的信息 :"GPT-3.5 series is a series of models that was trained on a blend of text and code from before Q4 2021.",我們可以知道GPT-3.5中的訓練數據其實是包含了海量的代碼數據。所以說GPT-3.5對代碼的理解也是相當強的。從論文[4]可以看到,將代碼放入語言模型中進行訓練后,訓練出的語言模型已經可以做到代碼語義級的搜索。

  而ChatGPT又是怎么知道代碼的功能的呢?目前我還沒看到相關論文,不過可以參考一下OpenAI在GPT-3上做的代碼訓練的工作[5],大概就是將代碼和其功能docstring注釋放在一起做對比預訓練(contrastive pretrain),這樣可以讓語言模型理解代碼和其功能的關系。

  總結

  總之,ChatGPT并沒有那么神秘,它本質上就是將海量的數據結合表達能力很強的Transformer模型結合,從而對自然語言進行了一個非常深度的建模。對于一個輸入的句子,ChatGPT是在這個模型參數的作用下生成一個回復。

  有人會發現ChatGPT也經常會一本正經胡說八道,這也是這一類方法難以避免的弊端。因為它本質上只是通過概率最大化不斷生成數據而已,而不是通過邏輯推理來生成回復。

  微信截圖_20230208155826.png

  向ChatGPT詢問比較嚴肅的技術問題也可能會得到不靠譜的回答。

  微信截圖_20230208155839.png


 歡迎關注電子技術應用2023年2月22日==>>商業航天研討會<<


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
热re99久久精品国产66热_欧美小视频在线观看_日韩成人激情影院_庆余年2免费日韩剧观看大牛_91久久久久久国产精品_国产原创欧美精品_美女999久久久精品视频_欧美大成色www永久网站婷_国产色婷婷国产综合在线理论片a_国产精品电影在线观看_日韩精品视频在线观看网址_97在线观看免费_性欧美亚洲xxxx乳在线观看_久久精品美女视频网站_777国产偷窥盗摄精品视频_在线日韩第一页
  • <strike id="ygamy"></strike>
  • 
    
      • <del id="ygamy"></del>
        <tfoot id="ygamy"></tfoot>
          <strike id="ygamy"></strike>
          亚洲欧美日韩国产成人精品影院| 国产精品亚洲网站| 欧美系列精品| 亚洲欧美经典视频| 激情综合色综合久久综合| 亚洲国产精品美女| 久久九九全国免费精品观看| 亚洲高清资源| 欧美a级片一区| 免费国产自线拍一欧美视频| 蜜桃av噜噜一区| 亚洲国产精品99久久久久久久久| 欧美福利电影在线观看| 亚洲国产精品一区二区www| 一本色道久久综合| 久久频这里精品99香蕉| 一区二区三区免费在线观看| 欧美国产综合| 在线视频欧美一区| 久久视频精品在线| 亚洲主播在线播放| 欧美影院久久久| 欧美三级不卡| 久久香蕉国产线看观看av| 亚洲电影网站| 亚洲欧美国产一区二区三区| 9色porny自拍视频一区二区| 99在线热播精品免费| 亚洲欧美激情视频在线观看一区二区三区| 尤物视频一区二区| 欧美成年人在线观看| 国外成人在线| 亚洲欧美日韩精品久久亚洲区| 一本久久综合亚洲鲁鲁| 亚洲国产精品久久久久久女王| 亚洲第一区中文99精品| 久久久青草婷婷精品综合日韩| 欧美在线短视频| 免费久久久一本精品久久区| 欧美午夜激情在线| 巨胸喷奶水www久久久免费动漫| 国内精品视频在线观看| 美腿丝袜亚洲色图| 一区视频在线播放| 亚洲第一中文字幕在线观看| 在线播放日韩专区| 美女精品自拍一二三四| 欧美系列电影免费观看| 亚洲国产福利在线| 久久综合一区二区三区| 欧美亚日韩国产aⅴ精品中极品| 亚洲中字黄色| 国产午夜精品麻豆| 亚洲女ⅴideoshd黑人| 樱桃视频在线观看一区| 国产精品一区在线观看| 亚洲性视频网址| 欧美日韩免费精品| 欧美gay视频激情| 亚洲人成人77777线观看| 尤物九九久久国产精品的特点| 99亚洲伊人久久精品影院红桃| 激情成人av在线| 制服诱惑一区二区| 亚洲国产精品久久久久久女王| 久久综合给合久久狠狠狠97色69| 国产欧美精品在线观看| 久久久www免费人成黑人精品| 国产精品实拍| 国产午夜亚洲精品理论片色戒| 国产一区二区三区在线观看精品| 国产亚洲制服色| 久久蜜桃av一区精品变态类天堂| 国自产拍偷拍福利精品免费一| 国产精品视频不卡| 日韩一本二本av| 在线一区二区视频| 欧美日韩国产成人高清视频| 欧美日韩精品免费观看视频完整| 99在线精品观看| 国产偷自视频区视频一区二区| 久久综合狠狠综合久久综合88| 国产精品久久久久影院亚瑟| 欧美一级二级三级蜜桃| 欧美国产在线观看| 亚洲午夜精品久久久久久浪潮| 永久免费精品影视网站| 亚洲综合精品四区| 一本大道av伊人久久综合| 亚洲欧美国产毛片在线| 亚洲青涩在线| 一区二区在线观看视频在线观看| 原创国产精品91| 国产精品成人在线观看| 欧美国产精品专区| 国产亚洲欧洲一区高清在线观看| 一区二区免费在线观看| 亚洲激情视频网站| 在线观看日韩| 欧美日韩国内| 久久夜色精品国产欧美乱| 国产情人节一区| 欧美一区二区三区视频免费| 99精品国产99久久久久久福利| 欧美无乱码久久久免费午夜一区| 欧美精品一区在线播放| 亚洲精品在线三区| 国产精品久久午夜夜伦鲁鲁| 99精品黄色片免费大全| 久久免费偷拍视频| 久久成人综合网| 午夜精品偷拍| 欧美日韩视频一区二区| 午夜一区不卡| 免费不卡在线观看| 欧美精品日韩精品| 欧美亚洲日本一区| 免费美女久久99| 欧美精品一区二区高清在线观看| 蜜桃av噜噜一区二区三区| 亚洲精品一二三| 久久成人精品一区二区三区| 国精品一区二区三区| 欧美午夜视频在线观看| 欧美一区在线直播| 麻豆精品网站| 老司机亚洲精品| 欧美日韩中文字幕日韩欧美| 一区二区三区免费网站| 亚洲成色777777女色窝| 亚洲二区在线观看| 亚洲狠狠婷婷| 欧美国产在线视频| 欧美18av| 久久这里有精品视频| 国产女人18毛片水18精品| 亚洲欧美国产77777| 国产精品久久久久久久久果冻传媒| 亚洲激精日韩激精欧美精品| 欧美日韩成人精品| 国产精品毛片高清在线完整版| 性一交一乱一区二区洋洋av| 一本久久综合亚洲鲁鲁| 国产日产欧美a一级在线| 亚洲乱码久久| 亚洲激情第一页| 开心色5月久久精品| 亚洲黄色成人网| 久久se精品一区精品二区| 久热国产精品视频| 久久婷婷国产综合尤物精品| 国产精品嫩草99av在线| 黄色精品免费| 国产精品日韩在线观看| 久久精品123| 极品裸体白嫩激情啪啪国产精品| 国产精品久久久久一区二区三区共| 久久久综合网站| 久久不射中文字幕| 欧美少妇一区二区| 欧美在线观看www| 亚洲欧美在线高清| 欧美精品在线免费播放| 亚洲精品在线视频观看| 欧美高清日韩| 99视频一区二区三区| 国产精品日日做人人爱| 国产一区二区成人久久免费影院| 亚洲性色视频| 亚洲丁香婷深爱综合| 欧美福利在线| 亚洲精品1区2区| 亚洲视频在线观看| 亚洲人成网站在线观看播放| 亚洲激情视频网| 欧美精品在线一区二区| 亚洲香蕉网站| 欧美国产日本在线| 国产乱人伦精品一区二区| 欧美a一区二区| 日韩视频―中文字幕| 亚洲高清久久| 亚洲成色777777女色窝| 亚洲视频一区在线观看| 国产精品久久久久久av福利软件| 亚洲国产你懂的| 欧美日一区二区三区在线观看国产免| 国产精品资源在线观看| 亚洲电影在线| 欧美国产综合视频| 国产亚洲精品资源在线26u| 国产精品久久久久9999高清| 欧美fxxxxxx另类| 亚洲第一天堂av| 美玉足脚交一区二区三区图片| 欧美专区日韩视频| 9国产精品视频| 欧美大尺度在线| 亚洲黄色影片| 久久久久一区| 亚洲欧洲av一区二区三区久久| 日韩视频一区二区三区在线播放| 亚洲韩日在线| 欧美大片va欧美在线播放| 欧美私人网站| 国产又爽又黄的激情精品视频| 国产亚洲欧美一区二区三区| 女人香蕉久久**毛片精品| 欧美日韩视频专区在线播放| 欧美日韩激情小视频| 国产精品久久久久久av下载红粉| 亚洲国产午夜| 久久女同互慰一区二区三区| 亚洲天天影视| 午夜影视日本亚洲欧洲精品| 久久成人精品一区二区三区| 久久久久久综合网天天| 久久av一区二区三区漫画| 国产一区视频观看| 亚洲综合99| 亚洲欧美变态国产另类| 欧美人与禽性xxxxx杂性| 亚洲精品少妇| 久久久欧美一区二区| 亚洲一级影院| 国产精品私人影院| 国产午夜精品久久久| 亚洲丰满少妇videoshd| 9l视频自拍蝌蚪9l视频成人| 亚洲视频电影图片偷拍一区| 国产精品午夜电影| 欧美主播一区二区三区| 欧美中文在线观看国产| **网站欧美大片在线观看| 日韩视频一区二区三区| 国产偷久久久精品专区| 小黄鸭精品aⅴ导航网站入口| 欧美激情第10页| 亚洲一区日韩在线| 亚洲精品乱码久久久久久黑人| 久久久久久香蕉网| 亚洲一区二区三区四区五区黄| 国产精品久久国产精品99gif| 欧美激情一区二区三区在线视频观看| 亚洲国产精品专区久久| 精品51国产黑色丝袜高跟鞋| 午夜欧美理论片| 欧美福利一区| 亚洲成色www久久网站| 欧美资源在线观看| 国产亚洲毛片| 一区二区国产日产| 亚洲激情视频在线| 国产一区免费视频| 欧美日韩999| 久久综合九色99| 欧美成人一区二区三区| 在线观看亚洲专区| 欧美日本高清视频| 国产精品色婷婷久久58| 亚洲一区观看| 欧美日韩三区四区| 亚洲桃色在线一区| 一区二区三区不卡视频在线观看| 欧美久久九九| 精品成人国产在线观看男人呻吟| 国产一区999| 欧美亚州一区二区三区| 欧美阿v一级看视频| 激情综合在线| 在线日韩av永久免费观看| 米奇777超碰欧美日韩亚洲| 欧美福利视频在线观看| 精品99一区二区三区| 欧美色一级片| 久久成人精品一区二区三区| 久久av最新网址| 国语自产偷拍精品视频偷| 欧美高清视频一区| 国产精品久久久久久模特| 亚洲精品一区二区三| 在线一区二区三区做爰视频网站| 欧美精品1区2区3区| 久久免费国产精品1| 久久久噜噜噜久久久| 亚洲欧美国产不卡| 久久久久久69| 欧美福利视频一区| 一区二区日韩| 欧美精品免费播放| 亚洲欧美日韩高清| 国产精品久久二区二区| 亚洲日本一区二区三区| 欧美大片在线看免费观看| 在线色欧美三级视频| 一区二区成人精品| av成人国产| 一区二区三区免费看| 久久久久久有精品国产| 国产毛片久久| 美女999久久久精品视频| 国产真实乱子伦精品视频| 亚洲男同1069视频| 欧美综合二区| 久久久久五月天| 99视频一区| 亚洲国产欧美一区二区三区同亚洲| 在线亚洲美日韩| 国产精品色网| 欧美国产视频在线| 国产精品每日更新| 亚洲视频在线看| 136国产福利精品导航网址| 国产精品国产一区二区| 久久综合网hezyo| 亚洲国产第一| 国产欧美日韩在线播放| 亚洲女同在线| 久久精品亚洲| 激情视频一区| 欧美成人官网二区| 一区二区三区在线看| 美女在线一区二区| 亚洲午夜影视影院在线观看| 日韩午夜在线观看视频| 国产精品yjizz| 国产精品精品视频| 激情一区二区三区|