《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業界動態 > 大模型首次直接理解代碼圖

大模型首次直接理解代碼圖

不用Agent自動修bug,登頂SWE-Bench開源模型榜單
2025-06-27
來源:IT之家
關鍵詞: AI 大模型 開源模型

AI 自動修 bug,解決率達 44%!這是全球開源模型的最新最強水平。

來自螞蟻的開源新模型,在 SWE-bench Lite 上超越所有開源方案,性能媲美閉源模型。

000.png

具體表現如下,在 SWE-bench Lite 上:

所有開源模型方法(Open Weight Model)中排名第一;

所有開源系統方法(Open Source Syestem)中排名第六;

總體排名第 14;

優于目前榜單最好開源模型“KGCompass”7.33%。

000.png

他們首創將倉庫代碼圖模態融入大模型(Code Graph Model, CGM),讓大語言模型能直接理解代碼圖,更高效修復 bug、補全代碼。

這徹底擺脫對黑盒模型(如 GPT-4 或 Claude 3.7 等)和復雜 Agent 工作流程的依賴,實現更加可控、透明、安全的 SE 自動化。

而且,CGM 完全基于開源模型。要知道,開源模型在 SWE-bench 上的表現通常不夠好,此前幾乎所有 SOTA 級方案都是基于閉源模型實現。而 CGM 基于 Qwen 模型,做到了比肩閉源模型的水平。

CGM 僅需 4 步就能快速定位、生成補丁,省去了 Agent 方案中復雜的編排過程,效率直線 up。

000.png

讓 AI 真正理解大模型代碼庫

大模型趨勢以來,AI 編程迅速崛起,尤其是在寫函數這類小任務上的表現出色,比如在 HumanEval 等基準測試上,許多模型的準確率已經超過 90%。

然而真實的軟件工程遠比”寫一個函數“復雜得多。像 Bug 修復、功能增強這樣的任務,通常需要跨文件、跨模塊操作,并要求模型理解項目中復雜的結構、依賴關系和類的繼承體系。

現在的主流方法通常是使用基于閉源模型的 Agent。它們可以模擬人類程序員行為,如觀察代碼、調用工具、多輪交互等完成任務。

但這類方法也存在幾個問題:

行為路徑不可控,容易積累推理誤差;

依賴 GPT-4、Claude 等閉源模型,難以私有部署或定制;

工程成本高,效率不高。

與此同時,當前使用開源模型的方案,很難實現 SOTA 級效果。

為此研究團隊提出:能否只用開源模型、不依賴 Agent,解決倉庫級任務?CGM 由此而來。

??圖結構與大模型深度融合

CGM 采用類似 Vision-Language Model(VLM)的跨模態建模方式。它將傳統 LLM 的文本理解能力與代碼倉庫的結構圖(Graph)結合,形成一種圖-語言多模態模型。模型核心融合了兩個模態:

圖模態:將倉庫構建為結構化圖,節點包括函數、類、文件、包等 7 種類型,邊表示調用、包含、繼承等依賴;

語言模態:用戶輸入的自然語言描述和代碼提示,驅動模型生成 patch 或回答。

000.png

模型輸入為代碼圖和文本形式的 prompt,將在 LLM 中對結構-語義進行雙模態對齊。

具體結構融合方法如下:

使用小型編碼器(CodeT5+)對每個節點進行編碼,壓縮為單個“節點 token”,每個節點內按照至多 512 個 token 的文本塊切分。

通過一個適配器(一個兩層 MLP)將編碼后的節點表征映射到 LLM 輸入嵌入空間中。相當于將 LLM 上下文擴展 512 倍,能更好處理海量的代碼倉庫上下文。

使用圖感知注意力掩碼(Graph-aware Attention Mask)。替代 LLM 中原有的因果注意力,使注意力機制只作用于相鄰節點間。類似于 GNN 的消息傳遞機制,能夠讓 LLM 直接感知和利用代碼的結構依賴關系。

??兩階段訓練:結構理解 + 問題泛化

基于此模型架構,團隊通過兩階段訓練讓 LLM 能夠理解代碼圖的拓撲結構。

階段一:子圖重構預訓練

為了訓練 CGM 有效捕捉代碼圖的語義和結構信息,團隊設計了一個“圖生代碼 (Graph-to-Code)”任務。從大型代碼圖中隨機采樣出子圖(限制節點數量以控制輸出代碼長度),模型需要根據這些輸入的子圖(僅包含節點類型和連接關系,不含完整的代碼內容)來重建出原始的代碼片段。

然后采用層級化方法,保持重建代碼的結構一致性和可讀性。按照拓撲排序與行號順序拼接倉庫上下文:高級別節點(如 REPO、PACKAGE)置于輸出序列或文件的起始;文件節點通過拓撲排序確定順序;文件內節點(如 CLASS、FUNCTION)則按行號順序拼接。

階段二:噪聲增強微調

此階段使用真實的 GitHub 問題-修復補丁數據對 CGM 進行微調。

模型學習基于兩項輸入生成代碼補?。?i) 一個相關的代碼子圖;(ii) 一段文本提示,指明根據補丁可能需要修改的實際文件。為了提升模型的魯棒性,特意在提示中引入了 10% 的噪聲輸入:例如,提示中可能包含一個實際上無需修改的不相關文件,或者遺漏至少一個本應被修改的關鍵文件。在訓練中引入這種受控的噪聲有助于模型更好地泛化到實際輸入信息不完整或包含干擾的場景。

??推理階段:Graph-RAG 框架替代 Agent

最后,為了進一步提升實際應用能力,CGM 構建了一個無 Agent 輕量化框架 Graph-RAG。

它還原了人類程序員 bug 修復工作流,但比現有 Agent 方案效率更高。

核心模塊數量從 10 個進一步精簡到了 4 個:改寫器 → 檢索器 → 重排器 → 生成器(CGM 模型)。

改寫器(Rewriter):改寫問題描述,提取關鍵詞與相關文件;

檢索器(Retriever):通過語義與結構檢索,從代碼圖中抽取連通子圖;

重排器(Reranker):排序檢索結果,選擇最關鍵文件用于生成;

生成器(Reader):結合子圖與提示生成最終修復代碼。

000.png

基于以上,CGM 在多個測試基準中取得了領先成績。具體如下 ——

實驗結果

研究團隊在多個主流基準上系統評估了 CGM 的性能,涵蓋兩個主要任務類別:(1)代碼修復和(2)代碼補全。

倉庫級別的代碼修復

在 SWE-bench Lite Leaderboard 上,CGM 以 44.00% 的結果排名開源權重榜單第一。

000.png

在 SWE-bench Verified 上,CGM 相比于最佳開源基線提升了 10.20%,至 50.40%;

對于 Java 項目,CGM 在 SWE-bench-java Verified 上達到 14.29%,則相比于最佳開源基線提升了 4.4%。

000.png

這些結果表明 CGM 能夠處理跨語言、跨項目的大規模倉庫級 Bug 修復任務,展現出強大的結構理解與泛化能力。

倉庫級別的代碼補全

在復雜代碼生成任務中,CGM 在 ComplexCodeEval 和 CrossCodeEval 上也顯著領先于同尺寸開源模型,特別是在需要跨文件推理和補全的場景下效果突出。

000.png

此外,研究團隊在不同基座模型上(CodeLlama-7B 和 DeepSeek-Coder-7B)分別部署了 CGM,并與近期 RAG 系統進行比較。結果顯示,CGM 具備很好通用性,可以適配多種基座模型,并且表現超越傳統 RAG 方法。

000.png

總結來看,CGM 不依賴復雜 Agent 系統,首次實現了在大模型中融合代碼圖模態,讓 AI 像人類一樣 get 倉庫里文本和代碼之間的復雜依賴關系,“真正理解一個項目”。

更關鍵的是,它基于開源模型就能實現,不局限于特定模型。為企業和開發者提供了一個靈活、透明且可控的方案。

??最后,CGM 的技術論文、核心代碼、模型權重與訓練數據均已開源,感興趣的同學可進一步了解詳情。

技術論文:https://arxiv.org/abs/2505.16901

開源代碼:https://github.com/codefuse-ai/CodeFuse-CGM

模型權重:https://huggingface.co/codefuse-ai/CodeFuse-CGM-72B

訓練數據:https://huggingface.co/datasets/codefuse-ai/CodeGraph

??團隊此前工作:

Code LLM綜述:Awesome-Code-LLM(TMLR)https://github.com/codefuse-ai/Awesome-Code-LLM

Graph+LLM前序研究:GALLa(ACL 2025)https://github.com/codefuse-ai/GALLa

高效注意力架構:Rodimus(ICLR 2025)https://arxiv.org/abs/2410.06577

代碼多任務微調框架:MFTCoder(KDD 2024)https://arxiv.org/abs/2311.02303


Magazine.Subscription.jpg

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
热re99久久精品国产66热_欧美小视频在线观看_日韩成人激情影院_庆余年2免费日韩剧观看大牛_91久久久久久国产精品_国产原创欧美精品_美女999久久久精品视频_欧美大成色www永久网站婷_国产色婷婷国产综合在线理论片a_国产精品电影在线观看_日韩精品视频在线观看网址_97在线观看免费_性欧美亚洲xxxx乳在线观看_久久精品美女视频网站_777国产偷窥盗摄精品视频_在线日韩第一页
  • <strike id="ygamy"></strike>
  • 
    
      • <del id="ygamy"></del>
        <tfoot id="ygamy"></tfoot>
          <strike id="ygamy"></strike>
          麻豆av福利av久久av| 欧美日韩国产精品一区二区亚洲| 久久久国产精品一区| 亚洲精品少妇网址| 国产精品成人一区二区艾草| 久久大香伊蕉在人线观看热2| 欧美成人在线影院| 一区二区三区视频在线看| 亚洲人成网在线播放| 国产精品第一页第二页第三页| 亚洲精品小视频| 午夜精彩视频在线观看不卡| 亚洲欧美电影院| 免费观看在线综合色| 国产午夜精品久久久久久久| 香蕉久久精品日日躁夜夜躁| 亚洲国产精品久久久久婷婷老年| 久久伊人精品天天| 国内偷自视频区视频综合| 欧美一级午夜免费电影| 国产农村妇女毛片精品久久莱园子| 国产亚洲免费的视频看| 午夜在线观看欧美| 久久精品盗摄| 日韩一级成人av| 久久综合色天天久久综合图片| 黄色成人在线网址| 欧美私人啪啪vps| 久久精品最新地址| 中日韩在线视频| 国产精品国产三级国产普通话三级| 亚洲午夜一区| 亚洲男人的天堂在线aⅴ视频| 亚洲毛片在线免费观看| 亚洲欧洲在线免费| 亚洲激情综合| 欧美深夜影院| 在线视频中文亚洲| 国产精品99免视看9| 国产精品久久久久久久午夜片| 亚洲丶国产丶欧美一区二区三区| 国产精品外国| 伊人久久婷婷色综合98网| 久久在线免费观看视频| 羞羞漫画18久久大片| 欧美日韩国产在线| 国产精品久久国产精品99gif| 欧美国产成人在线| 香蕉av福利精品导航| 男人天堂欧美日韩| 欧美亚一区二区| 国产日韩精品综合网站| 亚洲第一中文字幕| 欧美日韩影院| 日韩视频中文| 欧美激情2020午夜免费观看| 欧美影院视频| 欧美高清在线播放| 国产日韩av一区二区| 女人天堂亚洲aⅴ在线观看| 久久美女性网| 久久综合色综合88| 老牛影视一区二区三区| 国产精品毛片大码女人| 激情欧美一区二区三区在线观看| 欧美成人综合网站| 在线视频国内自拍亚洲视频| 国产午夜一区二区三区| 国产精品乱码一区二区三区| 国产伦精品一区二区三区高清版| 亚洲国产成人久久| 欧美激情在线免费观看| 亚洲系列中文字幕| 久久久精品2019中文字幕神马| 欧美电影资源| 国产婷婷色综合av蜜臀av| 激情综合色综合久久| 亚洲午夜在线视频| 免费久久99精品国产自| 欧美三区免费完整视频在线观看| 激情91久久| 国产午夜亚洲精品理论片色戒| 亚洲春色另类小说| 在线成人h网| 欧美国产免费| 久久一区二区精品| 亚洲黄色影片| 欧美日韩亚洲综合| 亚洲精品国产精品久久清纯直播| 欧美午夜精品理论片a级按摩| 久久亚洲国产精品日日av夜夜| 久热国产精品视频| 欧美日韩中文字幕在线| 亚洲国产精品www| 欧美视频在线不卡| 亚洲欧洲美洲综合色网| 国产精品国产三级国产专区53| 久久久久9999亚洲精品| 欧美日韩亚洲一区二| 欧美日韩1区2区| 日韩网站在线观看| 亚洲欧美激情精品一区二区| 亚洲看片免费| 国产精品久久久久9999吃药| 欧美中文字幕视频| 性欧美xxxx视频在线观看| 久久国产精品72免费观看| 欧美一级片一区| 欧美成人免费观看| 国产视频一区二区在线观看| 激情综合网激情| 亚洲一区观看| 黑人巨大精品欧美黑白配亚洲| 日韩网站在线看片你懂的| 亚洲三级视频| 亚洲精品国产日韩| 99精品99| 国产精品一区二区三区四区五区| 亚洲午夜一区| 中日韩视频在线观看| 午夜精品国产更新| 久久精品亚洲国产奇米99| 欧美在线视屏| 久久一区二区三区超碰国产精品| 亚洲欧美资源在线| 可以免费看不卡的av网站| 国产一区二区三区免费不卡| 午夜精品福利在线| 宅男噜噜噜66一区二区| 亚洲视频一起| 久久精品在线视频| 免费不卡亚洲欧美| 欧美激情2020午夜免费观看| 久久久久久久性| 欧美裸体一区二区三区| 久久久欧美精品| 欧美在线啊v| 欧美日本高清| 国产精品永久免费视频| 欧美午夜寂寞影院| 亚洲欧美日本视频在线观看| 国产亚洲二区| 午夜精品久久久久久久99热浪潮| 欧美精品一区二区三区四区| 久久精品人人做人人综合| 亚洲剧情一区二区| 国产麻豆午夜三级精品| 午夜精品久久久久久久99黑人| 麻豆久久精品| 在线欧美视频| 欧美一区三区三区高中清蜜桃| 国产欧美一级| 久久久中精品2020中文| 99视频精品全国免费| 日韩午夜激情av| 欧美日韩一区二区三区高清| 国产一区二区三区av电影| 激情校园亚洲| 欧美一级日韩一级| 久久蜜桃精品| 欧美成人精品h版在线观看| 欧美一区二区在线免费播放| 国产精品久久久久久久久久久久| 亚洲人成人一区二区三区| 亚洲精品一区在线观看| 久久久久一区| 国产精品亚发布| 亚洲国产裸拍裸体视频在线观看乱了中文| 欧美成人免费小视频| 亚洲午夜免费福利视频| 黄色精品一二区| 亚洲免费视频中文字幕| 午夜视频在线观看一区二区| 亚洲精品视频啊美女在线直播| 欧美日韩91| 亚洲剧情一区二区| 国产精品草草| 亚洲三级影片| 久久国产精品毛片| 亚洲高清视频一区二区| 亚洲人成人一区二区在线观看| 亚洲大胆人体视频| 国产精品sss| 国产精品v欧美精品v日本精品动漫| 性刺激综合网| 欧美永久精品| 欧美激情亚洲国产| 日韩天堂在线视频| 亚洲一二三四久久| 亚洲第一搞黄网站| 亚洲视频中文| 亚洲国产mv| 欧美综合国产| 久久久久久久久久久久久9999| 亚洲精品看片| 国产乱码精品一区二区三区不卡| 韩日午夜在线资源一区二区| 亚洲精品视频一区二区三区| 国产一级久久| 久久精品视频亚洲| 久久aⅴ国产欧美74aaa| 欧美日一区二区在线观看| 国产欧美短视频| 国产精品免费一区豆花| 亚欧美中日韩视频| 亚洲人成在线观看一区二区| 欧美在线网站| 新67194成人永久网站| 免费日韩一区二区| av成人动漫| 国产欧美亚洲视频| 狠狠色狠狠色综合系列| 欧美大香线蕉线伊人久久国产精品| 亚洲欧美国产精品va在线观看| 国产伦精品一区二区| 国产精品青草综合久久久久99| 精品96久久久久久中文字幕无| 一区二区精品| 欧美精品麻豆| 一本大道久久a久久综合婷婷| 午夜亚洲影视| 久久亚洲国产精品日日av夜夜| 欧美精品福利视频| 亚洲国产合集| 国产婷婷色一区二区三区四区| 亚洲午夜激情免费视频| 欧美深夜影院| 开元免费观看欧美电视剧网站| 一区二区三区你懂的| 国产精品欧美日韩一区二区| 伊人一区二区三区久久精品| 狠狠干狠狠久久| 亚洲一区二区三区777| 女女同性精品视频| 午夜精品美女自拍福到在线| 亚洲成人在线网站| 国产亚洲一区二区在线观看| 国产日韩亚洲欧美精品| 久久精品99国产精品日本| 久久综合给合久久狠狠色| 欧美日韩综合另类| 欧美日韩国产电影| 欧美黄在线观看| 欧美极品在线视频| 中文av一区特黄| 国产精品久久久久久亚洲调教| 亚洲视频在线一区观看| 免费亚洲电影| 欧美呦呦网站| 欧美国产91| 99视频在线精品国自产拍免费观看| 欧美日韩在线观看一区二区三区| 两个人的视频www国产精品| 欧美视频专区一二在线观看| 欧美精品日本| 亚洲免费观看高清完整版在线观看| 欧美日本乱大交xxxxx| 亚洲欧美清纯在线制服| 亚洲一区二区三区三| 亚洲精品一区中文| 亚洲丁香婷深爱综合| 久久国产视频网站| 亚洲一区二区三区四区在线观看| 99精品国产在热久久婷婷| 国产在线播精品第三| 亚洲天堂久久| **欧美日韩vr在线| 国产欧美日韩综合精品二区| 亚洲色无码播放| 极品日韩av| 久久久久久伊人| 国产性做久久久久久| 午夜欧美视频| 欧美插天视频在线播放| 欧美日韩1区| 国产免费观看久久黄| 国产在线高清精品| 精品成人一区二区| 亚洲激情一区二区三区| 久久精品亚洲一区二区三区浴池| 欧美韩国日本综合| 亚洲精品乱码视频| 国产精品毛片大码女人| 国产精品亚洲成人| 一区免费观看视频| 久久爱另类一区二区小说| 久久久久九九九| 欧美成人免费一级人片100| 欧美区二区三区| 国产精品久久久一本精品| 欧美精品在线一区二区| 在线不卡免费欧美| 国产日本欧美在线观看| 国产亚洲一级高清| 久久精品中文字幕一区二区三区| 久久精品国产精品亚洲综合| 亚洲国产毛片完整版| 久久久蜜桃一区二区人| 欧美日本精品一区二区三区| 国产精品视频久久久| 久久综合免费视频影院| 亚洲综合视频1区| 一区二区免费在线播放| 国产精品av久久久久久麻豆网| 欧美少妇一区二区| 欧美巨乳在线观看| 99国产精品久久久久久久成人热| 亚洲精品精选| 老司机67194精品线观看| 久久人人九九| 香蕉成人啪国产精品视频综合网| 国产视频一区二区在线观看| 国产精品天天摸av网| 欧美一区二区三区日韩视频| 国产专区欧美专区| 久久精品色图| 午夜精品美女久久久久av福利| 在线欧美日韩国产| 国产精品夫妻自拍| 欧美日韩在线亚洲一区蜜芽| 欧美日韩国产在线观看| 国产精品va| 欧美日韩dvd在线观看| 国产精品久久久久aaaa九色| 久久久www成人免费无遮挡大片| 欧美日本国产在线| 久久久亚洲国产天美传媒修理工| 欧美一区二区啪啪|