減少代碼調試時間與成本支出
由于代碼調試對于程序開發至關重要,幾乎所有的大型軟件都需要調試,才能最大程度上避免軟件出錯。
但是對于絕大多數開發人員來說,這個過程不僅非常耗時,而且大部分調試只能手工作業。因為修復一個軟件缺陷可能需要幾天、幾周甚至幾個月的時間,據估計,多達 50% 的軟件開發時間浪費在調試程序上。這是因為大多數錯誤都需要語義分析來識別、評估根本原因,即使是最先進的調試系統也無法有效地執行這種分析。
英特爾實驗室首席人工智能科學家 Justin Gottschlich 也表示:“盡管在過去的幾十年里,研究自動化調試方面取得了部分進展,但現有工具仍無法完美發現日益復雜的軟件錯誤。這也是調試仍然主要由人為驅動的過程的一個關鍵原因。”
除此之外,調試代碼的預算支出也很高。據英特爾官方介紹,2020 年 IT 行業在與調試代碼相關的環節上大約花費了 2 萬億美元,約占 IT 平均預算的一半。
“超能的” ControlFlag
據悉,該系統是英特爾機器編程研究 (MPR) 項目的一部分,該項目的總體目標是通過自動化有望將開發軟件所需的時間減少 1,000 倍。例如,Gottschlich 的團隊正在研究的領域之一是最終擴展 ControlFlag 的能力,以自動修復它檢測到的錯誤。
自去年推出以來,英特爾已在各種軟件系統上測試了該機器學習工具,并取得了可喜的成果?!爱斘覀冏畛踉O計系統時,我們沒有預料到它能夠發現高度復雜的缺陷,”英特爾實驗室首席人工智能科學家 Justin Gottschlich 表示?!叭欢b于其自我監督的設計,ControlFlag 能夠發現高度復雜、細微的軟件缺陷,甚至連我們這些構建它的人都感到震驚?!?/p>
英特爾的團隊通過使用一種“無監督”的學習方法,以允許 ControlFlag 檢測更廣泛的存儲庫中的錯誤。該系統從超過 10 億行未標記的源代碼中學習編碼模式,使其能夠達到很高的準確性,甚至可以適應開發人員的風格,以區分軟件異常和編程語言的風格變化。
ControlFlag 適用于任何包含控制結構的編程語言(如 C/C++),而且ControlFlag 能夠不斷地從未標記的源代碼中學習,隨著新數據的引入而 “進化”,使自己變得更好。雖然它還不能自動解決它所發現的代碼錯誤,但該工具可以為開發人員提供了潛在的修改建議。
Justin Gottschlich 還表示,目前為止僅在兩個專有軟件存儲庫上使用 ControlFlag,就發現了生產質量、已部署程序中的 300 多個缺陷。例如,去年 ControlFlag 在名為 Client URL (cURL) 的計算機軟件項目中檢測到代碼異常,該項目每天使用各種網絡協議傳輸數據超過 10 億次。在向 cURL 團隊報告異常后,他們同意 ControlFlag 的發現并重新設計代碼以修補問題。
不斷進步的 ControlFlag
隨著英特爾團隊致力于開發 ControlFlag,過去的一年也帶來了相當多的學習點。Gottschlich 認為,需要改進的兩個關鍵領域是減少該工具報告的誤報數量,以及將更先進的語義分析器集成到 ControlFlag 的推理中。
然而,作為一個將成為英特爾機器編程工具套件之一的系統,ControlFlag 將繼續發展?!癈ontrolFlag 的進步不太可能停止,”Gottschlich 強調?!斑@主要是因為隨著軟件編程語言、硬件描述語言和計算設備的發展,ControlFlag 也需要發展以跟上它們的步伐?!?/p>
與此同時,英特爾的 MPR 團隊正在開展一些專注于簡化軟件開發的項目。例如,去年該公司還發布了一款與麻省理工學院實驗室共同開發的工具,該工具可以研究代碼片段以了解軟件打算做什么。該系統稱為 MISIM(機器推斷代碼相似性),它使用預先存在的代碼目錄來理解新算法背后的意圖,并通過建議其他編程方法或提供使代碼更高效的選項來幫助工程師開發軟件。
Gottschlich 預計 MISIM 有一天會與 ControlFlag 一起工作?!爱斦_想法融合在一起時,我們設想了一個更強大的新系統,該系統將能夠檢測 ControlFlag 目前可以檢測到的所有缺陷,以及由于潛在的復雜性而目前無法檢測到的數百種缺陷?!盙ottschlich表示。