Linux就AI生成代碼定下規(guī)則:允許Copilot類工具、拒絕劣質(zhì)AI代碼,錯誤由人類負責
經(jīng)過數(shù)月激烈爭論,林納斯?托瓦茲(Linus Torvalds)與 Linux 內(nèi)核維護者們終于就 AI 生成代碼 制定了明確規(guī)則。
開源社區(qū)圍繞人工智能長期存在的身份危機,終于迎來了一劑務(wù)實的解藥。本周,Linux 內(nèi)核項目正式出臺覆蓋全項目的正式政策:允許使用 AI 輔助編寫代碼貢獻,但開發(fā)者必須遵守嚴格的新披露規(guī)則。新準則規(guī)定,AI 不得使用具有法律約束力的 Signed-off-by 標簽,而是必須新增 Assisted-by(輔助工具)標簽以保證透明。最終,這項政策從法律上明確:每一行 AI 生成代碼、以及由此引發(fā)的任何漏洞或安全問題,責任完全由提交代碼的人類開發(fā)者承擔。
這一決定是在開源界經(jīng)歷數(shù)月混亂后做出的,平息了一場在今年 1 月達到頂峰的激烈爭論。當時,英特爾的戴夫?漢森與甲骨文的洛倫佐?斯托克斯就內(nèi)核應(yīng)如何嚴格監(jiān)管 AI 工具產(chǎn)生激烈沖突。托瓦茲以其一貫直白的風格最終終結(jié)了這場爭論,稱全面禁止的討論是 “無意義的裝腔作勢”。
托瓦茲的立場構(gòu)成了新政策的核心理念,且非常直白:AI 只是另一種工具。故意提交垃圾代碼的人根本不會去看文檔,因此內(nèi)核應(yīng)聚焦于讓人類開發(fā)者承擔責任,而不是試圖監(jiān)管他們在本地電腦上運行什么軟件。這是一種非常理性、務(wù)實的做法,尤其與開源生態(tài)其他領(lǐng)域的恐慌形成鮮明對比。
在此之前,各大主流項目對 AI 的態(tài)度天差地別。過去兩年里,知名 Linux 發(fā)行版如 Gentoo,以及歷史悠久的 Unix 發(fā)行版 NetBSD 都直接全面禁止 AI 生成提交。NetBSD 維護者曾直言,大模型輸出的代碼因其訓(xùn)練數(shù)據(jù)版權(quán)狀況模糊,在法律上是 “被污染的”。
恐慌的核心圍繞 開發(fā)者來源證書(DCO)。正如紅帽去年年底一份詳盡分析所指出的,DCO 要求人類從法律上證明自己有權(quán)提交代碼。由于大模型是在海量開源代碼數(shù)據(jù)集上訓(xùn)練的,而這些代碼往往帶有 GNU GPL 等限制性許可證,使用 Copilot 或 ChatGPT 的開發(fā)者無法真正保證所提交內(nèi)容的來源。紅帽警告稱,這可能無意中違反開源許可證,并徹底摧毀 DCO 框架。
除了法律麻煩,項目維護者還在與海量劣質(zhì)提交做徒勞的斗爭。目前開源世界正被社區(qū)稱為 “AI 垃圾(AI slop)” 的內(nèi)容淹沒。cURL 作者因被大量幻覺代碼淹沒而不得不關(guān)閉漏洞賞金計劃;白板工具 tldraw 開始自衛(wèi)式自動關(guān)閉外部 PR;Node.js、OCaml 等項目則出現(xiàn)上萬行的 AI 生成補丁,引發(fā)維護者關(guān)于項目存亡的爭論。
未披露的 AI 代碼帶來的文化沖突更為激烈。去年年底,NVIDIA 工程師、內(nèi)核維護者薩沙?萊文被曝在未披露的情況下,向 Linux 6.15 提交了完全由大模型生成的補?。òǜ氯罩荆?,引發(fā)社區(qū)強烈反彈。盡管代碼可用,但經(jīng)過審查和測試后仍出現(xiàn)性能回退。社區(qū)強烈反對開發(fā)者在自己并未實際編寫的復(fù)雜代碼上署名,就連托瓦茲也承認該補丁未得到適當審查,部分原因就是它沒有被標記為 AI 生成。
Linux 內(nèi)核并非唯一遭遇未披露 AI 輔助問題的社區(qū)。在游戲領(lǐng)域,傳奇的《毀滅戰(zhàn)士》(Doom)模組社區(qū)去年也因此分裂。廣受歡迎的 GZDoom 源碼移植版長期首席開發(fā)者克里斯托夫?“格拉夫?扎爾”?奧克爾克斯被曝使用未披露的 AI 生成補丁。當社區(qū)成員指責其缺乏透明度時,他態(tài)度輕慢, essentially 告訴批評者 “有本事就分叉項目”。社區(qū)直接戳穿他的態(tài)度,導(dǎo)致絕大多數(shù) GZDoom 貢獻者出走,新的 UZDoom 源碼移植版誕生。
GZDoom 事件與薩沙?萊文的爭議恰恰說明了 Linux 內(nèi)核新政策為何至關(guān)重要。開發(fā)者社區(qū)大部分人并非憤怒于使用 AI,而是憤怒于相關(guān)的不誠實。通過要求 Assisted-by 標簽并強制執(zhí)行人類責任,Linux 內(nèi)核試圖剝離爭論中的情緒因素。托瓦茲與維護者們承認現(xiàn)實:開發(fā)者會用 AI 工具加快編碼速度,試圖禁止它們就像試圖禁止某個品牌的鍵盤一樣。
歸根結(jié)底:代碼好就是好。如果是會破壞內(nèi)核的幻覺式 AI 垃圾,點擊 “提交” 的那個人就得向托瓦茲交代。在開源世界,這幾乎是最有力的威懾。












評論