狠狠做深爱婷婷久久一区,欧美日韩国内,久久麻豆精品传媒,久久久一区一区二区,色鬼伦理片,99视频精品久久,久久精品国产久久久久久,久久久伦理电影一区二,磁力天堂河北彩花

新聞中心

EEPW首頁 > 汽車電子 > 設(shè)計應(yīng)用 > ICCV會議,揭開了特斯拉FSD架構(gòu)的秘密(2)

ICCV會議,揭開了特斯拉FSD架構(gòu)的秘密(2)

作者: 時間:2025-12-26 來源:EEPW 收藏

作為自動駕駛行業(yè)的行業(yè)標(biāo)桿和技術(shù)路線的引領(lǐng)者,特斯拉曾經(jīng)在2021-2023年之間召開過兩次技術(shù)細節(jié)滿滿的AI Day,做過兩次CVPR會議的分享,向世人全面揭示了基于Transformer的BEV、純視覺占用網(wǎng)絡(luò)OCC、基于神經(jīng)輻射場NeRF 的三維重建技術(shù),后來,或許是因為發(fā)展速度趨緩,或者如馬斯克所言的為了避免“友商逐幀學(xué)習(xí)”,特斯拉不再對外公開FSD的技術(shù)方法論了。時隔兩年多之久,特斯拉AI副總裁、自動駕駛負責(zé)人Ashok在今年的ICCV上做了一次精彩的分享。作為自動駕駛行業(yè)今年最重要的技術(shù)分享之一,特斯拉在I這次演講引發(fā)了一些誤讀和謠傳。有人(或許是理想汽車的利益相關(guān)者)認為FSD 采用了理想汽車已經(jīng)拋棄的雙系統(tǒng)方案,也有人(或許是小鵬汽車的利益相關(guān)者)認為FSD 采用了小鵬力主的VLA 方案,那么,事情的真相到底是什么樣子?特斯拉FSD 到底采用了什么樣的架構(gòu)呢?

1   不是雙系統(tǒng)方案

在自動駕駛的發(fā)展過程中,涌現(xiàn)出了不少容易被搞混的概念,其中之一便是雙系統(tǒng)這個理念。追根溯源,雙系統(tǒng)的說法來自2002年諾貝爾經(jīng)濟學(xué)獎獲得者、心理學(xué)家丹尼爾· 卡尼曼 2011年出版的《思考,快與慢》。在這本書里,卡尼曼將大腦劃分為快思考系統(tǒng)1和慢思考系統(tǒng)2。

1766735049976942.png

圖片來源:Momenta

系統(tǒng)1采用自動、無意識、直覺式的運行模式,處理著我們?nèi)粘I钪薪^大部分決策,系統(tǒng)2 采用受控、有意識、分析式的運行模式,用于承接系統(tǒng)1 無法解決的難題。經(jīng)過十幾年的推廣,雙系統(tǒng)的概念日益深入人心。2018 年以來,隨著可內(nèi)嵌因果關(guān)系的Transformer架構(gòu)的出現(xiàn),生成式AI 系統(tǒng)都或多或少地同時擁有了面向簡單場景的直覺能力和面向復(fù)雜場景的推理能力。

1766735066676573.png

圖片來源:百度

從對這個概念的宣傳時間線來看,2023 年,地平線于國內(nèi)首個提出了基于雙系統(tǒng)概念的智能駕駛系統(tǒng)方案,進入2024 年,百度、理想汽車、Momenta 相繼在不同的場合對雙系統(tǒng)展開了宣傳。最有錢的理想汽車嗓門最大,自然而然地拿下了“行業(yè)首個”雙系統(tǒng)方案的桂冠。

1766735094373958.png

圖片來源:地平線

從“內(nèi)容”的角度來看,生成式AI 系統(tǒng)都同時具備基于直覺、快速響應(yīng)的系統(tǒng)1 和基于推理、提供高層次認知的系統(tǒng)2,但從“形式”的角度來看,生成式AI系統(tǒng)不一定要像理想汽車那樣通過兩個神經(jīng)網(wǎng)絡(luò)實現(xiàn)。

1766735114678230.png

圖片來源:理想汽車

特斯拉這次演講中出現(xiàn)的系統(tǒng)2,顯然沒有采用理想汽車的“形式雙系統(tǒng)”方案。因為,經(jīng)過反復(fù)的訓(xùn)練,系統(tǒng)2 的復(fù)雜技能可以轉(zhuǎn)化為系統(tǒng)1 的直覺反應(yīng),將深思熟慮的技能變?yōu)殡姽饣鹗g的本能,系統(tǒng)1 和系統(tǒng)2 完全可以存在于同一個神經(jīng)網(wǎng)絡(luò)里,而且,從形式上看,F(xiàn)SD 是單個而非兩個大神經(jīng)網(wǎng)絡(luò)。所以,別再拿特斯拉給理想汽車的雙系統(tǒng)方案背書了!

2   不是VLA方案

城頭變幻大王旗,自動駕駛行業(yè)每年都有熱議的話題。細數(shù)下來,21年的話題是前融合和基于Transformer的BEV,22年的熱議是占用網(wǎng)絡(luò)OCC和NOA進城,23年引發(fā)廣泛討論的是融合激光信息的OCC、純視覺OCC、基于無圖NOA 的開城大戰(zhàn),24年的熱點是兩段式端到端、一段式端到端和雙系統(tǒng)方案,到了25年,流量幾乎都給了理想、小鵬、小米、元戎啟行這些新勢力主導(dǎo)的VLA 方案。

1766735214121789.png

圖片來源:理想汽車

小鵬、理想們力挺視覺語言動作模型VLA,根本原因在于VLA的核心- 大語言模型具有強大的泛化能力和推理能力,從而賦予了VLA方案相較于傳統(tǒng)端到端方案更加強大的場景理解能力。也就是說,內(nèi)嵌語言智能的大語言模型是VLA的核心,正是借助大語言模型的通用泛化能力,小鵬VLA和理想VLA才大幅度提升了對復(fù)雜場景的語義理解能力。

1766735145449901.png

圖片來源:小鵬汽車

但是,這并不意味著加入了語言智能,系統(tǒng)就采用了VLA模型的架構(gòu)。這個道理就跟從智能的角度來看,現(xiàn)有頭部自動駕駛系統(tǒng)都是雙系統(tǒng),但同樣具備系統(tǒng)1快速響應(yīng)能力和系統(tǒng)2復(fù)雜推理能力的很多方案都沒有采用理想汽車那種形式雙系統(tǒng)方案是一樣的。事實上,理想VLA不也是把系統(tǒng)1和系統(tǒng)2集成進一個系統(tǒng)里了嗎?

1766735153878903.png

圖片來源:理想汽車

特斯拉FSD引入語言智能,主要目的是增強FSD這個黑盒系統(tǒng)的可解釋性。也就是說,特斯拉FSD中的語言智能是給人看的,一方面用于提升用戶對自動駕駛系統(tǒng)的信任感,一方面可以作為中間結(jié)果,供開發(fā)人員檢查缺陷,VLA中的語言智能除了給人看,更多是用來生成動作token ,直接指導(dǎo)車輛的運動控制。

1766735256371061.png

圖片來源:特斯拉

可以認為,F(xiàn)SD端到端神經(jīng)網(wǎng)絡(luò)中有一個小推理模型,專門用于以自然語言的形式展示對場景的理解和決策的機制,從作用上看,它更像是一個VLM。所以,也別拿特斯拉給VLA路線背書了。

是世界模型嗎?

人生如同打地鼠,每解決一個舊問題就會冒出一個新問題。解決了車端FSD推理模型既不是雙系統(tǒng)也不是VLA的老問題,馬上跳出來的新問題就是,F(xiàn)SD使用的是世界模型嗎?

特斯拉AI副總裁、自動駕駛負責(zé)人阿肖克明確指出,特斯拉的世界模擬器用于在云端提供模型測試驗證和強化學(xué)習(xí)的環(huán)境。它跟駕駛智能體或駕駛模型連接起來,形成評估其性能的閉環(huán)。

1766735257476591.png

圖片來源:特斯拉

從技術(shù)原理上看,特斯拉世界模擬器和蔚來汽車云端世界模型采用了同樣的方案,即根據(jù)當(dāng)前狀態(tài)和下一步的動作,預(yù)測生成未來的狀態(tài)。從概念上看,世界模擬器根據(jù)下一步動作預(yù)測未來狀態(tài),進行的是“當(dāng)前狀態(tài)+ 動作- > 未來狀態(tài)”的物理推演,而車端推理模型做的事情正相反,是根據(jù)當(dāng)前狀態(tài)預(yù)測下一步的動作,進行的“當(dāng)前狀態(tài)-> 動作”的預(yù)測。

1766735289292179.png

圖片來源:特斯拉

不過,蔚來明確指出,其車端推理模型同樣采用世界模型,通過推演不同動作下的狀態(tài),并對在不同自車動作軌跡下的場景進行排序,選出最優(yōu)的路徑最優(yōu)解。可以通過選擇行駛軌跡,也就是說,它進行的“當(dāng)前狀態(tài)-> 動作”的預(yù)測形成了“當(dāng)前狀態(tài)+ 潛在動作-> 各類未來狀態(tài)-> 動作”的完整閉環(huán)。

1766735289375150.png

圖片來源:蔚來汽車

從特斯拉的表態(tài)來看,它在云端生成了一個基于反事實推理的虛擬世界,高精度模擬重力、碰撞、流體動力學(xué)等物理規(guī)則,根據(jù)FSD智能體的傳感器數(shù)據(jù)和動作實時生成高保真的駕駛場景,讓FSD在這個虛擬世界中7x24小時不間斷行駛, 進行長尾場景的壓力測試并評估其長期表現(xiàn)。至于在車端,F(xiàn)SD到底部署的是不是“反事實推理”形式的世界模型,特斯拉沒有給出明確的答案。

3   寫在最后

為了避免友商學(xué)習(xí),車端FSD推理模型架構(gòu)應(yīng)該是特斯拉的頭號機密。如果非要說出個一二三,可以明確的是,F(xiàn)SD既沒有采用雙系統(tǒng)方案,也沒有采用VLA技術(shù)路線,其技術(shù)路線更接近于內(nèi)嵌對物理規(guī)律的理解能力的世界行為模型,跟華為的WA 架構(gòu)更加接近。不過,在WA架構(gòu)上,華為的細節(jié)分享也不多。不要覺得他們小氣,行業(yè)正處于輔助駕駛邁向自動駕駛的關(guān)鍵階段,誰也不想分享自己的殺手锏,理解萬歲吧。矛盾永遠存在于一切事物的發(fā)展過程中,貫穿于每一事物的發(fā)展始終。

(本文來源于《EEPW》


關(guān)鍵詞: 202512 ICCV會議 FSD架構(gòu)

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉
曲阜市| 博罗县| 若尔盖县| 呼和浩特市| 南康市| 沂南县| 翁源县| 林芝县| 洪湖市| 即墨市| 新津县| 朝阳市| 孟村| 泸定县| 肥乡县| 太仆寺旗| 余庆县| 顺义区| 离岛区| 眉山市| 苏尼特左旗| 定结县| 民和| 云霄县| 永登县| 清河县| 建昌县| 阜宁县| 凉城县| 奉节县| 图木舒克市| 孟津县| 石狮市| 怀仁县| 葵青区| 林西县| 浦城县| 吕梁市| 衡水市| 西吉县| 襄垣县|