新聞中心

EEPW首頁(yè) > 智能計(jì)算 > 設(shè)計(jì)應(yīng)用 > AI聊天機(jī)器人能像醫(yī)生一樣推理嗎？

AI聊天機(jī)器人能像醫(yī)生一樣推理嗎？

作者：時(shí)間：2026-05-15 來(lái)源：

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

核心要點(diǎn)

OpenAI 大語(yǔ)言模型（LLM）在真實(shí)急診病例的臨床推理任務(wù)中表現(xiàn)超越醫(yī)生。
研究界對(duì) AI 臨床推理的評(píng)估標(biāo)準(zhǔn)尚無(wú)共識(shí)，結(jié)果解讀差異巨大。
AI 存在編造信息、幻覺等風(fēng)險(xiǎn)，但人機(jī)協(xié)同是未來(lái)方向。

醫(yī)學(xué)計(jì)算最早目標(biāo)之一，就是輔助臨床推理—— 即診斷、制定治療方案的決策過(guò)程。過(guò)去，臨床決策支持系統(tǒng)多為專用規(guī)則引擎，人工編寫癥狀、閾值、用藥交互規(guī)則。如今 AI 能力提升，大語(yǔ)言模型自然成為臨床推理新工具。

4 月 30 日《科學(xué)》發(fā)表研究：OpenAI 大語(yǔ)言模型（LLM）在真實(shí)急診記錄的多項(xiàng)臨床推理任務(wù)中，表現(xiàn)優(yōu)于人類醫(yī)生。

這項(xiàng)研究正值爭(zhēng)議期：部分研究顯示 AI 診斷出色，另一些則發(fā)現(xiàn)編造引用、建議錯(cuò)誤、評(píng)分結(jié)果不穩(wěn)定。盡管不確定性仍在，面向醫(yī)療的 AI 產(chǎn)品已上市，如 OpenAI 今年推出臨床版 ChatGPT、醫(yī)療版 ChatGPT。

研究使用 o1-preview 模型（已更新?lián)Q代），作者建議：真實(shí)場(chǎng)景中，在關(guān)鍵節(jié)點(diǎn)讓醫(yī)生用 AI 輔助二次診斷。

紐約西奈山醫(yī)學(xué)院醫(yī)學(xué)影像研究專家Mickael Tordjman：“需更多前瞻性臨床試驗(yàn)證據(jù)，新一代醫(yī)療專用 LLM 可能表現(xiàn)更好?！?/p>

《科學(xué)》論文作者雖看好 AI 醫(yī)療潛力，也強(qiáng)調(diào)局限性，擔(dān)憂研究被誤讀。哈佛醫(yī)學(xué)院 AI 研究專家Arjun Manrai：“AI不會(huì)取代醫(yī)生。”

波士頓貝斯以色列醫(yī)療中心醫(yī)學(xué)教育專家Adam Rodman：“成果很棒，但對(duì)濫用風(fēng)險(xiǎn)感到不安?！?/p>

醫(yī)療 AI 靠譜嗎？

多項(xiàng)研究質(zhì)疑 AI 醫(yī)療可信度：5 款主流聊天機(jī)器人回答開放性健康問題時(shí)，近半回復(fù)存在缺陷，編造信息、引用，且錯(cuò)誤回答也極度自信。

哈佛醫(yī)學(xué)院Arya Rao：“AI 已被日常使用，風(fēng)險(xiǎn)未量化、未管控?！?/p>

普通用戶咨詢、醫(yī)生輔助是完全不同場(chǎng)景：醫(yī)生能更好判斷信息價(jià)值、識(shí)別錯(cuò)誤，但AI 幻覺極難識(shí)破 ——Rodman：“對(duì)錯(cuò)都一樣自信，需建立低錯(cuò)工作流?！?/p>

研究對(duì)比 2 名醫(yī)生、2 款 LLM 在急診不同階段的診斷表現(xiàn)。

評(píng)估標(biāo)準(zhǔn)無(wú)共識(shí)

4 月 13 日《美國(guó)醫(yī)學(xué)會(huì)雜志》（JAMA）研究：Rao 測(cè)試 21 款 LLM，最終診斷準(zhǔn)確率高，但鑒別診斷評(píng)分極低—— 只因評(píng)估標(biāo)準(zhǔn)不同。

鑒別診斷需列出所有可能病因：LLM 答對(duì) 6/7 種病因，可算 86% 合格，也可判定完全失敗。行業(yè)尚無(wú)統(tǒng)一評(píng)分標(biāo)準(zhǔn)。

Tordjman：“評(píng)估方法仍在探索，無(wú)完美方案?！?/p>

真實(shí)世界測(cè)試

《科學(xué)》研究用多組模擬病例（類似醫(yī)學(xué)難題），指令含冗余 / 關(guān)鍵信息，測(cè)試 AI 診斷能力。

Rodman：“研究證明真實(shí)場(chǎng)景有效，76 例真實(shí)急診顯示：最終診斷準(zhǔn)確率 AI 達(dá) 82%，兩位醫(yī)生分別 79%、70%?！?/p>

LLM 問世不足十年，迭代速度遠(yuǎn)超醫(yī)學(xué)研究周期，監(jiān)管、責(zé)任劃分仍空白。Manrai：“關(guān)鍵不是‘AI vs 醫(yī)生’，而是人機(jī)如何協(xié)同?！?/p>

哈佛 Rao：“AI 發(fā)展迅猛，謹(jǐn)慎、評(píng)估、創(chuàng)新并重，負(fù)責(zé)任創(chuàng)新才是正道?！?/p>

AI 聊天機(jī)器人 推理

評(píng)論

焦點(diǎn)

更多>>

技術(shù)專區(qū)

關(guān)閉

狠狠做深爱婷婷久久一区,欧美日韩国内,久久麻豆精品传媒,久久久一区一区二区,色鬼伦理片,99视频精品久久,久久精品国产久久久久久,久久久伦理电影一区二,磁力天堂河北彩花

新聞中心

AI聊天機(jī)器人能像醫(yī)生一樣推理嗎？

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)

狠狠做深爱婷婷久久一区,欧美日韩国内,久久麻豆精品传媒,久久久一区一区二区,色鬼伦理片,99视频精品久久,久久精品国产久久久久久,久久久伦理电影一区二,磁力天堂河北彩花

新聞中心

AI聊天機(jī)器人能像醫(yī)生一樣推理嗎？

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)

AI聊天機(jī)器人能像醫(yī)生一樣推理嗎？