AIPress.com.cn報道
4月13日消息,一項基于《紐約時報》調查的研究顯示,谷歌搜索中的 AI Overviews 功能雖然整體準確率較高,但由于搜索請求規模龐大,仍可能每天產生大量錯誤信息。
研究采用 SimpleQA 基準測試評估發現,AI生成摘要約有10% 存在不準確信息。考慮到谷歌每年處理約5 萬億次搜索請求,這一比例可能意味著系統每小時產生數千萬條存在偏差的回答。
谷歌方面對該研究提出質疑。公司發言人表示,該分析所依賴的評估基準本身存在問題,結論存在偏差。谷歌同時強調,AI Overviews 的準確率已持續提升,從Gemini 2.5 時期的約85% 提升至 Gemini 3 的約91%。
此前,AI摘要功能曾因“幻覺”問題受到關注。在一起涉及航空事故的信息中,系統曾出現機型識別錯誤。對此,谷歌表示已持續優化模型,并認為當前AI摘要的準確性已與傳統“精選摘要(Featured Snippets)”相當。(AI普瑞斯編譯)











