中國信息通信研究院近日宣布,將針對互聯網智能體領域啟動一項全新的測試評估工作。此次評估聚焦用戶普遍關注的核心問題,包括功能可信度、權限可靠性、操作透明性以及行為可干預性等關鍵維度,旨在通過科學嚴謹的測評體系,推動行業規范化發展。
據了解,該測試體系圍繞"能力真實""權限可靠""行為可控"三大核心類別展開,共設置16項主要指標,并細化為70余個具體測評項。評估將根據互聯網智能體的不同服務形態進行分類實施,確保測評結果能夠全面反映各類產品的實際表現。這種多維度、分層次的評估框架,既保證了測評的全面性,又突出了重點指標的針對性。
首批測試評估工作已正式啟動,將按照兩類形態、三種類型的分類標準對互聯網智能體展開評估。根據安排,2026年3月至4月期間將陸續開展材料審核、技術測試和專家評審等環節,最終評估結果計劃于2026年5月在相關產業大會上正式公布。這項工作將為行業提供權威的參考標準,幫助用戶更好地識別和選擇優質產品。











