隨著人工智能技術的迅猛發展,大模型在各個領域的應用日益廣泛。為全力筑牢人工智能安全防線,進一步提高大模型技術的安全風險防范能力,今年2月,中國信息通信研究院(以下簡稱中國信通院)聯合360集團,發起大模型安全基準測試SafetyAI Bench制定工作。
大模型安全基準測試秉持“公平公正、產業應用、選型參考”原則,采用科學嚴謹的測試方法,評估大模型在內容安全、數據安全和科技倫理等方面的表現。該體系將覆蓋合法合規、隱私保護、文明健康、人工智能自主意識等27個維度的中文評測數據集,為行業提供全面、細致的安全性能測試指標。
作為信息通信行業的重要研究機構,中國信通院在人工智能和大數據領域具有深厚的研究底蘊和豐富的行業經驗,是可以打通新技術研究、標準研制、試驗驗證、檢測認證到產業推進“全鏈條、全環節”的產業創新平臺。中國信通院專業的研究團隊、廣泛的行業合作網絡及深厚的行業影響力,為大模型安全基準測試的順利推進提供了有力保障。
作為國內較早布局人工智能大模型的企業,360集團自行研發的認知型通用大模型――“360智腦”,在中文通用大模型基準評測等多個第三方評測中,均位于國產大模型能力第一梯隊。憑借在數字安全和人工智能領域的深厚積累,360集團將為本次標準測試工作提供技術支持、實踐經驗和創新思路,共同推動大模型安全基準測試體系的建立和完善。