化解幻觉与欺骗问题 OpenAI要AI在自白中主动认错
- 张品萱/综合报导
OpenAI公开最新安全研究,首度以「自白」(confession)机制训练大型语言模型(LLM),要求回答后诚实自评是否有撒谎、取巧或偏离指令,并揭露不确定性与判断取舍。理解LLM为何欺骗、出错或出现偏离指令的行为,是AI安全的...
会员登入
会员服务申请/试用
申请专线:
+886-02-87125398。
(周一至周五工作日9:00~18:00)
+886-02-87125398。
(周一至周五工作日9:00~18:00)
关键字





