化解幻觉与欺骗问题　OpenAI要AI在自白中主动认错

OpenAI公开最新安全研究，首度以「自白」（confession）机制训练大型语言模型（LLM），要求回答后诚实自评是否有撒谎、取巧或偏离指令，并揭露不确定性与判断取舍。理解LLM为何欺骗、出错或出现偏离指令的行为，是AI安全的...

申请专线：
+886-02-87125398。
(周一至周五工作日9:00~18:00)

会员信箱：
member@digitimes.com
(一个工作日内将回覆您的来信)

申请专线：
+886-02-87125398。
(周一至周五工作日9:00~18:00)

会员信箱：
member@digitimes.com
(一个工作日内将回覆您的来信)

关键字