AI也会歧视AI吗？

徐宏民

2026-07-01

AI语音摘要

00:41

随著招募流程的两端逐步由AI代劳，一份履历能不能进入入围名单，可能取决于一个求职者完全不知道的因素：履历协作的模型，跟筛选履历的模型，是否为同一家。

2025年底收录于人工智能伦理与社会研讨会（AIES 2025）的一份研究，就这件事进行系统性的实验。研究在控制履历品质之后，比较模型生成与人工撰写的履历在不同模型中的评价：当撰写与评审（模型）来自同一家，求职者进入面试入围名单的机率高出2成到6成；在多数测试案例中，同等品质的履历，模型对 AI 生成内容的评分高于人工撰写版本。研究称这个现象为「自我偏好（self-preference bias）」：语言模型会偏爱自己生成的内容，即使品质已被刻意控制。

这份研究的实验场景，如今已贴近现实。HireVue 2026调查显示，逾7成HR团队已定期在招募流程中使用AI，近7成求职者也已用AI起草履历。一边用AI审、一边用AI写，已是现况而非未来情境。

对坚持自己撰写履历的求职者，这意味著可能在不知情的情况下，仅因履历未经模型加工，就在评分上落后。

这个现象，2026年6月有了更具体的面貌。AI工具比较业者i10X Research发布1份产业测试报告，让几个主流模型互评同一位虚拟求职者的履历，只换成由各家模型分别撰写的版本，再交给各模型逐一评分。这份报告来自产品行销背景的业者，非学术同行评审，但凸显相当现况。i10X Research的商业测试显示，各家模型的偏好倾向差异相当大：Claude对GPT撰写版本的录取率，比对自身风格版本低了约5成；GPT对自身版本的评分反而偏低，呈现反向的自我惩罚；Gemini撰写的版本不分评审者都受到青睐。在i10X的测试设定中，同一份文件由不同模型评审，差距可以大到足以让结果从「待定」滑向「淘汰」。这延伸原始研究对「模型风格会影响模型评分」的观察：不是每个模型都偏爱自己，而是每个模型都有自己的评分倾向，求职者完全无从得知评审偏好那套模型。

AI评审的脆弱性，学术审稿已先凸显。2025年中起，多篇arXiv稿件被发现在PDF里藏进肉眼看不见的指令，要求语言模型审稿人给予正面评价，实验显示这类手法可以把模型评分推近满分。顶尖会议ICML 2026 把相同做法反过来用在稽核：在论文PDF嵌入随机词汇，若审稿人偷用语言模型代写意见，词汇就会混进评语；2026年3月公布的结果，逾500位审稿人被侦测到违规，其中不少人因身兼投稿审稿人，所投论文遭退件。这套攻守兼备的机制对B2B场景的启示在于：指令注入手法既是攻击面，也能作为稽核工具的设计基础。

履历只是起点，影响不会停在这里。

当企业流程的两端都开始由AI代理人处理，一端用AI起草报价、技术方案、法遵文件，另一端用AI筛选与评分，「用哪一家模型」会成为过去不存在的竞争變量——过去企业竞争的是价格、品质、交期；未来还可能竞争「模型兼容性」。

机制尚未完全厘清，但有几种可能的解释。语言模型在生成内容时，似乎带有可被自家模型识别的「风格指纹」——句构偏好、用词分布、段落节奏。一个可能的解释来自后训练（post-training）阶段：RLHF、DPO等对齐训练以相同的训练目标，同时塑造「怎么写得好」与「什么算写得好」，风格与好恶因此一起被写进模型权重，评审模型可能因此将这些熟悉的风格特征误判为较高的内容品质。研究也验证，透过提示工程要求模型主动识别并校正自身偏好，偏差可下降5成以上；但这并非缺省行为，企业内部的AI评估流程多半还没有写进作业规范。

把场景移到臺湾产业，有可能受影响的是自动化报价与RFQ初筛。试想：买方以AI从上百份供应商技术文件中挑出前段名单，供应商也以AI起草标案。若这套筛选以文本摘要或技术叙述做初步排序，而买卖双方使用的是不同家的模型，供应商可能在价格、交期等结构化条件被充分比较之前，就因文本风格不符模型偏好而落后。这个情境目前仍是推断，但随著AI在采购流程的应用逐步深化，陆续发生的可能性不低。供应商尽职调查与法遵审查也在其中——ESG报告、網安自评书，愈来愈多由AI起草、也可能再由AI审查，同源偏差的空间同样存在。需要说明的是，研究测量的偏差幅度建立在文本叙述上，B2B 采购里的价格、交期、认证等结构化栏位仍占相当权重，整体入选率不会直接受到相同幅度的影响。但只要评估流程里有任何一段是模型对模型读「叙述」，这一段就有结构性偏差。

防御方向可能不复杂，但需要刻意设计。受评文件与评审模型最好不来自同一个模型家族；高金额或高敏感度的决策，应采多模型并行评估、考量评分差异；结构化數據与文字叙述分流计分，避免后者拉偏前者；可能暗藏内容的格式（如 PDF、Word）进入评估流程前，应做指令注入过滤；重要闸门保留人工抽查。这些不是技术突破，而是治理设计，目前产业界的 AI 导入多半停在工具层，治理层大多仍是空白。

同源偏差以外，还有另一层问题值得思考：当评估流程由人换成模型，人类评审識別「少数亮点」的能力，可能也悄悄消失了。一百份履历里长得不一样的那个人，一百份提案里带著真实观点的那份文件，在倾向偏好熟悉风格的模型眼中，可能反而是扣分项。HR筛选、绩效评估、供应商评鉴、学术审稿，都面临类似的结构。如何在AI介入的决策流程里，刻意保留人类洞察的空间，目前仍是个开放的问题。

AI也会歧视AI吗？

徐宏民台灣大學信息工程学系教授

作者其他文章

推荐活动

邦博士快讯

AI驱动數字转型创新高科技高峰论坛

AI也会歧视AI吗？

徐宏民 台灣大學信息工程学系教授

作者其他文章

推荐活动

邦博士快讯

AI驱动數字转型创新高科技高峰论坛

徐宏民台灣大學信息工程学系教授