DIGITIMES

AI也会歧视AI吗?

徐宏民
2026-07-01
AI语音摘要
00:41

随著招募流程的两端逐步由AI代劳,一份履历能不能进入入围名单,可能取决于一个求职者完全不知道的因素:履历协作的模型,跟筛选履历的模型,是否为同一家。

2025年底收录于人工智能伦理与社会研讨会(AIES 2025)的一份研究,就这件事进行系统性的实验。研究在控制履历品质之后,比较模型生成与人工撰写的履历在不同模型中的评价:当撰写与评审(模型)来自同一家,求职者进入面试入围名单的机率高出2成到6成;在多数测试案例中,同等品质的履历,模型对 AI 生成内容的评分高于人工撰写版本。研究称这个现象为「自我偏好(self-preference bias)」:语言模型会偏爱自己生成的内容,即使品质已被刻意控制。

这份研究的实验场景,如今已贴近现实。HireVue 2026调查显示,逾7成HR团队已定期在招募流程中使用AI,近7成求职者也已用AI起草履历。一边用AI审、一边用AI写,已是现况而非未来情境。

对坚持自己撰写履历的求职者,这意味著可能在不知情的情况下,仅因履历未经模型加工,就在评分上落后。

这个现象,2026年6月有了更具体的面貌。AI工具比较业者i10X Research发布1份产业测试报告,让几个主流模型互评同一位虚拟求职者的履历,只换成由各家模型分别撰写的版本,再交给各模型逐一评分。这份报告来自产品行销背景的业者,非学术同行评审,但凸显相当现况。i10X Research的商业测试显示,各家模型的偏好倾向差异相当大:Claude对GPT撰写版本的录取率,比对自身风格版本低了约5成;GPT对自身版本的评分反而偏低,呈现反向的自我惩罚;Gemini撰写的版本不分评审者都受到青睐。在i10X的测试设定中,同一份文件由不同模型评审,差距可以大到足以让结果从「待定」滑向「淘汰」。这延伸原始研究对「模型风格会影响模型评分」的观察:不是每个模型都偏爱自己,而是每个模型都有自己的评分倾向,求职者完全无从得知评审偏好那套模型。

AI评审的脆弱性,学术审稿已先凸显。2025年中起,多篇arXiv稿件被发现在PDF里藏进肉眼看不见的指令,要求语言模型审稿人给予正面评价,实验显示这类手法可以把模型评分推近满分。顶尖会议ICML 2026 把相同做法反过来用在稽核:在论文PDF嵌入随机词汇,若审稿人偷用语言模型代写意见,词汇就会混进评语;2026年3月公布的结果,逾500位审稿人被侦测到违规,其中不少人因身兼投稿审稿人,所投论文遭退件。这套攻守兼备的机制对B2B场景的启示在于:指令注入手法既是攻击面,也能作为稽核工具的设计基础。

履历只是起点,影响不会停在这里。

当企业流程的两端都开始由AI代理人处理,一端用AI起草报价、技术方案、法遵文件,另一端用AI筛选与评分,「用哪一家模型」会成为过去不存在的竞争變量——过去企业竞争的是价格、品质、交期;未来还可能竞争「模型兼容性」。

机制尚未完全厘清,但有几种可能的解释。语言模型在生成内容时,似乎带有可被自家模型识别的「风格指纹」——句构偏好、用词分布、段落节奏。一个可能的解释来自后训练(post-training)阶段:RLHF、DPO等对齐训练以相同的训练目标,同时塑造「怎么写得好」与「什么算写得好」,风格与好恶因此一起被写进模型权重,评审模型可能因此将这些熟悉的风格特征误判为较高的内容品质。研究也验证,透过提示工程要求模型主动识别并校正自身偏好,偏差可下降5成以上;但这并非缺省行为,企业内部的AI评估流程多半还没有写进作业规范。

把场景移到臺湾产业,有可能受影响的是自动化报价与RFQ初筛。试想:买方以AI从上百份供应商技术文件中挑出前段名单,供应商也以AI起草标案。若这套筛选以文本摘要或技术叙述做初步排序,而买卖双方使用的是不同家的模型,供应商可能在价格、交期等结构化条件被充分比较之前,就因文本风格不符模型偏好而落后。这个情境目前仍是推断,但随著AI在采购流程的应用逐步深化,陆续发生的可能性不低。供应商尽职调查与法遵审查也在其中——ESG报告、網安自评书,愈来愈多由AI起草、也可能再由AI审查,同源偏差的空间同样存在。需要说明的是,研究测量的偏差幅度建立在文本叙述上,B2B 采购里的价格、交期、认证等结构化栏位仍占相当权重,整体入选率不会直接受到相同幅度的影响。但只要评估流程里有任何一段是模型对模型读「叙述」,这一段就有结构性偏差。

防御方向可能不复杂,但需要刻意设计。受评文件与评审模型最好不来自同一个模型家族;高金额或高敏感度的决策,应采多模型并行评估、考量评分差异;结构化數據与文字叙述分流计分,避免后者拉偏前者;可能暗藏内容的格式(如 PDF、Word)进入评估流程前,应做指令注入过滤;重要闸门保留人工抽查。这些不是技术突破,而是治理设计,目前产业界的 AI 导入多半停在工具层,治理层大多仍是空白。

同源偏差以外,还有另一层问题值得思考:当评估流程由人换成模型,人类评审識別「少数亮点」的能力,可能也悄悄消失了。一百份履历里长得不一样的那个人,一百份提案里带著真实观点的那份文件,在倾向偏好熟悉风格的模型眼中,可能反而是扣分项。HR筛选、绩效评估、供应商评鉴、学术审稿,都面临类似的结构。如何在AI介入的决策流程里,刻意保留人类洞察的空间,目前仍是个开放的问题。

台灣大學信息工程学系教授,曾任富士康集团与Stellantis合资车用科技公司技术长暨副总经理,推动ADAS及智能座舱系统产品进入全球车用市场。纽约哥伦比亚大学电机博士,专精于机器学习、电脑视觉、自驾车、机器人等领域。为讯连科技研发团队创始成员,慧景科技(thingnario)共同創始人,NVIDIA AI Lab計劃主持人;曾任IBM华生研究中心及美国微软研究院客座研究员。担任多家科技公司AI策略顾问,习惯从学术与产业双重视角检验技术发展的机会与挑战。<br>
智能应用 影音