AI大语言模型无法驯服π
和一个人一生中相关的数字,都可以在圆周率的某一个位数找到。这是因为圆周率(π)是一个无理数,也就是说,它的十进制展开既不终止也不循环,并且其数字序列是随机的。尽管目前没有证据能证明圆周率的数字完全随机,数学家普遍认为圆周率的数字分布没有任何规律或模式,每个数字序列都有可能在某一位数中随机出现。这意味著,无论选择哪个数字组合,包括个人的生日、电话号码或重要年份等,理论上都能在圆周率的某个位置找到。这些数字可能会在圆周率的某个长段中出现一次或多次,具体位置由数字的随机分布决定。这种现象与数学中的均匀分布有关,这表示所有数字(0~9)在圆周率的各个位数上出现的机率理论上是相等的。因此,任何有限长度的数字组合都有可能出现在圆周率的某个位置。以最奇特方式运用圆周率的人,应属高德纳(Donald Ervin Knuth)。1969年时他开始发展一种计算机语言,让使用者能够以數字方式排版数学公式。接下来高德纳花十年功夫,设计一套论文排版系统TeX,并以圆周率来当开发版本编号,由TeX3开始,现在的版本是TeX 3.141592653。人类于四千年前就尝试找出π,但直到今日,我们仍然只是接近其实际数值。首次对π进行严格计算的,是西元前287至212年的希腊古数学家阿基米德Archimedes),他利用毕达哥拉斯定理计算内接于圆的正多边形与外接于圆的正多边形的面积,因为圆的实际面积必然介于这两者之间,因此这些多边形的面积提供了圆面积的上、下界。他明白这样只能得到π的近似值,而非其确切数值。透过这种方法,阿基米德推导出π介于3.1429与3.1408之间。2021年8月19日,瑞士格里松应用科技大学(University of Applied Sciences of the Grisons)计算出圆周率最精确的数值达62,831,853,071,796位数。有趣的是,神奇的AI大语言模型无法驯服π。我问7种大语言模型,却都给我不同答案。我询问和我相关的4个数字:「May I ask at which digit position 1026 appears in the digits of pi? 」结果每个LLM给我的答案都不同。过去的测试中,总会有几个LLM给出相同的答案,但这次完全没有共识。我先试GPT,得到答案6284。接著要求GPT自我验证:「What is the four-digit sequence starting at position 6284 in the digits of pi?」结果,得到的回复是7590,而非1026。我试Grok,得到的回复是1639,反向验证,也没得到1026,而是5807。我试Le Chat(Mistral.ai),得到的回复是176451,反向验证,得到3141。我试Qwen2.5-Max,得到的回复是39,反向验证,得到7169。我试DeepSeek,得到的回复是8580,反向验证,得到3099。我试Tulu 3,得到的回复是2480,反向验证,得到3282。我再试Gemini,得到的回复是175319,反向验证,他不告诉我答案,建议我找数学工具来算出。我最后试Claude,他不告诉我答案。这些大语言模型给错答案的原因是,它们试图自行编写程序来找答案,但程序未能正确运行。我询问Pi-Search页面,它回答说:「字串1026出现于位置14678。这个字串在π的前2亿位数字中出现20,130次。」这应该是正确答案。我的测试是在2025年2月24日。在告知GTP或Grok網絡上特定数学工具可给答案时,它们的确会认错,并依我建议,运用工具找到正确答案。随著大语言模型的进化,也许未来能在第一次询问时给出正确答案。
2025-04-14