Anthropic最智能的混合推理模型Claude 3.7 Sonnet
Amazon Web Services(AWS)宣布,人工智能(AI)安全与研究公司Anthropic迄今最智能的模型Claude 3.7 Sonnet现已在Amazon Bedrock上可用。根据Anthropic介绍,这是其首款「混合推论」模型。客户能在标准思考模式与深度思考模式之间自由切换,进而在速度、成本与答案深度之间取得最佳平衡。
Claude 3.7 Sonnet融合了前瞻大型语言模型(LLM)和推论模型的能力。大型语言模型通常用于生成文本和理解语言,而推论模型作为一种特殊的大型语言模型,还能将复杂的问题分解成多个步骤并展示「思维链(chain of thought)」,Claude 3.7 Sonnet与其他模型的不同之处在于兼具这两种能力。
使用者可以选择让模型正常回答问题,或者在回答前进行更深入的「思考」并展示推论过程,在用于快速回覆的标准思考模式和深度思考模式之间做出选择。使用者还能控制推论预算,进而为自己的应用程序在速度、效能和成本之间选择最佳平衡点。
AWS生成式AI副总裁Vasi Philomin表示:「初步使用Claude 3.7 Sonnet的用户回馈,在使用深度思考模式时,该模型在数学、物理、竞赛程序设计和深入分析方面表现最为出色。再结合Amazon Bedrock的丰富功能,Claude 3.7 Sonnet将帮助客户建构更强大的生成式AI应用程序。」
Claude 3.7 Sonnet是什麽
若将Anthropic的Claude 3.7 Sonnet拟人化,它就像才华横溢的同事,既能实时回答细致入微的产业话题,又能花数小时缜密规划复杂的专案,并在每个步骤中清晰展示思考过程与考量。
Anthropic营收主管Kate Jensen表示:「Claude 3.7 Sonnet是我们建构实用型AI道路上的重要里程碑。这是首款兼具快速回应与深度推论能力的混合模型,就像人类一样。Claude 3.7 Sonnet推动真正使用AI系统与人类合作应对重大挑战。Claude 3.7 Sonnet为世界带来更接近真正能与人类携手解决重大挑战的AI系统。」
数据亮点
Claude 3.7 Sonnet可生成长达128K token的回应,是前代模型的15倍(缺省token输出长度为64K)。token是模型能处理的最小文本数据单位(例如一个词、词组或单个字元)。长文本回应特别适合复杂的程序码生成与内容创作。
客户可控制「思考预算」,即设定Claude的思考不超过N个token(N最高可达128K)。这使客户能根据生成品质需求,灵活调整速度与成本。
Claude 3.7 Sonnet在Amazon Bedrock上可用,进一步体现AWS致力于为客户提供来自领先AI公司的众多AI模型,以最便捷的方式建构与扩展生成式AI应用程序。
透过提供一款既可快速回应(同时具备速度和准确性)、又能处理复杂推论任务的模型,Anthropic让各种规模的企业都能更方便地使用先进的AI功能,并更具实用性。Claude 3.7 Sonnet具有领先的程序码能力,并在电脑应用、智能代理能力、复杂推论与内容生成方面取得突破。
客户可透过Amazon Bedrock使用Claude 3.7 Sonnet建构与部署生成式AI应用程序。对金融服务业、数据分析及研发等领域的团队而言,Claude现在能在几分钟内解决人工需要花费数天才能完成的难题。
更多详情可参考AWS News或Amazon Bedrock页面。