Claude Opus 4.7又更新了

正文上方广告位

程序员又出大事了,Claude Opus 4.7又更新了。那么这次更新了哪些内容呢?

f9d492ef387287f716a001c09475801a

这次 4.7相对于4.6 基本上是全面的提升,特别是在视觉方面。以前图片可能识别不清楚。

Opus 4.7在高级软件工程方面相较Opus 4.6有显著改进,在最难的任务上有显著提升。用户报告说,他们能够自信地将最难的编码工作——之前需要密切监督的工作——交给 Opus 4.7。Opus 4.7 以严谨和一致的方式处理复杂且长期运行的任务,精确关注指令,并设计方法在报告前验证自身输出。

该模型的视力也显著提升:它能看到更高分辨率的图像。在完成专业任务时,它更具品味和创意,制作出更高质量的界面、幻灯片和文档。虽然它的能力不及我们最强大的模型Claude Mythos Preview,但在多个基准测试中表现优于Opus 4.6:

5c70a159603191f642a8b32461574850

但这次的话,它对于图像来说几乎是 现象级的提升。多项测试(逻辑性、代码性)几乎全部吊打原来的Opus 46

那么这次,原来的 Opus 4.6 就已经够强了。你看在每一个方面,70%对58%,基本上是吊打。然后这个价格但是…

变还是原来一样的价格,但 Opus还是非常贵。这时又更新了一个新的档位,就是High模式,又加了一个X-High的模型,加了一个新的审查命令,还有一个O-Mode 的 U 档位。

然后有一个很重要的一点,大家要注意它的流量可能会消耗得更快。

f180c00e7e0f5be44645d26a8a983fe8

本来大家说的是这个 Mythos级模型,但是因为MS 太强了,所以给大家先出。

限制Claude Mythos Preview的发布,并先在性能较差的型号上测试新的网络防护措施。Opus 4.7是首个此类模型:其网络能力不如Mythos Preview先进(事实上,在训练期间我们尝试过差异化降低这些能力)。我们发布的Opus 4.7带有自动检测和阻断显示禁止或高风险网络安全使用的请求的保护措施。我们从这些保障措施的实际部署中学到的经验,将帮助我们朝着最终广泛发布Mythos级模型的目标努力。

希望将Opus 4.7用于合法网络安全目的(如漏洞研究、渗透测试和红队协作)的安全专业人士,欢迎加入我们全新的网络验证计划。

Opus 4.7 现已在所有 Claude 产品及我们的 API、Amazon Bedrock、Google Cloud 的 Vertex AI 以及 Microsoft Foundry 上均可使用。定价与Opus 4.6相同:每百万输入5美元,每百万输出25美元。开发者可以通过 Claude API 使用。

一个 4.7,说是强得可怕,所以先给大家 4.7 过渡一下。他们先把安全审查搞定了,再出替代品吧。

© 版权声明
正文底部广告位

相关文章