刚刚，Claude Sonnet 5发布，国内直接使用！-尧图建网站

刚刚Claude Sonnet 5发布国内直接使用凌晨2点Anthropic甩出最能干的Claude Sonnet 5性能直逼旗舰Opus 4.8编程直接干翻GPT-5.5就在刚刚Claude Sonnet 5来了代号Fennec耳廓狐撒哈拉沙漠里体型最小的狐狸。这是Anthropic迄今为止Agent能力最强的Sonnet模型并且性能直逼旗舰Opus 4.8。即日起Sonnet 5成为所有Free和Pro用户的默认模型。Claude国内直接使用https://maynorai.jichiyun.sbs/buy/10它能自主规划、调用浏览器和终端工具。就在几个月前这还需要花大价钱调用超大模型才能做到现在Sonnet轻松拿下。相较于上一代Sonnet 4.6Sonnet 5在推理、工具使用、编程和知识工作任务中性能显著提升。划重点SWE-bench Pro得分63.2%反超GPT-5.5的58.6%略输Opus 4.8的69.2%「人类最后的考试」得分57.4%和Opus 4.8只差0.5个百分点标准价每百万token输入$3/输出$15只有Opus 4.8的六成浏览器注入防御0.93%反杀Mythos 5和Opus 4.8有趣的是Fable 5也在同一天被曝出即将回归。但代价是强制实名验证并且极大概率仅限美国用户。而Sonnet 5则主打一个毫无保留全球用户今天就能敞开用。全线逼平Opus 4.8最强打工AI突袭这一次Sonnet 5的突然上线也算是填补了人们用不上Fable 5的失落。对于很多开发者来说Agent时代的元年就是从Sonnet开始的。Claude Sonnet 3.5、3.6、3.7是最早一批在写代码、用工具上展现出惊人能力的模型。换句话说「让AI自己干活」这件事最早跑通的就是Sonnet「中杯」系列。但这一年多最猛的能力跃升全集中在Opus这条「大杯」线上。Sonnet直接被旗舰甩在后面。Sonnet5要做的就是把这道差距补回来Anthropic一句话定调——Claude Sonnet 5是史上最能「干活」的Sonnet。从实战的成绩来看最能说明这一点。在传统强项编程领域Sonnet 5在SWE-bench Pro上豪取63.2%。而前代Sonnet 4.6只有58.1%Opus 4.8则凭借69.2%暂时领先。相比之下老对手OpenAI的旗舰GPT-5.5在同一个榜上只拿到了58.6%谷歌的Gemini 3.5 Flash也只有55.1%。Terminal-Bench 2.1更加凶悍Sonnet 5直接飙到80.4%把只有67.0%的Sonnet 4.6狠狠甩在身后暴涨13个百分点。距离Opus 4.8的82.7%只差不到2个点。在号称「人类最后的考试」的跨学科推理基准Humanity’s Last Exam上Sonnet 5带工具斩获57.4%Opus 4.8是57.9%只差0.5个百分点。GPT-5.5同一测试只有52.2%Gemini 3.1 Pro是51.4%。电脑操控能力方面Sonnet 5在OSWorld-Verified上的得分是81.2%同样超过GPT-5.5的78.7%直追Opus 4.8的83.4%。更让人意外的是知识工作Sonnet 5更是在GDPval-AA v2上拿到了1618分直接反超Opus 4.8的1615。在智能体搜索、工具使用表现中Sonnet 5能以最低成本提供了Opus 4.8级的能力。可以说几乎每项benchmarkSonnet 5都落在Opus 4.8的90%到100%区间。堪称是花Sonnet的钱买Opus九成的脑子。2美元限时促销但埋了个大坑价格才是这次的「必杀技」。API定价方面Anthropic给出了限时大促输入2美元/百万tokens输出10美元/百万tokens。8月31日之后恢复输入3美元和输出15美元的原价。相比之下Opus 4.8是5美元和25美元GPT-5.5标准版是5美元和30美元。促销期内输入和输出价格都只有Opus 4.8的四成。恢复标准价后也只到六成。不过Anthropic虽然表面诚意满满细节里却藏着小心思。原因在于Sonnet 5换了全新的tokenizer同样一段输入的token数量可能会膨胀1.0到1.35倍。等促销期一过$3/$15的原价再叠加tokenizer膨胀效应真金白银的花销肯定要比用Sonnet 4.6肉痛一截。但即便如此跟Opus比依然是碾压级的差距。反杀全家族旗舰System Card里藏着Sonnet 5最被低估的一面。提示注入攻击成功率0.19%跟Opus 4.8持平。GPT-5.5是3.08%Gemini 3.5 Flash是6.66%。浏览器注入防御上攻击成功率只有0.93%而Mythos 5是29.7%Opus 4.8是31.5%。$2的中端模型反杀了全家族旗舰开启防护措施后直接降到0%。恶意代码注入上Sonnet 4.6的攻击成功率高达45.26%Sonnet 5降到了0.29%改善150倍。Firefox 147漏洞利用测试中Mythos 5能写出88.4%的可用exploitOpus 4.8是8.8%Sonnet 5是0.0%。能写顶级业务代码但写不出一个可用的漏洞利用程序。副作用是不对齐行为评分2.53满分10比Sonnet 4.6的2.89有改善但高于Opus 4.8的2.10和Mythos Preview的1.95。变强了也变得更有主见了。不争皇冠专砍腰部Sonnet 5卡在一个极其精准的位置上向上能力逼近Opus 4.8和GPT-5.5向下价格接近Gemini 3.5 Flash级别。OpenAI刚把价格相较上代翻了倍Anthropic转手把Sonnet 5的入门价压到了3美元。那些原本犹豫要不要为旗舰付费的开发者现在有了一个杀伤力十足的替代选项。所有人都盯着顶端打的时候Anthropic在腰部开了一枪。开发者钱包今晚先投了票如今Sonnet 5的性能已经踩进了旗舰区间大部分修bug、补测试、做重构的活都能一次搞定。以前觉得Opus太贵舍不得用、Sonnet又不够好的尴尬今天没了。价格上更划算。同样的预算以前只能跑一个Opus级的Agent现在可以跑两到三个并行的Sonnet。多Agent架构的成本门槛被Sonnet 5一脚踹低了。Fable 5究竟何时王者归来还是个未知数。但Sonnet 5此刻已经稳稳地站在这里性能直接怼到了Opus的门槛上。对于绝大多数开发者而言它就是接下来相当长一段日子里手边最能打也最好用的那个Claude。Claude国内直接使用https://maynorai.jichiyun.sbs/buy/10

相关新闻

OmniRoute免费AI网关：连接236个工具商，每月16亿免费令牌，最多省95%！

5分钟极速上手Dalfox：高效XSS漏洞扫描实战指南

纯电动公交车充电管理优化——从策略设计到协同调度的系统路径

最新新闻

RePKG技术解析：Wallpaper Engine资源提取与格式转换方案

从钢琴录音到精美乐谱：揭秘自动化音乐转录技术

如何轻松解锁Wallpaper Engine壁纸资源：RePKG完整指南

PhotoRec数据恢复终极指南：从误删到格式化的完整救援教程

2026视频去水印软件推荐：电脑手机免费付费工具，解析网站安全测评

打破次元壁：用MMD Tools插件在Blender中解锁MikuMikuDance创作新境界

日新闻

Selenium元素定位全解析：从八大方法到实战策略

BurpSuite Cluster Bomb模式深度避坑指南：从原理到实战的完整爆破策略

UnblockNeteaseMusic终极教程：3分钟解锁网易云音乐灰色歌曲的完整方案

周新闻

管理者的六个层次

华为OD机试2025C卷-座位调整[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

CrabCode v1.0.7与v1.0.8 更新速览！

月新闻

FAE放射组学分析工具：医学影像特征探索的完整解决方案

基于Dify与DeepSeek构建私有知识库问答系统实战指南

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！