轮盘app官方网站下载

轮盘app下载 马斯克说漏嘴了!Claude Opus参数5T,Sonnet 1T

发布日期:2026-04-13 01:10点击次数:163

轮盘app下载 马斯克说漏嘴了!Claude Opus参数5T,Sonnet 1T

哦豁,马斯克一个"不防御",把 Claude 参数抖出来了???

片言只语:Sonnet 1T、Opus 5T。

启事是老马发帖暗示,xAI 的 Colossus 2 超算正在教诲 7 个模子,其中最大的一款,参数目径直冲到了 10 万亿。

完竣清单:

Imagine V2

2 个 1 万亿(1T)参数的变体模子

2 个 1.5 万亿(1.5T)参数的变体模子

6 万亿(6T)参数模子

10 万亿(10T)参数模子

P.S. Colossus 2,即是老马巨硬筹谋(Macrohard)的一部分。据 2025 年 8 月走漏的信息,Colossus 2 依然装配了 119 台风冷式冷水机组,提供约 200MW 的冷却才智,足以因循约 11 万个 GB200 NVL72 GPU。

按照那时筹谋,Colossus 2 第一阶段部署 11 万个英伟达 GB200 GPU,最终见识是荒芜 55 万个 GPU,峰值功率需求瞻望荒芜 1.1GW。

此次发推文,亦然马斯克为数未几地对外公开 Colossus 超算的具体教诲筹谋。

音尘一出,网友开启意思意思宝宝模式,马斯克亦然激情可以的形态,看到发问也回复了不少。

比如有东谈主问"教诲一个 10T 模子,大摘记花多久?",马斯克说预教诲阶段约莫需要 2 个月。

哎,就有这样一段对话出现了。

Grok 4.2 的参数目,仅为 xAI 目下在训最大模子的 5%。也即是 5000 亿(500B)对比 10 万亿(10T),后者是前者 20 倍。

Grok 4.2 果然是总参数目 500B 吗?照旧说仅仅在一个更大的 MoE 里,激活的参数目是 500B 亿?

靠近疑问,老马又躬行回复了:

总参数目即是 0.5T(5000 亿)。目下的 Grok,参数目是 Sonnet 的一半、Opus 的额外之一。以它的范围来说,曲直常强的模子。

网友一眼瞄到显眼信息,这不即是说 Sonnet 是 1T,Opus 是 5T。

于是有东谈主追问:

纯意思意思,你(马斯克)怎样知谈 Sonnet、Opus 大小?

对此老马闭麦了,网友建议的点倒不无道理,"顶尖东谈主才在这样几家公司间流动,似乎也没什么神秘能藏太久"。

自打 Claude 系列模子问世,Anthropic 就一直严格守密参数范围,无论是 Opus 照旧 Sonnet,愣是少量没走漏。

越不说,网友究诘得越辛勤。

咱们用 AI 追思了一下网友们分析究诘的不同版块的 Claude 参数范围。

你还别说,你还真别说。最新模子 Claude 4.6 Sonnet ~1-2T、Claude 4.6 Opus ~1.5-2.5T/2-5T,还真和老马手滑透露的" Sonnet1T、Opus5T "对上了。

具体来看网友皆究诘出来了啥。

目下主流推测步履有四类:

推理资本与浑沌量反推法:模子推理资本与激活参数目呈访佛线性磋商,而总参数目则可通过架构类型和行业教养所有这个词推算。

性能基准对标法:通过与已知参数的开源模子在表率化基准上的弘扬对比,开云体育(中国)官网首页推断闭源模子的参数范围。

里面文献透露与据说分析法:官方不测泄漏的信息 & 一些小谈音尘。

架构特质分析法:通过对模子活动特质的不雅察,推断其选拔的架构类型,进而收缩参数忖度范围。

开首来看 Claude 3 系列,2024 年 3 月发布,这是首个造成显然家具矩阵的 Claude 系列,包含三个定位不同的版块。

小杯 Haiku、中杯 Sonnet 以及大杯 Opus,资本和性能次序递加。

对于它们的参数范围,LifeArchitect.ai 独创东谈主 Alan D. Thompson 曾给出估算:

Claude 3 Haiku ( ~20B ) 、Claude 3 Sonnet ( ~70B ) 、Claude 3 Opus ( ~2T ) 。

对于 Claude 3 Sonnet,Reddit 社区后续也伸开了抓续究诘,也有网友基于性能等推测 Claude 3 Sonnet 参数目在 150-250B 之间。

再来看 Claude 3.5,这是 Claude 的一次紧要升级,多个要害目的吊打 GPT-4o。

不外,Anthropic 最初只发布了独苗 Claude 3.5 Sonnet。

其速率是 Claude 3 Opus 的两倍,资本却仅为后者的 1/5。

对于模子参数目,微软等曾发布了一篇论文。

其中指出据行业估算,Claude 3.5 Sonnet 参数约 175B。

顺带附上其它模子估算参数:ChatGPT 约 175B、GPT-4 约 1.76T、GPT-4o 约 200B、o1-mini 约 100B、o1-preview 约 300B。

之后,Anthropic 跳过了 3.5 定名,未发布 3.5 Opus,在 Claude Sonnet 3.7 后径直投入 4 系列,轮盘游戏下载发布了两个模子:

Claude Opus 4 和 Claude Sonnet 4。

圈内对于 Claude 4 的参数忖度,存在较大不合。

行业估算 Claude Opus 4 参数约在 300 – 500B 之间,Claude Sonnet 4 约在 50B-100B 之间。

接下来 Claude Opus 4.1 发布。

其编程性能再次结巴,超越 Claude Opus 4,在 Agent 任务和推理方面也进一步升级。

不外发布时,官方暗示筹谋在改日几周对模子进行更大范围升级与转换,看来 4.1 真就仅仅一次小更新,替代 Opus 4。

以致网友究诘,Anthropic 可能蓝本不思发模子,关联词奈何 GPT-5/Gemini-3 的音尘太多,为了保抓市集竞争力是以先更新一波。

这可能亦然对于其参数究诘并未几的原因之一。

Hacker News 有网友以为,其可能是 Anthropic 尝试超大参数范围的推行性家具,后续 4.5 版块反而收缩了参数范围以优化后果。

Anthropic 对 Opus 4/4.1 进行了蒸馏,得到了 Opus 4.5。这亦然该模子的动手速率比 Opus 4 快约 3 倍,同期 API 调用资本仅为后者的三分之一的中枢原因。

通盘 AI 行业的发展见识,正在摈弃万亿参数范围的超大模子。当下的中枢命题是种植现存参数范围的运用后果。

Opus 4.5 参数目撑死也就在 2T 掌握。Opus 4/4.1 的参数目有时能达到约 6T(MoE 架构)。

再往下即是 4.5 系列了。

Claude Sonnet 4.5 先发布,诡计机操作方面,在 OSWorld 测试中获取了 60.2 分的 SOTA 获利,比 Sonnet 4 种植了近一半。

Claude Opus 4.5 后脚跟上,前端修复、视觉才智权贵种植,更擅长使用电脑;在深度磋商、PPT 制作与电子表格照料等过去任务方面的弘扬也全面升级。

本年 2 月刚发布的最新 4.6 系列,各项才智再上一个台阶。

Anthropic 暗示,对填写复杂 Excel、网页清单等诡计机操作任务,Sonnet 4.6 依然接近东谈主类水平。

而 Opus 4.6,在 GDPval-AA(一项评估金融、法律和其他范围经济价值学问职责任务的性能目的)上,比 GPT-5.2 跨越 144Elo;编程依旧独领风致,在 Agent 编程评估 Terminal-Bench 2.0 中获取了最高分,并在"东谈主类临了查验"中开首通盘其它前沿模子。

越往后,手艺迭代步入深水区,底层手艺和模子架构还一个劲地搞鼎新,思估算模子参数目,越来越难了。

最近,一篇发表在 Substack 的手艺逆向工程分析,通过 OpenRouter 在 Google Vertex 和 Amazon Bedrock 上的 Token 浑沌数据,估算了 Claude Opus 4.5 和 4.6 的激活参数目。

作家签字 unexcitedneurons,他以 3 个开源 MoE 模子为校准基准,推算出 Vertex 平台的灵验内存带宽约为 4.0 – 4.5TB/s,进而得出:

Opus 4.6 在 FP8 精度下的激活参数目为 93 – 105B。

若假定模子选拔 FP8 精度茁壮层 +FP4 精度搀杂巨匠层的竖立,Opus 4.6 的激活参数目约为 127 – 154B。

兼并不同巨匠稀少度决策,最终他以为,Opus 4.5 绝非网传的 10T+ 范围,它是一款体量小得多的模子,由 Claude Opus 4/4.1 蒸馏而来,参数目范围应落在 1.5T-2T 之间。

这少量也能从 API 订价中得到印证,Claude Opus 4.1 的输入 / 输出订价为每百万 Token 15 好意思元 /75 好意思元,而 Claude Opus 4.5/4.6 目下的订价仅为每百万 Token 5 好意思元 /25 好意思元,价钱径直降至原先的三分之一。

作家也提到,Claude Opus 4/4.1 参数目能够率在 5T-6T 掌握。

除了已发布模子的模子外,前几天 Anthropic 团队因权限竖立乌有,把自家未发布模子透露了。

模子 Claude Mythos(里面代号 Capybara)。

透露文献中,曾屡次使用质的飞跃这种说法来神色 Mythos,在具体才智上,相较于 Claude Opus 4.6,Mythos 在软件编码、学术推理和聚积安全等测试中的得分权贵更高。

Claude Mythos,被称为是迄今驱散公司修复过的最浩大的 AI 模子。

传言称模子参数达 10T。

参考连合:

[ 1 ] https://x.com/lifetimization/status/2042285703162397167

[ 2 ] https://www.reddit.com/r/ClaudeAI/comments/1ixuxln/estimate_of_model_size_for_claude_37/

[ 3 ] https://lifearchitect.substack.com/p/the-memo-special-edition-claude-3

[ 4 ] https://arxiv.org/pdf/2412.19260v1

[ 5 ] https://medium.com/@bob.mashouf/claude-4-vs-llama-4-benchmarking-55b99c17d3f7

[ 6 ] https://news.ycombinator.com/item?id=47319205

[ 7 ] https://unexcitedneurons.substack.com/p/estimating-the-size-of-claude-opus

一键三连「点赞」「转发」「防御心」

迎接在评述区留住你的思法!

—  完  —

� � 谁会代表 2026 年的 AI?

龙虾爆火,带动一波 Agent 与孳生家具海浪。

但真刚巧得恒久照应的 AI 公司和家具,有时不啻于此。

淌若你正在作念,或见证着这些变化,迎接申报。

让更多东谈主看见你。� � https://wj.qq.com/s2/25829730/09xz/

一键照应 � � 点亮星标

科技前沿进展逐日见轮盘app下载

澳门在线赌钱娱乐网入口