341 lines
22 KiB
Markdown
341 lines
22 KiB
Markdown
# 2025年11月大模型版本发布全景 & 2025年度发展回顾
|
||
|
||
下面分两部分回答你的问题:
|
||
|
||
1. 2025年11月“大模型版本更新全景”
|
||
2. 结合全年动态,对 2025 年大模型发展做一个结构化回顾与判断
|
||
|
||
---
|
||
|
||
## 一、2025年11月:全球大模型集中“换代”的关键窗口
|
||
|
||
11 月几乎可以看成 2025 年大模型“集中交卷月”,几家头部实验室都在这一个月完成旗舰模型换代或能力跃迁。
|
||
|
||
### 1. OpenAI:GPT‑5.1 家族(11 月 12–13 日)
|
||
|
||
**定位:从“单一大模型”转向“多模式路由系统”**
|
||
|
||
- **发布时间**:2025 年 11 月 12–13 日正式上线 GPT‑5.1 系列[1]
|
||
- **核心结构**:
|
||
- **GPT‑5.1 Instant**:
|
||
- 面向日常聊天、问答、写作、轻量分析
|
||
- 引入“自适应推理”(Adaptive Reasoning)机制:
|
||
- 简单问题走“快通道”,几乎无额外思考
|
||
- 棘手任务会短暂停顿 1–5 秒,自动“多想一步”再回答[1][2]
|
||
- 响应延迟进一步下降,数学等基础推理任务的准确率较前代显著提升
|
||
- **GPT‑5.1 Thinking**:
|
||
- 面向逻辑分析、长文档理解、数据解读、复杂规划等专业场景
|
||
- 可动态拉长思考时间(10 秒甚至更久),用更长的中间推理链换取更高正确率[2][3]
|
||
- 配套 **Auto 模式**:根据任务复杂度自动选择 Instant 或 Thinking,并支持预设多种对话“人格 / 语气”风格[2]
|
||
|
||
**对开发者/企业的意义:**
|
||
|
||
- 技术上:从“一个统一模型”转为 **前端路由 + 后端多模型** 架构,为后续 GPT‑5.2 的 Instant / Thinking / Pro 三档打好基础
|
||
- 商业上:
|
||
- 日常场景成本更低(Instant),复杂场景体验更好(Thinking)
|
||
- 有利于把 GPT 能力嵌入不同产品线:聊天、办公、编程、代理(Agent)各有最优版本
|
||
|
||
---
|
||
|
||
### 2. Google:Gemini 3 Pro(11 月 18–19 日)
|
||
|
||
**定位:首个在多项权威榜单全面压制 GPT‑5.1 的多模态旗舰**
|
||
|
||
- **发布时间**:美西时间 11 月 18 日,国内媒体 11 月 19 日集中报道[4]
|
||
- **亮点能力**[4][5][6]:
|
||
- **100 万 tokens 上下文窗口**(约几十万~上百页文档量级)
|
||
- 原生多模态:文字、图片、音频、视频统一建模,而不是简单“拼接模块”
|
||
- 在推理、编程、应用开发和图像生成等复杂任务上显著增强,被 Google 形容为
|
||
|
||
> “目前世界上最好的多模态理解模型,也是我们迄今为止最强大的智能体和氛围编程模型”[4][6]
|
||
|
||
- 通过 Deep Think / Deep Reason 模式,对标并超越推理型模型(如 GPT‑5.1 Thinking、Grok 4.1 Thinking、Kimi K2 Thinking)的“慢思考”能力
|
||
- **部署:**发布当日即落地 Google 搜索的 AI 模式、Gemini App、API、Vertex AI 等全产品线[4][6]
|
||
|
||
**意义:**
|
||
|
||
- 性能上,Gemini 3 Pro 在多项公共基准中首次整体超越 GPT‑5.1 系列,被外部分析视为“谷歌重新夺回模型能力榜首”的标志[3][4]
|
||
- 策略上,Google 走的是 **“一体化 AGI 平台”** 路线:搜索 + Workspace + Android + Cloud 一起吃到新模型红利
|
||
|
||
---
|
||
|
||
### 3. Anthropic:Claude Opus 4.5(11 月 24–25 日)
|
||
|
||
**定位:编程 & Agent 能力全面封王的“行动型模型”**
|
||
|
||
- **发布时间**:当地时间 11 月 24–25 日[7]
|
||
- **核心特征**[7][8][9]:
|
||
- 在 **SWE‑bench Verified** 真实软件工程基准中达到 **80.9%** 准确率,是首个超过 80% 的模型,公开数据上超越 GPT‑5.1‑Codex‑Max、Gemini 3 Pro 等[7][9]
|
||
- Anthropic 内部 2 小时工程考试中,得分超过所有历史人类求职者[8]
|
||
- 主打三大场景:
|
||
- 编程:代码生成、重构、复杂 bug 定位
|
||
- Agent:长时运行、多工具协作、复杂任务拆解
|
||
- Computer Use:自动操控浏览器、Office、Excel / PPT 等可视化界面
|
||
- 引入 **effort(努力程度)参数**:允许开发者在“省钱”与“极致能力”之间按需调节;中等 effort 下可在保持性能的同时节省约 76% Token 消耗[7][9]
|
||
- **价格腰斩**:输入 $5 / 百万 tokens,输出 $25 / 百万 tokens,较前代 Opus 4.1 大约降价三分之二[7][8]
|
||
|
||
**意义:**
|
||
|
||
- 从“会聊天的模型”到“能交付结果的智能体(Agent)”:Opus 4.5 被不少分析称为“从 LLM 到 ‘大型行动模型(LAM)’ 的分水岭”[8]
|
||
- 对高端工程师工作影响最大:复杂项目编码、长程自动化任务,首次在统计指标上系统性超越人类平均水平
|
||
|
||
---
|
||
|
||
### 4. 百度:文心大模型 5.0 & 5.0 Preview(11 月 8–13 日)
|
||
|
||
**定位:国内首个全模态 2.4 万亿参数旗舰 & 文本能力国内第一**
|
||
|
||
- **发布时间**:
|
||
- 11 月 8 日:ERNIE‑5.0‑Preview‑1022 登上 LMArena 文本榜,全球并列第二、国内第一[10]
|
||
- 11 月 13 日:百度世界大会正式发布 **文心大模型 5.0**[11]
|
||
- **技术亮点**[10][11]:
|
||
- **2.4 万亿参数、超稀疏 MoE 架构**
|
||
- 原生全模态统一建模:文本、图像、音频、视频同一套自回归架构
|
||
- 在 40+ 权威基准的综合评测中,语言与多模态理解能力与 Gemini‑2.5‑Pro、GPT‑5‑High 等持平[11]
|
||
- 官方强调的三大核心能力:
|
||
1. 创意写作:生成质量与多样性全球领先
|
||
2. 复杂长问题理解:面向专业领域长链条问题
|
||
3. 指令遵循:对齐用户意图、降低“跑偏”
|
||
- **意义:**
|
||
- 文心 5.0 让百度在国内基础模型竞争中重新站到第一梯队,并在 LMArena、部分多模态榜单上与国际顶级闭源模型对标[10][11]
|
||
- 配合 2025 年全年“萝卜快跑”等自动驾驶、搜索、办公场景应用,形成百度自有的 **“搜索 + 自动驾驶 + AI 原生应用”** 组合
|
||
|
||
---
|
||
|
||
### 5. 月之暗面:Kimi K2 Thinking(11 月 6 日)
|
||
|
||
**定位:开源推理 + Agent 能力首次对齐甚至超越闭源标杆**
|
||
|
||
- **发布时间**:2025 年 11 月 6 日[12][13]
|
||
- **关键特征**[12][13]:
|
||
- 基于 Kimi K2 万亿参数 MoE 基座,**1 万亿总参数、约 320 亿激活参数、256k 上下文窗口**
|
||
- 原生 “模型即 Agent” 设计:
|
||
- 支持 “边思考,边调用工具”(浏览器、代码执行、搜索等)
|
||
- 工具调用链可长达 200–300 步,适合长程复杂任务
|
||
- 在多个高难基准拿到/逼近 SOTA:
|
||
- Humanity’s Last Exam(人类最后的考试,极高难综合测试)
|
||
- BrowseComp(自主网络浏览)
|
||
- SEAL‑0(复杂信息收集与推理)等
|
||
- **意义:**
|
||
- 从开源阵营首次在若干推理与 Agent 能力上“正面硬刚”闭源顶级模型(如 GPT‑5 系列、Claude、Gemini 3)[12]
|
||
- 对国内外开发者来说,K2 Thinking 成为定制复杂 Agent 系统的高性价比开源基座
|
||
|
||
---
|
||
|
||
### 6. xAI:Grok 4.1(11 月 17–18 日)
|
||
|
||
**定位:情感智能 + 创意写作 + 深度推理三位一体**
|
||
|
||
- **发布时间**:2025 年 11 月 17 日正式发布[14]
|
||
- **主要升级点**[14][15]:
|
||
- 双模式:
|
||
- **Grok 4.1 Thinking**:带推理版,LMArena 文本 Elo ≈ 1483,位列全榜第一
|
||
- **Grok 4.1 Non‑Thinking**:直答版,速度快、成本低
|
||
- 情感与创意:
|
||
- 在 EQ‑Bench 情感智能测试中大幅提升
|
||
- 创意写作、对话连贯性、人格稳定性更好,用户主观偏好度高
|
||
- 事实性与幻觉控制:
|
||
- 真实用户场景下幻觉率从约 12% 降至 4.2% 左右,下降近 3 倍[14]
|
||
- **商业策略**:
|
||
- Thinking & 非 Thinking 两版 **对所有用户免费开放**,API 保持较低价格
|
||
- **意义:**
|
||
- xAI 在“推理 + 情感智能 + 创意写作”三个维度与 OpenAI / Google / Anthropic 正面竞争
|
||
- 以免费策略迅速做大用户基数,成为 2025 年下半年产品层面最具“话题度”的大模型之一
|
||
|
||
---
|
||
|
||
### 7. DeepSeek:DeepSeekMath‑V2 & DeepSeek‑OCR 云端上线(11 月 27 日)
|
||
|
||
**定位:数学推理与文档理解的“专业武器”**
|
||
|
||
- **DeepSeekMath‑V2(11 月 27 日开源)**[16]
|
||
- 基于 DeepSeek‑V3.2‑Exp‑Base,面向 **数学定理证明与自验证推理**
|
||
- 在模拟 IMO 2025、CMO 2024 达到金牌水平,在 Putnam 2024 获 118/120 分[16]
|
||
- 构建 LLM 验证器,对生成的证明过程进行自动审查,训练中将“解释评分”作为奖励信号,推动 RLVR 方向在数学领域落地
|
||
- **DeepSeek‑OCR 在多平台上线(含 Ollama v0.13.0)**[17]
|
||
- 利用 “上下文光学压缩”(Contexts Optical Compression),用视觉 token 对长文本进行高比压缩:
|
||
- 在 10 倍 Token 压缩下仍可保持约 97% 识别准确率[17]
|
||
- 2025 年 11 月,DeepSeek‑OCR 模型在网心算力云、Ollama 等平台上线,成为 RAG 与长文档处理的重要构件[17][18]
|
||
|
||
---
|
||
|
||
### 8. 本地推理生态:Ollama v0.13.0(11 月 19 日)
|
||
|
||
- **发布时间**:2025 年 11 月 19 日[19]
|
||
- **关键更新**:
|
||
- 新增 **DeepSeek‑OCR**、**Cogito‑V2.1** 等模型支持[19]
|
||
- 提供 Bench 性能测试工具,帮助本地部署者评估模型性能与资源消耗
|
||
- **意义**:
|
||
- 把顶级开源模型(如 DeepSeek‑OCR、Cogito‑V2.1)快速带入开发者桌面环境,加速“本地 AI + 私有数据”的普及
|
||
- 也为国外开源推理模型(Cogito v2.1)提供标准发行渠道
|
||
|
||
---
|
||
|
||
### 9. Agent 基础设施:MuleRun 2.0(11 月 13 日)
|
||
|
||
- **发布时间**:2025 年 11 月 13 日 0 点发布 2.0 版本[20]
|
||
- **定位**:全球首个 AI Agent 交易市场
|
||
- **2.0 主要升级**:
|
||
- 为用户配置 **专属 Agent 团队**(多个 Agent 协作完成复杂任务)
|
||
- 上线多种垂直场景的 Agent 专题(金融、研究、电商等)
|
||
- **数据**:自 2025 年 9 月正式版上线起,1 个月内平台注册用户数突破 50 万,其中美国用户占比约 27%[20]
|
||
- **意义**:
|
||
- 从“模型 API 市场”走向“Agent 市场”:将大模型能力封装为可交易的“数字劳动力”(AI Worker)
|
||
- 为 Agent 经济提供交易与分发“基础设施”
|
||
|
||
---
|
||
|
||
## 二、2025 年大模型发展回顾:从参数战争到“推理 + Agent + 开源”的系统竞争
|
||
|
||
结合全年公开信息,可以把 2025 年大模型发展概括为三个关键词:**推理之年、Agent 元年、中国开源崛起**。
|
||
|
||
### 1. 技术范式:从 RLHF 到 RLVR,推理能力成为主战场
|
||
|
||
- **训练方法革命**
|
||
- 2025 年,多份权威总结(如清华《2025 年 AI 大模型资料汇编》、Karpathy 年度总结等)都指出:
|
||
- 核心拐点是从 **RLHF(人类反馈强化学习)** 转向 **RLVR(可验证奖励强化学习)**[3][21]
|
||
- 特别是在数学与代码领域:
|
||
- 通过“自我生成解 + 自动验证 + 奖励信号”,大规模优化模型的推理链质量
|
||
- DeepSeekMath‑V2 就是典型例子——把“证明是否严谨”量化为训练信号[16]
|
||
- **能力结构的“锯齿化”**
|
||
- 2025 年头部模型普遍呈现:
|
||
- 在数学、程序设计、形式化推理上达到“鬼才级”水平
|
||
- 但在日常常识、灰度判断上仍有明显短板[3][21]
|
||
- 这导致对“是否接近 AGI”的讨论转向更细致的“分维度评估”
|
||
|
||
### 2. 生态格局:从“谁更大”到“谁更好用、更便宜、更系统”
|
||
|
||
- **规模定律见顶与“性价比之战”**
|
||
- 继续堆参数的边际收益在降低:
|
||
- Grok 3/4、GPT‑5、Gemini 3、DeepSeek‑V3 等超大模型之间的性能差异,已远低于算力消耗差异[22]
|
||
- 企业和开发者越来越关注:
|
||
- **单位成本下的性能**(性价比)
|
||
- 在具体任务中的 **稳定性与可控性**,而非单一基准分数
|
||
- **系统竞争:模型 → 工具链 → Agent → 生态闭环**
|
||
- OpenAI:GPT‑5.x + ChatGPT + Search + Codex + Agent 系统
|
||
- Google:Gemini 3 + Search + Workspace + Android + Vertex AI
|
||
- Anthropic:Claude Opus 4.5 + Claude Code + 各类插件与云平台集成
|
||
- 中国厂商:文心 + 千问 + DeepSeek + Kimi 等,围绕 **云 + 应用 + 行业方案** 构建系统化竞争
|
||
- 2025 年真正的焦点已从“模型跑分”转向 **“谁的系统更能跑起来、赚到钱”**
|
||
|
||
### 3. 开源浪潮:中国模型站到舞台中央
|
||
|
||
- 多份开源评述指出:2025 年开源大模型的领导力量逐渐从欧美转向“中美并立”,特别是中国在开源推理模型、代码模型、多模态模型上的贡献度显著提高[23]
|
||
- 核心代表:
|
||
- **DeepSeek‑R1/V3/V3.2**:以极低训练成本达到与 OpenAI o1 / GPT‑5 近似的推理水平,引发“去算力泡沫”讨论
|
||
- **Kimi K2 / K2 Thinking**:开源万亿参数 MoE + Agent 能力,成为世界级开源推理基座[12]
|
||
- **Qwen3** 系列:在多语种、多模态、多尺寸覆盖方面构建完整矩阵,开源生态极活跃[24]
|
||
- 影响:
|
||
- 推动全球开源社区从“复制闭源模型”转向“自创路线”(如便宜但强的推理模型、大上下文模型、多模态检索模型等)
|
||
- 也为中小企业和个人开发者提供了可负担的 SOTA 水平模型——配合 vLLM、Ollama 等推理框架,私有化部署门槛迅速下降
|
||
|
||
### 4. Agent 元年:从 Copilot 到 Autopilot
|
||
|
||
- **从“助手”到“执行者”**
|
||
- 2023–2024:以 Copilot / ChatGPT 为代表的“对话助手”阶段
|
||
- 2025:
|
||
- Manus 等长时自主 Agent 在欧美走红
|
||
- 国内 AutoGLM、Kimi K2 Thinking、DeepSeek 系 Agent 工具陆续落地
|
||
- MuleRun 2.0 等 Agent 交易市场让“数字劳动力”具备交易属性[20]
|
||
- **企业实践**:
|
||
- 在代码、运营、客服、销售、财务、供应链等领域,越来越多企业尝试把工作流程交给 Agent:
|
||
- 读取文档 → 搜集数据 → 调用工具 → 生成结果/执行操作 → 记录/汇报
|
||
- 这正在把 AI 从“办公插件”推向“业务流程执行引擎”
|
||
|
||
### 5. 中国大模型:从“追赶者”到部分赛道“领跑者”
|
||
|
||
- **数量与质量**
|
||
- 截至 2025 年中,中国已发布的大模型超过 1500 个,占全球约 40%[25]
|
||
- 在文本、推理、代码、多模态多个榜单上,中国模型已多次进入全球前列:
|
||
- 文心 5.0 Preview:LMArena 文本榜全球并列第二[10]
|
||
- Kimi K2 Thinking:多个推理 / Agent 基准对标并超越顶级闭源[12]
|
||
- DeepSeek:在数学、代码、推理、OCR 等细分领域提供了极具性价比的 SOTA 开源方案[16][17]
|
||
- **市场与政策**
|
||
- 市场规模:
|
||
- 多份研究预测中国 AI 大模型市场 2025 年规模将接近或突破 495 亿元人民币,2026 年有望破 700 亿元[26][27]
|
||
- 政策:
|
||
- 从备案、标准、算力基础设施到数据要素政策,逐渐形成支持创新又重视安全治理的监管框架[27]
|
||
|
||
---
|
||
|
||
## 三、对企业和个人的可执行建议
|
||
|
||
结合 2025 年 11 月关键发布和全年趋势,如果你是:
|
||
|
||
### 1)企业技术负责人 / CTO
|
||
|
||
- **模型选型**:
|
||
- 通用对话 / 办公:Gemini 3 Pro、GPT‑5.1 Instant、文心 5.0、Qwen3‑Max 等
|
||
- 高强度编码 / Agent:Claude Opus 4.5、Kimi K2 Thinking、DeepSeek‑V3.2 / Cogito v2.1
|
||
- 数学 / 科学推理:DeepSeekMath‑V2 + GPT‑5.2 Thinking 等组合
|
||
- **架构思路**:
|
||
- 优先构建 **“路由 + 多模型”** 架构,而不是依赖单一大模型
|
||
- 引入 RAG + RLVR 思路,降低幻觉、提升可靠性
|
||
- 及早试点 Agent,在一个可控业务流程中进行“端到端自动化”实验(如报表生成、合同初审、代码评审)
|
||
|
||
### 2)开发者 / 技术个人
|
||
|
||
- **技能优先级**:
|
||
1. 熟练使用 GPT‑5.1 / Gemini 3 / Claude Opus 4.5 等闭源 API,理解其优缺点
|
||
2. 掌握至少一个开源万亿级模型体系(如 Kimi K2 / Qwen3 / DeepSeek),并能本地或云端部署
|
||
3. 学会编排 Agent 流程:工具调用、任务拆解、错误恢复、长程状态管理
|
||
4. 理解 RLHF → RLVR 的变迁及其对提示词设计、系统设计的影响
|
||
- **实践路径**:
|
||
- 从小型“AI 助手插件”(如内部知识库问答)做起,到“AI 执行机器人”(自动化运维脚本、报表生成、测试用例生成)
|
||
- 尝试使用 MuleRun、AutoGLM、Claude Code 等成熟 Agent 工具,理解业界最佳实践
|
||
|
||
### 3)普通专业人士(产品、运营、金融、咨询等)
|
||
|
||
- 把 2025 年的大模型看作 **“第二曲线生产力工具”**:
|
||
- 日常:用 GPT‑5.1 / Gemini 3 做信息收集、初稿撰写、方案头脑风暴
|
||
- 专业:用 Claude Opus 4.5 / DeepSeek / 行业大模型做报表、建模、代码/脚本、文档精读
|
||
- 中长期:
|
||
- 主动拥抱 AI 工具,而不是被动“防被替代”
|
||
- 把自己定位为“人 + 多个 Agent 团队”的协调者/决策者
|
||
|
||
---
|
||
|
||
## 总结
|
||
|
||
- **2025 年 11 月** 是全球大模型领域 **新一轮军备与洗牌的节点**:
|
||
- GPT‑5.1、Gemini 3 Pro、Claude Opus 4.5、文心 5.0、Kimi K2 Thinking、Grok 4.1 等旗舰集中登场
|
||
- 多家厂商在多模态、推理、Agent、成本等维度对齐甚至超越 GPT 系列
|
||
- **2025 全年** 则可概括为:
|
||
- **推理之年**:RLVR、大量数学/代码/逻辑模型涌现
|
||
- **Agent 元年**:从 Copilot 到能真正执行任务的 Autopilot
|
||
- **中国开源崛起之年**:DeepSeek、Kimi、Qwen3 等在多个技术方向实现“弯道超车”
|
||
|
||
站在 2026 年初再看 2025,可以说:
|
||
**这不是大模型的终点,而是它真正变成“系统”和“基础设施”的起点。**
|
||
|
||
---
|
||
|
||
### References
|
||
|
||
[1] GPT‑5.1 系列发布相关报道. [https://blog.csdn.net/weixin_47221050/article/details/154843769](https://blog.csdn.net/weixin_47221050/article/details/154843769)
|
||
[2] OpenAI GPT‑5.1 系列模型介绍. [https://blog.csdn.net/Ashtar_katay/article/details/154800069](https://blog.csdn.net/Ashtar_katay/article/details/154800069)
|
||
[3] GPT‑5.2 能力评估与 GPT‑5.1 对比分析. [https://www.infoq.cn/article/drb6mxayutswarnsbyl7](https://www.infoq.cn/article/drb6mxayutswarnsbyl7)
|
||
[4] 谷歌 Gemini 3 正式发布相关报道. [https://so.html5.qq.com/page/real/search_news?docid=70000021_509691d42f800852](https://so.html5.qq.com/page/real/search_news?docid=70000021_509691d42f800852)
|
||
[5] Gemini 3 Pro 技术解读文章. [https://blog.csdn.net/Ashtar_katay/article/details/155038185](https://blog.csdn.net/Ashtar_katay/article/details/155038185)
|
||
[6] 谷歌官方与媒体对 Gemini 3 发布的新闻汇总. [https://docs.cloud.google.com/vertex-ai/generative-ai/docs/models/gemini/3-pro?hl=zh-cn](https://docs.cloud.google.com/vertex-ai/generative-ai/docs/models/gemini/3-pro?hl=zh-cn)
|
||
[7] Claude Opus 4.5 发布新闻及技术说明. [https://www.sohu.com/a/958111852_100190264](https://www.sohu.com/a/958111852_100190264)
|
||
[8] Claude Opus 4.5 能力与应用深度解析. [https://blog.csdn.net/2401_86688088/article/details/155516379](https://blog.csdn.net/2401_86688088/article/details/155516379)
|
||
[9] Anthropic 官方及多家媒体对 Opus 4.5 报道合集. [https://so.html5.qq.com/page/real/search_news?docid=70000021_0386924e29f35052](https://so.html5.qq.com/page/real/search_news?docid=70000021_0386924e29f35052)
|
||
[10] 文心 5.0 Preview 登榜 LMArena 报道. [https://so.html5.qq.com/page/real/search_news?docid=70000021_0366911c49a18452](https://so.html5.qq.com/page/real/search_news?docid=70000021_0366911c49a18452)
|
||
[11] 百度文心大模型 5.0 发布新闻. [https://so.html5.qq.com/page/real/search_news?docid=70000021_0146915c31930052](https://so.html5.qq.com/page/real/search_news?docid=70000021_0146915c31930052)
|
||
[12] Kimi K2 Thinking 官方与媒体发布信息. [https://so.html5.qq.com/page/real/search_news?docid=70000021_477690cbe9136452](https://so.html5.qq.com/page/real/search_news?docid=70000021_477690cbe9136452)
|
||
[13] 技术社区对 Kimi K2 Thinking 的评测与分析. [https://blog.csdn.net/2501_91883294/article/details/154659664](https://blog.csdn.net/2501_91883294/article/details/154659664)
|
||
[14] Grok 4.1 正式发布与模型卡解析. [https://www.jdon.com/83072-grok-4-1-model-card.html](https://www.jdon.com/83072-grok-4-1-model-card.html)
|
||
[15] 多篇 Grok 4.1 详解与实测文章. [https://blog.csdn.net/badfl/article/details/155070055](https://blog.csdn.net/badfl/article/details/155070055)
|
||
[16] DeepSeekMath‑V2 发布公告及技术解析. [https://blog.csdn.net/m0_53830442/article/details/155411324](https://blog.csdn.net/m0_53830442/article/details/155411324)
|
||
[17] DeepSeek‑OCR 技术说明与应用文章. [https://blog.csdn.net/u012723183/article/details/154598201](https://blog.csdn.net/u012723183/article/details/154598201)
|
||
[18] 网心算力云关于 DeepSeek‑OCR 上线通告. [https://www.onething.net/media/tech/](https://www.onething.net/media/tech/)
|
||
[19] Ollama v0.13.0 版本发布说明. [https://blog.csdn.net/weixin_48502062/article/details/155107352](https://blog.csdn.net/weixin_48502062/article/details/155107352)
|
||
[20] MuleRun 2.0 发布新闻. [https://so.html5.qq.com/page/real/search_news?docid=70000021_9926915516933752](https://so.html5.qq.com/page/real/search_news?docid=70000021_9926915516933752)
|
||
[21] 清华大学《2025 年 AI 大模型资料汇编》解读. [https://new.qq.com/rain/a/20251229A01EKH00](https://new.qq.com/rain/a/20251229A01EKH00)
|
||
[22] 2025 大模型进化论与 Scaling Law 讨论. [https://so.html5.qq.com/page/real/search_news?docid=70000021_7926943d10d83452](https://so.html5.qq.com/page/real/search_news?docid=70000021_7926943d10d83452)
|
||
[23] 中国领跑开源 AI:2025 大模型发展新格局. [https://finance.sina.com.cn/roll/2025-12-16/doc-inhaxvcr3477970.shtml](https://finance.sina.com.cn/roll/2025-12-16/doc-inhaxvcr3477970.shtml)
|
||
[24] Qwen3 系列模型发布与技术介绍. [https://so.html5.qq.com/page/real/search_news?docid=70000021_32368109e9a93452](https://so.html5.qq.com/page/real/search_news?docid=70000021_32368109e9a93452)
|
||
[25] 中国大模型发展年度报告相关数据. [https://www.sohu.com/a/951527879_120855974](https://www.sohu.com/a/951527879_120855974)
|
||
[26] 2025 年中国 AI 大模型市场规模与预测. [https://www.sohu.com/a/885084192_122006510](https://www.sohu.com/a/885084192_122006510)
|
||
[27] 多篇中国 AI 大模型行业研究与白皮书汇总. [https://m.chinairn.com/news/20250122/101818522.shtml](https://m.chinairn.com/news/20250122/101818522.shtml) |