
Google DeepMind 在 I/O 大会上发布 Gemini 3.5 Flash,首款结合前沿智能与行动能力的模型,支持 Agent 工作流和工具调用,输出速度比前沿模型快 4 倍。
2026/5/20
14 次阅读

Claude 在商业收入和新增企业客户上已超越 ChatGPT,Anthropic 收购 API 工具公司 Stainless,联合创始人与教皇 Leo XIV 合作发布 AI 通谕。企业级 AI 路线正在奏效。
2026/5/19
7 次阅读

从 Qwen 3.5 到 3.7 的高频迭代、Qwen3.6-27B 旗舰级编码能力(HN 993pts)、27B 参数即可挑战更大模型的性能、社区生态提速工具 Orthrus 实现 7.8 倍吞吐提升。
2026/5/19
21 次阅读

MTP(多 Token 预测)落地 llama.cpp,本地推理速度翻倍。Qwen 3.x 因原生支持 MTP 成为最大受益者,社区测试 Qwen3.5-27B 在 RTX 3090 上跑出 207 tok/s。
2026/5/19
38 次阅读

Bloomberg 最新报道显示,美国 AI 高风险岗位开始出现失业潮。BLS 数据表明 18 个 AI 相关职业在一年内就业下降 0.2%,而整体就业上升 0.8%。但这到底是 AI 的锅,还是企业借 AI 之名行裁员之实?
2026/5/18
9 次阅读

腾讯混元 Hy3 Preview 发布两周即登顶 OpenRouter 周榜,总参数 295B、激活参数 21B,这是姚顺雨带队全面重建后的首个模型,推理效率提升 40%,Agent 能力大幅增强。
2026/5/16
20 次阅读

Anthropic 在 Code with Claude 大会上推出了 Managed Agents 的"做梦"功能——通过跨 Agent 回顾会话记录,自动提炼和保留重要信息。
2026/5/16
3 次阅读

2026年5月,OpenAI 发布 GPT-5.5 Instant 成为 ChatGPT 默认模型,xAI 同期推出 Grok 4.3 以极致低价杀入市场。本文从性能基准、定价策略、Agent 能力、安全性四个维度做深度对比,帮你判断哪个更适合你的使用场景。
2026/5/7
8 次阅读

OpenAI 正式推出 GPT-5.5 Instant 模型,在保持 GPT-5.5 核心推理能力的前提下,将响应延迟压缩至 200ms 以内,API 成本降低 60%。本文从实测数据、适用场景和迁移指南三个维度,帮你判断是否值得切换。
2026/5/7
14 次阅读

基于最新发布的官方基准测试数据,本文对 DeepSeek V4 系列(Pro Max 与 Flash Max)与 OpenAI GPT-5.5 进行了全面的数值化性能对比。通过超过20项关键评测的详细数据表格,清晰展示了两大模型在知识、推理、编程、数学及智能体能力等维度的具体差距与优势,为开发者与企业的技术选型提供精准、真实的数据依据。
2026/4/24
45 次阅读

2026年4月23日,OpenAI正式发布新一代旗舰模型GPT-5.5,这是自GPT-5.4发布仅7周后的重大更新。GPT-5.5被定位为"面向真实工作的全新智能层级",在智能体编码、计算机使用、知识工作和早期科学研究等领域实现显著突破。与GPT-5.4相比,新模型在保持相同延迟的同时,以更少的token消耗完成更复杂的任务,标志着AI从对话工具向自主执行者的转变。
2026/4/24
17 次阅读

2026年4月16日,Anthropic正式推出Claude Opus 4.7模型,这是其旗舰模型的最新版本。该模型在复杂软件工程任务中表现显著增强,多模态能力支持更高分辨率图像处理,但分词器改进导致token消耗增加10%-35%。本文将对Claude Opus 4.7与GPT-5.4、Claude Opus 4.6、Gemini 3.1进行全方位对比分析。
2026/4/17
27 次阅读