
谷歌将 Computer Use 能力从独立的 Gemini 2.5 模型整合进 Gemini 3.5 Flash,开发者现在可以用一个模型同时处理函数调用、搜索和跨平台屏幕操控。
2026/6/25
1 次阅读

字节跳动在火山引擎 FORCE 大会发布 Seedance 2.5,支持单段 30 秒视频生成、50 个输入素材处理、后期编辑保持风格一致。同时发布豆包 2.1 Pro、Seedream 5.0 Pro、Seed-Audio 1.0。预计 7 月初上线。
2026/6/24
3 次阅读

微博AI发布VibeThinker-3B,一个仅有30亿参数的稠密模型,在AIME26数学推理和LiveCodeBench编程基准上达到或超越DeepSeek V3.2、GLM-5等千亿级模型。采用课程式SFT+多域强化学习+离线自蒸馏的后训练范式。
2026/6/24
1 次阅读

阿里巴巴发布视频生成模型 HappyHorse 1.1,在动态表现力、主体一致性、指令遵循、视觉质感和音频能力五个维度全面升级,1080p 定价下调 25%。
2026/6/22
2 次阅读

阿里通义千问6月16日发布 Qwen-Robot Suite,包含 RobotManip(操作)、RobotNav(导航)、RobotWorld(世界模型)三款具身智能基础模型。RobotManip 在 RoboChallenge Table30 基准排名第一,跨具身迁移率是前最佳的3.2倍。
2026/6/17
6 次阅读

Anthropic 于 6 月 9 日发布 Claude Fable 5,在 SWE-bench 编程基准上达到 95%,比上一代 Opus 4.8 提升 7 个百分点。该模型支持 100 万 token 上下文和 12 万 token 输出,定价为输入 $10/百万 token、输出 $50/百万 token。
2026/6/15
14 次阅读

智谱 AI 于 6 月 17 日正式开源 GLM-5.2 权重(753B MoE / MIT 协议),在 FrontierSWE、Terminal-Bench 等多项编程基准上逼近 Claude Opus 4.8,成为当前最强开源编程模型。
2026/6/14
7 次阅读

Anthropic 发布 Claude Opus 4.8,在 7 项核心 benchmark 中 6 项领先,定价不变。附带 Dynamic Workflows 新功能和诚实度改进。
2026/5/29
31 次阅读

基于 SWE-bench、HumanEval、实际编程测试等数据,整理 2026 年主流大模型的编程能力排行,附各模型擅长的编程场景。
2026/5/27
27 次阅读

从 AI 对话、编程、绘画、视频、语音、搜索、效率七个领域,精选 50 个 2026 年最值得关注的 AI 工具,每个都有简评和使用建议。
2026/5/27
24 次阅读

整理了 2026 年主流大模型的 API 定价,涵盖 DeepSeek、GPT、Claude、MiMo、Qwen、GLM、Kimi、Gemini 等 20+ 模型,按场景推荐最划算的方案。
2026/5/27
36 次阅读

小米 MiMo-V2.5 系列 API 于 5 月 27 日起永久降价,Pro 模型输出价格直降 71-86%,标准版输出降价 86-93%,缓存命中最低 ¥0.020/M tokens。
2026/5/27
31 次阅读