
测试了主流大模型在 100K-1M tokens 上下文中的实际表现,包括信息检索准确率、总结质量、长对话稳定性。
2026/5/27
25 次阅读

2026 年国产大模型全面评测,从编程、推理、中文能力、价格四个维度对比阿里 Qwen、智谱 GLM、深度求索 DeepSeek、小米 MiMo、月之暗面 Kimi。
2026/5/27
16 次阅读

从推理、编程、多模态、价格四个维度对比 2026 年三大前沿模型,附实测数据和选型建议。
2026/5/27
25 次阅读

从价格、能力、使用场景三个维度对比 DeepSeek V4、GPT-5.5 和 Claude Opus 4.7,帮你找到最适合自己的 AI 模型。
2026/5/27
29 次阅读