发布时间 LLM 模型参数量 组织名称 论文/模型特点 2025-02 Grok-3 xAI [介绍]具有更高的推理、计算和适应能力,使用约 20 万个 GPU 训练。 2025-01 DeepSeek-R1 DeepSeek [论文]无需大量 SFT 就能实现与 OpenAI o1 相当的推理能力。 2025-01 Kimi K1.5 Kimi Team [论文]多模态思考模型,性能比肩 OpenAI o1。 2024-12 DeepSeek-V3 DeepSeek [论文]V3 表现接近 GPT-4o 和 Claude-3.5-Sonnet,更注重综合场景适用性。 2024-12 o3 OpenAI [介绍]o3 在编程和数学能力方面达到 AGI 门槛。 2024-12 Gemini 2.0 Pro/Flash/Flash-Lite Google DeepMind [介绍]Gemini 2.0 全家桶,推理能和多模态功能增强。 2024-12 Phi-4 14B MicroSoft [介绍]phi-4 是微软小模型 phi 系列最后一个模型,增强了复杂推理能力。 2024-09 o1 OpenAI [介绍]首个具有“推理”能力的模型。 2024-08 Grok-2 xAI [介绍]Grok-2 系列模型具有聊天、编码和推理等功能,包括 Grok-2 和 Grok-2 mini 两个版本。 2024-05 Chameleon Meta [论文]混合模态基座模型,只支持图