大模型列表 - 企数智|企业级大模型服务平台

热门搜索：数字员工数字孪生数字化转型

关注公众号

分类

全部

文本

语言

图像

视频

语音

音频

编码

多模态

推理

排序

向量

行业

其他

上下文

全部

<=8k

<=32k

<=64k

<=128k

>128k

热门

全部

DeepSeek

GPT

Claude

通义千问

GLM

Doubao

元宝

排序

默认

发布时间

热度

推理模型

多模态模型

编码模型

391K

GPT-5.4 mini是OpenAI于2026年3月推出的新一代小型大语言模型，旨在以更低延迟和更高性价比解决高频工作负载问题。

核心优势：该模型主打“快、强、便宜”，通过知识蒸馏和架构压缩技术，运行速度比前代GPT-5 mini提升超过两倍。它专门针对编程、计算机操作、多模态理解以及子代理（Subagent）任务进行了深度优化。

性能表现：在SWE-Bench Pro（代码修复）和OSWorld-Verified（计算机操作）等核心基准测试中，GPT-5.4 mini的表现已非常接近旗舰版GPT-5.4，同时成本显著降低。它支持400K的超大上下文窗口，能够处理复杂的文本和图像输入。

应用定位：在AI智能体架构中，GPT-5.4 mini充当“四肢”与“前哨”的角色，负责执行具体、快速的任务，而将复杂的战略规划留给大模型。

2026年3月18日 OpenAI

语言模型

编码模型

多模态模型

MiniMax M2.7 是 MiniMax 发布的新一代 Agent 旗舰大模型，于 2026 年 3 月 18 日正式发布。该模型的核心突破在于展示了“模型自我进化”的路径，通过构建 Agent Harness 体系，让模型深度参与自身的训练、优化与迭代流程。

自我进化能力： 模型能作为研究型 Agent，参与数据流水线、实验设计、代码修复等研发环节，在部分场景承担 30%-50% 的工作量。
顶尖工程能力： 在 SWE-Pro 基准测试中正确率达 56.22%，在 VIBE-Pro 和 Terminal Bench 2 等测试中表现接近国际顶级模型，具备端到端项目交付和线上故障快速排查能力。
多智能体协作： 原生支持 Agent Teams，能稳定锚定身份并进行复杂协同决策。
专业办公与交互： 显著提升对 Word、Excel、PPT 的复杂编辑能力，并支持高情商的互动娱乐场景。

2026年3月18日 MiniMax

推理模型

文本生成

编码模型

1954K

Grok 4.20 是 xAI 推出的一款大语言模型，主打高可靠性与低幻觉率。该版本采用了创新的多智能体协作架构（Multi-agent system），内置了 Grok（协调者）、Harper（研究专家）、Benjamin（逻辑/编程专家）和 Lucas（创意达人）四个智能体。在处理复杂查询时，这些智能体会在内部进行讨论和验证，从而大幅降低错误率，提升回答质量。

技术上，Grok 4.20 支持高达200万 token的超长上下文窗口，并具备强大的实时搜索能力。根据第三方评测，其“非幻觉率”达到了 78%，在 Search Arena 中排名第一。该模型不仅继承了 Grok 系列标志性的机智风格，更在事实准确性和逻辑推理上实现了显著提升。

2026年3月13日 xAI

文本生成

语言模型

推理模型

编码模型

977K

Claude Opus 4.6 是 Anthropic 于 2026 年 2 月发布的旗舰级大语言模型，代表了当前智能体时代的顶尖水平。该模型在编程、知识工作、搜索和推理等核心场景实现了显著突破，多项基准测试成绩超越前代及行业竞品（如 GPT-5.2）。

核心特性：

1M Token 超大上下文： 首次在 Opus 级别模型中引入 100 万 token 的上下文窗口，极大改善了“上下文衰减”问题，能精准定位分散在长文档中的关键信息。
自适应思考（Adaptive Thinking）： 模型可根据任务复杂度自动判断是否需要深度推理，并提供了 low、medium、high、max 四档 effort 参数供开发者精细控制。
128K 输出容量： 最大输出长度提升至 128K token，支持生成长篇技术文档和复杂代码，无需拆分请求。
上下文压缩： 当对话接近窗口上限时自动摘要并替换旧内容，保障长对话和 Agent 任务的流畅性。

此外，Opus 4.6 引入了 Agent Teams 功能，支持多个 Claude 实例并行协作，无需人类实时监督即可完成复杂任务。

2026年2月6日 Anthropic

多模态模型

推理模型

编码模型

977K

GPT-5.4是OpenAI于2026年3月发布的旗舰级大语言模型，标志着AI从“聊天工具”向“数字员工”的跨越式进化。该模型整合了GPT-5.3-Codex的编程能力、高级推理能力以及原生的计算机操作能力（Computer Use）。GPT-5.4具备极强的视觉感知能力，能够像人类一样通过识别屏幕元素、模拟鼠标键盘操作来直接控制电脑，在OSWorld评测中成功率高达75%，超越了人类平均水平。此外，它支持高达100万至200万Token的超长上下文窗口，使其能够处理整本书籍、复杂代码库或长期的业务流程。模型还引入了“极限推理模式”和“思维草稿”功能，允许用户实时介入并修正AI的思考路径，显著降低了幻觉率，提高了在复杂任务中的准确性和可靠性。

2026年3月6日 OpenAI

多模态模型

语言模型

文本生成

推理模型

图像理解

256K

Qwen3.5-397B-A17B 是阿里云发布的 Qwen3.5 系列开源旗舰大语言模型。该模型拥有 3970 亿总参数，但采用创新的混合架构（Gated DeltaNet 与稀疏混合专家 MoE 相结合），每次推理仅激活 170 亿参数，大幅提升了推理效率并降低了成本。

在性能方面，Qwen3.5-397B-A17B 在 MMLU-Pro、GPQA、IFBench 等多项权威评测中表现优异，性能超越万亿参数的 Qwen3-Max 以及 GPT-5.2、Claude 4.5 等国际顶尖模型。此外，该模型是原生多模态模型，支持 201 种语言与方言，具备强大的长上下文理解、代码生成及智能体能力。

2026年2月16日阿里云

图像生成

图像处理

多模态模型

Nano Banana 2是谷歌于2026年2月27日发布的全新图像生成模型，基于Gemini 3.1 Flash Image架构。该模型成功打破了图像生成领域“速度与画质不可兼得”的矛盾，将Pro级的画质、推理能力和世界知识融入Flash级的生成速度中。

在技术上，Nano Banana 2支持最高4K分辨率的图像生成，具备强大的文本渲染能力（特别是对中文书法的优化），并能保持多主体的一致性（最多5个角色和14个对象）。它集成了实时网络搜索功能，能够利用真实世界知识生成信息图表和复杂场景。

性能方面，该模型在多项基准测试中超越了GPT-Image 1.5、Seedream 5.0 Lite等竞品，甚至在某些配置下超越了前代Nano Banana Pro。同时，谷歌大幅下调了其调用价格，旨在推动AI生图技术的普惠化。

2026年2月27日谷歌

多模态模型

语言模型

推理模型

128K

Seed 2.0 Pro是字节跳动历时21个月打磨的重磅大模型，代表了豆包大模型系列的首次跨代升级。该模型在多模态理解、复杂推理和Agent能力方面实现了显著突破，采用深度推理机制和系统性优化架构，在各类视觉理解任务上达到业界顶尖水平。

模型具备强大的视觉推理、感知能力、空间推理与长上下文理解能力，在数学与视觉推理基准测试中表现卓越，能够处理高度复杂的逻辑问题和专业领域任务。

2026年2月15日字节跳动

推理模型

多模态模型

编码模型

977K

Gemini 3.1 Pro是谷歌DeepMind推出的新一代旗舰大模型，在Gemini 3系列基础上进行了重大升级。该模型在核心推理能力上实现了显著突破，专为处理科学、研究和工程领域的复杂任务而设计。通过改进模型处理"思考"token和长期任务的方式，3.1 Pro在多项严格基准测试中表现出色，特别是在ARC-AGI-2基准测试中取得了77.1%的成绩，推理性能达到上一代Gemini 3 Pro的两倍以上。

该模型采用先进的Transformer架构，支持1M上下文长度，知识截止日期为2025年1月。在多模态理解、代码开发、长上下文处理等多个维度均有显著提升，代表了当前大模型技术的前沿水平。

2026年2月20日 Google

语言模型

推理模型

多模态模型

编码模型

977K

Claude Sonnet 4.6是Anthropic于2026年2月发布的最新一代中型大语言模型，在编程、计算机操作、长上下文推理、智能体规划、知识工作和设计等核心能力上实现全面升级。该模型采用先进的transformer架构，在多项基准测试中性能接近旗舰Opus级别，但成本仅为后者的五分之一，实现了卓越的性价比。模型具备100万token超大上下文窗口，能够有效处理复杂任务和长期战略规划，代表了当前AI模型在实用性和经济性方面的重大突破。

2026年2月18日 Anthropic

多模态模型

语言模型

文本生成

图像理解

视频理解

编码模型

250K

Qwen3.5是阿里巴巴通义千问团队推出的新一代开源大语言模型，采用了创新的混合架构设计，结合线性注意力机制与稀疏混合专家（MoE）技术，实现了3970亿总参数但仅激活170亿参数的极致效率。

该模型在多项基准测试中表现优异，性能超越万亿参数的Qwen3-Max模型，同时部署显存占用降低60%，推理吞吐量最高提升19倍。作为原生多模态模型，Qwen3.5支持文本、图像、视频、音频等多种模态的联合推理，具备强大的跨模态理解能力。

2026年2月16日阿里巴巴

图像生成

多模态模型

Seedream 5.0 Lite是字节跳动火山引擎推出的智能图像创作模型，作为豆包大模型家族的重要成员，代表了多模态AI技术的最新进展。该模型在跨模态理解与推理、精准指令遵循、联网实时检索三大核心能力上实现了显著突破。

技术特点包括：首次引入实时检索增强能力，可通过联网获取最新知识和资讯；搭载CoT（思维链）推理能力，实现从指令识别到语义理解的跨越；内置生物科学、建筑设计等垂直行业专业知识库，支持复杂逻辑推演与多步推理。

作为通向统一多模态模型的探索，Seedream 5.0 Lite能够像人类设计师一样理解用户意图，识别画面规律，并将世界知识应用于图像与文本创作中。

2026年2月13日字节跳动

1 ……2 3 4 ……48

OpenAI GPT-5.6模型曝下月发布：AI上下文150万tokens 国家数据局召开词元经济座谈会学习时报：词元经济的产业逻辑与演进方向 450亿美元！国家大基金拟领投DeepSeek首轮融资，中... 刚刚，DeepSeek V4 双版本正式上线！梁文锋内部透露：DeepSeek V4将于4月下旬发布五款头部AI平台半数医学建议存在误导性，研究称AI... 狂揽4万星!换掉OpenClaw太爽了，5美元就能养个AI打... 阿里巴巴新设集团技术委员会：升级通义大模型事业... DeepSeek 上线专家模式

企业数智化服务平台

www.QiShuZhi.com

微信

小红书

企数智，企业数智化服务平台

津ICP备14003781号-9

回顶部

资讯

关于我们

内容服务

产品服务

联系我们

人工导购

咨询服务