GLM-5V-Turbo - 企数智|企业级大模型服务平台

多模态模型

编码模型

语言模型

图像理解

200K

GLM-5V-Turbo是智谱于2026年4月2日发布的全球首个原生多模态Coding基座模型，标志着AI编程正式进入“视觉原生”时代。

该模型从预训练阶段就深度融合视觉与文本能力，打破了传统纯文本Coding模型的输入限制，在引入视觉理解能力的同时，纯文本编程与推理能力保持了同等水准，在多模态Coding、Agent任务、纯文本Coding等核心评测基准上均取得领先表现。

作为多模态编程领域的突破性产品，GLM-5V-Turbo为AI Agent的实用化落地提供了关键能力支撑，未来将推动视觉编程、多模态智能体等领域的快速发展。

视觉编程场景：可直接理解设计稿、网页截图、UI原型等视觉信息，一键生成可运行的前端、后端代码，实现“所见即所得”的编程体验，大幅提升前端开发、UI还原的工作效率。
多模态Agent开发：深度适配龙虾Agent等智能体场景，为智能体赋予视觉感知能力，可应用于GUI界面操控、自动化办公、智能运维等需要理解屏幕视觉信息的复杂任务场景。
多模态内容处理：支持理解图片、视频、文档版面等多模态输入，可应用于多模态检索与问答、视觉探查、图表数据分析、文档结构化解析等场景。
编程辅助工具开发

以上信息来自企数智AI小编，如有错误可反馈给我们

收藏微博微信

41

热度

相关模型
GLM-4.7-Flash GLM-4.7 GLM-4.6 GLM-4.6V glm-4v-9b glm-Z1-rumination-32b-0414 glm-Z1-32b-0414 GLM-ASR-Nano glm-4-32b-0414 GLM-5.1

简介