GLM-5V-Turbo
多模态模型
编码模型
语言模型
图像理解
200K
版本名称:GLM-5V-Turbo
所属模型:GLM
所属公司:智谱
发布时间:2026年4月2日
最新版本:GLM-5V-Turbo
参数规模:未知
上下文长度:200K
支持语言:中文,英文
授权协议:未知
体验方式:https://maas.aminer.cn/

简介

GLM-5V-Turbo是智谱于2026年4月2日发布的全球首个原生多模态Coding基座模型,标志着AI编程正式进入“视觉原生”时代。

该模型从预训练阶段就深度融合视觉与文本能力,打破了传统纯文本Coding模型的输入限制,在引入视觉理解能力的同时,纯文本编程与推理能力保持了同等水准,在多模态Coding、Agent任务、纯文本Coding等核心评测基准上均取得领先表现。

作为多模态编程领域的突破性产品,GLM-5V-Turbo为AI Agent的实用化落地提供了关键能力支撑,未来将推动视觉编程、多模态智能体等领域的快速发展。

应用

  • 视觉编程场景:可直接理解设计稿、网页截图、UI原型等视觉信息,一键生成可运行的前端、后端代码,实现“所见即所得”的编程体验,大幅提升前端开发、UI还原的工作效率。
  • 多模态Agent开发:深度适配龙虾Agent等智能体场景,为智能体赋予视觉感知能力,可应用于GUI界面操控、自动化办公、智能运维等需要理解屏幕视觉信息的复杂任务场景。
  • 多模态内容处理:支持理解图片、视频、文档版面等多模态输入,可应用于多模态检索与问答、视觉探查、图表数据分析、文档结构化解析等场景。
  • 编程辅助工具开发
以上信息来自企数智AI小编,如有错误可反馈给我们
人工导购
咨询服务