全模态模型
多模态模型
| 版本名称: | DeepSeek-Omni |
| 所属模型: | DeepSeek |
| 所属公司: | 杭州深度求索人工智能基础技术研究有限公司 |
| 发布时间: | |
| 最新版本: |
| 参数规模: | 未知 |
| 上下文长度: | 未知 |
| 支持语言: | 中文,英文 |
| 授权协议: | 未知 |
| 体验方式: | 暂无 |
DeepSeek-Omni是深度求索推出的全模态大模型,其相关技术理念启发了行业内全模态模型与RLVR(可验证奖励强化学习)技术的结合探索。RLVR是区别于传统RLHF的新型训练范式,核心是利用验证函数直接评估模型输出,无需单独的奖励模型,能让模型输出与任务内在正确性标准保持一致,同时结合GRPO强化学习方法,可简化训练流程,提升模型对高质量输出的区分能力。
该类技术路径推动了全模态模型在推理能力、理解能力、泛化能力上的提升,不仅在分布内数据任务上表现优异,在分布外场景也具备更强鲁棒性,还能清晰解释不同模态在任务处理中发挥的作用,为可解释性多模态AI的发展提供了重要的技术参考,是下一代AI技术发展的重要探索方向。
关注公众号
立刻获取最新消息及人工咨询