「SenseNova V6.5 Omni」是商汤“日日新”融合大模型的交互版本,拥有强大的实时交互、视觉识别、记忆思考、持续对话和复杂推理等能力,进一步强化AI的陪伴感、沉浸感,让每次互动更加智能与贴心。
同时,通过整合大装置基础设施能力,商汤还为「SenseNova V6.5 Omni」提供了配套的Realtime API的服务优化,实现与RTC网络的深度结合。用户在任何环境下都能享受稳定、实时、流畅、无延迟的音视频对话服务。
V6.5-Omni | Gemini 2.5 Flash | GPT-4o | |
平均分 | 77.97 | 76.04 | 75.4 |
MMBench V1.1 | 86.96 | 85.59 | 86 |
MMStar | 71.67 | 73.8 | 70.2 |
MMMU | 69.67 | 69.78 | 72.9 |
MathVista | 72.4 | 77.6 | 71.6 |
Hallusion Bench | 62 | 63.15 | 57 |
AI2D | 87.92 | 87.92 | 86.3 |
OCR Bench | 89.9 | 86.1 | 82.2 |
MMVet | 83.21 | 66.15 | 76.9 |
支持高质量的实时多模态交互能力,提供真人般自然贴心的交互体验,无论是日常使用还是复杂业务交互都能胜任。
通过云服务 API 的方式提供「SenseNova V6.5 Omni」的调用服务,满足多样业务场景需求。
RTC 技术全程保障通信质量,无论网络环境如何复杂,都能确保数据传输低延迟、高可靠,让模型调用流畅无阻。
面向机器人、智能眼镜、手机移动应用、教育教学、文旅等场景,提供卓越的多模态交互能力。
提供扩展性的关键能力,如结构化输出、主动感知、知识库运用、动作调用等能力。