「SenseNova V6 Omni」是商汤“日日新”融合大模型的交互版本,拥有强大的实时交互、视觉识别、记忆思考、持续对话和复杂推理等能力,进一步强化AI的陪伴感、沉浸感,让每次互动更加智能与贴心。
同时,通过整合大装置基础设施能力,商汤还为「SenseNova V6 Omni」提供了配套的Realtime API的服务优化,实现与RTC网络的深度结合。用户在任何环境下都能享受稳定、实时、流畅、无延迟的音视频对话服务。
排名 | 产品名称 | 机构 | 总分 | 基础认知能力 | 视觉推理能力 | 记忆能力 | 语音交互能力 | 应用场景 |
- | ChatGPT (实时音视频) | OpenAI | 69.05 | 70.5 | 51.34 | 79.67 | 81.05 | 62.67 |
1 | SenseNova V6 Omni | 商汤科技 | 68.59 | 77 | 46.34 | 77.67 | 77.95 | 64 |
2 | 讯飞星火 (实时音视频) | 科大讯飞 | 66.83 | 76 | 46.35 | 65.34 | 75.78 | 70.68 |
3 | 智谱清言 (实时音视频) | 清华&智谱AI | 55.32 | 73 | 33.67 | 49.32 | 66.26 | 54.35 |
3 | 通义 (实时音视频) | 阿里巴巴 | 55.25 | 57.5 | 33.68 | 68.99 | 65.43 | 50.66 |
支持高质量的实时多模态交互能力,提供真人般自然贴心的交互体验,无论是日常使用还是复杂业务交互都能胜任。
通过云服务 API 的方式提供「SenseNova V6 Omni」的调用服务,满足多样业务场景需求。
RTC 技术全程保障通信质量,无论网络环境如何复杂,都能确保数据传输低延迟、高可靠,让模型调用流畅无阻。
面向机器人、智能眼镜、手机移动应用、教育教学、文旅等场景,提供卓越的多模态交互能力。
提供扩展性的关键能力,如结构化输出、主动感知、知识库运用、动作调用等能力。