Banner 1
Banner 1
实时交互融合模态模型
多模联动,智启畅聊
模型介绍

「SenseNova V6.5 Omni」是商汤“日日新”融合大模型的交互版本,拥有强大的实时交互、视觉识别、记忆思考、持续对话和复杂推理等能力,进一步强化AI的陪伴感、沉浸感,让每次互动更加智能与贴心。

同时,通过整合大装置基础设施能力,商汤还为「SenseNova V6.5 Omni」提供了配套的Realtime API的服务优化,实现与RTC网络的深度结合。用户在任何环境下都能享受稳定、实时、流畅、无延迟的音视频对话服务。

模型亮点
  • 实时多模交互
  • 超长场景记忆
  • 灵动类人交互
  • 支持音视频连续理解,实现真人级交互,精准响应语音、动作指令,延迟<2秒,对话流畅如真人
  • 32K长上下文支持,精确记忆每轮对话;超5分钟多模态音视频记忆,细节问题随时回溯,实现深度连续交互
  • 秒级响应多模态交互,精准共情千人千面,真人级对话革新情感陪伴与智能服务
模型优势

「SenseNova V6.5 Omni」在 SuperCLUE 和 OpenCompass 两大权威2024年12月的评测中拔得头筹,展现出卓越的自然语言处理能力与多模态交互能力。能够有效满足用户对图像、视频、语音、文本等多源信息的综合处理与识别需求,在多场景应用优势显著。

音视频交互能力



V6.5-OmniGemini 2.5 FlashGPT-4o
平均分77.9776.0475.4
MMBench V1.186.9685.5986
MMStar71.6773.870.2
MMMU69.6769.7872.9
MathVista72.477.671.6
Hallusion Bench6263.1557
AI2D87.9287.9286.3
OCR Bench89.986.182.2
MMVet83.2166.1576.9

服务优势
  • 实时多模态交互

    支持高质量的实时多模态交互能力,提供真人般自然贴心的交互体验,无论是日常使用还是复杂业务交互都能胜任。

  • 灵活稳定的API模型服务

    通过云服务 API 的方式提供「SenseNova V6.5 Omni」的调用服务,满足多样业务场景需求。

    RTC 技术全程保障通信质量,无论网络环境如何复杂,都能确保数据传输低延迟、高可靠,让模型调用流畅无阻。

  • 多领域强大能力

    面向机器人、智能眼镜、手机移动应用、教育教学、文旅等场景,提供卓越的多模态交互能力。

    提供扩展性的关键能力,如结构化输出、主动感知、知识库运用、动作调用等能力。

客户案例
归墟机器人
归墟机器人
基于「SenseNova V6.5 Omni」,助力归墟机器人研发新一代具有情感陪伴和心理筛查疗愈功能的具身智能类人型机器人飞燕,并为其赋予强大的全景视界感知能力,让机器人看清并理解这个物理世界,并以更自然、更真实、更全能的方式与人交互。实现智能健康和心智陪伴领域实现人机交互体验的突破。
用AI大模型,找商汤日日新
合作咨询及邀请码申请,请邮件至sensenova_support@sensetime.com