Banner 1
Banner 1
融合模态模型
图文融合登顶,兼备深度推理
模型介绍
日日新融合模态大模型实现图片、文本、视频能力的原生统一,突破传统多模态分立局限,引领AI技术革新。在OpenCompass和SuperCLUE评测中斩获双冠军,具备深度推理与跨模态理解能力,适用于自动驾驶、办公教育等场景。支持多种模型规格,在通用对话、视觉任务中表现卓越,并创新实现“慢思考”深度分析,推动多模态AI迈向更高智能。
规格介绍

SenseNova V6 Pro
旗舰模型
SenseNova V6 Reasoner
慢思考推理模型
SenseNova V6 Turbo
高性价比模型


32k上下文长度

支持图片、文字输入,支持文本输出

数百亿参数,数十亿以上激活,性能顶尖

可部署于云上或者重型⼀体机


32k 上下文长度

支持图文输入,支持文本、思维链和答案输出

-

兼顾视觉、语言深度推理,实现慢思考和深度推理


32k上下文长度

支持图片、文字、视频输入,支持文本输出

 数十亿参数,性价比高,适合交互应用 

可部署在云上或者进⾏⾼性价⽐私有化部署


输入3元/百万token
输出9元/百万token

输入4元/百万token
输出16元/百万token

输入1.5元/百万token
输出4.5元/百万token


免费发放千万tokens体验额度,4月10日至17日融合模态模型服务限时优惠50%!


模型亮点
  • 领先多模能力
  • 图文理解
  • 深度推理
  • 函数调用
  • 视频理解
  • 同时支持语言大模型chat能力、多模态模型VQA问答能力,且在多项测评中获得双冠军
  • 支持图片、文本、视频的多模输入,融合多模信号进行推理
  • 创新支持基于视觉、文本的慢思考和深度推理,呈现完整的思维链过程,并获得最终推理答案
  • 支持网络搜索、文生图、文档上传等一系列的原始函数调用,根据客户需求可自行定义工具调用
  • 支持长视频、短视频输入,支持视频时间帧提取,支持提示词控制视频理解
模型优势

在面向多模能力和语言能力领域的多个学术评测和外部榜单的测评中,日日新融合模态大模型在多模基础能力、语言基础能力等核心维度全面领先,文理兼修,在多项测评中多次位列国内外第一梯队水平

V6 Pro-多模态任务


SenseNova V6 ProGPT-4.5Gemini 2.0 Pro
MMMU72.5672.10

72.60

MMBench (v1.1)89.4083.4083.00
MMStar75.3369.3068.50
HallusionBench63.8660.0049.80
AI2D88.6787.2084.80
OCRBench92.1084.5086.30
MathVista79.4070.5070.40
MMVet85.9275.30    -


V6 Reasoner-多模态推理


SenseNova V6ROpenAI o1GPT-4.5*
MathVista75.6071.5070.50
MathVision55.3960.30    -
DynaMath48.1040.90    -
LogicVista58.6161.10    -


V6 Pro-纯文本任务


SenseNova V6 ProGPT-4.5Gemini 2.0 ProDeepSeek V3SenseNova V5.5
MMLU88.6889.60    -88.5084.44
MMLU-Pro78.6678.6379.1075.9064.13
Global MMLU (Lite)83.8887.3786.3060.6365.38
BigBench Hard94.9894.45    -87.5088.74
DROP92.2890.30    -91.6088.79
LiveCodeBench (v5)58.8665.2336.0037.6028.26
IF-Eval81.1588.67    -86.1070.76


V6 Reasoner-纯文本推理



SenseNova V6RDeepSeek R1OpenAI o1GPT-4.5*
MATH-50097.4097.3097.0085.20
GPQA (diamond)69.3271.5078.0066.41
AIME 202478.3379.883.3038.75
AIME 202563.3363.3374.0726.35

多模态能力横评表
服务优势
  • 灵活稳定的API模型服务

    通过云服务API的方式提供模型的调用服务,满足多样业务场景需求

  • 多模态理解和深度推理

    支持高质量的图片、文字、视频输入,具备多模态理解能力,同时具备基于多模态理解的慢思考和深度推理能力,胜任通用和复杂的多模态交互场景。

  • 模型推理服务

    通过API产品,企业可快速构建自己专属的大模型应用,服务稳定可靠

    基于商汤SenseCore大装置强大的AI基础设施,支持专有云部署,满足企业数据安全方面的需求

  • 模型落地支持

    模型产品团队贴身服务提供提示词工程及工作流调优支持,帮助企业快速完成联调上线正式服务。

用AI大模型,找商汤日日新
合作咨询及邀请码申请,请邮件至sensenova_support@sensetime.com