
记者 王永娟
7月5日发布了“日日新5o”———国内首个所见即所得模型。 它通过整合跨模态信息,基于声音、文本、图像和视频等多种形式, 带来一种全新的AI交互模式,即实时的流式多模态交互。 交互体验对标GPT-4o。
作为2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2024)战略合作伙伴, 商汤科技召开了“大爱无疆·向新力”人工智能论坛。 现场,近千人共同见证这一创新交互模式———
能听,会看,还会找话题,和“日日新5o”的交互就如同和真人对话一般。这种交互模式特别适用于实时对话和语音识别等应用,其多任务适应性强,能够在同一模型中自然处理多种任务,且根据不同上下文自适应调整行为和输出。
商汤科技表示,能够实现对标GPT-4o的交互体验,正是源于“日日新5.5”基础模型能力的全面提升。 7月5日,商汤科技正式发布“日日新5.5”大模型体系,在今年4月商汤科技发布的“日日新5.0”大模型基础上又迎来多项升级,综合性能较“日日新5.0”平均提升30%,数学推理、英文能力和指令跟随等能力明显增强,交互效果和多项核心指标对标GPT-4o。
据了解,“日日新5.5”采用混合端云协同专家架构,最大限度发挥云边端协同,降低推理成本,模型训练基于超过10TB tokens 高质量训练数据,包括大量合成的思维链数据,提升推理思维能力。
为了让更多企业用户低门槛接入并使用“日日新”大模型体系的强大能力, 商汤于近期推出了“大模型0元Go”计划。凡是“日日新”的新注册用户,都可获得涉及调用、迁徙、训练等多项免费服务大礼包。同时, 商汤还将赠送5000万tokens包,并且派出专属搬家顾问,帮助OpenAI用户实现零服务成本迁移。