(以下内容从爱建证券《电子行业跟踪报告:字节跳动发布Seedance 2.0》研报附件原文摘录)
投资要点:
事件:2026年2月12日,字节跳动正式发布了新一代音视频创作模型Seedance2.0,该模型采用统一的多模态音视频联合生成架构,支持文字、图片、音频、视频四大模态输入,集成了当前业界领先的多模态内容参考与逻辑理解能力。
Seedance系列模型是字节跳动在多模态音视频生成领域的核心战略布局,技术迭代脉络清晰。2024年9月,字节跳动旗下火山引擎在深圳AI创新巡展上,正式发布PixelDance、Seaweed两款AI视频生成大模型。2025年5月,字节跳动完成PixelDance与Seaweed两大模型的深度技术融合,推出视频模型Seedance1.0lite。2025年6月公司正式发布Seedance1.0系列模型。同年12月,迭代至Seedance1.5Pro版本,采用原生音视频联合生成架构,显著提升复杂场景与专业镜头的创作能力。2026年2月,Seedance2.0全量发布,进一步强化了公司在多模态内容生成领域的技术壁垒与商业化落地能力。
Seedance2.0采用统一的多模态音视频联合生成架构,支持文本、图像、音频、视频多模态输入,具备业内领先的内容理解、参考与编辑能力。1)Seedance2.0凭借出色的运动稳定性和物理还原能力,多主体交互及复杂运动场景下的视频生成可用率达到业界SOTA(StateoftheArt)水平。2)Seedance2.0指令遵循与一致性表现全面提升,支持混合模态输入,用户可同时输入最多9张图片、3段视频和3段音频,有效拓展创作素材边界。3)Seedance2.0支持稳定可控的视频延长与编辑功能,显著降低创作门槛。4)该模型可输出15秒高质量多镜头音视频内容,并配备双声道音频能力,实现高度拟真的视听效果。相较于Sora2Pro、Veo3.1、Kling系列等主流产品,Seedance2.0在运动逻辑、指令遵循、画面质感、视听一致性及长脚本理解上均具备明显优势,模型对参考内容的还原精度、编辑任务响应完整性,以及主体形象、特效风格、剧情叙事的一致性表现突出。
当前全球AI音视频大模型行业已进入技术快速迭代、商业化加速落地的爆发期,海内外头部厂商密集发布旗舰产品,形成百花齐放的多元竞争格局。海外市场以OpenAISora系列、GoogleDeepMindVeo3.1为两大核心标杆。其中Sora系列凭借DiT架构实现行业技术破局,迭代版本补齐原生音画同步、物理模拟精度核心短板,完成产品力全面跃升。Veo3.1则以免费普惠、极速生成的核心优势,在易用性与商业化适配性上实现突破。国内市场本土模型加速崛起,2026年2月全新上线的快手可灵Kling3.0以原生音画一体化为核心迭代方向,实现音频生成能力全维度升级,与字节跳动Seedance2.0形成国内市场双强领跑的格局,共同构建起本土模型差异化竞争的行业生态。
投资建议:字节跳动发布了新一代旗舰AI音视频大模型Seedance2.0,实现原生音画一体化多模态生成领域的关键技术突破,行业已进入技术迭代与商业化落地加速期。我们预计多模态大模型的持续升级将会带动数据处理规模的加速提升,这将进一步加强对上游AI基建的需求。建议关注AI音视频生成应用放量带动下的上游AI基建核心赛道投资机会,包括光模块,存储,PCB等重点领域。
风险提示:1)技术迭代不及预期风险;2)行业竞争加剧风险;3)政策监管合规风险。
