「盘中宝」巨头将首次发布这类模型等最新产品，该技术具备商用潜力，生产力工具蓄势待发，这家公司相关技术能力已有落地应用

导读财联社资讯获悉，9月24日，“2024 火山引擎AI创新巡展”将落地深圳。本次巡展中，火山引擎将公布豆包大模型的最新增长情况，首次发布视频...

财联社资讯获悉，9月24日，“2024 火山引擎AI创新巡展”将落地深圳。本次巡展中，火山引擎将公布豆包大模型的最新增长情况，首次发布视频生成模型等最新产品，带来更多模型家族的能力升级，以及火山方舟、扣子专业版、HiAgent 平台、AI全栈云等产品的最新进展。

一、视频大模型迎来Sora时刻，生产力工具蓄势待发

国产大模型快速更新迭代，过去一个月时间内，国内主流大模型基本上都更新了模型版本或发布新应用产品，各大模型厂商持续打磨产品，推出了针对效率办公、创意创作、智能搜索、实时互动等场景的功能，大模型技术加速融入用户的生产和生活。视频生成是当前大模型在多模态方向上的前沿应用，豆包大模型推出视频生成模型，将进一步丰富大模型应用场景，为内容创作、娱乐、广告营销等多个行业带来全新的增长机遇。

浙商证券表示，中文语境下，国内模型文生视频表现优于国外。根据SuperCLUE的测评结果，在中文环境下，国内外多模态能力总体水平差距不大，海外模型在基础认知能力方面领先，国内模型应用能力有优势，国内文生视频模型整体表现好于国外。德邦证券指出，视频大模型迎来Sora时刻，生产力工具蓄势待发。视频大模型具备商用潜力，下游应用正在储能。未来随着用户习惯的培育以及算力基础设施的完善，视频大模型的或者办公、广告、电影、游戏等多领域具有广阔的前景。

二、相关上市公司：万兴科技、捷成股份、当虹科技

万兴科技音视频多媒体大模型天幕，聚焦数字创意垂类创作场景，以音视频生成式AI技术为基础，涵盖文生视频、文生3D视频、视频AI配乐、数字人播报等近百项音视频原子能力，同时支持全球不同语言，致力于为全球用户提供音视频创作完整解决方案，相关能力已在filmora、播爆等产品上落地应用。

捷成股份研发的AIGC一键成片系统ChatPV，基于多模态大模型能力，可将视频片段、图片、音频等素材，根据提示词自动生成视频脚本、广告词、分镜脚本等，并根据视频脚本和分镜脚本自动摘取相关素材生成完整的视频，根据创作者要求一键生成高质量视频，极大提升了视频创作者的工作效率和内容生成效果。

当虹科技多模态视听大模型整合了视频、音频、图像、文本和三维模型等跨模态内容的推理与生成能力，包括文本生成、文生视频、图生视频等生成式算法。

来源：财联社

标签：

猜你喜欢

最新文章