美图大模型升级视频生成能力,逐步落地美图秀秀/Wink/MOKI等产品
已支持1分钟、帧率24FPS、分辨率1080P的超长视频生成
9月23日,美图公司宣布美图奇想大模型(MiracleVision)视频生成能力完成全面升级,在实现生成能力、生成效率以及模型性能的三重进阶基础上,结合美图在计算机视觉领域的多项自研技术优势,视频生成时长与画质、流畅性、真实性及可信度等方面提升显著。
目前,美图奇想大模型(MiracleVision)的单次文生视频时长、单次图生视频时长均达5秒,已支持1分钟、帧率24FPS、分辨率1080P的超长视频生成,可以任意视频尺寸输出。
基于美图公司在影像领域的长期深厚积累,全新升级的美图奇想大模型(MiracleVision)结合对特征的大范围提取,实现了在艺术风格、细腻画风、细节把控之间的高度平衡,并针对人像、动漫、国潮、商业设计等领域进行优化,具备强大的风格泛化力与兼具艺术审美的视觉表现力。此外,在复杂3D时空精准重构基础上,视频生成能够重现真实物理规律,支持大幅度流畅运动。
美图奇想大模型(MiracleVision)于2023年6月上线,2024年1月通过国家备案,2024年6月迭代至V5版本并升级为Diffusion与Transformer模型结合的全新技术路线,采用DiT视频生成架构。
在新的技术路线下,相较业界先头兵,美图奇想大模型(MiracleVision)选择优先攻克更具挑战性的问题。此次升级,美图奇想大模型(MiracleVision)在技术层面上解决了主体一致性、运动连贯性、物理逻辑合理性等视频生成能力落地的核心问题。
目前,美图奇想大模型(MiracleVision)全新视频生成能力已应用于美图旗下部分产品,凭借高度可复用的模块化能力,升级优势将逐步覆盖美图秀秀、美颜相机、Wink、开拍、美图设计室、WHEE、MOKI等产品,进一步深化美图在视频工具赛道的应用深度与广度。
作为美图AI产品生态的基石,美图奇想大模型(MiracleVision)坚持以用户需求场景驱动技术研发模式,追求用户体验和技术进步的平衡。本次升级完成后,美图奇想大模型的架构进一步完善,从AI图像、AI视频、AI设计三个维度,全方位支持美图AI产品生态的丰富与进步,切实提升用户的体验与效率,深化美图公司在电商、广告、游戏、动漫、影视领域的应用实践。
- 100+大模型综测结果出炉!智源发布FlagEval“百模”评测结果,覆盖文本语音图片视频多种模态2024-12-19
- 新奥程路:AI×能源已到“奇点变革”前夜,仿真大模型是关键|MEET 20252024-12-17
- 全球首个全模态理解开源端模型:长语音自动总结,图文音啥都会!300%推理速度领先,来自无问芯穹2024-12-16
- AI模仿人类看漫画,视频大模型时序定位能力新SOTA2024-11-23