美图大模型升级视频生成能力,逐步落地美图秀秀/Wink/MOKI等产品
已支持1分钟、帧率24FPS、分辨率1080P的超长视频生成
9月23日,美图公司宣布美图奇想大模型(MiracleVision)视频生成能力完成全面升级,在实现生成能力、生成效率以及模型性能的三重进阶基础上,结合美图在计算机视觉领域的多项自研技术优势,视频生成时长与画质、流畅性、真实性及可信度等方面提升显著。
目前,美图奇想大模型(MiracleVision)的单次文生视频时长、单次图生视频时长均达5秒,已支持1分钟、帧率24FPS、分辨率1080P的超长视频生成,可以任意视频尺寸输出。
基于美图公司在影像领域的长期深厚积累,全新升级的美图奇想大模型(MiracleVision)结合对特征的大范围提取,实现了在艺术风格、细腻画风、细节把控之间的高度平衡,并针对人像、动漫、国潮、商业设计等领域进行优化,具备强大的风格泛化力与兼具艺术审美的视觉表现力。此外,在复杂3D时空精准重构基础上,视频生成能够重现真实物理规律,支持大幅度流畅运动。
美图奇想大模型(MiracleVision)于2023年6月上线,2024年1月通过国家备案,2024年6月迭代至V5版本并升级为Diffusion与Transformer模型结合的全新技术路线,采用DiT视频生成架构。
在新的技术路线下,相较业界先头兵,美图奇想大模型(MiracleVision)选择优先攻克更具挑战性的问题。此次升级,美图奇想大模型(MiracleVision)在技术层面上解决了主体一致性、运动连贯性、物理逻辑合理性等视频生成能力落地的核心问题。
目前,美图奇想大模型(MiracleVision)全新视频生成能力已应用于美图旗下部分产品,凭借高度可复用的模块化能力,升级优势将逐步覆盖美图秀秀、美颜相机、Wink、开拍、美图设计室、WHEE、MOKI等产品,进一步深化美图在视频工具赛道的应用深度与广度。
作为美图AI产品生态的基石,美图奇想大模型(MiracleVision)坚持以用户需求场景驱动技术研发模式,追求用户体验和技术进步的平衡。本次升级完成后,美图奇想大模型的架构进一步完善,从AI图像、AI视频、AI设计三个维度,全方位支持美图AI产品生态的丰富与进步,切实提升用户的体验与效率,深化美图公司在电商、广告、游戏、动漫、影视领域的应用实践。
- 大模型玩你画我猜:Claude6局3胜,GPT-4o表现迷惑2024-11-03
- AI动漫头部创企招聘AI算法实习生/工程师!创始团队来自B站上交大2024-08-21
- 香港科技大学张黔团队招聘博士生/研究助理2024-07-28
- AI Agent当牛做马,办公自动化带来超级生产力|对话Laplace2024-07-03