投资者包括Spark Capital(领投)、Lightspeed和Greycrof等著名机构。

Pika回应量子位,本轮投后最新估值将来到4.7亿美元(约34亿人民币)。

这家由两位斯坦福华人博士创立的公司曾在去年底推出了产品1.0并宣布融资5500万美元。

郭文景Pika再融5.8亿,最新估值约34亿,已自研AI视频生成基础模型

而后半年,Pika从最初的4人团队扩展至13人,并陆续上线了几项新功能,还在今年4月入选福布斯AI50强榜单。

Pika所在的AI视频生成赛道,今年在技术投融资领域均迎来双重爆发。

技术方面,OpenAI发布的Sora为行业树立了新的标杆,将时长一举拉到60s,而后开源社区发布了能生成2分钟视频的StreamingT2V,紧接着国内发布了对标Sora能生成16s、分辨率高达1080P的Vidu,再然后谷歌推出同样对标Sora能生成1分钟视频的Veo。

投资方面,继人们对文本和图像生成器的兴趣激增之后,使用AI生成视频被认为是下一个前沿领域,初创企业和大型科技公司都在押注该领域。除了Pika,其他AI视频初创公司Runway和Synthesia也在过去一年里筹集了大量资金。

目前,Pika等初创公司正在快速扩张,因为OpenAI和谷歌的视频工具尚未面向公众开放,这给它们留了一定时间。

那么,自半年前推出1.0以来,Pika后来都在忙啥呢?

AI视频生成赛道,在这段时间还有哪些大事件发生?

郭文景Pika再融5.8亿,最新估值约34亿,已自研AI视频生成基础模型

Pika最近半年干了啥?

概括而言,Pika近半年除了推出几项“锦上添花”的新功能外,一直在做产品和技术更新。

下面按照时间顺序大概梳理一下。

2023年12月,也就是Pika1.0上线后不久,其研究人员提出了将文本转3D生成速度提高4.7倍的方法。

这一被称为DreamPropeller的嵌入式加速算法,能够优化并增强任何基于分数蒸馏的文本到3D模型生成流程。

之后不久,Pika宣布面向所有公众开放,不过紧跟着推出了其付费订阅模式

郭文景Pika再融5.8亿,最新估值约34亿,已自研AI视频生成基础模型

到了今年2月底,Pika宣布推出可以给视频中的人物配音,并同时“对口型”的唇形同步功能Lip Sync

然后接着在3月份推出AI配音工具Sound Effects,有了这项新功能,用户既可以使用文本生成音效,也可以让Pika直接根据视频内容匹配音效

至今年4月,Pika在成立不到1年后入选了福布斯AI50强榜单。

郭文景Pika再融5.8亿,最新估值约34亿,已自研AI视频生成基础模型

以上为Pika最近半年的动向,Pika表示公司目前拥有数百万用户(官方在彭博采访中未提供确切数字),不过能看到Discord上有近80万用户。

郭文景Pika再融5.8亿,最新估值约34亿,已自研AI视频生成基础模型

AI视频赛道已变天

简单回顾一下,Pika的创始人一共有两位,郭文景(Demi Guo)和Chenlin Meng,都是斯坦福博士。

从二人学术经历来看,她们分别专注于NLP计算机视觉两个方向的AI研究,也都有生成式AI的学术经历。

这两人在AI生成领域专业背景深厚且技术过硬,以至于在团队仅有4人之时就获得了5500万美元融资。

郭文景Pika再融5.8亿,最新估值约34亿,已自研AI视频生成基础模型

Pika亮相的时机不可谓不妙,从去年11月开始,一个月内就有5家AI视频生成产品发布或迎来重大更新。

主要包括:

  • 11月3日,Runway的Gen-2发布里程碑式更新,支持4K超逼真的清晰度作品。
  • 11月16日,Meta发布Emu Video,这个工具在用户评估中号称打败Gen-2、Pika等对手。
  • 11月18日,字节发布PixelDance,作品的动态性可谓史无前者,画面中的元素动作幅度都相当大,且不变形,让人眼前一亮。
  • 11月21日,Stable AI也推出了自家的视频工具Stable Video Diffusion
  • 同在21日,Gen-2上线“涂哪动哪”的运动笔刷新功能,这是生成模型可控性上的一个重要里程碑。

接下来就是Pika在11月29日发布正式版1.0,叫板“老大哥”Runway。

可以说,Pika正是在人们将目光狂热转向视频生成领域时横空出世的,可谓赶上了风口。

但没人预料的到,新年伊始,OpenAI“杀手级”视频生成模型Sora发布,将视频生成的质量拉高了一个档次,时长也拉到了60秒。

Sora的热度盖过了一切,行业后来者也必须得卷起来了。

4月7日,GitHub开源了视频生成模型StreamingT2V,能够生成1200帧、时长120秒的长视频。

紧随其后,4月29日,清华大学与生数科技联合发布了Vidu,画面效果对标Sora,长度可达16秒,还能读懂物理规律。

然后就是谷歌在5月14日的开发者大会上发布了Veo,对标Sora能生成一分钟长视频。

总之,AI视频生成在技术上愈发成熟,也因此带动了行业投融资风潮。

仅在2024年3月一个月,就有三个华人创立的AI视频生成创企获得了融资,且融资额都过了千万美金

  • 3月7日,总部位于英国伦敦的Haiper(由两位前DeepMind团队的华人工程师建立)宣布产品上线,并已经完成1380万美金融资。
  • 3月13日,由前字节跳动视觉技术负责人创立的爱诗科技,完成一亿元人民币(约合1380万美金)左右的A1轮融资。
  • 3月24日,凭借让霉霉说中文视频火起来的AI数字人产品HeyGen(由前Snap软件工程师徐卓创立)完成一轮6000万美元的融资。
  • 4月23日,爱诗科技完成A2轮超亿元融资,由蚂蚁集团领投。
  • 6月1日,Runway获得1亿美元D轮融资,由谷歌领投。

就在6月5日,生数科技宣布完成数亿元Pre-A轮融资,由北京市人工智能产业投资基金、百度联合领投。

不难看出,AI视频生成今年将迎来新的爆发,而作为顶流之一,Pika自然有人关注。

郭文景Pika再融5.8亿,最新估值约34亿,已自研AI视频生成基础模型

且Pika现在声称他们已经构建起了自己的“基础模型”,因此不会依赖其他AI公司的技术。

虽然需要不少资金来训练模型,但创始人郭文景透露Pika在这块不需要消耗大量的资金,他们有点类似法国的Mistral AI,可以在较少资金的情况下也能训练出比较好的模型,不过具体没有透露。

最后,今天正值Pika一周年生日(从创始人休学创办Pika开始计算),官方也放出了纪念视频。

接下来,Pika计划在今年晚些时候发布其文本转视频模型的重大更新,这包括两方面,一个是提供更高质量、更长的视频,另一个是确保输出的一致性。

据创始人郭文景透露:

Pika的新工具可以让用户定义一个对象或角色,然后在视频中或最终在不同的剪辑中一致地生成它。

那么,你看好这家公司吗?欢迎在评论区留言讨论。