又双叒一清华系团队入局大模型创业!蚂蚁领投,主打多模态
面向图像创作、3D资产创建
衡宇 发自 凹非寺
量子位 | 公众号 QbitAI
清华计算机系教授朱军,终于正式站在了大模型创业赛的擂台上。
多方消息证实,他带领新团队成立新的AI公司,冲进大模型混战场——这是朱军继瑞莱智慧后,带领的第二支创业团队。
新公司生数科技,基于底层多模态通用大模型,面向图像创作、3D资产创建等场景打造垂类应用。
量子位进一步获悉,它刚刚曝出完成了近亿元天使轮投资,目前市场估值达1亿美金。
蚂蚁集团是这次融资的领投方,BV百度风投和清华系专看AI的VC卓源资本紧随其后。
这是ChatGPT诞生后,蚂蚁集团第一次下手投资大模型公司,也是自今年1月7日阿里从蚂蚁集团实际控制人“身退”之后,蚂蚁集团对外曝光出的与AI初创公司第一次亲密接触。
(哪怕阿里和蚂蚁集团刚刚合作提出了VideoComposer,通过组合式生成范式,在视频领域同时实现时间和空间双维度的可控性,狗头.jpg)
打造可控多模态通用大模型
量子位进一步获悉,生数科技这家公司,由蚂蚁、BV百度风投,以及朱军第一次创业时成立的瑞莱智慧RealAI联合孵化而来。
目标是“致力于成为全球领先的生成式人工智能基础设施及应用建设者”。
据悉,生数科技研究团队主要来自清华大学人工智能研究院,主要来自朱军带领的课题组。
该课题组致力于贝叶斯机器学习的理论和算法研究,是国际上最早研究深度概率生成模型的团队之一
工作主要面向针对深度生成式模型的骨干网络、高速采样、可控生成、大模型训练等全栈底层原创研发。
而目前推进中的业务,是聚焦AIGC,打造可控的多模态通用大模型,覆盖文本、图像、3D模型、音视频等多个模态。
要覆盖的商业场景,包括艺术设计、游戏制作、影视后期、内容社交等。
生数科技大模型目前已处于迭代中,现阶段已经开始落地实践图像生成、3D内容生成和视频生成等业务。
业务水平究竟怎样?
面对量子位的上门追问,生数科技给出如下回答:
论视频生成,团队目前聚焦于文本的视频自动化编辑。
△生数科技视频生成效果(中)和Runway生成效果(右)
论3D生成,团队提出新算法ProlifcDreamer,从贝叶斯建模和变分推断的角度,重新形式化了text-to-3D问题。
该技术能够在无需任何3D训练数据的前提下,通过文本描述,自动生成高质量带纹理的三维网格与NeRF图。
包括生成复杂效果和360°场景、根据同样的描述生成不同形式的3D内容。
以及首个实现了基于三视图自动生成高质量的3D内容,“是目前业内最接近产业级应用的3D生成效果”。
论图像生成,团队旗下多模态大模型UniDiffuser,今年3月开源,是首个基于Transformer的多模态扩散大模型。
能够很好地在构图、风格、画面精准度等方面把握用户意图。
现状,是“正自研新一版的产业级模型,其中,图像生成效果已超过Stable Diffusion最新版基础模型水平”;
计划,是“将于年内赶超Midjourney最新版本”。
并且透露道,过去两年,生数科技团队在ICML、NeurIPS、ICLR等计算机顶会发了20多篇相关论文,扩散模型是团队的主要发力阵地。
先后提出的采样算法Analytic-DPM、DPM-Solver等成果,被DALL·E、Stable Diffusion等应用。
论文成果颇丰,生数科技接下来的任务,就是把基础科研推向应用市场。
生数科技背后团队
生数科技领兵冲刺的带头人朱军,IEEE Fellow,现任清华大学计算机系教授。
同时也是清华人工智能研究院副院长,清华智能技术与系统国家重点实验室主任,智源首席科学家。
求学期间,他在清华计算机系拿下本科和博士学位,师从中国科学院院士、清华计算机系教授张钹。
△朱军
2011年,在张钹的邀请下,朱军回到清华计算机系任教。
去年,师徒二人围绕扩散概率模型合作的工作《Analytic-DPM: an Analytic Estimate of the Optimal Reverse Variance in Diffusion Probabilistic Models》,拿下ICLR 2022杰出论文奖。
朱军长期从事机器学习、贝叶斯方法、深度学习、数据挖掘等方面的研究,在顶会ICML、NIPS、IJCAI、AAAI、 JMLR、PAMI等发表论文100余篇,连续多年担任ICML、NeurIPS领域主席。
(贝叶斯方法是自然语言处理、机器学习、图像识别等AI领域的重要基础。)
2020年,朱军团队发布深度强化学习平台Tianshou天授。
这是一个针对强化学习的灵活可靠的基础设施,能够以极简代码极速实现强化学习的诸多算法和功能,在GitHub上有用6.4k+星星。
话说回来,生数科技不是朱军在科研和产业之间的第一次尝试。
他的首次创业要回溯到2018年。当时,他支持自己的学生田天创办了公司瑞莱智慧RealAI,专注提升人工智能的安全性。
并且和张钹共同担任该公司的首席科学家。
这一次正式入局大模型,朱军再次选择站在新公司“运筹帷幄”的位置上。
而根据企查查App资料,成立于3月的生数科技,在4月时进行了一次法人变动,从“田天”变更为“唐家渝”。
唐家渝其人,现在是生数科技的联合创始人兼CEO。
他同样毕业自清华大学计算机系,师从NLP组教授孙茂松。
此前,对唐家渝外界的主要公开身份是瑞莱智慧的副总裁,先后负责公司产品团队、AI安全产研团队及业务。
而从再往前的简历可以看到,唐家渝曾在腾讯优图实验室工作。
△唐家渝
最新能公开的消息是,生数科技团队近期在扩散模型工作上,提出了一种新的训练策略,能够尽可能用较少的标注,持续优化多模态生成效果。
如此看来,生数科技的多模态大模型可能武力值要再+1了?
以及不得不感慨一句,清华系AI初创公司在这一波大模型创业中,真的是风头无两。
哪怕单纯从数量上说,生数科技也已经是又双叒叕一个了~
参考链接:
[1]https://github.com/thu-ml/tianshou
[2]https://www.cs.tsinghua.edu.cn/info/1121/3551.htm
[3]https://www.qcc.com/firm/3903aa13076b2df3918d75f504bb9395.html
- 国产模型指令跟随全球第一!来自LeCun亲推的「最难作弊」大模型新榜单2024-11-21
- 百度打通两大国民产品!六边形AI创作新物种「自由画布」来了2024-11-14
- AI毒液刷屏抖音小红书!闲鱼10元代生成一次,但官网其实免费2024-11-10
- 钉钉上线工单等六大场景AI助理,AI继续深入到业务中2024-11-13