IDEA研究院张家兴入局大模型创业，沈向洋任顾问，首轮估值20亿

衡宇 2023-04-25 13:44:38 来源：量子位

下游应用瞄准B端市场

衡宇发自凹非寺

量子位 | 公众号 QbitAI

大模型创业江湖，又来了两位重磅大牛。

张家兴，粤港澳大湾区数字经济研究院（IDEA研究院）讲席科学家、认知计算与自然语言中心负责人，被曝已经启动了创业项目，而他站在他身后，以顾问身份出现的是知名AI大牛、IDEA研究院创始理事长沈向洋。

量子位获悉，张家兴新公司据说代号深度空间，大方向是打造大模型底座，希望瞄准B端市场打造企业级应用。

以及大牛创业多的是排队想进的投资者。所以即便项目尚未官宣，也只是小圈子里所知，但首轮估值已经高达3亿美元（折合人民币20亿）。

而张家兴，从过往履历和能力来看，确实也值这个价。

去年开源中文版Stable Diffusion

张家兴，北京大学电子系博士毕业，师从侯士敏；本科阶段在南开大学学习嵌入式系统。主要研究领域为AI、DL和分布式系统。

加入IDEA研究院之前，先后就职于百度、微软、阿里巴巴，曾任微软亚洲研究院研究员、360数科首席科学家。

△张家兴

在微软亚洲研究院期间，2014年，深度学习框架研究正处于萌芽期。张家兴在工作Minerva（发表于顶会NIPS，即后来的NeurIPS）中，提出用高级语言表述网络结构和用数据流图（dataflow graph）来解耦网络结构和执行引擎。

——这是后来出现的Tensorflow、Pytorch等主流深度学习框架的核心设计理念。

同年，他在NIPS发表的另一篇论文《Attentional Neural Network: Feature Selection Using Cognitive Feedback》里提出了Attentional Neural Network，以认知概念作为query对输入进行选择。

这个概念的提出，比attention成为主流早了一年。

△《Attentional Neural Network: Feature Selection Using Cognitive Feedback》

公开资料显示，离开MSRA后，张家兴先是任职阿里巴巴蚂蚁金服AI资深算法专家，“从零到一创建了阿里巴巴和蚂蚁集团的深度学习团队”。

又以360数科（原360金融）首席科学家的身份，“组建了360数科的AI数据融合中台部门”。

2021年，张家兴加入IDEA研究院，角色是认知计算方向负责人，参与过IDEA研究院发布的“悟道·文源”等大模型项目。

去年，AIGC在文生图领域刮起一阵风暴，张家兴带领团队开源了第一个以中文为主的AI绘画模型太乙——它被称为中文版的Stable Diffusion，并在11月1日推出纯中文版本和中英文双语版本。

据透露，太乙的训练数据量超过了1亿中文图文对。

△太乙根据提示词“小桥流水人家，水彩”生成的画作

张家兴曾对外表示，在IDEA前作Taiyi-CLIP-Roberta-large-326M-Chinese、Taiyi-Diffusion-532M-Nature-Chinese等的基础上，太乙团队从全力投入到完成面世，“用时不足一个月”。

在IDEA同时推进的还有他带领团队创建的“封神榜”大模型开源计划，截至去年年底，共开源了88个模型。

今年2月底举办的“2023全球人工智能开发者先锋大会”上，张家兴曾在圆桌讨论上公开表达：

我也是在这一波ChatGPT创业的大潮里边，准备入局。

不过一个来月，张家兴已经身体力行地动起来了。

不仅自己躬身入局，还拉了IDEA研究院理事长沈向洋一同在大模型之路上探索。

新公司还有谁？

在新公司担任顾问的沈向洋，是IDEA研究院的创立者，包括ACM和IEEE等全球计算机顶级组织的Fellow，前微软乃至科技巨头里最具权势的华人高管。

他博士毕业于CMU计算机学院，是图灵奖得主Raj Reddy的学生，主要致力于计算机视觉、图形学、人机交互、统计学习、模式识别和机器人等领域。

后来沈向洋与李开复、张亚勤、洪小文共同参与创建影响深远的MSRA。

此外，他还是微软必应、微软小冰等一系列知名产品的领导打造者，并因计算机视觉和图形方面的研究成就享誉世界。

△沈向洋

2019年11月，微软对外公告称：全球执行副总裁、AI及技术研发体系负责人沈向洋博士，将于2020年2月正式从微软退休。

于是2020年开始，沈向洋挥别了任职23年之久的微软。

但他并未远离AI江湖，沈向洋先后出任了小冰公司、Newsbreak的董事长，其后又亲自参与创办了base粤港澳大湾区的IDEA研究院成立，担任创始理事长。

在沈向洋的带领下，IDEA迅速集结起大批人才，其门生故吏云集，迅速打响了影响力。不仅没落下去年爆火的AI绘画，打造并开源太乙模型，今年的AIGC浪潮也没有落伍。

而且就在最近——IDEA还发布了zero-shot的视觉应用Grounded-SAM，把目标检测、分割、生成几大视觉AI功能all in one。

发布至今不足半个月，已经在GitHub上狂揽7.2k星。

张家兴谈大模型

不过目前，还不知道张家兴为何“出走”创业，或者新项目和IDEA研究院之间是否存在关联。

张家兴原本就是沈向洋在MSRA治下的老兵，但后来加盟蚂蚁集团，后来又辗转360担任首席科学家。

2021年6月，张家兴正式加入IDEA研究院担任认知计算方向讲席科学家。做为认知计算方向的负责人，带领团队，在认知计算和自然语言相关的各个方向进行前沿探索。

他最近一次公开亮相是今年3月，在2023全球AI开发者先锋大会现场，他与几位微软系老朋友，纵论大模型和ChatGPT变革后的世界，他认为ChatGPT的出现，开启了一个新十年。

并且这个新的十年，就是Generative + General，就是未来是属于生成式AI和通用AI的。

在这次讨论中，张家兴还留下了名言：

如果我们套用《三体》里面非常著名的一句话，“物理学不存在了”，那么我们今天从某种意义上也可以说，NLP技术不存在了。

IDEA研究院 LLM

衡宇

IDEA研究院张家兴入局大模型创业，沈向洋任顾问，首轮估值20亿

去年开源中文版Stable Diffusion

新公司还有谁？

张家兴谈大模型

相关阅读

GPT-4满分通过MIT本科数学考试！这套提示词火了

科研党狂喜！AI预测神经学研究结论超过人类专家水平 | Nature子刊

LeCun：请忽略关于Q *的大量废话

OpenAI创始大神卡帕西再度离职！回归一年很边缘，内讧中不站队不表态

GPT-4o医学知识覆盖率仅55%？腾讯优图团队发布大模型医疗能力“体检报告”

开源标杆！最强中英双语大模型来了，340亿参数，超越 Llama2-70B等所有开源模型

热门文章

业界首创，海螺集团携手华为发布水泥建材人工智能大模型

无需数据标注！测试时强化学习，模型数学能力暴增 | 清华&上海AI Lab

分化浪潮中的投资新局｜第19届中国投资年会·年度峰会在京召开

智能车速度刷新：仅10个月，首个纯端侧大模型上车量产！

特斯拉Q1净利润腰斩，马斯克宣布重心回归公司