微软全球合伙人姜大昕被曝大模型创业
背后还有两位MSRA故旧
衡宇 发自 凹非寺
量子位 | 公众号 QbitAI
大模型比武场战火纷飞了半年有余,左有OpenAI动作频频,右有Meta开源Llama2,开闭源方面,均被巨鳄占领山头,创业投资也已经进入了新阶段。
现在再下场,会不会晚了?
会者不晚。
因为就在最近,又一重量级大牛入局创业。量子位获悉,微软全球合伙人、副总裁、前微软亚洲研究院首席科学家姜大昕出现在最新名单中。
这位在微软工作16年有余、曾作为微软必应搜索引擎和Cortana智能助手自然语言理解负责人,近期被曝已经从老东家离职,下一站,自己创业,剑指大模型领域。
而且据说姜大昕还不是一个人战斗,他背后还有两位MSRA故旧,一位是地位卓然、微软华人旗帜的AI大牛,另一位则是年少有为、知名AI独角兽的CEO。
他们,将在AI高地上海的助推下集结。
姜大昕是谁?
姜大昕,2005年获纽约布法罗州纽约州立大学计算机科学博士,在机器学习、数据挖掘、自然语言处理、生物信息等领域有丰富的经验和工程经验。
迄今为止,他发表论文100余篇,被引用次数接近1万次。
现在的领英网站上,姜大昕的职业动态还停留在年初的更新。
“2023年3月起,担任微软副总裁”,所在部门为STCA(微软亚洲互联网工程院)。
从2007年3月加入微软到2023年,姜大昕已经和这家公司携手度过了16个年头。
姜大昕本硕分别毕业于中国科学技术大学和中国科学院软件研究所,当他远赴美国攻读计算机博士学位,做生物信息领域的数据挖掘研究时,恰逢深度学习方兴未艾。
博士毕业后,他选择了前往南洋理工大学担任助理教授,为研究生和本科生教授数据挖掘和生物信息学课程。
2006年12月,他从南洋理工离职,并在次年3月成为MSRA(微软亚研院)的副研究员。
他在MSRA工作了四年,负责数据挖掘、机器学习和信息检索等领域的应用研究,从事着个性化和上下文感知搜索等工作,一路从副研究员做到研究员再到首席科学家。
此期间,他在SIGKDD、SIGIR,WWW和WSDM等会议上发表了多篇文章,获得SIGKDD 2008最佳应用论文奖,还担任多个期刊和会议的副主编和PC成员。
2011年开始,姜大昕转入STCA工作。
STCA主要负责微软全球产品的研发工作,包括必应搜索引擎、智能语音助手Cortana、Azure认知服务以及Microsoft 365的自然语言理解系统等。
6年后,姜大昕的title已经升为了微软全球合伙人,STCA副院长、首席科学家。
2023年3月,姜大昕正式升任为微软副总裁,同时兼任亚洲软件技术中心WebXT S+D(网络体验、搜索和分销)集团总经理。
此时,姜大昕的工作重点是带领400多名应用科学家和工程师,为微软必应开发算法和基础结构。
同时,姜大昕团队还为各种Microsoft产品(如Office,Xbox和Microsoft认知服务)提供NLP模型和算法。
大模型创业进程中的微软系
姜大昕并不是第一位出身微软的大模型创业者,细数起来,不少头部玩家都有微软背景。
李开复,前微软全球副总裁,也是MSRA的创办者之一。
3月底,李开复开始筹备、塔尖孵化创业公司零一万物,走自研大模型路线,核心业务集中在大模型技术、人工智能算法、自然语言处理、系统架构、算力架构、数据安全、产品研发等领域。
已加入的联创团队成员,包含前阿里副总裁、前百度副总裁、前滴滴/百度首席算法负责人、前谷歌中国高管、前微软/SAP/Cisco/副总裁,算法和产品团队背景均来自国内外大厂。
目前,零一万物正自建平台,构建数千卡GPU集群进行训练、调优和推理,提高数据有效参数量,以及使用的高质量数据的密度,以构建连续、可控、科学化的训练能力。
筹备至今,该公司已经实现百亿参数规模的模型内测,正往300到700亿参数规模扩大。
周明,MSRA前常务副院长,旗下创业公司名为澜舟科技,于2021年6月成立。
公司选择了大模型的轻量化路径,并且瞄准To B赛道,聚焦于金融、营销、文化创意、机器翻译等场景。
今年3月,澜舟科技完成了Pre-A+轮融资,融资金额数亿人民币。由北京中关村科学城公司领投,斯道资本和创新工场跟投。
同时,澜舟发布了语言生成模型——孟子MChat可控大模型,具有类ChatGPT能力,加上原来澜舟科技孟子大模型N个项目功能引擎,既有对话能力,又具备翻译、生成、信息搜索等能力。
MChat背后依托的孟子大模型,是澜舟科技自研技术研发的大规模预训练语言模型,于2021年7月推出。
李笛,微软亚洲互联网工程院(STCA)前副院长、前微软全球资深合伙人,目前是小冰公司的CEO。
小冰公司前身是微软亚洲互联网工程院的人工智能小冰团队,于2013年12月在北京组建。2020年5月,小冰公司“单飞”,微软将小冰分拆为独立实体。
早在2014年,小冰就发布过一款名叫“小冰”的AI聊天机器人。并且一直沿着生成式AI的框架和路径前进。
今年2月,小冰一度短暂上线了内测版本的小冰链(X-CoTA,X-Chain of Thought & Action)。
小冰链同样是个大语言模型,通过对话的方式帮人们解答问题。其核心,是利用大模型技术,实现下一代的控制中枢。
与ChatGPT等不同,小冰链的数据来源是实时的,并且仅仅用GPT-3参数量2%的模型,就实现了思维链,能够把AI的思考过程完整、透明地呈现出来。
5月16日,小冰公司宣布启动“GPT克隆人计划”,基于小冰框架大模型、神经网络渲染及超级自然语音技术,进行实时情感交互、提供AIGC能力。
聂再清,MSRA前首席研究员,现为清华大学国强教授、AIR(智能产业研究院)首席研究员。
其在AIR主导的项目,在今年7月孵化出了初创公司水木分子。
水木分子专注生物医药垂直行业大模型的研发与应用,以及构建新一代对话式生物医药研发助手。
7月初,公司宣布完成千万级种子轮融资。同时宣布了联合创始人、CTO的人选,乔木。
3个月前,团队开源了轻量科研版BioMedGPT-1.6B。
BioMedGPT1.6B从研究层面验证了将文献、分子、蛋白、测序、知识图谱等数据,压缩到统一的多模态大模型框架内,可使模型在分子性质预测、药物-靶点亲和力预测等方面,具备“融汇贯通”的能力,
梅涛,MSRA前资深研究员,今年3月成立AI创业公司HiDream.ai 。
公司走多模态路线,尤其专注视觉与语言多模态交互与生成。
HiDream.ai在今年4月完成种子轮融资,投资方包括阿尔法公社和中喝大种子一号基金。
官方解释称,HiDream.ai的目标,是要在基础模型上超越Stable Diffusion最新版本,在产品上则要赶超Midjourney。
公司目前正在开发一个生成式视觉多模态基础模型,该模型不仅能够支持文生图,还能支持文生视频、图生视频以及文生 3D 等功能。
袁进辉,MSRA前主管研究员。
其公司一流科技,在2017年1月成立,立足于通用性深度学习标准框架的研发和推广使用。
公司从事大模型的研发业务,主要围绕数据处理、执行体、分布式数据、决策系统、拓扑图等技术领域展开。
今年3月,一流科技与王慧文创立的光年之外达成并购意向,交易以换股形式进行。
4月中旬,一流科技完成工商变更,光年之外成为一流科技的最大股东,持有约 46.52% 股权。
后来,王慧文因病辞任,美团于6月29日发布公告称,已完成光年之外境内外主体100%股权的收购,一流科技也一并转归美团麾下。
张家兴,MSRA前研究员,公司据传代号深度空间,IDEA研究院理事长沈向洋担任公司顾问。
大方向是打造大模型底座,希望瞄准B端市场打造企业级应用。
今年4月即有消息称,该公司首轮估值在数亿美元左右。据悉,该公司的融资进程仍在持续。
不难发现,在清华系创业公司占据国内大模型头部梯队半壁江山时,微软系也是不容小觑的一股力量。
而姜大昕此番从微软出走,入局大模型创业,要锚定领域中的具体什么方向?除了背后的两位AI大牛,有哪些技术或商业骨干选择加盟?迎来新一名重磅玩家的大模型战事,又会发生怎样的变局?
大约只有假以时日,才能知道答案。
- Claude团队喜提清华物理学霸姚顺宇!两个Yao Shunyu都投身大模型了2024-10-28
- 帮了一把南美农民的拼多多,联合国粮农组织都点赞了2024-10-31
- 4个专业Agent帮你出海,00后跨境做起婚庆,在阿里国际跑通全流程2024-10-29
- 值得买科技与人大高瓴人工智能学院首个多模态领域联合研究成果亮相CNCC20242024-10-25