存算一体是啥新趋势?值得教授学者纷纷下海造芯 | 附报告下载
2030年市场价值将达1000亿+
鱼羊 丰色 发自 凹非寺
量子位 | 公众号 QbitAI
芯片创业热度正酣,值此之时,一股风潮已悄然席卷学术界。
其中关键,是一种可以说刚走出实验室不久、国内外均未实现大规模量产的技术——
存算一体芯片。
且看这一领域内国内创企背后的创始人们,便可窥见一二:
率先迈入B1轮的知存科技,创始人&CEO王绍迪出身北大微电子,2017年获得UCLA电气工程博士学位,同年提前结束博士后研究工作,回国创业。
苹芯科技则由清华校友陈怡然、杨越组队成立。陈怡然现为杜克大学教授,IEEE/ACM Fellow。杨越博士毕业于多伦多大学,还曾任美光科技首席系统架构师。
而专注于神经拟态感存算一体芯片的九天睿芯,创始人技术背景同样深厚。
九天睿芯CEO刘洪杰博士毕业于ETH,师承IEEE Fellow托比亚斯·德尔布鲁克。后者是类眼图像传感器发明人,在神经拟态计算领域有着突出贡献,现在亦是九天睿芯科技顾问。
……
如此种种,实非个例。
所以,这背后究竟是什么引得他们纷纷创业出山?
翻译翻译,什么叫“存算一体”
这还得从AI行业增长迅猛的算力需求说起。
据统计,自2012年开始,AI训练需要的算力每3.5个月就会翻倍,这个速度已远超过摩尔定律的18个月。
目前,主流芯片主要依靠不断迭代先进工艺制程,来提升芯片性能,应对AI算力需求。
但当制程越来越小,尤其是走到7nm之下后,出现的问题越来越多:
一是成本持续走高。根据IC Insights调研机构估算,如果想追赶上台积电在先进制程上的制造能力,起码需要五年时间外加近万亿元的投入。
二是由物理限制引发的芯片性能问题越发突显。随着集成电路的尺寸越来越小,栅极电压夹断沟道的难度变大,从而出现严重的电流泄露现象,导致芯片功耗失控,发热严重。
此外,当制程走到1nm时,电子会产生“量子隧穿效应”而穿透绝缘层,导致晶体管出现漏电问题。
三是先进工艺下的芯片并非在所有应用场景中都有优势。比如大算力、高能耗的特点在AIoT等领域就不适用;可靠性不如成熟制程工艺的问题导致其在工业和军事领域同样缺乏优势。
而最根本的问题,还是芯片运行所依托的冯·诺依曼架构。
基于存算分离的设计,即使芯片制程能够不断突破,把处理器的算力做到非常大,但由于存储器的访问速度追不上处理器的处理速度,处理器性能仍会受到严重制约。
再加上数据在存储单元和计算单元之间频繁的搬运还带来了过高的无用功耗(占比高达60%-90%),芯片的性能往前迈进困难重重。
因此,人们不得不转变逻辑,希望通过改变底层架构来根本性地解决问题。
存算一体的概念由此再度被提及,并很快成为产学研各界破解AI算力困境的“希望之星”。
存算一体的概念诞生于1969年,最早由斯坦福研究所的Kautz等人提出。
顾名思义,存算一体就是指计算单元与存储单元融合,在完成数据存储功能的同时可以直接进行计算。
这一设计可以从根本上解决冯·诺伊曼瓶颈,在做到低成本、大算力的同时,保持低功耗。
存算一体芯片的关键在于存算一体架构,其核心是电路设计革新。
主要有两种计算方式:数字计算和模拟计算。
这两种计算方式采取的存储器不同,前者以SRAM等易失性存储器为主,后者采用Flash和RRAM等优势更大的非易失性存储器。
而依照计算单元与存储单元的关系(距离)划分,目前存算一体的技术路线大致可分:
- 近存计算
- 存内计算
近存计算是通过将计算资源和存储资源拉近,来实现能效和性能的提升,在广义概念上也被归入存算一体架构。
现阶段,近存计算是行业中最容易实现的路线,主要考验的就是先进封装技术。
存内计算则包含两种形式,其计算效率提升已经得到业内的充分认可:
一种计算操作由位于存储器内部的独立计算单元完成,存储单元和计算单元相互独立存在。
另一种是在内部存储中添加计算逻辑直接执行数据计算,这种架构数据传输路径最短, 能同时满足大模型的计算精度要求。
在现在这个时间节点,给存算一体技术的发展梳理时间线,2010-2017年可说是这一新技术潮流的探索期。
2011年,存算一体芯片开始受到学界关注。
2016-2017年成为学界热议话题。
随之而来的,便是一大波学术大佬纷纷“出山”,亲自开启了它的商业化探索:
2017年,知存科技在北京成立。
2018年,九天睿芯在深圳拉起团队。
2020年,苹芯科技团队和后摩智能团队先后组建完成。
为何引得学术大佬纷纷下场
落地前景明确的前沿技术领域,往往便是产学研互动最为频繁之所在。
而以史为鉴,新技术的爆发期,也正是学术界人才涌入工业界的高峰期。
一方面,新技术的兴起意味着机会与红利,对工业界的玩家们而言,自然迫切需要高精尖人才入场,打造技术壁垒挤占生态位。
另一方面,站在科学家们的角度来看,身至产业一线将实验室中的理论转化为实践,亦是难得的施展抱负、甚至改变世界的机遇。
由此推之,基于存算一体芯片技术当下的发展特点,这股创业之风席卷学术界正是水到渠成之事。
正如前文所言,当前,存算一体技术已然成为后摩尔时代突破芯片性能瓶颈最具潜力的技术方向之一。
尽管刚从实验室中走出不久,但其未来的应用潜力,已受到资本和产业界的一致看好。
然而,与愈发强烈的市场需求相矛盾的是,在现阶段而言,做存算一体芯片无疑是一件入局技术门槛相当高的事。
一方面,存算一体技术考验的是计算系统和存储系统的整合能力,设计要求本身就比标准模IP和存储器IP更复杂。
另一方面,由于缺乏EDA工具以及适配的工具链,该技术对技术领导者的要求也会比其他成熟的芯片领域更高。
要知道,存算一体当前面临的最大挑战之一,就是新兴技术的未知性带来的高风险。
并且其涉及的完整技术链条包括底层器件、电路设计、架构设计、工具链、软件等等,并且各个环节之间的适配度也非常重要。
这就导致现阶段的存算一体试错成本很高,如果相关公司创始团队缺乏足够的存储器量产经验和技术路线认知,那么很可能会一步踏错,满盘皆输。
此时此刻,恰如AI行业的彼时彼刻。
舞台已经搭好,各路英雄纷纷而至,便不足为奇了。
2030年规模将达1000亿+
说了这么多,存算一体芯片行业发展到什么程度了?
总的来看,如果将之放在整个半导体产业的大背景下,该行业还处于较为早期的阶段。
我国存算一体芯片研发公司集中诞生于2017-2020年,目前共有10家左右可以列为头部初创,大部分处在A轮前后。
具体业务方面,各公司基本都是基于传统的Nor Flash或SRAM存储器做存算一体芯片,但由于侧重点各不相同,尚未形成竞争格局。
其中九天睿芯专注于神经拟态感存算一体芯片研发,后摩智能做大算力AI芯片,千芯科技聚焦大算力可重构存算一体芯片的架构设计,苹芯科技在基于SRAM做存内计算加速器……
在此之外,国内也出现了一家专门基于新型存储器技术(RRAM)进行存算一体芯片研发的公司:亿铸科技(侧重于大算力AI芯片)。
RRAM新型存储器技术在存算一体芯片上具有速度快、结构简单、存储密度大等优势,有望成为未来的发展趋势,目前距离工艺成熟还有2-5年的时间。
存算一体芯片的应用场景主要分为两方面:一是面向端侧,对低功耗需求强烈的场景;二是面向云侧推理,对大算力需求强烈的场景。
目前业内80%的公司优先布局对能效比有高要求的端侧小算力场景(如智能可穿戴设备,智能安防,移动终端,AR/VR),国内在这方面初步实现量产的有两家:知存科技和九天睿芯。
相反,大算力场景(如自动驾驶)上的落地还不算特别明显,还处于业内共同努力的阶段。
其中,千芯科技主要融合存算一体与可重构计算,以支持AI芯片的更大算力和可编程灵活性。
后摩智能的成品在算力方面已做到数十TOPS,可支持大规模视觉计算模型,已跑通智能驾驶算法模型。
国外方面,大多公司的融资已进入C/D轮,几家头部企业如STT、Syntiant和Mythic走在全球商业化前列,芯片出货量最高达2000万级别(国内最高百万级),并有约15家公司实现了超100亿美元的营收(我国仅1-2家)。
需要承认的是,目前,国内存算一体的商业化进展与国外存在一定差距。
究其原因,除了国内起步时间稍晚3-5年外,我们还存在着产业/技术链还不够完整、配套工具(如EDA软件、编译器)不够成熟、与芯片大厂的合作程度不够高等问题。
由此还产生了一个最核心的问题:IP授权。
目前,在存储技术上,国内大多数公司都采用购买国外成熟的存储技术IP来完成存内计算的研发,这种模式存在一定的风险。
比如一旦在IP授权上发生问题(如停止授权),将会影响到存算一体技术的持续演进,甚至会阻碍技术成熟的速度。
不过国内已经出现了专门做新型存储器技术(RRAM)研发的公司。一旦该技术实现完全国产化,我国将不会受到存储器技术IP授权的限制。
值得注意的是,目前,在存算一体芯片这个领域,国内外均未实现大规模量产。而事实上,存算一体技术在国内有更大的发展空间:
国内市场在从非智能硬件向智能硬件转变的过程中,对端侧智能产品的兴趣远大于国外市场,因此在需求侧会出现更多元的机会。
尽管现阶段市场规模相对有限,初创企业们的增长来源主要为定制开发费用和SoC芯片销售费用,近期量产可达千万级别的公司预计仅有1-2家,未来几年内能实现量产的也只是再增加3-5家。
但量子位分析师认为,存算一体芯片行业的市场价值可以类比为一座巨大的冰山,下面还隐藏着相当大的市场潜力。
就拿应用来说,存算一体芯片必将从端侧小算力市场逐步扩展到整个AI芯片领域。总的来看,短期内,行业将会呈现持续走高的态势。
量子位智库预估,到2025年,国内存算一体芯片市场规模为125亿元。
从这个时间开始,存算一体将迎来商业化转折,应用场景从麦克风、智能手表和TWS耳机拓展到智能安防、 移动终端和AR/VR等。
相关公司也将逐渐从定制化产品过度到标准化产品研发上,针对端侧、边缘侧和云侧不同场景提供更具通用性的产品。
这个转变需要5年左右的时间,完成转变到了2030年,市场规模就将迎来大幅增长,达到1136亿元。
其中,中小算力芯片市场规模约为1069亿元,大算力芯片约为67亿人民币。
One More Thing
扫描二维码,就能下载量子位智库出品完整《存算一体芯片深度产业报告》。
在下一期专题中,将详细解读我们在存算一体芯片产业领域的七大核心研判。
关于量子位智库:
量子位旗下科技创新产业链接平台。致力于提供前沿科技和技术创新领域产学研体系化研究。面向前沿AI&计算机、生物计算、量子技术及健康医疗等领域最新技术创新进展,提供系统化报告和认知。通过媒体、社群和线下活动,帮助决策者更早掌握创新风向。
特别感谢:达摩院、后摩智能、九天睿芯、苹芯科技、千芯科技、燕博南、亿铸科技(按首字母排序)。
- 北大开源最强aiXcoder-7B代码大模型!聚焦真实开发场景,专为企业私有部署设计2024-04-09
- 刚刚,图灵奖揭晓!史上首位数学和计算机最高奖“双料王”出现了2024-04-10
- 8.3K Stars!《多模态大语言模型综述》重大升级2024-04-10
- 谷歌最强大模型免费开放了!长音频理解功能独一份,100万上下文敞开用2024-04-10