商汤杨帆:大模型并非单纯暴力美学,背后是大量软件工程系统问题 | 中国AIGC产业峰会
“技术突破和产业化应用之间的窗口期正在加速缩短”
杨净 发自 凹非寺
量子位 | 公众号 QbitAI
大模型引领的AI 2.0时代,远比想象来得更加猛烈——
它以对话即入口的方式,即将改变着我们生产生活。
那么对于上一波技术浪潮涌现的AI1.0公司,到底有何影响?
在首届中国AIGC产业峰会上,商汤科技联合创始人、大装置事业群总裁杨帆在现场给出了最新思考。
他认为,我们在关注ChatGPT以及大语言模型的同时,一定不能忽视近几年整个人工智能技术进展是全方位的。
除此之外,他还谈到了这一波技术革命的另外两大特点:1、会更快地形成产业应用;2、背后是持续的投入、经验积累,并非单纯暴力美学驱动。
事实上,ChatGPT的出现,给下游诸多应用打开了新的出口,但“如何高效率、低成本、规模化落地?”就成为了亟待解决的难题。
商汤大装置作为行业代表性解决方案,它类似于AI版“发电厂”,打通了算力、算法和平台,能做到批量化生产各种AI算法模型,并进一步部署、迭代和升级,也就进一步帮助AI产业落地。
未来,杨帆也做了进一步畅想:正如任何一个成熟产业链一样,人工智能产业将在未来几年,变成多分工、多分化的,并形成一种开放的生态。
中国AIGC产业峰会是由量子位主办的行业峰会,近20位产业代表与会讨论。线下参与观众600+,线上收看观众近 300万,得到了包括CCTV2、BTV等在内的数十家媒体的广泛报道关注。
演讲要点
- 这场人工智能技术进展主要有三个特征:1、全方位的;2、更快地形成产业应用;3、背后是持续积累,并非单纯暴力美学驱动。
- 接下来几年时间一定会迎来整个人工智能更繁荣、开放的生态。
- 今天大模型研究背后实际是大量软件工程系统问题。
- 当下一些核心应用,天然有大量的C端因素,以及在很多使用场景中能天然打造起数据闭环。这既更符合AI技术高速迭代本身,也将带来很强的飞轮效应。
- 最近两年大量技术突破都来自于「暴力」,但并非单纯资源积累,而是牵涉到每个环节很强的经验积累。
以下为杨帆演讲全文:
AI核心技术突破和进展是全方位的
今天站在一个新时代的开端,有人叫AI2.0,有人叫大模型时代,当整个技术能力、商业化迭代非常快的时候,我觉得可能更需要一种不同的能力去帮助整个产业。
首先分享一下个人观点,ChatGPT展现的AI技术能力,其实是个非常大的破圈,但在我个人看来,最新一些AI技术进展远不止如此。
正如七八年前AlphaGo导致大众对AI有很强的感知和冲击,但在那之前,2012年所带来的变革更加深远。
这里想说的就是前两年的AI for Science,我甚至觉得它对整个人类技术进步、或者对我们整个科技产业贡献、未来产业经济格局的改变,可能会更大。
今天AI已经能帮我们解决什么?它能模拟人类蛋白质结构,很多人拿它去做材料合成、新材料的推演;它还可以做大量数学物理,去做过去没办法做到的计算和推理,甚至它在尝试去做核聚变的一些推演。
ChatGPT是每个人都能感知到的,在消费级会给大家带来巨大冲击。但刚才讲的这些可能是决定整个人类底层的科技进步,对整个社会经济产生重大改变。
我当然不是说ChatGPT不牛,但我想说的是,我们在关注ChatGPT以及大语言模型的时候,一定不能忽视整个人工智能近几年核心技术突破和进展是全方位的。
与此同时,这样的技术进展还有个很强的特征,比起过去,它能更快地形成产业化应用。
比如AI绘画,很多人已经在做商业化了。而起初被诟病的「手指」问题,现在也已经解决了,技术迭代和应用都非常快。
这是这波技术浪潮第二个非常值得关注的点,就是技术突破与商业模式探索之间的窗口期更短了,带来的是极强的加速效应。
第三个点想说的是,这一切产生的背后,我们能够看到什么?
不管是超大规模计算资源的聚集、超大规模模型结构的设计、还是海量数据汇聚……最近两年大量技术突破都来自于这种暴力美学。这种暴力也并非单纯资源积累,而是牵涉到算力、算法、数据每个环节很强的经验积累。
诚如OpenAI的GPT-3.5到GPT-4,很强的一点就是在数据量上的跃升。在业内交流中发现,OpenAI将整个公司最优秀的算法研究员拿去做数据规划和处理,这可能是之所以做出这么好模型的重要环节。
今天大模型研究背后实际是大量软件工程系统的问题。
OpenAI能用一万块V100训一个模型,据我了解,国内还没有团队能在一万块卡上保持高的加速比且做稳定。这些都是大的挑战,一方面是大力出奇迹,另一方面里面核心know-how需要持续沉淀和积累。
给AI产业带来什么变化?
首先是生产范式的重大改变。为什么有人把这波叫AI2.0,你会发现一个新的AI技术去做产品、完成商业模式、创造客户价值等,整个事情逻辑都在发生很大的变化。
2018年商汤就有一些预感,因为当时感受到去服务产业客户太痛苦了,你会发现行业里所有事情几乎都得你自己去做,上下游合作伙伴能帮忙的地方非常少。因为AI本身是个高门槛、高成本的东西,但你看任何一个成熟产业链一定是多分工、开放以及大家各司其职的。
当时就会想一个问题,到底什么时候人工智能产业会走到这种状态?多分工、多分化、开放的产业生态。
今天我们看到了一个似乎很切合的答案。
这种关键性AI基础设施包括算力、模型服务(MaaS)都让整个产业门槛极大下降。同时因为提供这种基础设施的厂商一定是少量的,也将面临巨大的下游生态,所以它的规模化会带来非常高的边际成本的下降。
这对人工智能赋能产业带来极大的改变,未来可能会产生更大价值,今天很多创业者、投资者都希望在这里寻找到属于自己的机会。
在我们看来,这个机会其实是非常广阔的,它打破了过去人工智能在产业落地因为技术产生的高门槛。
另外,今天一些核心应用,天然有大量的C端因素,以及在很多使用场景中能天然打造起数据闭环,这既更符合AI技术迭代本身,也将因为高速迭代可能带来很强的飞轮效应,产品具备长期持续性,商业壁垒门槛更容易建立。
所以一个感受是,接下来几年时间一定会迎来整个人工智能更繁荣、开放的生态。
在这之前有记者问我,AI2.0对AI1.0公司是不是有很大影响?我说这个不是很准确。
商汤早在2018年就相关探索,当时叫做预训练模型,直至现在商汤通用视觉大模型也始终是世界参数量最大,在过去支撑了整个集团业务的持续发展。
商汤平台内容“一平台四支柱”中的“一平台”,指的就是人工智能基础设施“大装置”。多年的持续投入,源于商汤坚持认为AI基础设施未来会支撑更加百花齐放的产业生态。而从基础设施层面讲开去,大量模型设计和系统调优经验能够支撑大模型服务,帮助更多人迭代自有模型。
总体而言,这件事的核心价值在于,整个AI基础设施会具备弹性和拓展性。通过提供全方位能力,商汤希望为整个人工智能基础设施、市场及产业,提供更加基础化的支撑能力。
我们也相信,在下一个时代,当我们技术整个具备了更大的关键性能力前提之下,通过更加大规模、高效率、低成本的AI基础设施,实现更好的服务,支撑到未来百花齐放的产业生态。
最后一句广告语,希望大家训AI大模型,找商汤大装置,谢谢大家。
- Ilya宣判:预训练即将终结!NeurIPS现场沸腾2024-12-14
- 罕见!云计算一哥CTO,现场不发产品只讲教训2024-12-06
- 清华系初创面壁智能获新一轮数亿元融资2024-12-11
- 马斯克新文生图模型闪现!网友抢时间疯狂实测:人物生成超逼真,可算把赛博皮卡画明白了2024-12-09