AI十年进阶：一段算法能力演进的历史

鱼羊 2021-07-19 13:56:06 来源：量子位

算法已经无处不在，但还远远不够。

鱼羊发自凹非寺
量子位报道 | 公众号 QbitAI

现在，AI无疑已经到了祛魅的时间点。

当AlphaGo的惊世一战已成5年前的旧事，当GAN制造的特效在鬼畜区遍地开花，当曾经只有最精尖团队才敢涉足的自动驾驶迎来造车大潮……

有人认为AI被捧上神坛的黄金期已经过去，但也有更多的行业观点指出，此时，才真正到了见证AI技术创造价值的时刻。

不错，如今，对于App里的推荐算法，大家早已习以为常；手机里的智能助手也越来越能get到你的意图；甚至去趟亦庄，就能在地图App里打上一辆无人驾驶出租车……曾经只在实验室中被讨论的算法，已经在不知不觉中蔓延到了生活的各个角落。

而当AI神秘的面纱随着技术的普及不断被揭开，行业内那些曾经被精英光环照亮的明星公司，身上的标签也逐渐发生了变化。

说白了，就是比起“顶会论文”、“世界冠军”，外界正在像独角兽们提出更加直接的问题：

一家AI公司，究竟能创造出什么样的价值？

迷雾消散，潮水褪去，才见真章。

就在最近，这群独角兽里一直备受瞩目的旷视，成立10年以来首次举办了技术开放日活动。

恰好，旷视首席科学家、旷视研究院院长孙剑等人，就在活动中针对这样的问题，给出了自己的答案。

“AI是不断演进的算法能力”

谈及AI技术创造的价值，首先应该讨论的是衡量价值的标准。

事实上，在技术发展的不同阶段，所谓“AI的价值”始终是在动态变化着的。

众所周知，AI技术迎来爆发期，也就是近10年以来的事，但AI几起几落的历史，却可以追溯到上世纪50年代。

以史为鉴，其实不难看出，虽然受限于计算能力和数据，AI在两度迎来发展高峰后都很快陷入“寒冬”，但算法的演进，始终都是其引发关注的主因。

达特茅斯会议之后，掀起人们对人工智能第一波追逐的，正是机器自动定理证明、会下跳棋的跳棋程序、已经能胜任简单视觉处理的感知机（Perceptron）等算法研究成果。

更不用提现在这波人工智能热潮的来临，是以图灵奖得主Hinton等人提出的深度学习算法为基石。

但这还只是狭义上的“算法的演进”。

事实上，此前AI寒冬的来临，究其本质是AI无法突破从“有没有用”到“在哪里用”之间的距离。

如果说实验室单点算法的突破，是算法演进的深度，那么规模化的实现与落地，就是算法演进的广度。

收缩时间的范围，这样的认知同样可以在最近10年中国的AI价值进阶之路上得到证明。

作为中国AI十年的亲历者，旷视就认为，这10年来AI在中国产生的价值变化，大致可以划分为三大阶段：

基础科研
行业落地
基础设施

孙剑表示：

这三个阶段分别回应了三个问题：AI有没有用？AI在哪里用？AI易不易用？

并且，这三个阶段不是分段接替，而是以基础科研为起点，你中有我我中有你，并行推动着AI价值的进阶。

回到算法的角度，可以这样理解：

基础科研的关键点是突破单点算法，让AI率先在互联网等数字化程度高的领域应用落地，证明可用性的问题。

行业落地的关键点是拓展算法边界，让AI能在越来越大的行业场景中实现规模化的商业落地。

而基础设施的关键点是降低算法门槛，让AI生产变得更加容易，从非标准化生产到标准化量产——旷视研究员周而进也在活动中强调：“非标准化的生产流程是制约算法生产的主要因素。因为非标，所以过程充满不确定性，所以需要全能型人才。只有标准化，才能自动化，才能规模化。”

在这个过程中，正如开头所提到的，算法本身似乎越来越不令人兴奋、让人感知不到，但实际上，算法却已经无处不在，真正开始走出实验室发挥出越来越大的价值。

以这样的视角再去回看旷视的10年历程，就会发现旷视自身的进阶，正是遵循着上述算法能力演进的脉络：

最初，以算法起步，乘着深度学习的变革东风，将深度学习与计算机视觉进行结合，形成以面部识别、视频结构化、图像分类、物体检测、语义分割、动作识别等为代表的算法能力。

进入到产业落地的阶段，在前期积累的科研成果的基础上，又从face++到Brain++，将自身快速、低成本生产算法的能力沉淀为AI生产力平台，提供从数据管理，到深度学习框架引擎，再到算力资源管理的一站式AI能力，大幅降低算法生产的技术门槛，实现AI算法的标准化、自动化生产。

以这样的算法能力为基石，旷视又在与产业的更深入结合中，选择了AIoT的路线。

因为IoT是基于场景空间，以人为核心、软硬结合的网络。AI+IoT的本质，就是将AI的能力注入到IoT场景中，实现智能化。

在AI能力的注入下，传感器、机器人等物联网终端硬件如同拥有“小脑”，能够实现“单体智能”；AIoT操作系统则是在各种物联网硬件和设备完成整合、组网之后，构成“大脑”，实现“群体智能”。

如此一来，AI算法才能真正做到“无所不在”。

旷视十年，不变的是什么？

成立10年，是时候通过技术开放的窗口再来看旷视是一家什么样的公司。

其实跟最初外界给“CV四小龙”的定位，已然相去甚远。

如今，不仅是在CV领域，将算法能力从目标检测、语义分割，拓展到了光学指纹、SLAM导航等更加丰富的场景里，旷视也把基础研发的视角，投入到了更基础、更本质的创新。

比如旷视研究院就在今年提出了RepVGG，革新了模型设计方法论，让经典的极简神经网络架构重新达到SOTA水准。其在开源后Github star已超过1800。

而Brain++提供的智能化、标准化工具组件和AI能力，则是从基础设施的层面发力，解决AI进阶途中逐渐暴露出来的生产效率不足的问题。

看上去技术“杂”了，但实际上，旷视技术路线的演化背后，透露出的是其作为一家跟中国AI行业共同成长起来的公司，对自身造血更新的深入思考。

这样的不同之中，更深层的致胜逻辑其实却是不变的：围绕AI技术、围绕算法本身，持续创新拓展认知边界。

事实上，这种变化，不只局限在旷视。现在仍在行业中开辟自己的生存之道的独角兽们亦如是。

变，是基于作为AI行业的亲历者，对行业的不断洞察。

不变，是技术为王的底色，和对科技创新的坚持。

在这个过程中，旷视这样的公司在技术上依然“精英”，在落地上则更加务实。

— 完 —

旷视算法

鱼羊

文生图进入R1时代：港中文发布T2I-R1，让AI绘画“先推理再下笔”2025-05-14
Manus终于开放注册！每天能免费玩一次2025-05-13
大模型终于通关《宝可梦蓝》！网友：Gemini 2.5 Pro酷爆了2025-05-03
10秒生成官网，WeaveFox重塑前端研发生产力 | 蚂蚁徐达峰@中国AIGC产业峰会2025-04-30

AI十年进阶：一段算法能力演进的历史

“AI是不断演进的算法能力”

旷视十年，不变的是什么？

相关阅读

苹果Meta都在冲的Pancake技术，中国VR团队YVR竟抢先交出产品答卷

AI独角兽增援抗疫拉锯战，旷视守“城”，依图出“机”

糟糕，手机密码不保！剑桥大学新研究，用AI算法“监听”手机打字，触摸屏也中招

继天元开源后，旷视又亮出“看家本领”：推出Brain++商业版

潞晨科技尤洋：中小企业同样追求大模型，但最先进AI训练成本还是太高 | MEET 2023

科技部颁布十大国家新一代人工智能开放创新平台，华为旷视等入选

热门文章

鹅厂开源视频生成大杀器！参考图主体精准复刻，还能编辑现有视频

Qwen上新AI前端工程师！一句话搞定HTML/CSS/JS，新手秒变React大神

大模型重塑服务生态，容联七陌「AI进化论」探索智能客服新未来

开源即屠榜！UniME多模态框架登顶MMEB训练榜，刷新多项SOTA纪录

夸克即将发布“深度搜索Pro”，能力比肩DeepResearch

AI十年进阶：一段算法能力演进的历史

“AI是不断演进的算法能力”

旷视十年，不变的是什么？

相关阅读

苹果Meta都在冲的Pancake技术，中国VR团队YVR竟抢先交出产品答卷

AI独角兽增援抗疫拉锯战，旷视守“城”，依图出“机”

糟糕，手机密码不保！剑桥大学新研究，用AI算法“监听”手机打字，触摸屏也中招

继天元开源后，旷视又亮出“看家本领”：推出Brain++商业版

潞晨科技尤洋：中小企业同样追求大模型，但最先进AI训练成本还是太高 | MEET 2023

科技部颁布十大国家新一代人工智能开放创新平台，华为旷视等入选

热门文章

鹅厂开源视频生成大杀器！参考图主体精准复刻，还能编辑现有视频

Qwen上新AI前端工程师！一句话搞定HTML/CSS/JS，新手秒变React大神

大模型重塑服务生态，容联七陌「AI进化论」探索智能客服新未来

开源即屠榜！UniME多模态框架登顶MMEB训练榜，刷新多项SOTA纪录

夸克即将发布“深度搜索Pro”， 能力比肩DeepResearch

夸克即将发布“深度搜索Pro”，能力比肩DeepResearch