有人竟然为了两千多的眼镜倒贴10亿???

拿10亿激励开发者,AR独角兽Rokid与商汤声网成立产业联盟,还要「做下个时代的安卓」

明敏 发自 凹非寺

量子位 报道 | 公众号 QbitAI

戴上一副眼镜,就拥有了一块可随身携带的120寸4K高清大屏,这是怎样体验?

国庆高铁上看个电影:

有人竟然为了两千多的眼镜倒贴10亿?

玩个大型游戏:

有人竟然为了两千多的眼镜倒贴10亿?

还能办公,可电话会议,亦可处理文件:

有人竟然为了两千多的眼镜倒贴10亿?

或许你之前,对于AR眼镜没太见过如此具象的应用。

在谈论AR眼镜时,“期待”始终是主流话题。

有人说它是下一代交互终端该有的样子,有人说它是元宇宙的入口设备,也有人更关注它落地的可能性和可能性问题……

然而,当上述具象到一个个应用场景出现时,也意味着AR眼镜不再只是清谈阔论中的期待,它……真的来了。

消费级、量产发布,售价2999元……并且由一家中国技术公司打造。

消费级AR眼镜?

这副AR眼镜,从外表看,更像是一副大框墨镜,重量上也够轻——只有83g,不到两个鸡蛋。

这也解释了消费级AR眼镜之所以是消费级的必备能力,需要方便长时间佩戴。

有人竟然为了两千多的眼镜倒贴10亿?

按照介绍,该产品最大亮点就是能够成为一个“沉浸式随身巨幕”。

43°广域视场角+75Hz屏幕刷新率+2000nite屏幕亮度,相当于4米外120寸4K电视的效果,支持2D/3D切换。

有人竟然为了两千多的眼镜倒贴10亿?

而且100000:1的屏幕对比度,即使在夜晚佩戴AR眼镜,也不会感受到AR界面的背光。

有人竟然为了两千多的眼镜倒贴10亿?

此外还专门考虑到了近视人群

这副AR眼镜自带屈光度调节,0-500度范围内的近视用户,都可以通过旋转镜架上的旋钮,匹配自己的度数:

有人竟然为了两千多的眼镜倒贴10亿?

听觉体验上,也考虑到了应用场景。

镜腿上,藏着一对高清定向扬声器,可将音频的播放方向,直接朝向体验者的耳廓。

最高音量能达到85db,但半米外就会衰减为30db,给人一种“耳语”体验,不会显得缺乏公德,也保障私密性。

有人竟然为了两千多的眼镜倒贴10亿?

最后,出品方还介绍说,这款AR眼镜配有降噪麦克,并支持AI语音助手,在线或离线状态都可支持语音交互服务,能连接手机、PC、平板、Switch、PS4等终端,并且兼容4G/5G网络。

所以概括起来,这副AR眼镜打响的第一枪也非常明确——用一副便携眼镜,实现了大屏需求。

看电影追剧也好、玩游戏也行,甚至开个视频会议。

2999元的售价,也差不多是年轻人第一款电视的价格——但电视可不能随身带着走。

嗯,确实是消费级价格、消费级应用和需求,以及AR眼镜真正来到了To C时代。

但为什么这款AR眼镜会出现在此时此刻?又为什么第一枪主要展现的是“屏显”能力?

有打造者的努力,也有产业发展的阶段性局限。

我们接着往下看。

有人竟然为了两千多的眼镜倒贴10亿?

尤达大师是核心?

每一代新型消费级交互终端登场,背后必然有一套新型OS支持。

这副消费级AR眼镜也不例外。

核心就是它背后的系统:

YodaOS-XR

是的,名字来源就是《星球大战》的那个Master Yoda。

有人竟然为了两千多的眼镜倒贴10亿?

这个Master厉害在哪?

来自出品方公布的技术信息显示,这是一个支持多模态交互、跨平台的操作系统。

由基础层、平台层和应用层3个层面组成。

有人竟然为了两千多的眼镜倒贴10亿?

其中,基础层主要包括AR眼镜能实现的一些基本系统服务,比如戴上眼镜就能看到巨幕界面、2D/3D切换、语音交互等等。

基础应用外,YodaOS-XR系统还需要支持工业场景下的复杂应用,比如AR头盔——

这就需要平台层出马了。

它包括AI服务、AR服务和云存储3个板块,可以完成人脸识别、场景识别、AR远程协助、数据管理等任务。

但为了满足消费级硬件的多场景需求,上述两个层还是不够。

还需有面向开发者的最后一层,应用层

在这一层,YodaOS-XR提供了功能丰富的SDK和便携的开发工具,方便开发者开发;同时还具备全球化的开发者支持平台和应用发布平台。

跟你熟悉的智能手机系统类似,也都离不开底层软硬件堆栈、核心技术能力集成,以及最表层满足用户各种需求的App开发。

不同的是,在AR产业方兴未艾的今天,硬件、平台的碎片化在一定程度上会限制产业的发展。

这时,AR眼镜终端的打造者,就需要降低开发门槛,让更多人参与到开发过程中来,创造更多的生态内容和服务供应,让AR眼镜更多的用途被进一步激活。

实际上,YodaOS-XR虽然是专为AR眼镜打造的操作系统,但它还有个更知名的前身YodaOS

这是一个从一开始就开源的AI操作系统,专为人机交互设备开发而全栈开源。

在之前AI交互最为火热的时候,YodaOS也被类比为“AI时代的安卓”。

有人竟然为了两千多的眼镜倒贴10亿?

架构上,YodaOS跟安卓类似,从下至上,由Linux内核、硬件抽象层、AI抽象层和Java框架组成。

核心算法封装在AI抽象层,方便开发者直接调用诸如语音唤醒、语音识别、人脸识别等接口。同时,YodaOS支持替换第三方的AI算法,比如将语音唤醒替换为Amazon Voice Service。

同时,YodaOS使用Java作为应用开发语言,并自研在终端上的 Node.js(ShadowNode),开发者可以直接使用Java / Node.js来开发本地应用(技能)。

所以这种OS打造的思路,一方面为开发者延续创造了条件——可以最低门槛转入新一代交互设备开发,另一方面在语言、架构上的通用,也能让更多App应用能更快转入新一代交互设备生态中。

或者在还没有专门为AR眼镜开发的阶段到来前,也能与手机、游戏机等产品合力,完成第一阶段用户需求满足。

这也是为什么AR眼镜在企业级专用火热之后,终于可以进入消费级市场的关键铺垫。

而且,对于这种端到端交互、消费级终端的追求,这副AR眼镜和背后的打造者,从移动互联网格局未定时就在蓄力,滴水穿石已非一日。

消费级AR眼镜打造者?

官方大名Rokid,中文也叫若琪,出品过AI音箱,开源过AI交互系统,从第一天创办就表示要为下一代人机交互而生。

现在,Rokid带着消费级AR眼镜,到了刷新自我标签的时刻。

Rokid创始人祝铭明 (Misa),浙大出身,于加州伯克利国际计算机研究所攻读博士。

有人竟然为了两千多的眼镜倒贴10亿?

祝铭明似乎一直对操作系统和人机交互着迷,在移动互联网方兴未艾时代,他创办了一家名为猛犸科技的公司,主打的就是移动OS,后来被阿里巴巴收购,成为阿里巴巴M工作室负责人,后来这个“单位”,源流演变,成为了阿里新技术创新中心。

而祝铭明本人,因为成功的第一次创业,没有了财务之忧,加之有极客追求,在AI大潮已经被ImageNet在学术圈引爆后,开启再创业。

2014年,祝铭明从阿里巴巴离职后创立Rokid,成立之初就押注人机交互和人工智能。

成立当年,Rokid就推出了首款产品Alien智能音箱,比今天市面上常见的智能音箱早推出将近3年。

Rokid的首款AI交互产品,也以技术能力著称。在4字唤醒词流行的年代,Rokid率先实现了2字唤醒且很低的误唤醒率。

而且虽然其后陆续推出了多款AI音箱产品,但第一款Alien形态,其实就带有“视觉”设计和能力。

有人竟然为了两千多的眼镜倒贴10亿?

祝铭明也一直否认作为“AI音箱”甚至“AI公司”来被看待。

在他初衷里,Rokid始终就是一家人机交互公司,只不过生逢AI技术,可以利用AI技术来实现更加高效、智能的人机交互,并且可以不断推出终端产品来检验技术。

而利用AI技术来打造新一代人机交互终端,从语音、语言到视觉多模态,也是业内共识,只不过随着行业向前发展,走出了不同的路。

比如带屏音箱、AI大屏是一种路线,而Rokid和祝铭明选择的是另一条路线:

AI+AR

产品形态就是AR眼镜

2016年,祝铭明专门组建AI视觉团队,低调进军AR。

两年后,Rokid首款AR眼镜Rokid Glass应运而生,同时也逐渐展开了Rokid在AR领域的布局。

业内众所周知,Rokid创业发展数年间,AR行业的发展跌宕起伏,Magic Leap裁撤一半员工以求生存、Daqri总部关闭、员工遣散、变卖资产的消息时有传出——

Rokid何以走到今天,成为存活下来,还活得不错的少数?

其一是技术方向押对了宝。

尽管行业沉浮,但AI+AR始终是大势,尤其是AI能力的集成、落地和应用上,AR从来是最佳场景。

比如商汤这样的AI独角兽,就一直在AR领域内进行布局,其四大业务之一智慧生活板块,就是最好的注脚。

其二,Rokid自身发展路径更可持续,先To B再To C。

不同于谷歌、Magic Leap直接推出消费级AR眼镜,Rokid选择先在工业场景下做探索,并发展成为他们的主要业务之一。

他们的ROKID X-CRAFT工业防爆AR头盔,已经在中国石油等企业中投入应用,其搭载的AR交互平台,还能实现在远程交互、数据存储、管理等方面的应用。

实践与研发互补,这一过程中,Rokid积累了AI交互的能力、视觉的能力,以及硬件整合的能力,堪称全栈。

其三,行业又一轮春天。

今年,元宇宙概念席卷全球,又引发一轮AR热潮,究其本质,「Metaverse」一词所预言的那个沉浸式、多元化、自带经济系统和独特文明的世界,不正是以AR为起始点,逐渐构筑起来的么?

如果说虚实相生的元宇宙存在一个入口,那这个入口,最被看好的就是包含AR在内的XR眼镜

但元宇宙火热,只能说Rokid“被选中”,成为了焦点。

毕竟在人机交互和人工智能赛道长跑7年的Rokid,从做音箱终端、做硬件,自研芯片,多年死磕技术、算法,在软件方面积累了大量人机交互、多模态能力,可谓准备多年。

除了上面3点,Rokid为了消费级AR眼镜还做了更多背后筹备:

比如对整个AR产业生态的建设,重视开源。2019年,他们就在GitHub上开源了全栈AI操作系统YodaOS,吸引广大开发者加入,丰富AR世界应用类目。

还有最近,Rokid发布了RSS开发者助力计划,与商汤、声网共同成立AR智投联盟,投入10亿元补贴给开发者,并将Rokid AR Platfrom V1.0正式上线。

对于广大开发者而言,这自然是一次新的契机。

每一次交互终端的迭代,都会带来一次开发的浪潮。

PC时代,互联网开发者们乘风破浪成为那个时代的弄潮儿。再到后来的智能手机+4G时代,移动互联网开发者们又成为造富神话中的主角。

如今到了AR眼镜时代,在设备、平台更新的推动下,相信无数元宇宙开发者涌向内容创作,用一个个应用充实了人们手中的新媒介。

在这样一轮浪潮中,Rokid为代表的,在行业深耕多年的老牌玩家们,已经开始提供平台、鼓励开发者、内容生产者参与一个新世界的建立。

随着开发者的不断涌入、AR技术的内容愈加丰富,AR眼镜的能力也就会越强大,正向循环也就会形成。

回想2007年iPhone面世发布,同样先声夺人的也是那块与以往手机不同的交互屏幕……App Store还未推出,开发者生态尚未形成,最多的评价就是“收发邮件比功能机更方便一些”。

那时候鲜有人能预料,iPhone带来的手机智能化革命,将创造一个全新的开发者机遇,以及移动互联网浪潮。

就像现在,消费级AR眼镜来了,但对于它隐含着怎样的潜力和未来,当前还都只能以史为鉴、按照过去的发展史来推测新技术新应用和新终端可能的车辙轨迹。

不过即便如此,依然有一点可以明确:

新的人机交互时代正在开启,新的开发者机遇已经潮水扑面。

最后,如果有读者对Rokid Air这款AR眼镜感兴趣,可以前往有赞电商平台开始预订,售价为2999元。

版权所有,未经授权不得以任何形式转载及使用,违者必究。