2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定
AI+AR,大模型上头,还得是眼镜
小明 发自 凹非寺
量子位 | 公众号 QbitAI
AI眼镜热潮,迎来了XR实力派的降维打击。
这款最新AR眼镜,有AR的深厚技术积累,也加持了最新的AI大模型能力,还跟时尚最时尚的眼镜厂商联手。
能干什么?
一副眼镜可以等于一个真人翻译。
戴上它,再也不用紧张工作会议中没听清歪果客户说啥。AR眼镜直接将听到的语音实时翻译成中文、并呈现在眼前。
赶着上班打卡来不及用手机买咖啡?
没关系,只需说一句“帮我点杯拿铁”,AR眼镜就能根据你日常习惯下单,并且支持声纹识别支付,完全无需手动操作。
导航也不再需要一直低头看手机了。戴上这副眼镜,它就能成为实时定位,用语音为你指路。
当然,它也能成为抓拍最及时的相机。
点一点镜腿,萌娃的可爱瞬间立马被记录,这可比掏手机、相机快太多。
这就是最新发布的AR眼镜——Rokid Glasses。
它的外形时尚轻便,几乎和普通眼镜无异,BOLON眼镜操刀外观设计。
功能上,不仅和普通AR眼镜一样具备显示能力,也集成了多模态AI能力。
必须要承认,今年智能眼镜真的火啊,不少厂商都开始布局,甚至是跨界入局。
但如果智能眼镜——公认的手机之后的下一代交互终端,就是AI+眼镜,给眼镜加个摄像头然后接大模型,那Google Glasses当年是不是太冤了?
所以现在,AR实力派玩家Rokid,用最新产品给出了回应。
把AI打碎到日常生活
从功能体验上来看,Rokid Glasses颠覆了诸多日常场景,从出行到办公、从演讲到学习……
它兼具AR眼镜、耳机、AI助手和相机的多方面能力。
最先被变革的就是拍照和摄像的体验了。
现在,只需点点镜腿,就能记录美好瞬间,支持长视频拍摄,还能一键分享朋友圈。
也兼顾耳机的能力,可以听歌、接电话等。
AI方面具备AI问答、AI搜索、AI识别、AI多语言翻译、AI实时导航、AI快速回复、AI闪记、AI转译等能力。
只需唤醒“乐奇”,就能让它帮你搞定各种操作。而且响应速度非常快,语音等文本指令,在1秒内反馈完成,图像等多模态信息2秒内反馈完成。
由此,在开会时,可以让它来记录当下碰撞出的灵感火花。
或者是让AI快速回复消息,避免重要信息被遗漏。Rokid Glasses接入钉钉等软件,可以实时接收信息。
同时它也能充当实时翻译。通过麦克风拾取对话内容,乐奇就能进行翻译,并将中文直接打在虚拟屏幕上。
这样一来,避免了人工翻译打断发言者的情况,能让双方的对话体验更流畅。
做演讲时,Rokid Glasses可以成为眼前的提词器。Rokid创始人&CEO Misa今天的现场发布,就是把题词放到了眼镜中。
外出骑行时,只需一句话即可开启AI实时导航,并将导航信息显示在虚拟屏幕上,实时规划路线。
做饭时,也能直接询问乐奇,“番茄牛腩怎么做?”它就能进行AI搜索,并将搜索结果显示在眼前。
它甚至还能解答数学题,只需咔嚓拍照,乐奇就能识别题目进行解答。Misa在发布中表示,它能解答线性方程、微积分等高阶难题。
除此之外,Rokid Glasses还具备AI转译、AI健康提醒等能力。
由于接入支小宝,用Rokid Glasses打车也只是一句话的事儿。
无论你是正在办公室/家里准备外出,还是在户外,都更专注于自己手头上的事,把打车这类小事交给眼镜。
支小宝可通过声纹识别支付,使用Rokid眼镜支付过程中,可与手机保持可信连接,并通过支付宝账户对支付做安全保障。
同时Rokid Glasses还具备物体识别能力。如果戴去博物馆,它就能识别你看到的文物/艺术品,展开介绍它的背景和故事。
在产品方面,首先在外观上,Rokid Glasses几乎和日常佩戴的眼镜无异,BOLON眼镜操刀的大框设计更显时尚。
眼镜采用一体化设计,整体重量仅49g,非常贴近于普通眼镜(大约30g),而且包含显示功能。而不包含显示能力的Ray-Ban Meta,官网标出的重量为49.2g。
同时也支持近视/散光人群镜片定制,卡扣安装即可,拆装非常方便。
但就在这副纤薄的框架中,被塞进了主板、电池等核心组件。
显示上,采用了行业领先的衍射光波导成像技术。
扬声器采用双声道高保真定向配置,保障音质同时减少声音外泄,更好保护隐私。
Rokid Glasses配备一颗1200万像素专业级摄像头,达到业内领先水平,支持竖屏模式下高清拍照和视频录制。
同时还设置了拍摄状态指示灯,在摄像头开启时,指示灯就会亮起提示。
其次底层硬件上,Rokid Glasses搭载先进的高通AR 1旗舰处理器,2GB RAM+32GB ROM存储。
AR 1不仅能为AR眼镜提供更好的拍摄、识别能力,也能充分调用AI能力增强图片视频拍摄质量等。
此外还搭配健康和运动传感器,支持用户通过点头摇头等动作触发指令。
Rokid Glasses支持蓝牙标准5.3,可以连接智能手机、平板等设备。
10分钟即可充电90%,20分钟完成满充。
同步推出了一个可充电的眼镜盒,眼镜盒满电情况下可完成10次满充。
最后在AI方面,Rokid Glasses选择整合业界领先的阿里通义千问大模型,支持完成各种多模态任务。
通义千问支持视频、图像、文字和语音等模态信息输入。通过快速识别摄像头捕捉到的物体或场景,通义千问就能进行分析判断,并通过语音或视觉反馈为用户提供相关信息。
由此,Rokid Glasses能进行物体识别、文字翻译、数学题解答等。
总结来看,Rokid Glasses将AR和AI做了更深入的融合,并希望离普通大众更近一步。
在外观上,得益于BOLON眼镜操刀设计,Rokid Glasses更符合大众审美。不仅是数码产品,更有望成为一款出街时尚单品。
一体化、轻便的机身也更利于全天候佩戴。同时,语音&触控操作都非常简单,用户可以直接上手学习。
价格上也相当友好,配备显示能力的Rokid Glasses,只需2499元。
为了保障智能化水平,Rokid Glasses和阿里合作,集成业内领先的通义千问大模型。
当然也要保障AR眼镜本身的全面能力,因此Rokid Glasses支持大量常用应用,并尝试把今年兴起的AI应用(如支小宝)也纳入生态。
由此,Rokid Glasses为AI+AR提供了一个值得参考的行业范式。
但为啥AI趋势正酣时,AI+AR的成熟范式就能被快速推出?
这得益于AR眼镜自身的发展成熟,也得益于AR和AI天生的适配性。
AI+AR正在更明确
今年,Meta Ray-Ban直接引爆AI眼镜、乃至AI硬件市场。
不同于AI Pin、 Rabbit R1的短暂火爆,Meta Ray-Ban有着实打实的成绩——发售后两个季度卖出100万副。
这意味着,在AI硬件这个赛道里,眼镜成为更被认可的形态。
紧接着,Meta发布了首款AR眼镜Orion,它就是在AR的基础上进一步展现AI能力。不过这不是一款面向普通消费者的产品。而另一边,OpenAI最近也收编了Meta原AR产品负责人,有意向布局AR领域。
这些动向并非巧合,而是AI和AR天生适配的进一步外化体现。
原因还要从AR领域自身的发展看起。以已经成立10年的Rokid为例——
在2014年成立时,Rokid定位人机交互,最先在北京和硅谷成立两个实验室,A Lab 和 R Lab。A Lab 是AI,R Lab 是Reality,加在一起就是AR,也是下一代人机交互的方向。
如今的Rokid以AR深入人心,但是最早发力的方向其实在AI。在深度学习浪潮席卷全球时,Rokid推出了AI音箱、开源AI交互系统。
这也一度导致Rokid被视作是一家AI公司。不过Rokid CEO祝铭明一再表示,Rokid是一家人机交互公司,只不过生逢AI技术,可以利用AI来实现更高效智能的人机交互,并能通过产品来验证技术。
这种理念很快在2016年进一步显现。
这一年,Rokid组建AI视觉团队,低调进军AR。2年后,旗下首款AR眼镜问世,Rokid在AR的布局开始清晰明了,并以每年2款产品的发布节奏,持续扩大自身布局。
在这之中,Rokid的AI浓度要比传统AR厂商更高。
比如团队花费4年时间带来的单目摄像方案。它实现了在AR眼镜上,只用1颗摄像头去做整个空间识别和3D手势。
要知道,只用一颗摄像头是难以感知空间深度信息的。Rokid通过AI生成深度信息,使得空间计算中,70-80%信息由AI合成。
带来的好处就是,单目方案可以进一步减轻眼镜自重、降低功耗,同时也能让设计更为简洁。
这使得Rokid能进一步追求AR眼镜的终极形态——一体式方案。
同时,为了保障AR独立行走,Rokid还率先推出AR主机,能让AR眼镜与手机做切割,建立更原生AR的内容生态。
从2016至今,Rokid已经发布10余款AR产品。
最新发布的Rokid Glasses正是当下AR+AI趋势下,Rokid呈现的最好答案。
它为如今AI应用爆发提供了新型平台,也为AR进一步智能化给出参考。
随着大模型落地趋势到来,AI应用爆发。
在移动终端上,AI应用的一个重要发展方向便是节省繁琐操作。让用户能够通过自然语言交互,完成过去复杂的屏幕操作。
对于人类而言,最自然的语言交互就是说话。说一句“帮我点杯咖啡”,比自己找APP、选品牌产品、下单支付要方便得多。
但在手机上实现这些操作,还是需要用户拿出手机、唤醒AI,会打断他本来的动作和行为。
相对而言,眼镜就是更适合的载体。它佩戴在头上,能够让用户在做其他事时,通过语音进行交互。这种天生的沉浸式和便携性,让AR眼镜更适合碎片化AI场景。
从AR领域来看,经过十余年发展,AR眼镜自身已经相对成熟。
从底层芯片、轻薄设计、显示成像以及系统开发、应用生态等,AR眼镜的软硬件都为引入AI能力打下了基础。
这使得在当下将大模型放入AR眼镜,在工程上是可行的。
Rokid Glasses就是最好的例子之一。
由此,在2024年,Rokid早早喊出的那句“AI和AR其实是一回事”,终于得到了验证。
而且,对于这种趋势的认可,不仅体现在AR、AI领域本身。各类应用生态伙伴也在以实际行动,推动AI+AR的快速前进。
阿里爱奇艺B站都来牵手合作
在Rokid最新发布上,钉钉、爱奇艺、淘宝、哔哩哔哩也官宣了一系列新合作。
在办公场景下,Rokid携手钉钉探索未来AR办公的新模式。基于YodaOS-Master平台开发的钉钉AR版本支持多屏幕联动及单应用多开等功能,可以进一步提升用户的工作效率。
娱乐场景下,爱奇艺透露正在构建一个覆盖多种设备和全场景的AR生态系统,将包括空间多屏显示、空间交互以及云台模式等新功能。并选择与Rokid进行合作探索,重塑AR娱乐格局。
购物场景下,Rokid和淘宝合作将AR引入在线购物,推出3D商品展示和虚拟样板间功能,消费者能获得更沉浸的购物体验。
教育方面和与网易有道合作,利用AR技术提供虚拟英语教师互动交流,增强学习趣味性和口语表达能力。
Rokid还与哔哩哔哩合作,为《时光代理人》IP注入AR游戏元素,使用户能够与虚拟角色互动,并在现实世界中再现动画场景。
此外,Rokid与智象未来合作,在AR设备上实现了AI生成三维内容,简化创作流程,提高生产效率与作品质量。
为啥大家都选择Rokid?
来看Rokid成立10年的成绩单——
截至目前,Rokid推出了AR Studio、AR Lite等多款产品,购买人数超过30万,且日常活跃度达到75%以上,用户日使用时长达到2h45m+。
ToB方面,Rokid在文博市场占有率达到99%,用户数量突破250万。
在产品形态上,Rokid率先在行业内提出分体式设计。通过将电池、芯片、主板等核心部件从眼镜中分离到Station上,能在提高佩戴舒适度同时保障AR眼镜性能,为AR独立行走开辟道路。
在技术方案上,Rokid坚持单目摄像头识别方案。相较于行业中更为广泛的双目方案,单目方案可以让AR眼镜重量更低、结构更简单、功耗更低,并且能避免双目方案眼镜容易轻微变形、进而导致摄像头参数不准的问题。
此外,在光学方案上Rokid正在探索更面向未来的光波导路线。它能将光线沿着一个非常薄且透明的平板材料传导,将微型显示屏上的图像传递到用户眼中。
这种方案有着非常高的光线透过率(通常在80%以上),结构更紧凑轻便,能实现真正意义上的双眼显示,适合更加轻量化的AR眼镜。
另外值得一提的是,生态方面,Rokid推出了YodaOS-Master平台、灵境等供海内外开发者和创作者使用,构建了国内最大的AR开发者社区,聚集了90%专业AR开发者。其中注册开发者超过6200,企业开发者超过2500.
就在本次发布上,Rokid还推出了Station2创作版,在原有基础上增加2枚摄像头,支持空间拍照,为开发者提供拍摄功能。
并发布了Rokid Spatial Link,只需一根线连接电脑、手机、iPad、Xbox、PS5等支持DP协议的设备,就能立即开启空间显示体验。
总之,从产品、技术、生态方方面面,Rokid都早已走在了行业前列。
如今,AR+AI的方向更加明确。一时之间,各路人马都涌进这一赛道,行业内外好不热闹。
Rokid Glasses为行业提供了一种参考范式——XR厂商+时尚墨镜品牌+一流大模型,让更AI的AR眼镜,从一开始就兼顾硬件体验、好看外观和智能化体验。
AI大模型在多模态交互能力上的突破,之前给了业内这样的错觉——给眼镜加个摄像头,再集成AI能力就是下一代智能交互终端。
但Rokid也好,更早之前Meta也好,甚至苹果Vision Pro给出的方向押注也好,证明了AI对于下一代智能终端的如虎添翼,终究要建立在XR技术积累之上,或者可以更肯定的说——AR显示和交互技术基础之上。
对于智能眼镜,AI不会是谁的壁垒,AR显示和交互能力才是,丰富活跃的生态才是。
从Rokid Glasses,这一切才只是刚刚开始。
你说呢?
最后,福利时刻:
扫描下方二维码即可抢购“9.9元抵200元”F码,获得F码还将享有优先发货、质量问题一年内免费换新等福利。
感兴趣的童鞋速来~
- Sora开服被挤爆!支持中文/编剧模式/作品分享,145块就能玩2024-12-10
- 华为云又一数据中心开服:让算力像水电一样通用,青岛这步棋走对了2024-12-07
- 第一个国产中文o1来了,直接数学竞赛题伺候!2024-11-27
- 联想创新开放日:2024最全面AI产品组合来了2024-11-28