“AI眼镜的终极功能,是AI+社交” 对话影目科技创始人
克雷西 发自 凹非寺
量子位 | 公众号 QbitAI
AI眼镜,究竟为什么这么热?
2023年10月,现象级产品Ray-Ban Meta智能眼镜发布,标志着智能眼镜终端不再只是极客的玩具,而是可能成为继智能手机之后,人类与数字世界交互的下一个核心入口 。
截至目前,国内已有十余家厂商正式发布了AI眼镜产品,还有更多的产品正等待亮相,“百镜大战”的序幕已经拉开 。
这场大战之中,参赛选手属性各不相同,既有互联网厂商,也有做显示出身……不同类型的选手都是以一种怎样的姿态加入的这场战斗?
为了解开这些疑问,量子位与不同属性的AI眼镜从业者进行了对话。
今天的文章就是这一系列交流中的第一期,我们对话了影目科技创始人兼CEO杨龙昇 先生。
影目科技是一家自成立以来就在做智能眼镜的原生创业企业。作为原生创业选手,影目科技都积累下了哪些独特经验?面对生成式AI的浪潮,影目在智能眼镜的路上又有什么样的新战略?
看看一线实践者的Know-How。
核心要点
AI更多是一种底层能力,而不是一种聚焦的功能;按照功能划分,AI眼镜的发展可以分为三个阶段——AI+工具,AI+生活服务,最终是AI+社交;按硬件形态划分,三个阶段分别是无显示阶段、轻量显示阶段和全彩空间计算阶段;AI眼镜的竞争当中,需要实用性与时尚性并存;未来5到10年,AI眼镜将开始取代手机,成为新的交互入口。以下为量子位与杨龙昇对话实录,部分内容有删改。
AI眼镜的终极应用场景,是AI+社交
注:本节内容主要关于AI眼镜的AI功能和软件生态
量子位 :您如何定义AI眼镜,或者说听到AI眼镜这个词,您会最先想到的是什么?
杨龙昇 : AI眼镜在大众的脑海里面第一反应是钢铁侠眼镜,或者贾维斯眼镜,可能就是一个AI随身助理 。
量子位 :关于影目的AI功能,我们从电商平台的KV当中看到并没有特别地强调AI,这是否是影目的一种宣传策略?
杨龙昇 : 我们认为AI更多是一种底层能力,一种系统级的交互能力 ,可以去赋能各个功能场景,但不是一个非常聚焦的功能 ,这是我们对于AI的理解。
比如我们的INMO GO系列,就是将AI融合到了提词和翻译这两个功能场景里面。
假如你开一场会议,然后戴上眼镜,它会自动帮你提炼整个开会的核心,帮助你更好地去这个回答客户的问题,甚至在领导上台演讲的时候有一个更好的辅助作用。这个是AI结合这种功能场景带来的一些提升。
那我们其他的几个产品,比如说像INMO AIR3, 同样也是瞄准了AI,然后加上了一些娱乐应用。
我们的投资者当中包括三七互娱等等这些偏社交娱乐的股东,我们在探索有可能在AIR3上搭载AI,创造一种全新的陌生人社交方式。
总结起来的话,我认为AI更多是一个底层的系统,基于它的底层能力可以延伸出各种各样的智能体,然后发挥更好的效用,这是我们对AI的理解。
量子位 :您认为对于AI眼镜来说,接入大模型是不是一个必经之路?
因为其实很多时候人们去讨论AI眼镜,都会默认只要是AI眼镜一定是接入了大模型的,这一点您怎么看?
杨龙昇 : 我认为大模型更多地还是服务于功能链路 。
举个很简单的例子,就我们希望说AI眼镜将来可以像那种随身助理一样,能帮我随时去订外卖、随时帮我点杯咖啡等等。
从一开始下指令的时候,基于Transformer架构,可以快速去解析出来人的意图,然后去快速识别用户的需求,并精准地推送答案。
这个是AI或者说大模型本质上帮助智能硬件提升交互效率的核心。
量子位 :今年春节以来,DeepSeek的爆火让许多行业都受到了不同程度的影响。
您认为对于AI眼镜这个行业,这样的影响是什么呢?具体到影目,DeepSeek都带来了哪些新的思考?
杨龙昇 : 我认为首先Deepseek,包括其他的一些大模型的爆火,给整个AI眼镜行业带来了一波巨大的流量,也是巨大的推动力。
AI最直接的落地载体,现在看主要就是眼镜和具身智能 ,但我们会认为眼镜可能跟AI的结合会更加自然。
DeepSeek等等的AI大模型可以去帮助眼镜更加自然地交互。手机当中点击这种交互方式还是挺复杂的。
但基于AI的能力,配合眼镜端这种离眼更近的载体,就可以通做到一句话来调用到相关功能,获取到你想要的内容,这对智能眼镜的发展起到了巨大的促进作用。
第二点,AI其实也对于我们的一些场景功能有一些助力。比如在我们的go系列的AI翻译功能当中,可以去实现更多小语种和方言识别。
以及用户个人常用的词汇,它可以去更好地了解,以便向符合用户个人习惯的方向上迭代。
我们公司在AI和眼镜的结合探索这一块也是布局了挺久了。从23年9月我们第一代产品INMO GO开始, 就接入了AI大模型,这也是第一款量产的AI眼镜。
我们也一直希望把GO这个系列,继续往前推进,就像贾维斯(漫威作品中的AI系统)一样,让眼镜可以作为一个AI助理。
去年的GO 2发布以后,也确实由于AI的爆发,带动了我们产品销量的巨大的上涨。确实AI对我们这波还是影响还挺大的,带来很大的促进作用,我感觉它应该是超出我们预期了。
量子位 :对于AI眼镜来说,最重要的环节之一是应用场景,实际上每个AI硬件厂商也都会面临的一个问题,所以影目目前都会探索一些什么样的场景?
杨龙昇 : 对于整个AI眼镜的发展,我自己是给它列成了大概三个阶段。
第一个阶段,我们认为AI+工具 会成为当前的一个可落地的场景,这里的工具具体可能是一些办公场景,比如像开会的时候可以做会议纪要翻译,跟外国人一起沟通的时候可以做翻译。
第二个层级的话,我们给它归类,可能是AI与本地生活的结合 ,简单说就是和衣食住行相关。我们希望AI 助理可以帮用户去点餐,去做一些日常生活中的一些动作。
第二个层级的AI应用场景,也是在我们看来正在发生的。我们接下来要发布的AIR 3,今年还会再发一个GO 3。
最终极的应用场景我们认为是AI+社交 ,我们认为这会是一个颠覆性的体验。
过去的社交一般是真人之间的社交,但是基于AI的出现和虚拟人等技术的提升,我认为在未来不远的未来,可能四五年内,人是可以去跟一个个这种虚拟智能体去社交的。
我可以创造一个梦想中的虚拟形象,然后给TA灌入我想要的性格,然后在整个虚实融合的世界里面互动。
这也是我们一直在推进的一个场景,并且我认为这个事离实现来越近了。
量子位 :您刚才提到的第二、第三层级,可能单靠硬件厂商的努力是不够的,怎么去解决这样的一个问题?影目和这些功能的供应商之间怎么去磨合这个事情?
杨龙昇 : 目前我们和一些应用市场正在进行一些内容生态建设方面的合作。实际上这些互联网内容厂商对接下来的一波发展趋势也是非常兴奋。
我们当前可能更多是先按照层级,按照这当前的市场的进展,先从一些本地生活场景入手做,先解决一些大家简单的高频使用的场景,但同时也在对未来的AI社交,这种更加终极的场景去做一些布局。
确实这块是需要互联网的厂商参与,现在基本上各个大厂其实已经开始投入一些精力在里面了。
量子位 :有没有什么办法能够去提高这些大厂在这方面的热情和投入?
杨龙昇 :对大厂来讲,确实在情怀和现实之间做出权衡,是一个很实际的问题。
我们认为,今年如果整个个行业总体的出货量达到千万台以上,或者几个头部品牌能做到出货量百万台以上,总之是当用户量有足够的基数以后,大厂的投入意愿会更加的强烈,因为毕竟说在这种量级体验下的话,它这个内容是有可能去赚到钱的,
其次的话是我认为当前AI技术变革的周期非常的快,基本上每两三个月都会有一些突破性的进展出来,这个也促使了大厂其实在AI上面在做一些很多很多的应用体、智能体的一些尝试。
他们也需要为这些智能体去找一些落地点,眼镜当前无疑是最好的形态,那也促进了他们愿意在眼镜上面去做更多的内容尝试。
空间计算+全彩显示,AI眼镜的最终形态
注:本节内容主要关于AI眼镜的硬件形态
量子位 :AI眼镜其实有很多不同的硬件形态,影目比较青睐带屏显的路线,但是其实市面上还有一种不带显示的AI眼镜。
选择了这种带屏的路线就意味着它会比这个无显示的方案带来更多的挑战,比如续航、重量、发热这些都是一些现实的问题。
影目在这些问题上咱们都做了一些什么样的探索?
杨龙昇 : 我们认为整个眼镜行业的发展,也可以分几个阶段,当前最容易让消费者接受就是这种不带屏的拍照眼镜 ,也是当前Meta带起来的这波热度。
这种形态的产品其实坦白讲就核心功能还是以拍照为主,只是配合了一点点非常基础的AI能力,比如一些简单的一些问答和多模态识别。
但实际上它的AI的体验非常差,核心就是你问了一个问题,但并不能通过眼前的屏幕快速获取到答案和反馈,所以我们认为把它看做AI场景是一个伪命题。
现在整个行业瞄准的是第二个阶段,也就是AI加上轻量级显示 的这种产品。今年Meta也会发布这样一款产品,就是在拍照的基础上加上一些简单的信息提示功能。
这里面有一点好处,就是它只要带显示,就可以得到一些快速的反馈。
如果我接下来想去接入AI,去完成本地服务的场景,比如需要让他来帮我去买附近的一杯咖啡,就需要一个确定的动作(需要显示)来证明我这咖啡有没有成功下单。我们当前的GO系列也在主打这样的一些场景。
当然最终的话就还是像我们的AIR系列那样具备空间计算和全彩显示能力 。
从当前的技术限制来看,第一级别和第二级别的眼镜都可以已经做得非常轻量。
哪怕是拍照加上显示这种产品,也可以做到40克以内,跟单纯的拍照眼镜的重量基本上是没有任何区别的,也不会涉及到这种续航或者是发热的问题。
所以硬件的瓶颈主要这种基于空间计算的全彩显示,可能还需要有将近两到三年的积累期。
量子位 :如果站在用户这边来看,您认为这三种硬件形态的用户群体都有什么特点?
杨龙昇 : 对于第一个层级,可能一半用户是科技爱好者,买过来主要是想要尝试一些AI能力,当然也有一些炫耀的因素,去证明TA跟随到了行业科技的最前沿。
另外一半群体的话以这种拍照人群为主,比如孩子出去旅游的时候,拍拍孩子的精彩瞬间,或者是钓鱼要看演唱会的时候,用第一视角抓拍一些VLOG,这个其实是有一部分是跟运动相机的市场是做重叠的。
对于第二个阶段,增加的主要是是后一半的量。因为科技爱好者他同样该买还是会买,依然是追求行业最前沿的潮流。
但是有显示的这个能力以后,另外一半就不只是带孩子、看演唱会这些群体了,可以发展成一些更加广泛的用户群,比如一些手表用户,可能通过眼镜实时获取到一些微信的消息。
用户可以去快速获取一些指令,同时在日常的生活中可以有更好的助手,我认为这部分群体的整个量是远高于第一级别这种拍照眼镜的一个量。
我们预估AI加上这种简单显示的形态,全球范围内潜在用户量肯定是过亿的,国内大概是3000万以上,这是我大体的一个判断。
未来5到10年,AI眼镜将开始取代手机
注:本节内容主要关于AI眼镜的竞争格局及未来发展
量子位 :您认为,不论是哪种形态,决定AI眼镜类产品能否成功的最关键的因素是什么?
杨龙昇 : 我认为是时尚和功能各占一半 。
首先作为日常佩戴的眼镜一定要非常时尚,这对整个产品的重量和外观有非常高的要求。
我们目前在和依视路集团,包括他们的设计团队在做一些合作和探索,让影目的眼镜看起来就跟普通的眼镜一样,并且和国际上的时尚趋势接轨。
第二个维度,也就是功能的话,我们认为1500块钱对于消费级电子产品是一个分水岭,1500元以内用户可以接受买一个玩具,但超过这个数就一定要有实用性了 。
那我们认为当前用户的真需求,就是我们现在定位的几个产品序列——
要不然你要解决我在日常陪孩子的问题;要不然你就要在我的工作和会议的场景里面,帮我做一些翻译、提词,做一些会议记录。
这些是真真正正地在解决用户核心的问题。
基于这两点,既具备时尚,又有实用功能,才能让消费者去花钱买单 。
量子位 :您认为影目在“百镜大战”之中,最大的优势是什么?
杨龙昇 : 首先,我们在这个行业属于做得最早的几家,也是行业中第一家提出无线AR眼镜,或者叫AR智能眼镜,并且把这个产品量产的一家公司。
我们在这个行业赛道里面积累了超过4到5年的经验,可以分为这么几个方面。
一是我们做非常充足的储备,在整个硬件层面 上面、在整个光波导光学设计上面投入了巨大的时间精力,然后现在也是国内第一家可以做到阵列光波导量产,以及衍射光波导防漏光设计这些核心技术能力的公司。
除此之外,我们在整个系统OS上面也积累了非常多的经验 ,我们是国内第一家能在这种一体化的眼镜上跑出来6DoF效果的眼镜公司。
另外我们还积累了一些技术优势,能让我们把产品做得更轻、更小型化、更省电。
第三个点是我们公司本身的背景就是手机厂(酷派)出来的。在酷派这个阶段,我们在供应链上做了超过十年的积累。
我们所选用的很多都是国产的方案,我们在过去也是和这些供应商有非常好的关系,能够在芯片、传感器等方面做很多深度的定制,确保我们的成本优势远超同行 。
基于这几个点——硬件、光学上的积累,系统OS的积累,以及价格的优势,我们在接下来的这场“百镜大战”里面,我们有非常非常强的信心是可以去跑到前一前二的。
量子位 :您怎么看待像小米、华为这样的大厂入局AI眼镜这个行业?
杨龙昇 : 小米、华为这些厂商入局,它会有自己的一些优势,核心其实就是过去在手机上面的一些品牌渠道,包括一些生态能力。
然后我会觉得说像眼镜这个行业,它其实到最后不一定会是这种小米华为通吃的一个局面 ,因为刚才我也提到了它的时尚性的占比要超过50%,每个人喜欢的款式样式包括品牌都不一样。
虽然大厂在这个赛道里面有技术和资金优势,但我反而会觉得“品牌”会成为一个拖后腿的事情 。
我并不觉得,提起来华为、小米给我的感觉,像女生去买爱马仕巴黎世家时的感觉一样,反而会让人觉得我好像买了一个并不太时尚的产品。
所以说在眼镜这个赛道里面,它最后不一定是这种赢家通吃的结局,它会催生很多新品牌,每家品牌可能有自己的适应人群 。
我们则是更倾向于做年轻人、新中产这类群体,这些群体年龄大概在25到35岁之间,他们对于华为也好、小米也好,并没有那么强的这种品牌归属感。
我们更多是希望有一些更新的一些这品牌、有自己设计调性的品牌出现,这也是未来我们的生存之路,也是我们可以存活下来的核心原因。
量子位 :对整个AI眼镜行业的未来,有人觉得它可能会替成为手机的一个替代,直接变成下一个人机交互的入口;
但是另一批人会认为现在AI手机做得都不成熟,用一个新的形态去取代手机作为交互入口会非常困难。
您是如何看待这样的一个问题的?
杨龙昇 : 我是坚定认为眼镜一定可以替代手机的 ,因为我们过去做过手机,做了那么多年手机、手表,我太知道说当前手机这个行业已经是走到末路,快走到瓶颈了。
所有的用户都非常期待一个全新的终端,然后能让大家既有手机已有的这种生态和功能,然后又有一种全新的交互,包括一些视觉上的一些感受,所以当前用户对于新的“手机”的期待是非常高的。
那为什么说眼镜没有达到取代手机的这么一个状态?
我觉得它当前在整个的重量、时尚性上还没有做到极致,我们还需要将近两到三年的时间去把光机做小、把续航延长,然后把眼镜做到40克、可以always on,可以24小时佩戴的一个形态,同时又可以兼容手机的内容生态,然后又具备分屏空间交互的效果。
到了那一刻开始,它一定是可以替代掉手机的,我坚定地支持这一观点。
我认为在5到10年,这种替代会逐步出现 ,会有一部分25到35岁的潮流先锋,他们其实是出门就不带手机了,他是更愿意去接受新事物了。
当然,如果说完全去替代整个现在的这些习惯,可能还需要更久的时间。
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
做AI眼镜,为什么一定要有定制化大模型 对话雷鸟创始人李宏伟
克雷西 发自 凹非寺
量子位 | 公众号 QbitAI
AI眼镜,究竟为什么这么热?
自2023年10月Meta旗下的Ray-Ban Meta智能眼镜发布,标志着智能眼镜终端不再只是极客的玩具,而是可能成为继智能手机之后,人类与数字世界交互的下一个核心入口 。
截止目前,国内已有十余家厂商正式发布了AI眼镜产品,还有更多的产品正等待亮相,“百镜大战”的序幕已经拉开 。
这场大战之中,参赛选手属性各不相同,既有互联网厂商,也有做显示出身……不同类型的选手都是以一种怎样的姿态加入的这场战斗?
为了解开这些疑问,量子位与不同属性的AI眼镜从业者进行了对话交谈。
今天的文章是这一系列交流中的第三期,我们对话了雷鸟创新创始人兼CEO李宏伟先生 。
在AI眼镜的多项关键技术当中,光波导显示是雷鸟创新的看家本领。
同时,雷鸟还与阿里通义团队合作,成为了国内首家使用定制大模型的AI眼镜厂商。
雷鸟如何发挥在显示技术上的巨大优势?选择定制大模型路线又是基于什么样的考量?
且看李宏伟先生的回答。
核心要点
AI眼镜要具备实时响应能力,必须要有定制化的基座模型;具备全彩显示能力的AI眼镜,才是AI最好的落地载体;无论是用户画像还是生态破局点……AI眼镜的许多问题,本质上都和Killer APP相关;AI眼镜发展的最大限制因素,在于技术和生态的互动。以下为量子位与李宏伟对话实录,部分内容有删改。
AI眼镜,必须有定制化基座模型
量子位:V3在发布的时候剧透了很多未来要上新的AI功能,V3前不久刚刚完成了一次更新,这次更新有什么亮点?从发布到现在,在技术的迭代上有没有遇到什么难点?
李宏伟 :最近的一次更新是一个非常重要的更新,我们上线了两个最重要的新功能。
一个是AI录音 ,它包括了录音、转写、总结、翻译,一键完成。
另外增加了“所见即所得”的探索世界 ,它的摄像头是一直开着的,你可以一边走,一边问摄像头里面的内容。
除了新的功能之外,我们还优化了核心的拍照录像的色彩效果 ,这样可以让画面更加鲜活,而且我们还极大地提高了语音助手的启动速度和稳定性,它的稳定性和速度都有很大的提升,这是在上次的新版本上做的事情。
在这个过程中其实还有蛮多的困难要克服,比如说在端云侧的功能分布、网络连接的稳定性、网络连接的速度 ——我们怎么能保证在弱网环境下也能连接得好,但同时启动速度也比较快。
包括AI上面的多模态算法的协同,用语言、视觉的,在不同场景下,因为多模态大模型现在还没那么成熟,我们在一些场景下怎么做不同模态算法的融合,同时做算法和规则的融合 。
还有就是多品牌手机设备的兼容性 ,这里面还有一系列的问题,在过去得到了很大的解决。
量子位:关于接下来的的重点更新,雷鸟的计划是怎样的?
李宏伟 :我们在下一步的更新有几个大的方向。
第一个是符合我们过去在发布会上对大家的承诺,比如说我们过去提到的RayNeo新的AI电台、RayNeo AI备忘录 这些新的功能,我们会按照原计划上线,这里面还是可以给用户带来比较好的体验。
V3既然是一个带扬声器的眼镜,我们就希望它能够更自然地每日获取资讯 ;它又是一个24小时戴在头上的设备,所以我们希望它可以帮用户很好地记录日常生活中大大小小的事情 ,这是一个方向。
另外一点,我们也在不断地吸收用户的反馈,包括对新功能、核心体验上的反馈,所以我们也在做核心体验不断地优化,比如拍视频,在防抖效果上会持续做优化。
同时我们也在伴随大模型的发展,在眼镜上面随时给大家最新的大模型相关的产品。
比如说我们最近应该会上我们的AI Agent商店 ,这里面就可以引入更多开发者开发的各种各样AI的功能。
当然包括基座大模型本身的迭代,我们都会第一时间放到眼镜上面去。
量子位:当时雷鸟跟通义做了定制的大模型,但是DeepSeek在1月底突然火了,这对咱们在模型上的策略有没有影响?
李宏伟 :其实没有影响,原因有几点。
我们选择通义大模型是经过深思熟虑的,其中大模型在工程化方面的能力、对产品适应度 等维度都是非常重要的决策点。
DeepSeek在推理模型上做得很好,但推理模型本身是不是适合接眼镜作为核心大模型,坦白说,不是很合适。
现阶段,用户希望在眼镜上提出的问题能够尽快得到反馈 ,这是最主要的。从结果来看,我认为我们的选择是对的。
其次,我们也会上线AI Agent商店,这样我们能够在通义合作的技术上,将更多大模型的能力引进到产品上来。
量子位:现在市面上很多厂商是选择接一些能力比较强的通用大模型,然后自己再做调优,您认为定制大模型未来会是更好的趋势吗,还是觉得这两种路线各有优势?
李宏伟 :我还是觉得定制大模型是好的 。我们认为眼镜是AI落地非常好的载体,它对AI的倚重是比较高的。
你做一个东西,如果这里面AI不是很重要,或者你用AI不重,你在上面调优就可以。
但如果你跟它是生死相依的,你只在外面改就不行,简单粗暴就是这样理解的。
眼镜和AI是生死相依的,所以我们就认为只在外围改是不行的 ,外围你改不了什么东西,你只能做Agent,只能在它的功能上做集合。
但现在AI落在眼镜上的问题,不是说功能集合的问题,是它的基座大模型就要改,它的速度问题、准确的问题、多模态的问题,都不是在上层能解决的问题 。
上层当然有很多工作要做,但是不改基座大模型,我认为是不行的。
因为大模型本身的发展,主要考虑到的是基座大模型的能力,而它的工程化方面,过去更多的是考虑手机或者电脑的使用场景。
但在眼镜上面要做到反应速度非常快——我问了它,要赶紧给我回复,因为我也没有别的响应方法。
所以,眼镜对多模态大模型的要求比较高,对图像识别率要求也比较高,所以我们跟通义一起在眼镜上做了很多的改变和优化 ,从底座模型开始就做了很多事情,所以我们在快、准等等各个方面都做了很多的突破,这一点还蛮重要的。
量子位:在1月份的发布会上,雷鸟承诺过给V3提供3年的免费AI功能更新维护,今后的新产品,比如说X3 Pro,也会这样吗?未来会不会也会考虑一些订阅的模式,或者半订阅的模式,去平衡一些AI上面的成本?
李宏伟 :首先我们承诺的就肯定会做到 ,所以我们会在V3上面持续提供3年的免费AI更新维护。
其次,我们在未来会探索更多或者更长期的商业化的模式 ,这件事情主要有两个考虑。
第一个考虑是说,我们还是希望在一定的用户基础上再做这样的商业模式,用户基数太少了意义不大。
第二是我们做这种商业模式,其实是为了给用户提供更好、功能更强大的AI,所以我们会在成本和用户体验之间做一个平衡,这样可以给用户提供更长期、稳定的服务和价值。
发挥AI的最大价值,需要全彩显示
量子位:雷鸟在光波导上积累的技术优势特别多,包括5月份马上也要发X3 Pro,同时涉猎不带显示的AI眼镜,好像就体现不出雷鸟在光波导上的优势,所以同时涉足这种不带显示的AI眼镜是什么样的战略?
李宏伟 :这里面主要的原因,实际上就是雷鸟采取的策略,我们的策略,就像任正非任总说的,一边攀登珠穆朗玛峰,一边沿途下蛋 。
彩色AI眼镜一体机是我们攀登珠峰的产品,它一定是未来的AI+AR眼镜的主要形态 。在过程中我们也会把比较成熟的技术和成熟的用户需求做成“沿途下蛋”的产品。
这样做有几个原因,第一个原因是说只有攀登珠峰才能有未来。第二点是沿途下蛋对于我们获得现在的商业成果,以及逐步的积累能力,尤其是市场化的能力,也有帮助,所以主要是这个考虑。
基于这个考虑,不带显示的AI眼镜不是现在突然决定做的,是我们很早就在做相关的研究 ,我们在前期设计了V1、V2两款,它们都是从摄像头出发的产品,所以我们发的这一款叫V3,就是因为这个原因。
另外一点,不带显示的眼镜有一个优点,就是当前更成熟,我们看到在行业里面不带显示的AI眼镜已经做到了PMF (产品市场匹配度,Product Market Fit)。
在核心的Killer App上面,比如说第一视角拍摄,比如AI上面,我们已经可以做得比较好了。而对我们来说,我们通过这样的产品,在AI上面可以做到更及时的基于用户检验的积累。
眼镜是AI落地最好的载体,同时眼镜上面的AI也是非常重要的,我们在眼镜上面积累AI,或者做一个很好的AI Agent出来,实际上是需要数据积累的 ,所以我们现在做不带显示的眼镜,也可以让我们有更广泛的数据积累。
我们很快会推出来一个用户激励计划,如果用户同意把一些数据经过脱敏上传,我们会提供相应的奖励,这样我们就可以真的打磨出来更好的在眼镜上的Agent,或者在眼镜上的多模态个人助理。
量子位:您认为在AR设备上,AI能够带来哪些创新?
李宏伟 :首先我们认为AI和AR的融合,就是一个确定性的、必须的事情 。
比如说X3 Pro是一个带显示的眼镜,我们把它和AR等同了,但如果我们拆开来看,它里面首先是显示。
AI到底需不需要显示?我认为AI非常需要显示,这是必须的 。因为视觉是一个人最主要的感官,所以显示是必须的。
举一个典型的场景,比如翻译菜单,现在雷鸟V3和Meta都是一样的,你可以让它翻译菜单,它念给你听。但最好的情况,其实是我看到一个法语的菜单,我调动眼镜就可以把它变成中文的菜单,我把它翻译成中文盖在上面去,这样我点菜的时候,直接指向某个菜就可以直接点了,这是效率最高的方法。
所以AI眼镜是非常需要显示的,这是第一点,它们的结合是在各种各样的场景下结合,几乎没有什么场景是说有显示是不好的。
第二件事情,AI确实把AR的场景能做出来,并且体验很好 。
举个例子,刚才讲的翻译的场景,我们把翻译的结果贴在菜单上,这当然就是一个虚拟现实融合的AR的功能。但是如果要翻译得好,实际上背后是需要AI的。
比如说我们用一些AR的场景,我们提问题的,希望面前站了一个人物形象或者一个小精灵形象,他跟我们沟通的时候,如果他只是跟我们简单互动,像以前AR的场景,你跟他招招手,他动一动,他的玩法或者可玩性就比较弱。
如果你做了一个AI+AR的场景,它可以真的跟你互动。比如说眼镜看到迪士尼的米老鼠,你只是跟它招手,它能在你手上停一停,这个比较简单。但如果你要能跟它聊天,它有各种各样AI驱动的对话和表情,体验就完全不一样。
所以对一系列的AR场景来说,AI都让它能够成为现实,并且对体验提升非常大的一个助力。
量子位:您认为有显示的眼镜和没有显示的眼镜,它们的用户群体都有什么特点?
李宏伟 :我们现在看到的是有显示的眼镜和没有显示的眼镜,这当然是一个视角,产品就是这样子的。但其实如果我们补充另外一个视角,就能更好地回答您这个问题。
背后其实是不同的Killer App造成了产品形态不同 。顺序不完全是说我们定义了怎样的硬件,反倒是我们定义了什么样的Killer App,定义什么样的产品形态,去满足这个关键的Killer的应用场景。
从这个视角来看,我们看到几个Killer App。
第一个是第一视角的拍摄 ,这件事情是蛮重要的,举个例子,比如你去徒步的时候,你一边走要一边举起手机来拍,体验就不太好,或者是你去旅行,在海外,比如在巴塞罗那的街头去City walk,你就不希望不断掏手机出来,你希望直接拍到,不管是照片还是视频,这样效果就比较好。
第二个Killer App就是AI ,AI当然是一个非常重要的部分。
我们看到了一系列的应用场景,进而决定做什么样的产品是满足这些场景的,比如不带显示的眼镜,它就可以做到第一视角拍摄,它也可以做到一定程度的AI,比如对话的AI、视觉的理解,但是它的输出就比较受限制。
带显示的眼镜,一方面可以把原来的体验做得更好,比如说第一视角的拍摄,现在我们第一视角的拍摄,因为没有显示,所以我们不知道当时拍的大概是什么样子,但有了显示之后,我就可以做预览,我就可以知道拍的什么样子,这样才能拍到我想要的画面。
AI有了显示之后,它的反馈就不单是用语音,还可以用视觉反馈,这还蛮重要的。所以首先是场景体验会提升,当然它的使用成本、价格会变高一点,所以在这些场景里面,更关注更高级体验的用户,就会采用带显示的眼镜 。
另外带显示的还有别的用户画像,因为有的功能是不带显示做不到的,比如说这里面对AI和AR非常感兴趣的科技爱好者,他们就希望做这样的事情,买这样最领先的产品。
再比如说有些人是希望能投屏到眼镜上面去,它有一系列的场景会在上面用,这些群体都会偏好带显示的眼镜。所以带显示的眼镜使用范围更广、应用场景更多,但是在这些场景里面偏重于早期科技爱好者群体这样的画像。
量子位:现在有一些AI眼镜采用的是“折中路线”,也就是在全彩显示选择单色显示,雷鸟如何看待这种模式?如果可以一步跳到全彩显示的阶段,对大家是否是更有好处的?
李宏伟 :还是刚才说的,既要考虑硬件的问题,也要考虑Killer App的问题 ,我们认为单色显示的产品是有价值的,但它的重要性不如彩色的 。
举个例子,我之前参加一个电视节目录制,阿里的王坚院士也是嘉宾,他本来认为全民AR时代要20年,但是看到雷鸟X3这样带彩色显示的眼镜之后,他就改变了,他说3到5年全民AR时代就会到来,这是它的价值,彩色会带来更多的应用场景。
一个设备的爆发,其实本质上是应用场景带动的爆发,所以核心的我们还是觉得,单色的是有价值的,但彩色的更有价值,它更有决定性的意义。
AI眼镜的生态破局点,在于打造Killer App
量子位:您觉得AI眼镜,不管带不带显示,它能否成功的最关键因素是什么?
李宏伟 :我觉得这还是跟它的Killer App有关系 ,当然面向不同场景、不同用户的时候也不太一样。
如果我们简单粗暴地来说,首先如果我们认为是大规模用户,我们就希望这个眼镜无非是符合两个特征,第一是它的功能够强,第二是成本够低 。
功能够强这件事情当然是Killer App不断叠加 ,作为下一代的手机,它就是这个发展过程,就跟手机一样,打电话、发短信、上网、APP Store、图片、视频……
它要有一个一个的Killer App上去,比如第一视角拍摄,它要拍得够好,它拍得越好,可能用的人就越多。
还有AI的功能,现在语音对话、视觉翻译导览都可以,但是在多模态的时候,做一个复杂意图规划,这样的模型还需要发展。
比如我跟大家在开会,会上我说下周三咱们一起吃个饭,AI要理解我面前有多少人,要给我定个日历,去哪儿吃饭,要不要订个餐厅,这件事情还要发展,这也是一个要解决的问题,就是Killer App不断增加,其中非常重要的是AI Agent的成熟。
还有一个是成本的问题,这方面主要还是工程化的问题 ,就是把眼镜做到尽量轻、把续航时间做到尽量长,核心的还是这个问题。这里面当然要解决一些IP设计的问题、电池、功耗的问题,产品佩戴人因工程的问题,核心是这几个方面。
量子位:AI眼镜生态内容不足也是一个非常棘手的问题,尤其是现在各家眼镜厂商的应用之间,可以说基本上都不太互通,面对这个困境雷鸟有什么对策?
李宏伟 :AI+AR眼镜本来就是一个不断持续发展叠加的过程,现在没有到解决生态繁荣问题的时候,现在的核心是要解决第一步的问题,也就是前面几个Killer App的问题 ,在这件事情上最近是有进展的,比如雷鸟V3、Meta雷朋眼镜。
另外我们一边在发布产品,一边为开发者提供一个非常好的开发生态,包括我们的产品本身,包括SDK,包括开发者支持等等相应的事情,所以我们在一个螺旋上升过程中,只是说一开始可能10个应用,后面变成50个、200个,它有一个发展的过程。
我们也在跟全球最大的生态公司合作,比如腾讯、阿里、谷歌,刚才您提到我们跟阿里在AI上面的合作,不单是AI大模型本身的合作,我们也在做AI Agent平台的合作,所以这里面也在做这件事情,去促使生态的发展。
我们在内容、应用、硬件上都还是做了比较多的工作,比如提供一个很好的硬件基础,打造前面最重要的几个Killer App,同时跟大公司、开发者一起构成一个促进生态发展的环境,这是我们在做的事情。
破局点也是比较明确的 ,就是像雷鸟这样的公司,把产品卖到几百万、上千万,这个事情自然就解决了。最核心的破局点在这里。
量子位:那您认为做AI眼镜的友商之间有没有必要抱团取暖,比如说推出一个相对兼容性比较强的开发标准,从而更好地推动开发者生态?
李宏伟 :我觉得需要。雷鸟就是这样做的,比如说我们的SDK、开发者生态,就是兼容Open XR、AI的一些基本标准的。
我只是觉得这件事情可能只能发挥30%、40%的作用,但也号召大家这么做,因为这件事情这样做,对大家都有好处,开发者生态本来就是一个生态问题,它不是一个纯粹的技术问题,生态起不来,大家都会受到影响 。
不会存在说一个人突然生态很好,这是基本不可能的。
量子位:AI眼镜虽然出现也有一两年的时间,但是它还算是一个比较新的物种,在供应链打通上面,可能也是存在一些不完善的地方,您认为目前的供应链能够满足我们当下和未来一段时期的需要吗?
李宏伟 :我认为还不行,在一些关键的地方还不是很完美。
这主要体现在两个维度上面,第一个维度是说这个技术不是什么大问题了,但是因为AI眼镜这个方向,大家的准备度不够,所以没有针对性地做出来很适合它的好的供应链的组件 。
某种意义上芯片就是这个逻辑。现在的芯片主要还是考虑过去手机或者相关设备,当然有些像AR1这样的比较考虑眼镜的,如果更多人真的专门为眼镜去做设计,体验还是会好很多,这是第一个问题。
第二个问题是在技术的完成度 上面,确实有些关键的器件在技术完成度上面还是需要一点时间去做不断地优化,当然这不代表它现在就不能商业化,它只是有不断优化的过程,比如说包括micro LED、波导,但是在这个方面,雷鸟都在推动行业一起去做非常重要的突破。
比如芯片,我们也在跟一些芯片公司定制;以及Micro LED和波导,雷鸟发布了全球第一个全彩Micro LED的眼镜,我们自己做了全彩光引擎,我们也在和应用材料这样的公司,联合开发了第一个量产的光刻刻蚀的光波导,它就可以做到很好的一致性。
供应链问题是一个产业问题,也是一个生态问题,它需要和大家联动,头部的企业就非常需要跟供应链一起解决刚才那两个问题。
当然,在这两件事之外,还有一个问题,就是要把成本和规模化量产 解决,才能给客户一个价格合适的产品,这件事情雷鸟做得也比较多,我们在各个方面通过大规模量产,把成本降得更低一些。
量子位:所以您认为对于整个行业的发展,最大的限制因素是什么?
李宏伟 :我还是认为最大的限制因素,实际上还是技术和生态的互动 。
这个行业发展,我认为它的主线是这样的,从不带显示的AI眼镜,到带显示的AI眼镜,再到AI+AR眼镜,它会有若干个指数级增长的爆发点,就是它会有几个iPhone时刻,这些iPhone时刻的核心就是技术足以把产品变成现实 。
当然要想产品化,除了技术突破,还需要整个生态,包括软件、供应链生态的互动。
所以这件事情我整体来说觉得是随着时间发展会快速突破的过程,雷鸟作为头部企业在这里面已经做了比较多的探索,已经看到了一定的趋势和结果。
量子位:小米、华为等大厂最近也纷纷在AI眼镜上有所动作,您认为这样的大厂加入这个行业会带来什么样的影响?
李宏伟 :我觉得对行业来说是一个好事,促进行业更快的发展 ,我刚才不断地提到生态的问题,他们进来之后就会让生态更繁荣,至少他们进来了,生态就多了一家。
对市场的竞争也会带来影响,在不带显示的AI眼镜上面,战术上不好做,但是战略上它的技术栈的深度不是那么深,所以大家会相对比较卷。坦白说,不带显示的AI眼镜,其实也不是特别适合纯新的创业公司来做,当然雷鸟背后有知识,也有我们过去的积累,所以我们决定做这个产品。
行业发展会经过几个阶段,刚才不断地说那几个阶段,我们尽快把第一个阶段渡过去,就可以让第二阶段更快的到来,第一个阶段越久,第二个阶段永不容易到来。
第二个阶段是什么?就是带显示的AI眼镜,而带显示的眼镜上面,它的技术是具有颠覆性的,光学显示技术是新的,它不是手机的技术。
带了显示之后,应用生态会更丰富,也有更强的颠覆性了。所以我们觉得这没有关系,包括雷鸟这样的公司,我们现在在不带显示的AI眼镜上已经获得了比较好的竞争力和份额,我们认为更重要的是在带显示的AI眼镜上,雷鸟这样的公司会获得更大的优势。
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
相关问答
量子产品的植入原理
[回答]“量子化”指其物理量的数值是离散的,而不是连续地任意取值。例如,在原子中,电子的能量是可量子化的。这决定了原子的稳定性和发射光谱等一般问题。...
量子产品功能都是真的嘛
[回答]量子产品功能很多,量子植入后的产品可携带量子的高频能量场,从而通过人体本身无法感觉到的每秒钟上亿次的震动,打通微循环,剥落细胞、血管内的细胞...
量子能量产品有效果吗?量子能量植入哪家好
[回答]量子产品的用途挺多的,量子能量棒是一个方便,实用的高科技产品,只需靠近身体它就能让你体力增强,增强你的力量、柔韧度、耐力、平衡、促进微循环,缓...
量子能量植入产品加工商哪家靠谱?
[回答]量子眼镜是经过高科技量子舱能量植入后,用量子的高频振动特性促使眼部运动,激火眼部细胞组织,促进眼细胞的血液循环,量子能量植入产品有很多的,我朋...
为什么量子纠缠技术可以有效保障通讯安全?
量子密钥分配,甲方发送的光子既不是竖偏振,也不是横偏振,而是横竖偏振的叠加态光子。乙方将收到两种可能的偏振结果,具体是那种偏振是随机的(量子态坍塌...
【二十世纪都有哪些科学成就】作业帮
[回答]在20世纪的科学成就.数学抽象代数学的兴起泛函分析的诞生自然科学物理学x射线、放射性和电子的发现原子可变性和同位素的发...数学...
生活中光的折射应用_作业帮
[回答]楼上说得好象也不对啊~放大镜、眼镜、镜子(球面镜和平面镜)都是反射流动双折射技术是一种利用光学双折射原理进行流动测量的一门技术楼上说得好象...
为什么钢铁侠到死都没用过伊迪丝的无人机功能?
在钢铁侠要召唤出战甲的时候,这眼镜就没有用,被收了起来,当时进攻地球的是乌木喉与黑矮星,并没有其他外星人,或者是灭霸的先锋卫,“伊迪丝”是可以详细分析...所...
【超声波的应用有哪些】作业帮
[回答]:超声波:超声治疗学是超声医学的重要组成部分.超声治疗时将超声波能量作用于人体病变部位,以达到治疗疾患和促进机体康复的目的.在全球,超声波广...
汉方护肤品好吗?,汉方集团量子护肤价格贵吗都来说说?
[回答]可以让皮肤变好。皮肤干燥,使用滋润补水的护肤品。皮肤黑,使用美白功能护肤品。皮肤有皱纹,使用抗皱护肤品。有眼袋,使用去皱眼霜。女人过了25岁皮...
