吕骋退场渡鸦终结,中国智能音箱该怎么玩?

网易科技赵赛坡2018-07-10 15:36事业线
在中国做智能音箱,要从价格、有无屏幕、内容生态上深谙本地玩法,市场的未来发展,也会成为BAT加小米的四强之战。

如果在一年前,也就是2017年7月之前谈论智能音箱,几乎所有的讨论都集中在亚马逊 Echo 以及 Google Home 这两大产品线。也是从2017年7月开始,随着百度正式发布 DuerOS 以及阿里巴巴人工智能实验室推出天猫精灵,中国智能音箱市场开始起步,并在随后半年多的时间内影响到全球智能音箱市场的格局,在市场研究公司Strategy的一份统计里,2018年第一季度,来自中国的智能音箱玩家,如阿里巴巴、小米已经成为影响这个新兴市场的重要力量。

吕骋退场渡鸦终结,中国智能音箱的玩法你还不懂吗

自2018年3月之后,中国智能音箱市场的玩家和玩法也越来越多:

2018年3月,小米推出小爱 mini 音箱,售价 169 元,随后价格被调整到 99 元;

2018年3月,百度和小鱼在家联合发布 599 元的带屏智能音箱;

2018年4月,腾讯发布腾讯听听音箱,售价 699 元;

2018年5月,阿里巴巴新款智能音箱方糖,售价只有 89 元;

2018年6月,百度发布小度智能音箱,定价 249 元,尝鲜价 89 元;

2018年7月,百度发布 DuerOS 3.0,从技术和商业闭环的方面打造「中国版 Alexa」;

上述这些新的变化也让我们格外期待稍后关于二季度全球智能音箱市场的格局,在此之前,不妨先来思考一个问题:为什么 BAT 以及小米,都在砸钱进入这个领域?

| 为何杀入这个市场?

几乎所有关于智能音箱市场爆发的分析都包含两个理由,其一,智能音箱以对话式的交互方式带来了全新的交互体验,这是自 2007 年 iPhone 之后最有可能取代智能手机的单品,尤其是在语音交互技术成熟之后,智能音箱的对话式交互也将变得更智能。

其二,智能音箱作为一个全新的入口,其背后是智能家居这样一个巨大的市场。下图是前瞻产业研究院的一份预测,可以看到,即便是中性估计,整个市场也将在 2022 年达到 2600 亿人民币以上。

吕骋退场渡鸦终结,中国智能音箱的玩法你还不懂吗

这两个理由自然不算错,但还有一个值得关注的原因,这就是语言和文化差异,导致智能音箱市场注定成为一个区域性市场。以目前全球市场占有率最高的亚马逊 Echo 系列为例,该产品虽然早在 2014 年年底就上市销售,但直到 2017 年才将语言支持扩张到非英语之外的语种,目前支持英语、德语和日语。

而在中国,根据教育部的数据,中国有多达 130 多种语言(方言),书面文字 30 种。由于智能音箱是一个非常依赖对话的产品,从语音识别到语义理解,机器都需要对语言有非常深刻的理解,这些都是美国公司无法克服的障碍,即便是深耕中国多年的苹果,Siri 目前能听懂的方言也仅仅只有上海话和四川话。

这样的文化和语言障碍,使得中国智能音箱市场几乎完全属于中国公司,尤其是在线上流量获取越来越难也越来越贵的行业背景下,争夺线下流量入口的战争也将愈发激烈,前两年的共享出行盛况也一定程度上映射了正在发生的智能音箱之争,整个行业也不可避免地进入到价格战、补贴战之中。

| 低价的两种玩法

不敢想象,如果不是在去年双十一期间以 99 元进行促销,天猫精灵的销量到地能有多少。这个上市价格为 499 的智能音箱,自 2017 年 8 月上市后,直到 2017 年双十一之前的三个月,都处在不温不火的状态,但双十一的销量爆发,最终让这款产品成为当下中国市场销量最好智能音箱。

吕骋退场渡鸦终结,中国智能音箱的玩法你还不懂吗

与天猫精灵99元低价战略形成鲜明对照的则是百度2017年对渡鸦的收购,现在看来,这也许是一步错棋。2017年2月,陆奇出任百度COO后的第一笔收购,就是以数千万美元的价格收购了渡鸦科技,其目的是推进百度的智能硬件,或者准确地说是百度的智能音箱战略。

吕骋退场渡鸦终结,中国智能音箱的玩法你还不懂吗

图:渡鸦面向高端市场的音箱产品raven-H

2017年11月的百度世界大会上,渡鸦科技拿出了他们对于智能音箱的解决方案,这款从外形上绝对秒杀市面所有音箱的产品有两个死结:其一,价格,高达 1699 元的价格第一次让中国智能音箱产品进入1000元大关;其二,产量不足,当用户对着屏幕向这款音箱发出一声声感叹后,却发现无法第一时间买到手。

也正是这两个死结,让这款被《华尔街日报》誉为2018 CES最好的产品最终被百度放弃,最新的消息称,渡鸦创始人、百度智能生活事业群组(SLG)旗下Raven Studio工作室负责人吕骋已经离职,而百度也在这半年时间先后发布了两款智能音箱,尤其是最新发布的小度智能音箱,直接将将价格降到了89元。

这些或成功或失败的案例,也给智能音箱市场的价格竞争提供了参考。作为一款全新的品类,不管渡鸦上千元的音箱还是不足百元的产品,其基本功能没有太大差异,这也意味着,只有价格足够亲民,才能最大限度地吸引用户关注,进而购买。

另一方面,简单的价格战之外,多样化的产品线将有助于规模的扩大。当用户购买了一款智能音箱之后,接下来,如何刺激这个已经对智能音箱有认知的群体进行二次购买?至少在现阶段,智能音箱迭代周期还没有完全形成,但智能音箱在使用空间有一定限制,比如一台智能音箱无法完全覆盖卧室、厨房与客厅,如果此时能有多样化的产品选择,至少从价位上做出区分,也成为促进智能音箱市场爆发的重要举措。

而要开辟新的产品线,硬件可以节约,但基本功能并不能节省,也正是在这样的背景下,带有屏幕的智能音箱开始出现在市场上。

| 屏幕带来哪些可能性

在3月底的天猫精灵发布会上,负责天猫精灵研发的阿里巴巴人工智能实验室总经理浅雪这样说道:

屏幕不等于视觉能力,不是加块屏就好了,我们不拘泥于上面那块屏是什么,我们拘泥的是有没有新的交互方式,是用视觉跟你做互动的,这才是下一代人和机器交互的东西……

这是对诸多记者质疑天猫精灵为何不发布有屏音箱的回应,但这个理由并不成立,因为屏幕本身就是一种新的交互方式。在去年亚马逊有屏音箱 Echo SHow 的广告宣传片里,尽管依然需要通过Alexa来唤醒,但这块屏幕却让智能音箱的用户群体从年轻人扩展到老人和孩子。

吕骋退场渡鸦终结,中国智能音箱的玩法你还不懂吗

如上图所示,这些广告里人物选角的细节和广告里的多个场景设计,比如年轻夫妻照看双胞胎的场景以及小女孩和爷爷一起画星空的场景,事实上都是亚马逊 Echo Show 的用户群体定位,那就是,美国的中产阶级白人群体——他们受过良好教育、有着相对稳定的工作和收入、看重家庭观念,更希望能够通过技术带来的便利优势,让家庭成员之间的联系更加紧密和便捷。

无独有偶,当百度发布有屏音箱小度在家时,也大打家庭理念。多个广告片里,忙碌的年轻人无法和父母团聚、焦虑的职场的妈妈想时刻和孩子通话等等场景反复出现,尤其是家庭通讯功能:

“一呼即通”功能最适合有老人和孩子的家庭。通过简单的权限设置,当你向家里的小度在家拨出电话时,不需要家人操作接听,小度在家就能帮你直接联通。

这个功能有着极强的“侵略性”,它强化了智能音箱与其他计算设备的不同——它不再是私人(个人)设备,而是一种家庭共有设备。

有了一块屏幕,也让整个交互的反馈机制得以视觉化的呈现,屏幕是从PC到智能手机时代最深入人心的交互媒介,如果说早前纯粹依赖声音的智能音箱产品是一种年轻人面向未来的体验,那么现在拥有屏幕的智能音箱,则更具普遍和大众意义,这也是为什么 Echo Show 、小度在家等广告里出现如此多的老年人和小孩的原因。

由此也可以大胆的预计,2018 年下半年,会有越来越来的有屏音箱出现,而随着种类增多与产品的普及,属于智能音箱以及对话式 AI 的内容与生态会出现吗?

| 内容与生态是关键吗?

当智能音箱在基本功能、基本形态(有屏无屏)与价格上的差异性越来越小,内容和生态之争就变得越发重要。

中国互联网过去几年所形成的若干个阵营,也反映在当下智能音箱市场的内容和生态里,天猫精灵背后是阿里巴巴的电商平台以及虾米的音乐曲库,百度 DuerOS 依靠的是爱奇艺、百度地图等自家的产品,而腾讯音乐也支撑了多个非阿里、百度的智能音箱产品……

在基础的音乐、服务之外,百度在上周开发者大会上宣布,开始全面赋能第三方开发者「技能」,根据官方的说法,要打造一个 AI 时代的 App Store。

具体来说,包括以下三个方面:

开发者可以选择「付费技能」和「技能内付费」,前六个月的付费收入全部归开发者;

推出 DuerOS 亿元开发者支持计划,提供开发资金传播资源,云服务器教育成长以及流量支持孵化基金等形式的支持;

推出 DuerOS 对话技能大赛,鼓励开发者开发有趣的技能参加比赛;

上述举措可谓相当领先,要知道亚马逊也是在今年 5 月份才开始向开发者们开放「付费技能」和「技能内付费」的功能,百度此举也彰显出其在语音交互生态建设上的决心。

但如果以亚马逊 Echo 的技能生态为参考来看,基于智能音箱的第三方技能开发并不像看起来那么美。根据今年 3 月的数据,亚马逊 Alexa 平台的技能数量已经达到 30000 个,而差不多一年前这个数字只有 15000 个,如此之快的增长速度背后,却也有诸多不确定性。

智能音箱的操作,除了特殊的唤醒词,比如“你好小度”、“天猫精灵”之外,还需要一些命令用语,也正是这些命令用语可以调动各种技能,但随着技能越来越多,不仅增加了用户的使用难度(记住那么多命令并不是一件容易的事情)也大大降低了某个应用的二次试用,或者说应用的用户留存率。

科技媒体「爱范儿」曾援引语音交互研究机构 Voice Labs 的一份报告指出,在2017年1月Alexa所拥有的7000多项技能中,其中只有31%拥有超过一次的评分,同时用户二次使用某个技能的比例只有 3%。因此,某种意义上说,这些 Alexa 语音技能中的大多数既无法被发现,也不大可能被二次应用,变成了所谓“僵尸技能”(Zombie Skills)。

另一方面,随着有屏音箱的出现和普及,基于家庭特定领域的技能,比如面向儿童、老人的的技能数量会有大幅增加。但这些领域的技能,如何能在远程通讯、问答之外做出更多的创新,如何能将屏幕的视觉、语音与手机乃至其他智能家居做出整合,从而带来全新的交互体验,已远不是单一一个技能开放平台所能承担的,也不是独立第三方开发者能所能应付的事情,而这些目前看起来,还非常遥远。

| 尾巴

如果产品出现的时间来看,中国智能音箱产品的出现,较亚马逊第一台Echo发布,足足差了两年半的时间,但与过往 PC 和智能手机的落后追赶所不同,中国智能音箱市场的出现和发展,已然形成了和美国相抗衡的局面,这背后的深层原因既有前文提到的语言文化差异,也包含了中国用户对于新技术、新产品的接受程度,当然还包括,中国用户对于“隐私换便利”的默许。

而中国互联网特有的生态、内容围墙也将进一步塑造中国特色的智能语音生态,你热衷淘宝还是重度使用微信,决定了你在购买智能音箱的决策;你是米粉还是米黑,也一定程度左右了你对99元以下智能音箱的购买决策……而对中国智能音箱的玩家们来说,历来的流量入口之争从来都是一场一场惨烈的战斗,BAT 们做出的烧钱架势,也将进一步压缩其他小厂商的生存空间,这个市场的未来发展,也会成为BAT再加上小米的四强之战。

*本文作者赵赛坡,由新芽NewSeed合作伙伴网易科技授权发布,转载请联系原出处。如内容、图片有任何版权问题,请联系新芽NewSeed处理。

相关领域的投资人