智能语音助手真的能提高生活效率吗?Siri 的表现让人失望
说到智能语音助手,大家肯定会想起那些让自己无语的经历。
毕竟,现阶段人工智能距离智能还很远。
我这样说并不怕被人笑话,但世超其实很早以前就利用Siri来提高自己的生活效率了。
简单来说,你可以让他查实时汇率,识别歌曲,设定时间。
更高级的做法是,通过米家App和iOS快捷功能,下班后你只需要说一声“嘿Siri,我到家了”。
家里的窗帘会拉上、氛围灯会打开、蓝牙音箱会启动。
嘿,听起来很酷,对吧?
但经过无数次的练习,我发现 Siri 的聆听和理解能力有时非常糟糕,以至于我不得不对它竖起两个大拇指,然后我放弃了。
如果我有时间一遍又一遍地改正它,我就能把我的手指戳对了。
因此和许多 iPhone 用户一样,史超现在只是使用 Siri 来设定时间之类的,对于其他任何事情他都不再依赖这部智能手机。
然而,前段时间我们发表了一篇关于网络安全的文章,下面的评论让我对这个聪明的想法有点担心。
——当我们说“嘿 Siri”时,手机会做出反应。但是当我们不说“嘿 Siri”时,手机不是一直在监听周围的声音吗?
嘶,好像有点道理?
如果它不继续聆听声音,它怎么知道我叫了它?
后来我去苹果官网查看,发现他们在Siri的介绍文案里提到了四个字:“Always on call”。。。
我的怀疑更加强烈了。
如果真如网友所说,手机时刻在监听我们的谈话,那是不是意味着我们每天的每句话,比如半夜看学习资料时说的话,都会被人知道呢?
带着这个疑问,世超在网上查了整整一天,居然找到了一些解释。
我先告诉你一个结论,iPhone 之所以能听到你喊“嘿 Siri”,是因为它一直在聆听你的声音。
不过不要着急批评他,只听到声音不代表他能听懂。
就像你的狗总是能听到你说话,但它能理解一切吗?
要理解这个问题,我们必须回到2013年。
那一年,苹果发布了iPhone 5s,除了在iPhone中搭载最新的A7处理器外,还增加了一个小型的M7协处理器。
大家熟悉的A系列处理器,是iPhone中的C位,负责大部分的工作。
协处理器相当于一个助手,负责一些不是很困难,但是需要持续性去做的事情。
比如你平时在微信上统计的步数,就是通过加速度计和陀螺仪感应,然后通过协处理器计算出来的。
原因很简单。
由于协处理器消耗的电量非常低,即使不断计算数据,对电池寿命的影响也很小。
如果使用 A 系列处理器来实现这一点,手机将一直处于唤醒状态,并且电池寿命将被破坏。
此外,指南针和压力传感器也由协处理器管理。
2014 年苹果推出 Hey Siri 功能后,协处理器又有了另一项任务:处理 Siri 音频。
麦克风拾取声音,协处理器识别声音。
因此,手机确实一直在监听周围的声音来确定你是否说了“Hey Siri”。
问题来了,这时候手机能理解周围的声音吗?
它很难。
我们先来了解一下Siri的识别原理。
当你和Siri说话时,手机收集到的声音会被发送到苹果的服务器进行处理,这样它就能很容易地知道你说了什么。
但在触发Siri之前,手机一直在采集声音,数据非常庞大,如果把数千万部iPhone的数据发给苹果,服务器早就崩溃了。
因此在触发Siri之前,手机采集到的声音其实是在本地进行计算的。
这个计算很复杂,请参考下图。
由于世超不是相关专业,所以这张图只能看懂一半,我给大家简单讲解一下。
当你的声音进入麦克风时,它会被处理并切成很多小的音频,然后协处理器计算这些音频的“分数”。
最后,将这些音频分数加起来,看看它们是否达到了你的“嘿 Siri”语音阈值。
一旦达到,协处理器就会唤醒主处理器,主处理器会使用更精确的算法再次确定。
只有确认是你说了“嘿 Siri”后,Siri 才会出来接听电话。
总结一下:
协处理器不断检测周围的声音,在确认“Hey Siri”后,主处理器再次计算并向Siri服务器发出请求。
经过这么复杂的过程,iPhone才能确定自己听到的是“嘿Siri”,如果想让它听懂其他所有的话,那么就算工作量增加一百倍、一千倍,也不够。
因此,让 Siri 在被触发之前理解你所说的内容是不现实的。
有没有可能它只是收集声音并直接传输给苹果,不管它是否理解?
从技术上来说,这是可行的,但是从电池寿命来看,则不太可行。
想想看,如果你的手机一直在传输数据,那电池比你的头还大,续航能力就不够了,对吧?
就算苹果够阴险,只在充电时偷偷传输数据,但这么大的数据流量,难道不是公然送人性命的行为吗?
看到这里可能有朋友会问了,你这是在洗苹果吗?
之前有国外报道称,苹果能通过Siri听到难以形容的声音?
我查了一下,那篇文章只有一半是标题。实际情况不是 Siri 窃听,而是用户不小心触发了 Siri,Siri 开始监听,而用户当时正在做一些坏事。
为了判断Siri是否运行良好,苹果会提取不到0.2%的音频信息进行人工审核,最终遇到了这个问题。
用户还可以拒绝分享音频▼
当然,除了Siri之外,还有其他智能语音助手,它们大多也是通过低功耗芯片来监控唤醒词。
可以说,这些智能语音助手(包括Siri)理解周围的声音或者在触发之前将所有声音上传到服务器都是不太现实的,无论从技术层面,还是从逻辑角度来说。
有没有可能在特定条件下,语音助手会悄悄地连接到互联网并窃听十几秒钟?
人们经常会说,他们刚刚谈论了一款产品,但下一刻它就出现在了网上购物平台上,他们怀疑语音助手正在窃听他们的谈话。
其实,时超认为,这很有可能得益于广告联盟,他们拥有大量精准的用户画像,比如谁喜欢二次元,谁最近在看生活用品等。
根据用户画像推荐商品确实很精准,有时候你刚说完话就收到推荐,别人会以为你被偷听了。
关于广告联盟我们之前也写过文章▼
当然,这并不意味着语音助手不会窃听。这种可能性是有的,但可能性相对较小。
而且退一步来说,随着这两年我们国家相关隐私法的实施,各大厂商都加强了权限管理,我觉得被窃听的可能性就更低了。
想想看,任何语音助手制造商都没有必要为了赚几块钱而冒着被制裁甚至违法的风险去窃听人们的谈话。
文章评论