我们通过语音数据拼凑出了一个人的全部生活,这让人毛骨悚然。
在智能音箱刚刚火地一塌糊涂时,我们就曾担心过这个问题:
我们的语音及对话数据,在一字不差地被传送回设备云端后,真的能被妥善保管及利用吗?
事实上,当天猫精灵、小爱同学、小度在家等诸多智能音箱品牌刚刚上市时,误唤醒率的频次高到让我怀疑这是公司想多获取用户日常语音对话数据而故意采取的策略。
其实不止音箱这个物件。当语音助手被唤醒,录音启动的那一刻,我们的语音信息就皆被掌握。
虽然所有技术公司都再三强调对用户隐私的保护与重视,但这显然不能阻止一些事情往往更容易向人们最不愿意看到的方向延伸。
譬如,今日登上外媒头条的亚马逊,因为一个重大失误,正在接受网友的口诛笔伐。
一位亚马逊电商网站的德国用户向当地杂志《c't》爆料,自己在向亚马逊讨要自己的个人活动语音数据时,对方竟然发给他 1700 份陌生人对话录音。
今年 8 月,他曾根据欧盟颁发的《通用数据保护条例》行使了自己的权利——要求亚马逊向自己开放所有存储在云端的数据。
而两个月后,亚马逊才姗姗来迟地发给他一个可下载的 100MB 压缩文件。
然而,除了他自己在亚马逊网站上的搜索记录,还有数百份音频文件以及一份解释 Alexa 语音命令的 PDF 分类记录。
不过这位用户很奇怪,因为他没有任何嵌入 Alexa 的硬件设备,也没有使用过 Alexa 的相关服务;此外,文件录音里的声音主人也跟他没有任何关系。
他在拿到文件后,迅速向亚马逊发邮件告知了这件事,并要求得到回复。
然而,亚马逊一方毫无音讯,与此同时,那个数据下载链接也已经失效。
不过,这些文件早已被这位用户下载并保存了下来。
“我担心亚马逊不会告诉这些录音被泄露的用户真实情况,所以想把这件事公开出来。”他把整个事件都分享给了《c't》杂志,包括那几百份录音文件。
《c't》听取了其中的部分录音,发现仅凭这些语音对话是完全可以“拼凑”出一个人的生活细节及个人习惯的。
譬如,一个人在家里用相关设备,呆在家里的时间比呆在外面更长;不仅仅有 Echo 智能音箱,电视里连着 Fire 机顶盒,这些设备的打开频次都很高;
另外,有一个女人有时会出现在他的周围;甚至可以听到他沐浴的声音……
这让我们有点毛骨悚然。
外媒 Gizmodo 是这样评论的:
我们竟然能够在一个陌生人完全不知情的情况下在他的生活中“自由穿行”,这掩盖不了绝对不道德且近似于偷窥的本质。
通过细节输出用户画像?一点都不难。
仔细一想,此前各大智能音箱公司发布的智能音箱技能使用频率排行榜,设定闹钟、收听音乐、询问天气、查找交通路线……
仅这 4 项功能就能拼凑出我们的个人习惯、音乐品味、工作性质以及位置信息。
利用这些信息,我们可以接着寻找到这个用户以及他的同住人。而拥有了这些人的名字甚至是姓氏,又可以让我们快速锁定他的朋友圈。
后面的就不难了,一个 Facebook,外加其他社交网站公开信息,几乎就可以为这场非专业用户侧写画上完美的句号。
这个事件的结局比较俗套。
两位被曝光私人信息的用户被《c't》杂志根据录音信息成功找到,前者表示震惊和愤怒。然后亚马逊在被媒体联系后,立马给用户打电话表示歉意,并公开表示:
“这是一起不幸的人为失误事件,也是一起个别事件。我们已经与涉及到的两位用户解决了这个问题,并且在已经采取措施进一步改进我们的流程。
为了预防新的意外,我们也在与国家有关监管当局保持联系。”
然而,亚马逊故意避而不谈我们更想知道的一些关键信息:
这起人为失误是如何发生的,向外界发送数据文件的监管流程是什么?
用户的语音数据都是如何被保存下来的,是否有可靠的安全保护措施?
为什么会有沐浴时的录音?
虽然这起事件看起来很严重,但是把数据泄露问题放在手机上,估计你就会恍然大悟——
只要你的手机麦克风与摄像头权限开放给了某个 app,那么它可以时不时开一下监听你说话,要么偷偷打开一下摄像头监控一下你的周围环境,很多人好像已经习惯了这种“小偷行径”。
麦克风监听多出现在一些有声音向功能的 app 上。
有工程师曾透露,很多音乐流媒体应用程序都存在这样的“故意行为”,这也是你某天在某地听到一首歌,发现当晚或第二天音乐 app 或基于这个音乐 app 的智能设备就能给你推荐这首歌的重要原因之一。
而谷歌工程师也曾经爆料,你把位置信息开放后,其实不仅仅能靠手机定位到你的平面位置,3D 位置也是完全没问题的。
也就是说,你在哪栋楼的第几层,某个 app 都会一清二楚。
对了,有看过《黑镜》没?第三季第三集男主电脑摄像头被黑引发的一连串悲剧,让很多网友夸张地直呼“要用创可贴把笔记本前置给粘起来。”
但某位安全工程师小哥是这样说的:“这本来就是常识啊,竟然还有人不遮摄像头?”
作者:宇多田
编辑:李晨琰 谢婉吟(实习)
责任编辑:顾军
来源:公众号“机器之能”