当你注册微信的时候,你需要阅读一份 8300 个字的隐私协议,必须勾选「我已阅读并同意上述条款」,才能进行下一步。
但我们都知道,你其实并没有读,也不知道你究竟同意了什么条款。
理论上,只要你同意,你在 App 里填写的住址、电话号码、聊天记录、手机里的通讯录、照片、短信、通话记录都可以被 App 们自由地采集和分析。
它们对你的隐私数据到底做了什么?视频链接
首先我们要知道 App 究竟能采集到你的哪些信息。
在 Android 提供的开发者文档中,我们可以把 App 能获取的权限分为普通权限和危险权限。
普通权限有 140 项,不需要经过用户同意就可以获取。比如控制你的振动传感器和日历数据。
而更敏感的危险权限则分为 9 组,比如录制音频、读取短信、访问照片等等。
而这些授权基本都是一次性的,比如你需要通过 app 发送语音,打开了麦克风权限。那么这个 app 理论上是可以一直在你的使用过程中录音的。
这时需要分清 App 权限和 App 可以采集的数据。
在大多数 App 的隐私协议里,都会说明它们不会偷听和偷看:
但你使用麦克风的时候就不好说了,比如这份卫报 2019 年 7 月的报道中,苹果会对 1% 的用户采集他们和 Siri 的几秒对话录音,用于改善 Siri 的识别准确率。
但除了这种用来改进产品的情况,目前并没有证据可以证明 App 会偷偷上传分析你的录音或者的照片。
你的数据更常见的用途是生成给分析师和广告主的用户画像,比如微信就知道 00 后和 60 后最爱的表情包,知道 90 后每月坐 25 次公共交通。
而我们这样的视频创作者,也可以在后台看到观众的性别比例、年龄比例、使用设备和地域分布。
互联网公司可以这么做的前提是你同意了这一切,虽然你很可能没看过。
但它们的要守住的底线是,不能通过大数据反推出你的个人信息。
举个例子,假设我们有 100 个关注者,在后台我们可以看到 50% 来自广东、40%来自江苏、10% 来自湖北。
此时我们如果我们移除一个关注者每羊,剩下 99 人的地域比例变成了 50.5%、 40.5%、 9%。
这样,每羊的隐私就暴露了,我们轻易可以推算出他来自湖北。
解决这类问题的常见方案是差分隐私。
差分隐私的核心思想是给数据加入噪声,让有没有美羊都输出差不多的结果,无论是关注者是 100 还是 99 人,来自湖北的观众比例都有可能是 9%、10%、11%。
但另一方面,噪声也不应该乱加,要不然数据也没有参考意义了。
最常见的噪声算法是 Laplace 噪声。Laplace 是一种常见的连续概率分布,位置参数=0 的情况下大概长这样。这个 b 是尺度参数,可以看到 b 越大 Laplace 分布就越扁平,数据波动的幅度越高。
而在原数据的基础上加上的 Laplace 噪声的大小则取决于两个参数,敏感度 Δf 和提前设置好的隐私预算 ε 。
简单来说, Δf 就代表了有没有每羊对最终结果的改变数值,用 Δf/ε 就能得到 Laplace 中的尺度参数。
所以,如果两个数据集差距越大,敏感度 Δf 也就越大,分布越扁平。这样,加入的噪声可能就很大,让两个数据集输出类似的结果。
如果数据集差距不大,Δf 就小,输出的噪声很可能就接近为 0,不影响数据可用性。
相比外部攻击,更常见的是内部泄露。
在这个问题上,互联网公司们的做法通常是考证,其中最重要的是 ISO/IEC 27001。作为全球公认的最高信息安全标准,27001 包含了信息安全、人力安全、物理安全在内的 14 个模块。
完成这一套认证耗时耗力,需要评审机构通过访谈、抽样、现场观察等方式完成近 100 项内容的审查。比如抽查员工电脑桌面是否有敏感信息、电子文档是否标明保密等级、入职员工的保密协议等。
2014 年, ISO 在 27001 的基础上提出了27018,一项在隐私问题上更严格的扩展标准。像百度网盘这样的企业就需要搭建「数据保护权限系统」、「数据脱敏处理算法」等更复杂的隐私保护体系。
这也意味着你的 App 为了保护你的隐私得花更多钱,在中国也只有 BAT 这样大厂旗下的产品比如百度云、百度网盘、阿里云等服务通过了这两项认证。
这样,我们才可以说我们的数据是相对安全的。
但这不意味着你的数据就绝对安全。今天所有的隐私协议里,都会写着例外情况。
比如根据百度云的隐私协议,在这 11 种情况下,收集、使用你信息就无需征求你的同意了:
比如你上传的色情片就有可能因为刑法第三百六十四条传播淫秽物品罪,被认为与公共安全或犯罪侦查相关,进而让你的隐私不被保护。
在这份 2018 年的判决书中,来自安徽的陈先生就在百度网盘上传了 189 部色情片,在淘宝以「公司男女同事为人相处方式的奥秘高清教程视频设计素材」为名进行销售。被判处有期徒刑 3 年 8 个月。
但如果你上传的是其他文件,百度还是会试图保护一下。
比如在这场持续 3 年长达 21000 字的判决书中, 百度网盘为了保护用户隐私,坚持不删除用户存在网盘里的电视剧《匆匆那年》资源,在一审中被判赔偿 50 万元。然而在二审中,百度辨析了存储和传播这两个概念,在不干涉用户存储隐私的同时,网盘也会积极切断盗版内容的传播路径。从而奇迹般的逆转了判决,连 4 万元案件受理费都让《匆匆那年》掏了。
来源:回形针PaperClip
如若转载,请注明出处:https://www.zhangzs.com/367213.html