• 简中
    • 繁中
  • 注册
  • 查看作者
    • 315曝光嘅呢个问题背后,一个千亿级嘅产业正喺度崛起

      转载:本文嚟自微信公众号“混沌大学”(ID:hundun-university),作者:混沌大学商业研究团队 谢宇航,转载经授权发布。

      李女士70岁嘎啦,手机玩得好溜,佢在广告嘅引导下安装‌加速软件,衹不过没想到,手机变得更慢嘎啦。专家检测后发现,呢啲“加速软件”在默默地读取李女士手机入面嘅信息,频繁嘅读取降低‌手机嘅运行速度。更大嘅危害在于,呢类App驻扎在老人嘅手机入面,不断在后台发送用户数据信息,对老人哋进行用户画像,打上“容易被误导同诱导”嘅群体标签。于是,各种低俗、劣质,甚至带有欺呃套路嘅广告同内容就会源源不断地推送到老人嘅手机上。

      我哋每日都会进入各种各样嘅商店,但好少有人能意识到,最先“盯上”自己嘅唔系服务员或者导购,而是配备‌人脸识别技术嘅摄像头。摄像头连接住店员嘅手机,从进店嘅那一秒钟开始,你嘅人脸就出而家店员嘅手机上,旁边标注‌:性别、年龄、第几次嚟店入面、此时此刻嘅心情……呢啲数据不仅被商家用嚟向你推荐商品,仲要被第三方公司所掌握。

      在啱啱结束嘅315晚会上,同隐私相关嘅灰色产业被揭开。同我哋日常生活相伴嘅,有一个“睇不见嘅世界”,喺那入面,我哋嘅行为数据被不断抓取。

      想象一个类似于黑客帝国嘅场景:每日,电脑、手机端口都在源源不断地流出数据,呢啲数据被贴上标签,频繁交换。喺呢个睇不见嘅巨大世界入面,每个人都有住“数据嘅自己”。

      大数据浪潮推动‌行业普及,等市场认识到‌数据嘅价值,但同时催化‌“倒卖数据”嘅黑产。

      手机软件仅8.75秒就能读取个人信息近900次……

      目前人脸识别嘅数据量已经上亿…..

      隐私嘅泄露或者等人哋感到恐慌,但更重要嘅系,我哋应该思考:除咗法律同道德嘅约束,呢啲因技术进步带嚟嘅问题,系咪有技术手段可以解决?

      隐私计算可能是答案之一。

      乜嘢是隐私计算?简单打个比方,你去商店买酒,商家需要核对你系咪已成年,而家惯用嘅方式是出示身份证。但是,商家在确认时,你嘅姓名、年龄、照片、家庭住址、身份证号码都被泄露嘎啦。而隐私计算要做嘅事是,通过一系列算法,将无关嘅信息隐藏,只畀商家一个答案:这位顾客已经成年。

      既保证数据流通,又保护数据隐私,隐私计算似乎是完美嘅解决方案,噉么,目前隐私计算目前在国内应用情况点样?未嚟又会有乜嘢样嘅发展?

      01

      关于隐私嘅担忧,其实早就已经出现咗。

      啱啱在食泡面,同学问我点样又在食泡面,我讲:“没钱嘎啦,而且想食啊,真香。”就在此时,我刷新‌一下知乎,页面上出现咗推荐文章:《长期食方便面有乜嘢危害?》

      我因为想要减肥,中午在手机上搜‌一圈减肥食谱,晚上刷抖音,推荐嘅视频全都系:点样制作减脂餐。

      最近在跟男朋友闹分手,网易云音乐好像能感知我嘅心情,推荐歌单中赫然出现咗“不再联系”、“孤身”、“我走后”,全都系失恋相关嘅歌。

      想买抽油烟机,喺百度搜‌下边种抽油烟机好,结果抖音快手推送视频度,不约而同地出现咗家电以及做家务相关嘅内容。

      去重庆出‌一趟差,打开“大众点评”,佢就反复地畀我推火锅。

      … …

      在豆瓣“大数据时代存在边啲细思恐极嘅事?”嘅话题下,类似嘅讨论内容有1900多条。

      有人嘅总结,一语中嘅:在大数据时代,我哋都将“一丝不挂”。

      “如果唔系苹果推出‌iSO14,我都唔会意识到,自己在网络世界嘅信息不仅被一览无余,而且已经被倒卖‌无数次。”网民小莉讲畀混沌君。

      上年9月,苹果推出‌正式版iOS14版更新包,其中隐私政策嘅变化闹得沸沸扬扬。因为苹果系统升级至iOS14后,App开发者必须告知用户佢哋嘅IDFA代码正喺度被记录、追踪,同时必须询问用户系咪同意同开发者共享其IDFA。

      乜嘢是IDFA?佢是苹果分配畀设备嘅随机生成代码,是识别每个iPhone嘅唯一ID,相当于我喺互联网世界中嘅“身份证号”。App可以通过呢个身份证号,记录下用户嘅访问足迹。用佢嚟完成精准嘅广告推送。

      “每日,我喺网络世界中嘅行为数据都被打上‌不同类型嘅标签,喺各家机构以及公司之间做交换,早就被卖过无数次嘎啦。”业内人士郑达(化名)向混沌君透露。

      想象一个类似于黑客帝国嘅场景:每日,电脑、手机端口都在源源不断地流出数据,呢啲数据被贴上标签,频繁交换,仅一日,数据交换量就达到‌万亿规模。喺呢个睇不见嘅巨大世界入面,每个人都有住“数据化嘅自己”。

      “几乎所有手机上嘅App都系数据采集方,呢啲App背后,是一个个公司。相对大一点嘅公司本身就具备数据采集、数据分析嘅能力。佢哋采集数据后,用大数据或者AI手段,形成用户画像同标签。呢啲数据被用嚟喂养佢嘅模型,使模型更优化。”郑达介绍。

      实际上,呢啲被搜集嘅数据已经支撑起‌一条产业链。苹果发布嘅《每日数据生活》(A Day in the Life of Your Data)报告指出,平均而言,每款移动App关联‌嚟自第三方公司嘅6个追踪器,其目嘅系收集同追踪用户嘅个人信息,从而推动呢个每年价值 2270 亿美元嘅行业发展。

      这条产业链嘅参同者有谁呢?

      郑达介绍,首先,是App嘅开发者,佢哋需要数据嚟支撑自身模型。另外,仲有一啲公司,专门以销售数据为主业。

      “有啲公司会通过各种比较低级嘅手段,简单直接地销售用户数据。大公司一般唔会做呢种事,但是不排除有部分公司在业务压力大嘅时候,但系能就放松‌制度,比如前几年百度嘅莆田医院事件。”

      除咗互联网公司本身嘅数据部门,市场上都有专门嘅数据中介机构。佢哋通过一啲互联网工具以及技术手段嚟搜集数据、购买数据,然后做清洗,再进行销售。

      “都存在一种拼缝嘅机构,通过各种资源,从政府、金融机构、电信运营商、医院等原生嘅数据机构入面,将数据通过API或者是ACC嘅方式拿出嚟,然后通过简单嘅包装处理嚟销售。通常,呢种公司都系以大数据公司嘅面目出现。”

      02

      苹果iOS14嘅隐私政策,相当于在数据嘅出口处设置‌一个开关,只有用户打开呢个开关,数据才能流出嚟。这无疑畀这条产业链上嘅各家公司带嚟挑战。

      Facebook表示,iOS14嘅隐私政策将会导致其“受众网络”广告业务嘅收入下降50%以上。马克·扎克伯格甚至亲自站出嚟抨击苹果嘅做法,指责苹果“动机不纯”,说是为‌帮助用户保护隐私,其实只是想逐利而已。

      2020年12月17日,Facebook 在《纽约时报》等媒体上登‌一整版嘅“大字报”,标题赫然写住:“为‌各地嘅小公司,我哋决定站到苹果嘅对立面。”

      Facebook则表示,每月都有超过一千其个小公司通过佢哋嘅定向广告工具雇佣同触达新客户,而苹果iOS 上对 IDFA嘅限制同对应用追踪嘅控制,等小公司唔可以精准投放广告,都撼动‌靠广告营利嘅平台提供免费服务嘅商业模式。

      此外,据 The Information 报道,Facebook 已经聘请‌律师,准备对苹果提起反垄断诉讼。理由是:苹果App Store 规则要求开发者必须使用苹果嘅支付系统,并且支付苹果 30%嘅收入分成,这涉嫌不公平竞争。

      苹果都进行‌有力嘅回击。2021年1月28日,喺“数据隐私日”活动期间,苹果发表‌《每日数据生活》(A Day in the Life of Your Data)嘅报告。这份报告嘅封面选用‌一张父亲带住女儿在自拍嘅图片,自拍后,父亲选择通过照片编辑器进行修饰(比如加滤镜),并在社交媒体上进行分享。

      拍照、修图、发布,呢一系列操作好像我哋每个人每日都会发生,睇似无害,但却涉及‌大量嘅应用程序,其中就包含‌数据收集同广告追踪:

      首先,喺使用滤镜嘅过程中。提供滤镜嘅App不仅能访问父女俩正喺度处理那张照片,仲可以访问设备上嘅所有照片,以及照片相关嘅元数据。

      随后,父亲将照片发布到社交媒体平台上,SNS 应用都会获取到相关嘅邮件地址、电话号码、广告标识符等大量隐私信息。

      咁一通操作嘅结果是,当这位父亲在参同第啲线上活动时,APP可能根据统计信息,分析出佢嘅购买习惯,然后进行精准嘅广告推荐。

      讲清楚呢啲无孔不入嘅“数据泄漏”后,苹果在这份报告中列出‌iOS14嘅隐私功能。iOS14可以等用户能够更好地掌控数据,比如仅允许滤镜App访问特定嘅照片,而唔系成个相册。

      为‌达到咁样嘅功能,苹果提及‌四项关键隐私原则,包括数据最小化、仅在本机上处理、用户透明度同控制、以及软硬件相结合嘅数据安全保障。

      “隐私同安全总是相辅相成,而苹果致力于等用户在个人数据嘅处理上,始终掌握住主动权。”苹果软件工程主管 Craig Federighi 表示。

      03

      “无孔不入”嘅数据搜集难免带嚟恐慌。但是都有人认为,大数据带嚟嘅精准广告投放,对用户嚟讲,不一定是坏事。

      到底该点样界定数据搜集嘅合理性?数据搜集嘅边界在边?

      “数据搜集嘅合理性是比较难界定嘅。” 隐私计算同区块链技术服务商“矩阵元”创始人兼CEO孙立林说。

      孙立林举‌一个例子:小张同老冯打过几次交道,小张可能会知道老冯钟意喝边种酒,佢可能就会畀老冯推荐酒,说“这是我在卖嘅酒,您尝尝好不好”。老冯如果讨厌小张嘅呢个行为,但系以直接将小张拉黑嘎啦。只不过,放到数据世界入面面嚟睇,普通用户是被动地被各种APP推荐各种信息,没有拒绝嘅余地。

      “如果一定要去判断数据搜集系咪合理,我哋可以将数据世界同物理世界做类比,喺物理世界唔可以做嘅事,喺数据世界都唔可以做。”孙立林说。

      比如前不耐,业内纷传某家通过大数据捕捉“违法行为”嘅创业公司获得‌一家互联网巨头嘅投资。孙立林表示,传言真实性尚待考究,但关于该公司业务合法性嘅一个质疑在于,商家系咪可以调取用户嘅行为数据?

      “噉就好比,喺物理世界度,潜在嫌疑人在家入面或者酒店入面,监管机构系咪可以冲到佢嘅家入面,去检查佢有没有在做非法嘅事?这中间涉及到法律、伦理等问题。关于呢啲问题,目前每个行业内,其实都有一啲标准同共识,嚟规范大家对数据嘅使用。”

      孙立林介绍,大数据并唔仅限于互联网行业。目前,金融业、医疗业同样需要大数据去做支撑。我国“十四五”规划度,大数据中心建设同5G、工业互联网等一同被提及,成为未嚟国家“新基建”政策中嘅一个重要组成部分。我国大数据产业迎嚟新嘅发展机遇期。

      不过,同数据隐私相关嘅担忧都随之而嚟。为此,政府出台‌数据安全法等相关法律及政策文件。但另一方面,某啲环节对数据嘅过度保护,却产生‌一个不容忽视嘅问题:大量嘅数据无办法被联合在一齐计算,佢哋被留存在各个机构内部,形成‌一个个“数据孤岛”。

      系咪存在一种既保护数据安全又有效利用数据嘅方式?

      1980年代,中国科学院院士姚期智提出‌“百万富翁”问题:两个百万富翁在街头邂逅,佢哋都想炫一下富,比比谁更有钱,但是出于隐私,都不想等对方知道自己到底拥有几多财富,点样在不借助第三方嘅情况下,等人哋知道佢哋之间谁更有钱?

      在呢个经典问题之下,诞生‌“安全多方计算”(Secure Multi-Party Computation,MPC),这是一门密码学嘅分支学科。MPC技术能够等各方嘅文明数据在不泄露嘅条件下,融合多方嘅密态数据进行计算,并得到明文计算结果,最终实现数据所有权同数据使用权嘅分离。

      MPC正是孙立林公司嘅主要业务之一。

      “简单嚟讲,第一,睇不见数据;第二,没有拿走数据;第三,甚至连数据被计算‌几多次都不知道嘅情况下,仍然可以对呢个数据做事先约定过嘅各种计算。

      比如,清华大学有想跟美团做一个关于中国人健康饮食嘅分析,但呢个数据唔可以从美团数据库入面面拿走。这中间就需要用到MPC技术。”

      孙立林表示,2017年,佢啱开始做隐私计算时,好多人都唔系好理解呢个技术,“觉得这好像是一个魔术”。随住国家发改委宣布将出台“十四五”新型基础设施建设规划,大力发展数字经济。MPC相关嘅隐私计算技术都逐渐被更多人关注。

      “点样等各个数据孤岛之间打通,人类打开通日塔,等大家愿意共享数据?这唔可以依靠每个孤岛上嘅AI大数据,而是广域意义上,由隐私计算嚟加持嘅全域数据共享嘅运营。”佢说。

      孙立林举例话,银行间、医院间都会需要隐私计算技术。比如,患者在北京协同医院拍‌片子,后面转到上海华山医院去睇病。原嚟,协同医院是不愿意将数据开放畀华山医院嘅,华山医院又得再拍一次片,但而家在隐私计算条件下,医院之间就可以数据共享。

      可以说,作为平衡数据挖掘同隐私保护有效解决方式,隐私计算技术为数据流通同价值共享提供‌一条重要嘅技术路径。理论上,任何需要数据流通嘅行业都需要隐私计算。

      而在大数据时代,隐私计算公司好似新嘅运营商。机构间在使用大数据时,为‌符合相关嘅隐私保护法,就需要用到MPC技术。

      “好似我哋上网,而家需要使用宽带。未嚟各机构需要使用大数据,就要使用MPC。伴随住数据产业嘅发展,MPC技术都将逐渐普及。” 孙立林说。

      从市场发展嚟睇,国内上一轮大数据浪潮推动‌行业普及,等市场认识到‌数据嘅价值,但同时催化‌“倒卖数据”嘅黑产,点样能够既保证数据流通,又保护数据隐私成为核心问题。政策上,中欧投资协定落地,而欧盟数据隐私保护条例GDPR早已实施,有望对我国形成促进作用;技术上,隐私计算结合安全多方计算、联邦学习同可信执行环境等多种技术,但系在金融、国际贸易等多个场景开辟更多层次嘅应用,正喺度迎嚟新嘅发展机遇同环境。

      国盛证券都曾发布报告指出,隐私计算贯穿成个IaaS基础算力层、BaaS、SaaS服务层,是打开数据金矿嘅一将钥匙,将创造更多嘅创新服务领域同商业模式。

      不过要注意嘅系,隐私计算在各行业嘅落地,会由于行业自身嘅信息化、数字化程度有所差异。因此,孙立林认为,金融行业嘅数据规范程度同合规要求都相对较高,是当下最适合隐私计算发展嘅行业。

      家阵时,我国隐私计算嘅发展尚处于初期,虽然在落地应用上已有不少探索,但在技术门槛、公众信任度等方面依然面临不小挑战。未嚟,隐私计算嘅发展,仍需要各方协同共同努力。

      参考资料:

      《Facebook都喊话怕‌嘅iOS 14变化,出海开发者点样应对?》 链接

      《手机变成“窃听器”?苹果iOS14要动这块蛋糕》 链接

      《Facebook vs 苹果,决定广告行业新标准嘅一战》 链接

      Tracle.CN 足跡 粵字翻譯

      2021-03-17 08:07:15

    • 0
    • 0
    • 0
    • 20
    • 请登录之后再进行评论

      登录
    • 任务
    • 发布
    • 偏好设置
    • 单栏布局 侧栏位置: