行业动态 > 5000张人脸照片10元兜售,人脸识别背后的数据泄露危机

5000张人脸照片10元兜售,人脸识别背后的数据泄露危机

作者:数科邦 发布时间:2019-12-08 1368 1 1

11月29日晚,央视报道人脸信息在网上被公开兜售,5000多张人脸,打包只要10元。

这并不是人脸数据第一次被发现公开售卖。今年9月,有媒体报道,17万条人脸数据挂在网上售卖。今年11月19日,新京报报道,8元可买3万张人脸照片。随着人脸识别应用迅速落地,人脸数据泄露问题越来越受到媒体和公众广泛关注。

人脸识别应用大范围落地始于2017年前后,目前已经广泛应用在安防、金融等领域,许多写字楼、交通安检闸机、银行、手机APP都会应用人脸识别技术进行身份认证。

在人脸识别提供大量便利的同时,身份信息保护也迎来了前所未有的巨大挑战。

数据量将远超公安系统

人脸识别最终的应用是身份认证,就是确认真人的真实身份。

身份认证一直存在。2001年全国公民身份证号码查询服务中心成立,是公安体系的事业单位,负责建设管理和运营全国公民身份信息系统,为政府部门及社会各界提供全国公民身份信息服务。

之前,身份认证的方法是,公民个人在进行社会和经济活动(例如到电信、银行办理相关业务)时,向有关机构主动出示居民身份证件,有关机构工作人员获得公民授权后,将被认证人的“公民身份号码”、“姓名”等数据通过电信运营商的网络通道传送至公安部“全国人口信息社会应用平台”进行比对,返回“一致”或“不一致”的比对结果。

人脸识别技术出现之后,成为不少商家的首选身份认证方案。因为直接比对姓名和身份证号,在很多实际应用中是不够的,商家需要知道活人的真实身份,而不只是证件的真假。

人脸识别技术公司正成为人脸数据量最大的机构,甚至未来将超过公安系统。一位金融类APP内部人士告诉零壹财经,比如你上一个APP,会要求你刷脸认证,还要求你眨眨眼、点点头或者摇摇头,每做一个动作,后台都可以有十几张截图。这样,人脸识别公司可以有一个人各个角度和动作的照片。

“日积月累,这比全国公民身份证号码查询服务中心里那点数据多太多了。”该人士坦言,“全国公民身份证号码查询服务中心就是有全国公民的身份证信息和照片,每个人就是身份证上那一张照片。而人脸识别公司手里,有每个人几十张照片。”

在实际业务当中,人脸识别公司的照片更好用。上述人士解释,身份证照片只有一张,而且很多拍摄未必清晰,大多数情况下还是很多年前的,用来识别真人比较费劲。而人脸识别的照片,清晰度、角度、实时性都好太多了。此外,很多时候,金融类APP要求上传的还是手持身份证照片,一张照片上,人和证件的信息非常全面。

这个数量有多大,从人工智能独角兽旷视科技的招股书中可窥一斑。根据旷视招股书,截至2019年6月40日,旷视为超过1100名企业客户提供Face ID解决方案,每天平均处理客户约240万个Face ID验证请求。除了Face ID之外,旷视还通过"Face++"来给客户提供人脸对比、抠像等服务。之前有媒体计算,如果把不同类型的人脸识别调用量算在一起,旷视的人脸识别总调用量超过2000万/天。

数据泄露大潮将启

如此丰富的数据量,在现有的数据保护环境下,几乎可以说泄露是必然的。

市场对人脸数据有大量需求。之前有媒体报道,目前市场上兜售的人脸照片大多用于训练人脸识别模型。需要训练人脸识别模型的,是做人脸识别技术的科技公司。人脸识别是人工智能技术目前最活跃的应用领域之一,数据量越大,越有助于训练出更精准的识别技术。

据前瞻产业研究院数据显示,2019 年人脸识别 市场规模为 34.5 亿元,未来五年人脸识别市场规模将保持20%以上的增长速度,到 2024 年市场规模达到 100 亿元左右。

与此同时,运用人脸识别进行身份验证,中间要经过数据层层转接,中间环节是数据泄露的重灾区。

一位金融类APP内部人士向零壹财经举例,以金融类APP的身份信息验证为例,“全国公民身份证号码查询服务中心——一级渠道商——人脸识别厂商——金融APP”,这是一个金融类APP接身份验证服务的最短路径,即金融类APP和人脸识别厂商接数据,人脸识别厂商在后台通过一个数据渠道商来将照片上传,进行身份认证。

值得注意的是,这是一个最短的路径,在实际应用中,全国公民身份证号码查询服务中心和人脸识别厂商之间介入的渠道商不止一个,而是好几个。

“只要数据从这些渠道商过,几乎都会被缓存。也就是说,在人脸照片上传寻求验证的过程中,在整个链路上的渠道商,几乎人手一份同样的人脸照片。如果验证通过,这些渠道商也会接到验证结果,就相当于拥有了一个人脸数据库。”上述人士向零壹财经透露。

这些中间的渠道商,泄露数据的问题非常严重。据零壹财经了解,全国身份证号码查询服务中心早年曾经提供过“身份证返照查询服务”,由于这项服务监管不严,导致诈骗等犯罪案件屡次发生,屡禁不绝,因此全国公民身份证号码查询服务中心关闭了“身份证返照查询”服务。11月21日,考拉征信被央视曝光涉嫌非法提供身份证返照查询9800多万次,获利3800万元,相关人员已被公安机关带走。

AI的原罪?

除了中间渠道商有可能大量泄露人脸照片之外,还有一个难以回避的问题是,大批的AI公司可能难逃原罪。

在人脸识别领域涌现出了一批明星企业,如旷视科技、商汤科技、云从科技、依图科技等以计算机视觉业务起家的人工智能企业发展势头迅猛。

此类公司一个绕不开的问题是:在应用大规模推广之前,如何训练模型?最初训练模型的照片从哪来?

之前即有媒体报道,中国人脸识别技术和产业的发展,得益于互联网上大量的数据。比如网民很乐于在互联网上发布自己的照片,加上国内外政界、娱乐界公众人物的照片,科技公司都可以拿来用作训练人脸识别的能力,这在法律上也处于灰色地带。

有业内人士告诉零壹财经,此前做人脸识别的科技公司们想尽一切办法搜集照片来训练模型。有媒体报道,在IT社区、网络商城等多个平台搜索发现,有不少人脸照片可供免费下载或付费购买,更有网购平台上的卖家提供照片“定制”,数据获取含有人工数据采集、自动化数据采集、调研问卷收集等途径。

未来,人脸识别技术大规模落地的同时,如何保护好个人隐私?这将是一个前所未有的更具挑战的问题。

封面图来自pexels

本文来自微信公众号“零壹财经”(ID:Finance_01),作者:温泉,


评论:

您还可以输入0/300个字
        • 无搜索结果