据媒体报道,有卖家在网上以两角一张的价格售卖几十万张戴着口罩的脸部照片。这些照片部分是“网络爬虫”从网上搜集到的面部照片,另一部分则是人们上班打卡或进出小区门禁时拍的面部照片。买家买这些照片,主要用于训练算法的精准度,也有可能用于申请信用贷款,甚至注册公司。
疫情之下,一些科技公司纷纷研发出针对戴口罩场景下的人脸识别技术,给人们带来了便利,也减少了摘口罩带来的病毒感染风险。但对于那些本就担心人脸识别技术会造成数据泄露的人来说,这却让他们更加忧虑:即便戴上口罩也阻挡不了人脸数据泄露。上述媒体的报道,让他们的忧虑变成了现实,同时,也暴露出人脸数据泄露存在于这项技术从研发到应用的每个环节。
人脸识别技术是基于对人面部大量特征点的提取来做出判断。而对于戴口罩的人,只能提取其眼睛、眉毛等区域的特征点,无法进行全脸扫描。目前,戴口罩人脸识别技术的主要实现方法是通过模型训练加强对眼睛、眉毛等重点区域的识别,也有的通过图像重构网络将戴口罩的人脸图像重构为未戴口罩的人脸图像,进而通过比对实现人脸识别。
无论是哪种实现方法,都需要有人脸数据的积累,且数据越海量,往往越能提高精准度。这些海量数据从哪里来的?上述报道提供了一个线索:大量人脸数据被非法售卖,用于训练算法的精准度。虽然并不能将买家与研发新技术的公司对号入座,但是推出新技术的公司应该公布训练所需人脸数据的来源。
科技是中立的,但如果用于研发的基础数据都不明不白,就很难说清楚这项技术究竟是天使,还是魔鬼。此外,不能排除一些不法分子也在研发这项技术,他们购买数据,训练算法的精准度,就是为了更方便地破解人脸密码。
这些基础数据可能泄露于保存、传输、应用等各个环节。这既有技术本身存在漏洞的原因,也有人为窃取的原因,甚至有些是监守自盗,负责管理数据的人售卖数据的新闻并不鲜见。尽管具体到单个数据泄露案例,可能会找到原因,但是大量泄露数据综合在一起,背后原因错综复杂,很难说清楚到底是怎么泄露的。
人脸的不可更改性,让很多人对人脸识别技术持保守态度。去年底发布的《人脸识别落地场景观察报告(2019年)》显示,在个人信息泄露频发的态势下,超过七成的民众对网络运营者的安全保障能力存有疑问,担心人脸数据泄露。去年一位大学教授被杭州野生动物园强制使用人脸识别入园,更是一怒之下将后者告上法庭。
人脸识别技术所需基础数据的采集如何规范?技术应用的边界在哪,如何把握合法性和正当性?目前还没有一个明确的说法。有关部门监管也存在一定困难,更多的要靠行业自律,这让数据泄露存在很大的不确定性。
尽管很多科技公司宣称人脸识别技术已经准备好了,戴口罩人脸识别技术也已经应用于一些公司,但如何防范人脸数据泄露,却很少提及。事关个人隐私安全的大事,在社会规制没有准备好之前,应该严格限制应用的范围,并征得用户同意。高筑安全防线,再推广应用不迟。毕竟,脸可能是人们最后一道隐私防线,这个密码被破解,后果将不堪设想。
(记者 杜鑫)
来源:《工人日报》