10万个名人,1000万张照片,全球最大人脸识别数据库被删除了“澳门威尼克斯人网站”

本文摘要:人脸识别技术发展到今天,早已某种程度在技术发展层面受到注目,实质上,在政策和用户隐私层面,它引发的争议更加多,在某些区域或者领域也甚受推崇(参看此前报导);比如说,2019 年 5 月,旧金山市对人脸识别技术收到了禁令,禁令该技术在政府机关和执法机关中用于,从而沦为全球首个对人脸识别技术收到禁令的城市。

人脸识别技术发展到今天,早已某种程度在技术发展层面受到注目,实质上,在政策和用户隐私层面,它引发的争议更加多,在某些区域或者领域也甚受推崇(参看此前报导);比如说,2019 年 5 月,旧金山市对人脸识别技术收到了禁令,禁令该技术在政府机关和执法机关中用于,从而沦为全球首个对人脸识别技术收到禁令的城市。近日,微软公司悄悄移除了该公司于 2016 年公布的人脸识别数据库 MS-Celeb-1M——该数据库是全球仅次于的公开发表人脸识别数据库。微软公司为什么要公布 MS-Celeb-1M 数据库?2016 年 8 月,微软公司在官网中发布了一篇为题《MS-Celeb-1M: A Dataset and Benchmark for Large-Scale Face Recognition》的论文,论文作者还包括来自微软公司研究院的 Yandong Guo(郭彦东,目前他早已离开了微软公司重新加入到小鹏汽车), Lei Zhang(张磊), Yuxiao Hu, Xiaodong He, Jianfeng Gao 等人。在这篇论文中,微软公司讲解了一个取名为 MS-Celeb-1M 的人脸识别挑战赛,参赛者必须根据微软公司获取的数据集作为训练数据来研发自己的图像识别系统,以便从 100 万个名人名单中展开人脸识别。

与此同时,随着这一挑战赛,微软公司也公布了一个面向公众对外开放iTunes的大规模人脸识别数据集 MS-Celeb-1M,其中第一个版本包括了 10 万个名人(根据他们的热门程度,从上述 100 万个名人名单中自由选择而来)的 1000 万张脸部照片,来供研究者研发自己的人脸识别技术——微软公司声称,这些照片来自于人们常用的搜索引擎,也就是公开发表渠道。以 Lady Gaga 为事例,我们来看一下数据库中的涉及照片:微软公司声称,该数据库是全球仅次于的公开发表人脸识别数据库。

澳门威尼克斯人网站

微软公司技术与研究院首席研究员 / 研究经理张磊(即上述论文作者中的 Lei Zhang)博士曾对外回应,MS-Celeb-1M 的目标是辨识百万人脸,是计算机视觉内最大规模的分类问题,并且其中一个人物对应一个 entity,初始化了知识库,并且知识库中获取了每个人的职业,性别等等非常丰富的信息,从而解决问题了人物混淆的问题,可以从辨识超过理解。基于这一数据库,微软公司举办了 MS-Celeb-1M 百万名人辨识竞赛,这一竞赛被业界指出是人脸识别的年度 “世界杯”。(公众号:)了解到,在 2017 年的微软公司百万名人辨识竞赛中:Panasonic-新加坡国立大学合作勇夺第一,CIGIT(中科院重庆绿色智能技术研究院)和中科院合作队伍名列第二,美国东北大学名列第三。

虽然在微软公司的理解中,最开始这个数据集是面向学术界做到的,但后来,这一数据集被许多工业界的同行所用于。根据涉及的注解资料,MS-Celeb-1M 数据库早已被多商业机构所用于,比如说 IBM、松下电气、阿里巴巴、辉达、日立、商汤科技、旷视科技等,甚至有消息称之为,也有涉及的军事研究人员使用了这一数据库来训练面部识别系统。微软公司移除了,但它不存在于全世界的硬盘里然而,预示着人脸识别技术的发展,人们对涉及隐私的注目和忧虑更加多减少,也有人指出微软公司的这一数据库因涉嫌侵害隐私,比如说来自德国柏林的艺术家和技术专家 Adam Harvey,他在自己的 Megapixel 项目中记述了还包括 MS-Celeb-1M 在内的数据库的详细信息以及用于用户。

Adam Harvey 指出,微软公司用 Celebrity 一词指的是那些在网上工作并且在数字世界不具备知名度的人,而某种程度是 Lady Gaga、Steve Jobs 这样的名人。比如说,有媒体在针对 MS-Celeb-1M 数据库中的人脸展开核实后找到,MS-Celeb-1M 的确包括了不少名人的照片,比如说 Lady Gaga、Steve Jobs 等,但是也包括一些媒体人的信息,比如说《连线》杂志负责管理报导网络犯罪、网络安全、隐私等问题的高级记者 Kim Zetter。实质上,针对微软公司因涉嫌侵害隐私问题,英国《金融时报》也设法联系了被收录于在 MS-Celeb-1M 数据库的当事人,某些当事人甚至显然不告诉自己的照片早已被收录于——比如说科技作家 Adam Greenfield;他在拒绝接受专访时回应,自己决不是公众人士,无法退出自己的隐私权。

也就是说,微软公司在数据库中用于的照片,并没同意当事人的表示同意,即使他们是名人。当然,微软公司自己也意识到了这个问题,目前它早已移除了 MS-Celeb-1M 数据库;在对英国《金融时报》的对此中,微软公司回应:这个网站原本是用作学术目的,它是由微软公司的一个前员工来运营的。目前,该员工早已离开了微软公司,因此我们也早已后移除了它。值得一提的是,预示着微软公司移除了 MS-Celeb-1M 数据库,另外两个学术单位也移除了它们旗下的类似于涉及数据库,还包括由杜克大学研究人员修建的 Duke MTMC 监控数据库和斯坦福大学的 Brainwash 数据库。

就目前的情况来看,微软公司用来讲解 MS-Celeb-1M 项目的网站还在,但是数据集本身早已无法iTunes;然而,据搜寻找到,涉及的数据库资源仍然可以从其他网站展开iTunes。更加最重要的是,作为一个公开发表iTunes的数据集,MS-Celeb-1M 实质上早已不存在于不少企业或机构的本地硬盘中,被用于各类的用途,而照片当事人却无法左右。正如,Adam Harvey 所言:一旦你公布了它,人们iTunes了它,那它就不会不存在于全世界的硬盘里。

澳门威尼克斯人网站

原创文章,予以许可禁令刊登。下文闻刊登须知。


本文关键词:澳门威尼克斯人网站

本文来源:澳门威尼克斯人网站-www.yqgloves.com