刷脸时代的开拓者

作者:汪婕舒 | Jieshu Wang | 首发机器之心


2015年3月,马云在德国向世界展示了蚂蚁金服的刷脸支付服务。女生必备App美图秀秀中,眼睛放大和瘦脸功能颇受欢迎。这两件看似毫不相干的事件,背后的人脸识别技术都来自于旷视科技(face++)。最近,旷视科技推出了互联网身份验证系统FaceID和号称「人工智能行业第一款产业级硬件」的智能摄像机MegEye C1。这款相机究竟能做哪些事呢?难道天网时代即将来临吗?旷视科技(face++)的极客们如何看待人工智能的未来呢?带着这些问题,机器之心对旷视科技CEO印奇、硬件团队负责人Jesson和市场与品牌部总经理谢忆楠进行了专访。

首款「认脸」的摄像机

我们生活中见到的许多摄像头都只有拍照功能,并不能计算。如果要分析视频,就需要先把数据传输到后台的服务器,再进行计算。这种传统方式对带宽、存储和后台服务器的计算能力都有很高的要求,并且响应十分滞后。尤其在安防场景下,假如逃犯出现在某个摄像头里,等拍摄的视频传回服务器,再进行处理,可能好几个小时后才能发现可疑人员,而那时嫌疑犯早已逃之夭夭。这正是旷视科技想要开发智能摄像机的初衷之一。

根据旷视硬件团队负责人Jesson介绍,这款能「认脸」的智能摄像机MegEye C1由拍摄视频的「眼睛」和进行计算的「大脑」组成,不需要向服务器传回数据,仅在摄像机上就可以实时完成人脸识别和人脸追踪。据介绍,它的传感器达到1英寸,并采用了Nvidia TEGRA K1芯片,每秒能进行3000亿次浮点运算,是世界上首款同类相机。

从face++ 到faceID

除此之外,旷视科技(face++)的人脸识别云服务中还衍生出了互联网身份验证服务——FaceID,采用了领先的深度学习框架,并经过了海量数据的训练,适用于互联网金融、银行、电信等多个行业,目前调用量已达62亿次,涉及3万多个应用,7000多万台设备。

印奇介绍说,人脸识别分为几个环节,人脸抓拍、关键点识别、给出特征值到后续的搜索等等。早在3年前,旷视科技(face++)就已经把人脸识别的所有环节全部深度学习化了。这样的好处是,建立起了具备良好扩展性的统一框架,后续技术可以完全依靠大数据的累积实现自动提升,未来还可整合入汽车、人体等多种识别。

FaceID的人脸识别到底有多精确?据印奇介绍,它的误识率已经达到金融级别,低于10万分之一。误识率是判断人脸识别系统安全性的指标。最近,赵薇老公黄有龙的司机冒充他本人到公证处通过人脸识别办理了委托公证证明,委托另一人卖掉了他的房子,究其根本,正是因为公证处使用的人脸识别技术误识率太高,安全性太差。

此外,FaceID的人脸识别中还有一个核心环节是「活体检测」,要求用户对摄像头做出一系列动作,以确保摄像头前是当事人本人在进行操作,避免有人用照片或视频攻击别人的账号。

 

目前,为了适应互联网金融对人脸识别的要求,旷视科技正与一些科研单位一起,配合国家相关部门制定互联网人脸识别验证体系的国家标准。这或许是一个信号,代表着未来几年,人脸识别技术会更加规范、门槛会更高,像赵薇老公「被」卖房这样可笑的事情可以休矣。

旷视市场与品牌部总经理谢忆楠告诉机器之心,目前人脸识别技术已经比较成熟,但仍在寻找针对每个行业的「最后一公里」。而MegEye C1 和Face ID就是「最后一公里」的第一步。它们不仅适用于金融和安防产业,还能延伸到其他更多领域的产业升级。例如,能与地产行业一起实现新一代智慧楼宇和小区,与教育行业一起实现智能校园(如智能注册管理),与零售业一起实现智能客流分析、智能会员管理等等……这种共生生态也是旷视未来业务拓展的理念。谢忆楠表示,旷视希望变成各产业的合作伙伴,成为产业智能化升级的催化剂。

人脸识别有什么优势?

除了人脸识别之外,还有许多其他身份识别方式,例如指纹、虹膜、静脉等,甚至还有《碟中谍5》中神奇的步态识别,那旷视科技(face++)为什么会选择人脸识别呢?印奇介绍道,人脸识别的优势有三点:首先,人脸识别是体验最好、最自然的身份确认方式。其次,人脸识别的适用场景最广泛,对硬件的依赖程度较低,普通的手机摄像头就可以完成;而虹膜、静脉、指纹除了需要特殊的硬件以外,还需近距离甚至接触式的方式才能完成。第三,人脸信息数据库很全面,拥有权威的国家级数据库,而指纹、虹膜等方式目前缺少采集标准,也缺乏权威数据库。由此可见,人脸识别是最值得推广的身份认证方式。

数据脱敏,保证隐私安全

很多人可能会有疑问:如果摄像头认识了我的脸,就知道我去了哪里、做了什么,会不会侵犯隐私?并且,我的各种数据被上传到云端,如果有黑客攻破,会不会有安全问题?

针对隐私问题,印奇说大可不必担心,因为他们只会给出群体化特征,而不会使用个人的隐私信息。如果商家需要对用户进行会员识别,一定会提前告知用户,并获得授权。印奇认为,人们对隐私的要求与技术变革带来的便利性之间会此消彼长,人们的心态也会越来越开放。

为了保障数据安全,他们采用了一个比加密更为保险的重要环节——「数据脱敏」。印奇解释说,同一张人脸,人看到的东西与机器看到的并不一样:人看到一张脸,而机器看到一串编码。如果对编码进行加密,让它变换一下,在机器看来还是同样的信息,但是如果把人脸照片的像素点打乱重排,人就完全认不出照片中是谁。另外,普通的加密其实是可逆的,但旷视采用的「数据脱敏」则丢弃了一些关键的隐私信息,因此是不可逆的,即使黑客把数据全部偷走,也无从得知这些数据背后的个人信息。

人工智能的未来:科幻变现实

在印奇看来,旷视科技(face++)未来的战略可以分为识人、识图和机器大脑三步:

  1. 识人:即人脸识别。
  2. 识图:也就是通常所说的「识万物」,目的是识别图像中的高价值信息,例如人脸、车辆、文字、行人等等。这些信息尽管算不上「万物」,但却是最有应用价值的部分——举例而言,如果实现了对车辆、行人和交通标志牌的识别与计算,无人驾驶汽车也就应运而生了。
  3. 机器大脑:将视觉推而广之,实现更广义的机器思考。

在谈到未来的技术时,印奇预测,人工智能将是未来20年内最重要的技术。20年内,很多科幻片里的场景或将现实。他提及目前最亟待攻克的AI技术,首当其冲就是感知型技术,也就是语音和视觉,包括视觉的感知与理解、语音交互和自然语言理解,因为这代表着机器到底能不能看懂世界,并与人进行交互。解决了这两个问题,其他问题就可以迎刃而解了。他相信未来两年内,语音和视觉技术一定会有很大突破。

在旷视科技的主页上有一段炫酷的「愿景片」,畅想了一个机器理解世界的未来——生活中,门禁、家电和机器人都能认出你的脸,并为你提供个性化的服务;而侵犯人身和财产安全的罪犯将无处可逃;月球上,机器将能实时扫描宇航员眼前的世界,为他呈现出所有细节;当他拾起一块石头,其形状、质地甚至成分将立刻出现在他眼前。年纪不大、梦想不小的旷视科技,正努力为机器植入眼睛和大脑,让它们为我们带来更美好的生活,并次第揭开宇宙的秘密。印奇相信,这将不再是科幻。

发表评论

电子邮件地址不会被公开。 必填项已用*标注