主持人:下面一位讲师来自涂图架构师李扬,他带来的主题是“在一切看脸的时代,如何高效的打造人脸识别服务”?这个是315报出来人脸识别之后,大家可能关注的一个点。下面时间交给李扬讲师!

李扬:感谢主办方,也感谢极光推送及IPO Club给我这次机会在这边做一个分享。我不知道有多少人听过涂图,我们是做开发者服务和企业服务的官司,我们专注于图像技术方面。

这个是涂图公众号的二维码,我介绍一下涂图的历史。我们从成立开始,我们先推出移动端图像处理的SDK,主要功能包括图片处理、滤镜、贴纸、美颜以及一些相机,开发者使用这些功能比他自己调试那些OPGLES那样的脚本完成滤镜这样的功能要简单得多。我们目的提供一个标准化开发者SDK产品。我们从一开始的图片到后面的视频、直播,以及机器学习,都是专注在图像这条路上做。这边的TuSDK,后面的TUTUCLOUD是人脸识别和设防监控方面的业务。

我们在2015年,在IPO Club做的一个分享,Logo还是以SDK为主体的。讲一下最近比较热的人工智能和机器学习以及深度学习这个话题。其实人工智能包括了很多方面,比如文本的识别,图片的识别,以及语音的识别,相信行业内大家都了解,毕竟是一个很热门的话题。人工智能里面一小块是机器学习,意思是机器学习是实现人工智能一种方式,机器学习里面还包括早期的经典的方式,我后面会讲到,近几年来研究者研发出一种更简单,并且准确率更高的方式,这是基于深度学习。

这个是一些机器学习方法的对比,从最开始叫规则系统,它的方式是提供一个输入,程序里面根据我们手动指定规则来判断,可能类似于有开发者听过像决策树,或者知识库,或者专家系统这样的词,就是这种方式。后面是基于特征,之前人脸识别这个领域很早就做,当时研究者的方式根据五官或者是人脸五官的位置,或者轮廓这样的特征来做映射,来给出输出,这张图片里面到底有没有人脸。发展到后面表示学习以及表示学习里面的深度学习,我们可以做到一种更简单的标注特征。其实这个跟机器学习相关话题就是大数据,相信大家有所耳闻。如果需要得到更精确的结果,我可能是要堆积很多数据上去,从而能够让程序从更多数据体上来明白什么样的特征是对应到什么样的类别上面。

具体到人脸识别这个话题,其实人脸识别里面包含一些比较细的分类,首先是人脸检测,简单来说一张图片里面是否有脸,识别我要认出来张三是张三,每个人脸图片对应到一个特征值,这个值是一个多维项量,可以是256维,或者是更高维的项量,除了人脸特征,以及五官轮廓特征之外更多的特征。

接下来想讲一下在机器学习领域相信大家都知道英伟达以前是一个做视频渲染、游戏显卡的公司,为什么到机器学习之后,这家公司估值会翻几倍,先来了解一下CPU和GPU的工作原理。这个对比相信大家都比较熟悉了,CPU上面大家买到CPU8核16核,GPU有几千个核心,GPU它是所有核心一起并行计算,而CPU一个核心一个核心做事情,很明显,在图像这个领域,一张图片上面有很多像素点,现在幻灯片1024×768,这么多像素点交给CPU来算不如交给GPU来算。

这里有一个视频,可以直观感受一下。这个是国外一个节目叫《终结者》,他们拍摄的,接下来分享一下我们开发过程中一些实际技术方面的话题。我们服务目前有C++后端以及PHP前端,还包括给开发者使用各种语言的DEMO,这里我想提的一点,DOCKER本身不支持调用GPU,英伟达合作做了一个插件,就可以直接调用GPU。

API文档使用SWAGGER,地址、版本号、语法,这个是比较实用的,在平时开发过程中一些前后端 调试都可以采用这个。它直接生成出来的文档包含这样的信息,这只是我部分的截图。包括方法以及路径、功能、文件都可以生成出来。这个工具主要是可以结合描述以及测试为一体。这个测试在我们涂图网站上面可以看到的。

现在介绍一下我们产品,其实人脸识别包含了目前推出的模块,包含这几个模块,检测、年龄、性别、特征连标注,以及人脸对比识别,可以看出相似度多少。我们应用场景以及优势的介绍,现在的互联网更多是拿人脸识别做娱乐化的场景,比如说在移动端同样有人脸识别产品,它做的是图像上直播上的美颜,以及动态贴纸,跟随人脸一起运动的一些贴纸。涉及到一些企业或者是说单位内部使用的人脸检索,或者签到这样的功能同样可以应用到。包括后面的支付,以及安防安全领域方面同样也是比较适用的。

这是我们现在网站长一个在线演示页面,这里上传图片都可以直接测试到API。这里详细解释了标注五官的定位,从轮廓到眼睛到鼻子到嘴巴。这个是我们开源在各个语言上面的单位库,拿到这个SDK之后,可以直接集成到开发者的程序当中。我的演讲主体内容就这些,各位有问题可以提出来。

提问:我主要想问一下,你相对其他竞争对手,你们有什么优势或者说,你觉得你们亮点是什么?因为现在像识别的话,可能公司自己内部就做了这样子的一些分享的东西。比如说今年315打假的时候提到自己搞一个假脸,做一个人脸识别,你们有做什么预防或者识别吗?
李扬:首先第一个问题,我们相对于其他提供同类型服务公司的标点,其他公司提供人脸方面的服务,做得比我们早,做得比较我们专业,相对来说精确度、准确度更高的。我们从移动端做起,做到服务端,我们围绕图像一整套解决方案。比如说我们移动端SDK里面的图片美颜,以及直播里面同样都是跟我们服务端是一体的,我们可以给开发者提供一个完整的方案,这是我们一个主要的优势。
第二点,今天活动宣传文案上面提到315,那个里面可能它提到主要是我用一张照片,或者说打印出来的东西来冒充某个人,这个可以通过活体检测的技术来规避的。比如说我让用户执行我给他具体的指令,比如说眨眼或者是摇头,我可以检测到他是否真的做了这样一个动作,这个是普通照片无法模拟的。当然,在安全方面,完全依靠人脸识别本身就是不够可靠的。

提问:今年315也可以自己眨眼,那个照片也真的眨眼这种技术,你们有对这个做一些识别吗?
李扬:现在移动端产品可以介绍一下,我们主要还是应用在我刚才提到的直播以及短视频里面一些娱乐化场景,我们实际上在这方面研究还不够,所以还没有推出基于比较准确的一个活体识别的方案。在移动端活体要结合移动端更多的工作来做。

提问:我想了解一下精确度,人脸对比的精确度,还有活体检测这个东西,这个是我比较关心的,能多讲一点这块的东西吗?
李扬:我们准确度是97%,这是识别上的准确度。活体检测,我们移动端活体检测做得还不够成熟,所以我们移动端活体检测没有推出一个成熟的产品,目前推出是基于HTTPAPI的一些功能。

提问:像身份证对比度?
李扬:身份证照片对比,真实场景是吗?
提问:对。
李扬:基本的对比可以做,对比是不是同一个人,并且我们可以提供预制设置,给开发者自行设置,达到百分之多少判断为同一个人,自己根据不同的场景来设置的。
提问:你们这个是怎么收费的?
李扬:按照调用次数来收费。如果大家感兴趣,可以在我们网站上可以看得到一些DEMO的链接,以及详细的使用方式。

提问:如何精确确定脸部特征点呢?
李扬:我们支持这种功能的,我们最高可以支持到95个点,包括轮廓以及五官。
提问:你们支持图像再处理,你们有开放一些直播的SDK吗?我其实对直播这块比较感兴趣?
李扬:有,今天主题主要是人脸识别,我们图像处理,包括图像、视频、直播都有相关的SDK。
提问:极光好像也有直播这块?
主持人:还没有。