这次故事的开头,不再是“思科又宣布收购了一家公司...”,因为对方是市值上千亿美元的英伟达(Nvidia)公司。
Nvidia芯片和套件
对,就是2000年初做出来Riva 128、GeForce256、TNT显卡的那家公司,爱打游戏的同学应该有印象。但是,现在NVIDIA公司新的定义是:GPU(图形处理器)的发明者、全球计算机视觉技术的行业领袖以及 AI芯片市场的领军者。
英伟达分别于2015年3月和2016年9月发布了Tegra X1、Tegra X2处理器芯片:
[转发]#804 - 认知协作#4:面部识别/姓名标签

对应地,英伟达后来分别基于这两款处理器芯片发布了第一、二代嵌入式平台开发者套件:Nvidia Jetson TX1、Nvidia Jetson TX2:
[转发]#804 - 认知协作#4:面部识别/姓名标签
[转发]#804 - 认知协作#4:面部识别/姓名标签
[转发]#804 - 认知协作#4:面部识别/姓名标签
请注意处理器芯片、编解码能力:
Nvidia Jetson TX1使用的是Tegra 1处理器芯片(GPU是Maxwell),视频处理能力:编码最大4Kp30,解码最大4Kp60;
Nvidia Jetson TX2使用的是Tegra 2处理器芯片(GPU是Pascal),视频处理能力:编码最大4Kp60,解码最大4Kp60;
Nvidia Jetson TX系列套件可为终端应用提供人工智能边缘计算支持,助力打造高度智能化的工厂机器人、商用无人机和智能摄像头等,能够让这些终端设备在终端侧就能够拥有 AI 计算和处理能力,低延迟,同时也能为云端的 AI 数据库提供最初级的数据筛选。它使得终端应用上能够运行更庞大、更深度的神经网络,让设备更加智能,具有更高的精度和更快的响应时间,以执行如图像分类、导航和语音识别等任务。 这时候,思科该出场了:
据说,这几款以及后来的思科Room Kit系列、Webex Board系列视频终端内部硬件芯片都采用了英伟达之前发布的两款处理器芯片或开发套件,用于AI边缘计算,特别是音视频智能处理和计算机视觉方面 - 面部识别(Facial Recognition)。
[转发]#804 - 认知协作#4:面部识别/姓名标签

面部识别应用场景
一个企业如果有3个以上分支机构、200人以上规模,普通员工是无法认全每一个其他同事的脸。所以,经常会出现的情况是:在跨分支机构的视频会议中,有人会开始发言,而我不会知道他们是谁、职位高低或他们在会议中的关注点是什么。要获取这些信息,我不得不低声窃语询问旁边的与会人员寻求帮助。在得知相关人员的姓名后,然后立刻搜索我们的企业目录以了解他们在公司里负责的工作职责。如果我在会议上因为害怕尴尬(不认识彼此)而不愿意参与讨论或提出问题/见解,那么此次会议实际上是一个效率低下的协作沟通。
思科Webex Room系列、Webex Board系列终端,启用了面部识别(Facial Recognition)功能。我不需要知道或认出会议中的每一个面孔,因为系统已经为我完成了此项任务,在他们的视频人像下方会出现姓名标签。现在,即使我们彼此之间相互不认识,我也可以通过说出他的姓名,直接与该人友好交流。再配合人员洞察(People Insight)功能,我更能知道TA的职位、关注点或者近期动态等。
[转发]#804 - 认知协作#4:面部识别/姓名标签
支持终端型号
Desk Pro
Room Kit Mini
Room Kit
Room Kit Plus
Room Kit Pro
Room 55
Room 55 Dual
Room 70
Room 70 G2
Room Panorama
Webex Board 55
Webex Board 55S
Webex Board 70
Webex Board 70S
Webex Board 85S
后台如何开启面部识别/姓名标签功能
用户如何使用面部识别/姓名标签功能
远端画面
当您在经Webex注册的Room Kit系列设备或Webex Board系列设备上通话或开会时,远端与会方人员可以通过会议画面看到您的姓名标签。他们可以在会议开始的前60秒内看到您这边会议室全体人员的姓名标签。在此之后,您这边会议室里当前发言人的姓名将在其开始讲话时显示一小段时间。
本端控制
您可以通过Touch 10 触控板在Room Kit系列设备上打开和关闭姓名标签。具体操作如下:
如果在关闭了Touch 10 触控板关闭了姓名标签,下次呼叫期间将不会发送您这侧会议室这些人员的姓名标签。但如果远端侧有可用的姓名标签送过来,您这一侧终端会收到,你这一侧与会者会看到画面中对方人员的姓名标签。在呼叫结束后,姓名标签会自动重新打开。
扩展功能
面部识别技术,除了能在会议中显示出与会者的姓名标签外,视频终端还可以根据发言者面孔进行自动构图,显示最佳视图(Best View)。另外,还可以汇总远端会场的与会者(或面孔)的人数。管理员可以根据实际使用情况验证房间容量规划是否合理。
以上视频是由Amy Chang(对,就是先前提到过的CTG的Amy Chang)主持的Room Kit Mini新产品演示视频的节选部分,由远在(挪威)奥斯陆市的思科视频研发团队配合演示人脸识别/姓名标签、最佳视角、会议人数等内容。
[转发]#804 - 认知协作#4:面部识别/姓名标签
xAPI开发接口与实例
《Collaboration Endpoint Software Api Reference Guide CE93》文档里有提到一些相关API,例如:
RoomAnalytics PeopleCountOutOfCall
RoomAnalytics PeoplePresenceDetector
RoomAnalytics PeoplePresence
RoomAnalytics PeopleCount Current
[转发]#804 - 认知协作#4:面部识别/姓名标签
[转发]#804 - 认知协作#4:面部识别/姓名标签
以下是基于相关API的开发实例。
实例1:以下这个开发实例是显示日常会议室使用情况分析,并允许您基于面部识别和超声波技术查找可用的会议室。
[转发]#804 - 认知协作#4:面部识别/姓名标签
实例2:以下实例创建了一个地图,显示由一组Room Kit设备上收集到的PeopleCount分析:
[转发]#804 - 认知协作#4:面部识别/姓名标签
隐私及实现方式
思科声称,它优先考虑个人数据隐私。当您使用Webex设备进行会议时,系统扫描会议视频中出现的任何人的脸部,为了识别会议参与者,思科使用面部向量绘制鼻子、眼睛和下巴之间的距离,以创建每个人唯一的阵列。
系统通过与会人员在个人资料页面的设置中提交的照片图片进行学习和标记。然后,系统将扫描图片并为其提供一个标识编号,该编号代表此与会者。当您参加会议时,系统将扫描会议与会者的面孔,并使用相同的算法来为与会者计算一个标识号。这些信息都是被加密过的,然后与存储的标识号进行匹配。
[转发]#804 - 认知协作#4:面部识别/姓名标签
上图是基思·格里芬(Keith Griffin)在解释人脸识别的实现方式。Keith Griffin是Teams Collaboration Group的首席工程师。 他从事Webex Intelligence的工作,特别专注于AI和机器学习以提供认知协作。 基思还领导思科的协作专利和研究策略。
其他
在个人消费领域,比如:家乐福超市支付宝刷脸支付机、地铁站的饮料自动售货机也支持刷脸支付、火车站/机场安检刷脸过闸机等等,人脸识别技术上其实已经成熟,但在企业应用场景上使用却很少,可能并不是技术方面的问题。那是什么原因呢?
相关阅读
==========================
#805 - 认知协作#5:噪音侦测和抑制
#806 - 认知协作#6:近场共享/主动入会
#807 - 认知协作#7:手势识别
#808 - 认知协作#8:室内解读
#809 - 认知协作#9:未来已来