揭秘阿里打假AI大脑：数据总量186个国家图书馆，1 AI=50000人类，获创新大奖

作者：李根时间：2019-08-15 来源：量子位

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

本文经AI新媒体量子位（公众号 ID: QbitAI）授权转载，转载请联系出处。

本文引用地址：https://www.eepw.com.cn/article/201908/403730.htm

“令人震惊的是，在打假这方面，美国竟然远远落后！”一个月前，美国司法委员会副主席、共和党参议员道格·柯林斯痛陈美国被假货所困的问题，其话言犹在耳，近日阿里打假技术又拿下国内高规格的技术大奖。

8月9日，由工信部、公安部及网信办三部委指导主办的“中国人工智能高峰论坛”在厦门召开，经过层层评选，阿里巴巴知产保护科技大脑被三部委评为“人工智能创新之星” 。

知识产权保护所指，更喜闻乐见的叫法就是打假。而阿里的知产保护科技大脑是一套阿里20年间积累的海量线上线下假货特征库、打假经验聚合而成的算法技术系统，独创“安全AI”大脑是核心。

这套系统24小时自动运转，96%的疑似侵权链接在发布的那一刹那就已被秒杀。在过去3年，阿里已使用这套技术协助全国31个省份、227个区县的警方抓获制售假嫌疑人4439人，捣毁制售假窝点4289个。

从美国议员点赞到国内技术大奖，可以说时节已至，阿里打假正进入爆发性收获阶段。量子位也了解到这背后的安全AI运作之力、创新之功，接下来为大家一一揭秘。

1 AI 大脑=5 万人类

知产保护科技大脑，就是诚心和技术创新的集大成产品。

该“大脑”完全由阿里自主研发，已经被广泛应用于阿里生态内外，对假货、山寨、侵权盗版等进行侦测和打击。

而且作为一支上岗AI，各方面实力，不仅比人类干得好，而且很多能力人类干不了。

阿里方面公布了一系列惊人数据表现：

如果人工查看1张图片的信息需要10秒钟，那么5万人同时工作的效率才能勉强赶上“知产保护科技大脑”扫描甄别图片的速度。淘宝天猫平台每日新发商品量以千万计，如果人工巡查，138889人工作1天才能把这项工作完成。

阿里安全图灵实验室负责人薛晖透露，这套系统的样本数据总量相当于186个中国国家图书馆藏量，仅累积的打假图片样本量就超过137亿张，用0.3毫米的标准相纸打印叠加后高达4110千米，是世界最高建筑迪拜塔的4964倍，约等于464个珠穆朗玛峰。

惊人的效果背后是阿里在安全场景里不断进化技术力量所锻造的“安全AI”风控体系。

安全AI如何服务知识产权保护？

所谓安全AI，是指安全场景中进化出的AI，拥有更强、更多元化的能力；与当前通用AI的理念不同，阿里安全更注重在业务安全领域垂直纵深的技术积淀，开发出适应更多安全场景的新一代AI，让传统的安全问题找到新的AI解法。阿里在今年年初提出这一全新理念，称其将成为未来网络安全问题的核心解法。

据悉，阿里知产科技大脑的秘密在于四大智能核心引擎，涵盖阿里上百项自主研发的安全AI技术。分而解之，涉及感知引擎、认知引擎、决策引擎和计算引擎。

实际也是通用人工智能（AGI）必不可少的四大引擎，只是阿里垂直为打假服务。

从项目申报说明里，也能寻得宏观架构脉络。

感知引擎：核心技术是计算机视觉技术及语音识别技术，是整个系统的感官系统，是对象识别的基础，为形成后续一系列处理动作迈出第一步。

包括，用于开店身份认证环节的人脸识别、声纹识别、活体检测等生物识别技术；用于开店资质核验环节的证件识别、篡改检测技术；用于线上商品识别的商标检测、物体检测、光学字符识别技术；用于营销环节检测的广告图片分析和视频直播监测技术，以及用于原创作品保护的多媒体检索和图像水印技术等。

正是“感官系统”精准的语音、图像、音频、视频感知能力，整个系统才能在数亿复杂数据中准确识别出需要保护和防御的对象，进行下一步处理。

认知引擎：核心技术是自然语言处理技术

认知引擎是系统的“翻译官”，让机器懂得文字的意思、人类声音的含义，以及人们动作的性质，从而判断善意恶意、危险安全。

具体包括针对海量商品结构化与非结构化数据构建的知识图谱技术；面向海外电商的多语言分析和机器翻译技术，针对外部反馈的评价、舆情进行识别的语义分析技术；以及融合多模态信息，对商品的全面认知和理解的技术。

第三，决策引擎：核心技术包括深度学习和强化学习两块，用来解决现实中的复杂决策问题。

它是系统的“军师”，决定了系统该如何动作，如何更合理有效地作出最佳应对。例如当面临商家实时博弈、信息内容的变异，以及黑产的恶意攻击时，在全局视角下做出更有利的决策。

最后还有计算引擎，包括实时指标计算系统、分布式异构计算系统、和大规模图神经网络系统。

这是打假AI大脑的发动机，它强大的性能保证了系统在数千并发、数十亿数据面前坦然自若、精准高效。

计算引擎背后，支撑的是阿里云机器学习平台 – PAI 3.0。

它可以实现单任务支持上千worker并发训练，并支持5k+超大规模异构计算集群，保证全天候监控数十亿商品异常情况，以及对经营者行为的全方位监督。

台上一分钟，技术20年功

值得一提的是，四大引擎架构宏观，但背后每一项技术积累，都是工程师们日夜苦功的结果。

值得一提的是，打假AI大脑是阿里安全“安全AI”落地应用场景之一。阿里在高风险、强对抗的场景中不断进化AI的力量，通过小样本学习、多模态、自监督学习等新技术的持续应用，在内容安全、新零售安全、交易安全等百余场景中持续应用，其凝聚着阿里安全图灵实验室在AI领域超过10年的技术积淀，实现水滴石穿。

从最近阿里安全图灵实验室在人工智能顶会的论文中，不难发现其功力所在。

这是阿里发表于ECCV Workshop 2018的论文，核心分享了其在视频分析领域的技术进展。

也是阿里从视频中识假打假，保护原创的秘诀所在。

当前业内通行的视频分析，往往先预训练CNN网络提取特征分类，其后采用循环神经网络（RNN、LSTM）进行序列建模。

但视频的特征序列一般较长，且含有多级结构（hierarchical data structure），即一个视频包含帧、镜头、场景、事件等。

而且帧与帧、镜头与镜头间的关系十分复杂，不仅仅是前后帧的顺序关系，通过一般的序列建模方法，RNN无法表达如此复杂的关系，建模效果较差。

因此阿里研究团队通过深度卷积图神经网络（DCGN）对视频的帧、镜头、事件进行多级的建模，逐渐地从帧级、镜头级，一直到视频级进行抽象，从而获得视频全局的表达，进而进行分类：

最后方法在youtube8m数据集上验证后，效果相对其他经典的序列建模方法，都有提升。

论文传送门：https://arxiv.org/abs/1906.00377

还有自然语言处理领域的进展，同样是知产保护科技大脑的关键技术。

阿里安全图灵实验室入选IJCAI 2019的文章，主题是面向对象的情感分析，主要目标是挖掘出评论对象，同时判断情感表达的极性。

一般而言，很多对于商品质量描述的蛛丝马迹，会隐藏在用户对商品的评论中，却很难从商品本身中发现问题，这也是NLP技术能够施展拳脚的场景。

论文中提出的方法，通俗来说是利用全局信息、结合上下文语境去识别情感对象，而不再是预测每个字对应的序列标签。

这种方法基于词块方法，提出更简单高效的联合模型，同时抽取情感表达对象以及判断其情感极性。

具体步骤上，首先对评论语句中的所有候选词块进行向量表示，然后提出了一种基于词块的注意力机制来预测词块对应的标签和极性。

最后公开数据集评测对比后，证明比现有方法表现更好。

新闻中心

揭秘阿里打假AI大脑：数据总量186个国家图书馆，1 AI=50000人类，获创新大奖

评论

相关推荐

技术专区