新闻中心

EEPW首页 > 智能计算 > 业界动态 > 苹果推高精度手写识别系统，可准确识别3万字符集

苹果推高精度手写识别系统，可准确识别3万字符集

作者：时间：2017-09-28 来源：量子位

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

收藏

　　在手机、平板和可穿戴设备不断普及的今天，手写识别比以往任何时候都重要。但这并非易事，拿汉字来说，让移动设备识别大量手写汉字字符还是个挑战。

本文引用地址：https://www.eepw.com.cn/article/201709/364988.htm

　　今天，苹果机器学习博客发表文章《Real-Time Recognition of Handwritten Chinese Characters Spanning a Large Inventory of 30,000 Characters》，介绍了苹果如何在iPhone、iPad和Apple Watch的Scribble模式中解决上述问题。

　　这套基于深度学习的识别系统，能准确处理多达3万个字符。为了提高准确性，苹果研究人员还特别注意了数据的收集环境、典型字体和训练方案。他们发现，这套系统还能支持更大的字符库。

　　苹果研究人员的实验表明，只要训练数据集的数量够大质量够好，准确率只会随着字符量的增加缓慢下降。量子位将这篇博客中的要点翻译整理，与大家分享——

　　

苹果推出高精度手写识别系统，可准确识别3万字符集

　　简介

　　手写识别能够提高用户在移动设备上的体验，尤其适用于汉字这种相对复杂文字的使用者。由于汉字数量和书写样式多，手写识别确实是个大挑战。

　　字母类的语言也就涉及到100多个字母的排列顺序，但在中国国家标准GB 18030-2005《信息技术中文编码字符集》中就收录了27533个字符。

　　日常生活中，人们只用得到最具代表性的一小部分。因此，国标GB2312-80《信息交换用字符编码字符集·基本集》中仅包含6763个字符。中科院自动化研究所创建的CASIA数据库中所用字符有6763个，其中一级字符(常用字)3755个，二级字符(非常用字)3008个。

　　然而，早期识别算法主要依赖分析笔画的构造。后来，研究人员对研究汉字整体结构的方法产生了兴趣。由于众多汉字具有相似性，汉字识别的难度加大，研究人员通过分类降低错误识别。

　　在MNIST数据集的拉丁文任务中，卷积神经网络(CNN)崭露头角。因为训练数据足够大，根据需要补充合成样例，CNN无疑是最好的方法。美中不足的是，这些研究中分的类别很少。

　　当我们开始研究汉字的大规模识别时，CNN似乎是个不错的选择。但这种方法需要将CNN扩展至约3万个字符，并且在嵌入设备上实时保持性能。

　　

苹果推出高精度手写识别系统，可准确识别3万字符集

　　系统结构

　　我们采用的是CNN通用架构，类似于之前在MNIST上手写识别实验中的架构。系统结构如图所示：

　　

苹果推出高精度手写识别系统，可准确识别3万字符集

　　△典型的CNN架构

　　出于性能原因，我们将输入设定为一个中等分辨率的图像(48x48像素)，这是普通手写汉字的大小。之后我们将它输入至特征提取层，交替进行卷积和子采样。最后一个特征提取层通过全连接层输出。

　　从一个卷积层到下一个卷积层，我们选择了kernel的大小和特征映射的数量得出粗粒度特征。通过用2x2 kernel，我们对最大池化层进行了采样，每个输出层都有一个节点。

　　下图展示了使用CNN的运行结果，其中“Hz-1”指的是一级字符库(3755个字符)，“CR(n)”表示输入法界面排序为n的可能字符的准确度。除了常见的“最可能字”(top-1)和top-10的准确性外，我们也特意提到了top-4的准确性，因为输入法界面一开始会显示4个可能汉字，而top-4的准确性是用户体验提升的重要指标。

　　

苹果推出高精度手写识别系统，可准确识别3万字符集

　　△在CASIA在线数据库3755个字符上的运行结果

　　除此以外，我们对在iOS设备内部收集的额外训练数据感兴趣。此数据涵盖了更多字体样式，并包含每个字符大量的训练实例。在同一个有3775个字符测试集的训练结果如下：

　　

苹果推出高精度手写识别系统，可准确识别3万字符集

　　这次训练准确度有些许提高，总体来说，在测试集中出现的大多数汉字书写风格已经在CASIA训练集中得到了很好覆盖，也表明折叠训练数据不会使准确性下降，附加样式在对底层模型没有负影响。

　　扩展至3万字

　　我们想为用户提供从印刷体到草书等各种可能的输入字体。为了尽可能多涵盖不同的汉字书写风格，我们从中国几个地区找到了一些书法家的数据。让我们惊讶的是，大多数用户表示没有见过这些罕见的汉字。

　　因此，我们又收集了不同年龄段、性别和不同教育背景的用户数据，发现了各种各样的书写风格。下图显示了样例中“花”字在楷书、草书和“随便画几笔”风格下的样本。

　　

苹果推出高精度手写识别系统，可准确识别3万字符集

　　事实上，在日常生活中，用户输入经常是“随便画几笔”，出现一种非常不相似的曲线变化。有时也会让系统混淆成其他字符。下图展示了我们在数据中观察到的一些具体例子。需要注意的是，有足够的训练数据能区分像Figure 7这样的草书变化很重要。

　　

苹果推出高精度手写识别系统，可准确识别3万字符集

　　用这种方法，我们收集了大量汉字，将可识别字符从3755增加到大约3万。

　　

苹果推出高精度手写识别系统，可准确识别3万字符集

　　△30000个字符在CASIA在线数据库的结果

　　为了解系统如何支持30000个手写字符识别，我们还在许多不同测试集上对其进行评估，这些测试集支持所有字体的字符。平均测试结果如下：

　　

苹果推出高精度手写识别系统，可准确识别3万字符集

　　△不同字体的30000个字符在多个内部测试集的平均结果

　　当然，上面两张图的结果不能直接比较，因为它们属于不同的测试集上。但我们能发现，top-1和top-4的准确性相当，top-4达到了95.1%的准确率，结果尚好。

　　综上所述，我们在嵌入式设备上构建了覆盖3万个字符的高精度手写识别系统。只要有足够数量和质量的训练数据，识别准确度就不会大幅降低。未来，我们能精确识别的汉字字符还会更多。

<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=a7a83b30&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=a3d98779&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=abca108c&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=a1775170&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=a449048b&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

关键词：苹果 手写识别

评论

相关推荐

如何高仿苹果日历

资源下载如何高仿苹果日历 | 2013-09-13

拆解苹果最强Mac Studio

苹果 Mac Studio | 2025-06-03

三星恐以拆分抢台积电订单想让苹果、英伟达变心

EDA/PCB 三星台积电苹果英伟达 | 2025-05-29

苹果推出面向Mac和PC用户的802.11g移动基站

hehehehe | 2005-11-24

日本苹果电脑社长：40岁以前跳一次槽

liujt_ic | 2003-05-15

方正电脑将预装苹果iTunes数字音乐点播软件

pingdea | 2005-11-18

苹果造车能造出一个新苹果吗？

设计方案苹果无人驾驶汽车电动车 | 2015-09-07

AMOLED面板缘何成移动设备“新宠”？

设计方案 AMOLED 三星苹果移动设备 | 2015-07-19

苹果公布WWDC25邀请函：6月10日举行 iOS19等系统获更新

手机与无线通信苹果 WWDC25 邀请函 iOS19 | 2025-05-21

 WWDC25：新系统，新命名

WWDC25 苹果 iOS iPad Mac | 2025-06-10

苹果手机电路图(M42C)

设计方案苹果手机电路图 | 2012-07-25

报道：苹果将在 WWDC 上推出“Solarium”全设备界面大改版

消费电子 Apple 苹果 WWDC | 2025-05-27

MOTO 与苹果合作开发的新手机

资源下载苹果新手 | 2013-09-13

苹果电脑展在巴黎举行

hpnet | 2003-09-23

新版Siri跳票，苹果员工痛诉AI危机：我们的船正在下沉

智能计算 Siri 苹果 AI 人工智能 | 2025-05-19

Mac转基英特尔给苹果带来什么好处

taishij | 2005-11-15

外媒曝光特朗普为何给iPhone加税：库克没\"随驾\"中东惹恼总统

手机与无线通信特朗普 iPhone 加税库克苹果 | 2025-05-27

苹果公司手机的ID设计

资源下载苹果公司手机设计 | 2013-09-13

台积电2nm良率曝光

台积电 2nm AI 苹果晶圆 | 2025-06-05

苹果多灾多难的一年，库克急赴白宫找妥协方案？

手机与无线通信苹果库克特朗普 iPhone | 2025-05-26

仿Apple（苹果）机电源CLC-3型电路图

设计方案 Apple 苹果电源 CLC-3 电路图 | 2011-08-16

台积电难救美国制造矛盾 NVIDIA、苹果高端芯片何处封测？

EDA/PCB 台积电 NVIDIA 苹果封测 | 2025-05-16

Apple（苹果）机电源电路图

设计方案 Apple 苹果电源电路图 | 2011-08-16

苹果公司2011年部分专利

资源下载苹果专利 | 2013-09-16

苹果iPod Touch和iPhone拆机对比评测

资源下载苹果 Touch iPhone 拆机对比评测 | 2013-09-16

焦点

推荐视频

技术专区

关闭