自律学习SDL模型赋能自动驾驶

作者：顾泽苍时间：2021-09-12 来源：中国电子报、电子信息产业网

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

编者按：本文作者为南开大学特聘教授、天津市阿波罗信息技术有限公司CEO

最近发生的几起自动驾驶恶性事故，某种意义上看，都是因为深度学习的识别问题造成的。为什么被大家崇拜的深度学习在识别图像上会出现问题？

本文引用地址：https://www.eepw.com.cn/article/202109/428180.htm

原因有几个方面，最主要的是深度学习在理论上属于函数映射模型，简单说就是给它训练什么图像就只能识别哪个图像，不具有举一反三的能力。通常我们用手机拍摄一个图像，在屏幕上虽然看不出图像有什么变化，这是因为大脑有记忆能力。但是对于没有智能的机器识别来说，随着相机的抖动，拍摄角度，光线等的微小变化所得到的都是完全不同的图像。深度学习就是这样，哪怕图像有一点错位，也会认为是另一个图像。所以深度学习需要上万乃至上百万个图像的训练才能识别一个图像。这就意味着用深度学习模型的自动驾驶的图像识别装置，遇到没有训练过的图像时，明明有障碍物，也会做出没有障碍物的判断结果，出现撞车的恶性事故在所难免。尽管开发者们下力量不断的搜集大量图像数据进行训练，但是面对众多种路况这种做法从科学观的立场上讲是徒劳的。这也就是马斯克指责目前学术界给出的AI不够智能的原因所在。

我们希望更加智能的自动驾驶的诞生，需要各方努力，特别需要探索和寻找更好的算法模型。2018年发表在国际机器人大会上的自律学习模型是一个值得自动驾驶领域关注的算法模型。自律学习（Self-Discipline Learning）SDL模型其实就是人工智能领域所期待的机器学习模型。这种模型之所以强大是因为具有四个特殊的技术特征。

第一个技术特征是能让机器模仿人来处理自动驾驶的识别，机器推理，以及自动驾驶的控制问题的算法。深度学习是基于统计学的机器学习模型，其实是属于模式识别的理论，本不是人工智能的主流算法。人工智能的定义就是把人的智慧授予机器，让机器具有超越人的能力。因此对于上述自动驾驶所面临的复杂系问题，近几十年一直围绕着如何实现人为介入，就是说让人介入到算法里去，把人在如何解决问题的方法构成算法，用这样的算法让机器去代替人解决复杂系问题。人工智能的第一，二次高潮的主流算法就是力图解决给机器赋予人的智慧的问题，只是因为当时缺少数学基础理论的支持，还无法在技术上实现让机器智能的目的。因此真正的人工智能算法一定要直接解决如何把人的智慧让机器深度理解，让机器变聪明来代替人的工作。

谈到这里，恐怕包括一些专家学者们都会感到茫然。这么复杂的算法何时才能得到？其实支持新一代人工智能的核心理论并不一定是极其抽象的理论，传统的理论由于过于僵化不容易做到人为介入，把人的智慧授予机器，在当今人工智能领域是行不通的。而往往被人看不上的现代数学却是可以成为人工智能可以产生突破性的核心理论。其中，模糊集合理论就为我们提供了可以针对任何一种事物的定式化方法。把人的智慧用足够多的隶属函数（Membership Function）的公式来表达，机器按照这些隶属函数来处理各种复杂系问题，机器就可以同人一样聪明起来。

这是受第二次人工智能高潮为了让机器聪明起来，所推出的规则库理论的启发，由于当时用规则所实现的知识表现过于简单，规则只能告诉机器在什么情况下，应该如何做？面对复杂系问题却需要无穷个规则才能解决，所以规则库理论以失败告终。今天，用隶属函数进行知识表现，一个隶属函数可以相当无穷个规则，所以不用怀疑隶属函数的能力。

我们可以用自动驾驶中目前很难解决的机器推理为例子，介绍上述算法的惊人作用。

自动驾驶的机器推理难就难在要想控制自动驾驶车正确的行驶，至少要考虑前后左右共有8辆车之间的距离，速度，加速度，以及自动驾驶车的速度，加速度，严格讲这就是超越了40个组合要素的图灵机不可解的NP（Non-deterministic Polynomial）问题。所以目前推出的自动驾驶就是国际大公司也苦于做不好这个功能，我们看到的这些自动驾驶很少变道，宁可跟着前面的车停下等待。

面对这个难题，我们搞的自动驾驶中的机器推理系统，就是把人在驾驶汽车时的安全驾驶，安全礼让，以及鱼贯而行的安全驾驶的智慧用数百个隶属函数来表达实现了机器深度理解，再通过深度的推理指挥自动驾驶的行驶，这样的自动驾驶在路上跑，真的同人的驾驶很接近。为了让机器推理能够适应目前在路上经常出现的野蛮驾驶的同行车，我们做了几乎可以模拟实际路况的自动驾驶仿真系统，这个仿真系统中自动驾驶车是用我们的机器推理模型来控制，周围的同行车可以由人来控制，用人来控制同行车的目的就是，可以由人主动的构成各种变化多端甚至包括一些危险的路况场景，通过人同自动驾驶博弈，用以考验机器推理的效果。这就是在新一代人工智能模型下，目前传统模型不可解决的问题，却可以轻而易举的解决的案例。

由此可见，让机器聪明起来并不是不可想象的神话，路在脚下只要用心就可以摆脱传统的理论的束缚，在人工智能的研究中产生突破性的成果。

近代数学中的高斯过程理论也是人工智能的核心理论。著名数学家高斯发明的高斯分布的伟大之处在于它可以通过少量的数据就能得到大数据的训练结果，基于这个理论所搞出的机器学习模型一定具有举一反三的能力。高斯分布还给出了一切事务发展的必然结果，如同人类发展也是不以人的意志为转移的，一定按照高斯分布由人类起源到人类的高度发展时期，最后一定趋于逐渐的终结，由起源到终结是一个对称的过程，是由高斯分布所决定的。
构成自律学习SDL模型的其中一个核心的算法是“概率尺度自组织”，这是一个既简单又实用的自律学习的算法。“概率尺度自组织”的迭代过程是在高斯分布的任何的初始空间里，逐步朝着最大的概率空间迁移，并最终在最大概率空间里收敛的过程。我们的自动驾驶的三维图像识别就是用了这么简单的算法，自动驾驶所遇到的任何障碍物，在三维空间里是一个密度很大的物体，也就是概率分布最大的空间，利用概率尺度自组织的迁移特性，不管障碍物在什么地方，都可以被算法直接抓住，这种图像识别不需要事先训练图像，不需要特征抽出，彻底避免了深度学习对障碍物与背景不好分离，造成把白色车厢看成是云而酿成恶性事故的发生。

随着机器学习被业界高度重视，距离问题是机器学习的核心理论。为解决概率空间的数据的直接分类问题，吸引了无数数学家们投入概率空间距离的研究，虽然有KL（Kullback −Leible）距离等很多的概率空间距离被发明，但是基于目前的数学基础，数学家们把概率空间抽象化，看成是独立的无穷维的空间，不能把欧几里德空间与概率空间融合，以及还解决不了非线性函数的复杂的求解问题，致使目前数学界提出几乎所有的概率空间距离都不能在工程上应用。
其实依据概率空间的严格定义，测度为一的空间就是概率空间，也就是一个高斯分布的数据就是一个概率空间数据。这就揭示出我们现实的数据是由欧几里德空间发展到了概率空间的。经过长时间的探索，我们发现了欧几里德里空间距离与概率空间距离之间仅仅存在一个与概率空间的概率密度相关常数，在欧几里德空间距离里消除概率空间的距离的这个常数就可以得到一个精确的可以统一欧几里德空间与概率空间的距离公式。

自律学习SDL模型就是用我们发明的概率空间距离作为概率空间数据之间的尺度，以概率尺度自组织的最大概率尺度为聚类的依据，就可以自律的进行数据聚类。特别是在最大概率空间下的聚类，也可以说是在接近母体的高斯分布下的聚类。这是一个当今最佳的机器学习模型。即可以把概率空间的数据直接聚类，又可以得到在概率空间里以小数据学习得到相当于大数据学习的效果。

SDL模型还可以直接用于自动驾驶的控制，在控制领域近20年一直没有突破，本来为解决随机性的控制问题引入了自适应控制理论，但是，控制是应用于在线系统的，利用统计学理论，需要在线的抽取大量的统计数据，这是现实应用中很难做到的，因此自适应控制一直停滞不前。机器学习为自适应控制提供了非常强大的支持，机器学习可以在离线上训练数据，使用训练后的数据进行在线控制，不影响在线控制的速度。因此导入机器学习实现最佳的自适应控制是人们期待的算法。
自动驾驶的控制问题也对现代控制理论提出了挑战，汽车是重的载体，在高速运动中会产生很大的动能，目前虽然有模型预测控制（Model Predictive Control）MPC模型，以及线性二次型调节器控制（Linear Quadratic Regulator）LQR模型，但是，自动驾驶需要根据不同的路况不断的改变控制状态，传统的最佳控制是最不适应多变的自动驾驶的控制。把人在驾驶汽车时的生物意识的自然反应是驾驶汽车的最佳的方法，把人的驾驶智慧通过SDL模型的机器学习所得到的自动驾驶的高阶信息，机器通过调用高阶信息控制自动驾驶，实现了让机器按照人的驾驶智慧进行自动驾驶，这是目前最理想的自动驾驶的控制方法。这种控制方法，不管是冰冻的道路，雪地，以及大水淹没的道路都可以让自动驾驶平稳的行驶，实践证明导入这样的自动驾驶的控制算法，可获得最理想的自动驾驶的效果。

使用我们发明的概率尺度自组织以及概率空间距离公式，以概率空间为中心的自律聚类这一新的机器学习的发明其先进性，在美国获得的发明专利中被肯定，这也是构成了SDL模型的第二个技术特征。

只有符合科学的理论才可以被实践所接受！在人工智能领域存在着很多缺乏科学依据宣传，人工神经网络是否是深度学习可以产生一定应用效果的根源？

带着这个问题我们的团队励志要打开人工神经网络的黑箱，我们基于组合理论的基本原则，经过大家的努力奋战终于在一个人工神经网络中找到了全局最佳解，这个全局最佳解实际上就是一个高维线性方程的解。在获得全局最佳解的过程中，我们又掌握了各种数据函数映射的特点，以及与梯度下降法SGD（Steepest Gradient Descent）的解的关系。从而人工神经网络的不被人知的黑箱被打开了。通过打开黑箱推动了深度学习的技术进步，我们发现深度学习的应用效果主要是卷积核以及反向传播的作用，而人工神经网络的作用主要是分类。利用SDL模型可以最佳的最高效率的自律聚类的特点，再加上把SDL模型与卷积核与反向传播技术的融合，甩掉人工神经网络，使小数据小模型的SDL模型的能力超越一般的深度学习，这就是自律学习SDL模型的第三个技术特征。

自律学习SDL模型的第四个技术特征就是：利用自律学习的聚类结构简单以及可分析性的特点，可以方便的融合其他技术。为了解决深度学习还很难解决的针对不同类的数据在低维空间混合在一起不可分问题，引用核函数（Kernel Function）理论，把数据映射到高维空间，使不可分离的数据利用高维空间的超平面就可以分离的技术特征，使SDL模型在分类技术上又产生了飞跃。

SDL模型在几十年的人工智能的应用中，如今已形成一整套完整的理论体系，和立竿见影的应用效果。可以在目前深度学习所做不到的工业控制，医疗领域，自动驾驶，以及嵌入式系统等的所有IT产品，以及所有的应用场景下发挥独特的作用。SDL模型确实可以实现人们对人工智能的期望，实现全社会的人工智能的大普及，可以获得以往任何技术所不能产生的经济效果。

当今在人工智能领域的技术发展日新月异，经过长年的实践针对复杂系问题用人的智慧赋予机器让机器做出超越人的工作是新一代人工智能的核心理论，也是在工程上最行之有效的方法，在目前人工智能的基础理论还没有完全建立起来时，掌握这一核心理论一定会在实践中获得突破！寄托于年轻一代利用这个核心理论，在人工智能的发展过程之中建功立业！

新闻中心

自律学习SDL模型赋能自动驾驶

评论

相关推荐

技术专区