柯洁与AlphaGo2.0五月对决机器人究竟有多强大？

作者：时间：2017-04-11 来源：21世纪经济报道

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

编者按：尽管还未开战，但外界对本次赛事的结果，已经开始有了预期，无论输赢，这也恰好证明了围棋奇妙无穷，提升的空间很大，无论棋手还是深度学习团队，都将从中获益匪浅。

　　“AlphaGo采用的是蒙特卡罗树搜索框架，加上深度学习和深度强化学习。在这样一个框架下，深度学习尤其是深度强化学习在计算机围棋上的天花板究竟有多高，还是个未知数。”中国人工智能学会副理事长、清华大学计算机系教授马少平指出。

本文引用地址：https://www.eepw.com.cn/article/201704/346464.htm

　　就仿佛科幻小说《三体》中，人类舰队首次迎战三体舰队“水滴”——去年3月，AlphaGo与李世石的围棋对决，让原本自信的人类，被不可预料的强大战斗力打了个措手不及。而与《三体》中人类舰队几乎全军覆没、残存舰队仓皇逃走所不同的是，李世石版人机大战还留下了一个悬念：人类围棋第一人柯洁，与AlphaGo战果如何?

　　如今，这个悬念将在今年5月于乌镇揭晓。

　　4月10日，中国围棋协会、浙江省体育局及谷歌共同宣布，三方将于5月23日至27日联合主办“中国乌镇·围棋峰会”(以下简称“围棋峰会”)。围棋峰会首日，柯洁与AlphaGo升级版的比赛将正式开打。该次比赛将采用中国规则的三番棋赛制，无论输赢均下满3盘，比赛每方3小时，5次1分钟读秒。

　　除此之外，主办方表示，围棋峰会期间还将举办配对赛和团队赛。在配对赛中，两位棋手将分别与AlphaGo组队，以此挑战棋手如何理解AlphaGo的独特风格并与之合作;在团队赛中，将由五位中国顶尖棋手合作，建立棋手“神经网络”与AlphaGo对决。

　　“我在半年前得知了与AlphaGo对决的消息，这次能够与AlphaGo对决，是我的荣幸。”在10日发布会现场，柯洁如是坦言。而对于一个“只有胜利才是唯一真谛”的棋手而言，柯洁表示“这一次不会轻易妥协”，并称“抱有必胜的心态和必死的信念”。

　　来自未来的对手

　　本次发布会就如AlphaGo一般神秘。在发布会前夕，谷歌仅对外通知10日下午将有“重磅消息”，直到10日上午9点之前，发布会地点仍是一个谜团。

　　即便如此神秘，也难掩内容本身的耀眼。早在数日之前，发布会的内容便不胫而走：业内传闻AlphaGo将与柯洁有一战，战期定档在5月下旬的乌镇。在10日发布会现场，主办方宣布这个巅峰对决的时间为5月23日。

　　赛事如此吸引眼球，原因在于这次的交战双方。

　　作为当今棋坛第一人，柯洁更像是人类获胜的最后一丝希望。他曾在一年前李世石0：2落后于AlphaGo之际放出豪言：AlphaGo要证明自己天下无敌，必须先过自己这一关，并称自己有信心战胜对手，“胜算大概在六七成”。

　　如今，在围棋峰会发布会现场，柯洁则显得更为谦虚，将AlphaGo描述为来自未来的对手。“现在的AlphaGo已经超过我们最强棋手的想象，带给我们最大的震撼与享受，”柯洁感慨道，“我是站在了历史变革的节点之上，很幸运能够见证AlphaGo这样强大的棋手。”

　　作为人工智能代表，全新版本AlphaGo相较一年之前更加强大，这也成为本次赛事的另一大看点。据介绍，新版AlphaGo采用了新的机器学习技术，能够通过训练形成策略网络，将棋盘上的局势作为输入信息，并对所有可行的落子位置生成概率分布，然后训练出价值网络进行预测，以对手的绝对胜利到AlphaGo的绝对胜利为标准，预测所有可行落子位置的结果。

　　而AlphaGo的真正优势体现在，将策略网络和价值网络整合进基于概率的蒙特卡罗树搜索(MCTS)中，将监督学习和强化学习结合起来。此外，新版AlphaGo还将产生大量自我对弈棋局，通过自身为下一版本提供训练数据。

　　“蒙特卡罗树搜索的算法是让AlphaGo不停地自我对弈，”一位业内观察人士表示，“通过自我对弈，进而训练价值网络和策略网络，从而优化蒙特卡罗树搜索。”

　　换言之，击败李世石的AlphaGo 1.0，是通过学习大量人类对战棋谱及与多位人类顶级高手交锋，不断积累形成棋力的。本次迎战的AlphaGo 2.0版本，则将完全摒弃人类棋谱，凭借自我对弈成长为顶级高手。

　　不过，尽管柯洁自己坦言AlphaGo为强劲对手，却仍表示不会轻易妥协。“无论它多么强大，我都要一决胜负，并尽力击败AlphaGo，”柯洁称，“现在我的心情很激动，期待五月的大战。”

　　胜负之外

　　尽管还未开战，但外界对本次赛事的结果，已经开始有了预期。

　　“AlphaGo采用的是蒙特卡罗树搜索框架，加上深度学习和深度强化学习。在这样一个框架下，深度学习尤其是深度强化学习在计算机围棋上的天花板究竟有多高，还是个未知数。”中国人工智能学会副理事长、清华大学计算机系教授马少平指出。

　　而就是这样尚看不清天花板的人工智能应用，已经足以横扫人类顶级高手。一年以来，由AlphaGo引爆的各色棋牌类人机大战的结果已基本没有任何悬念：无论是AlphaGo化身Master，在网上实现对阵各国高手，实现60连胜(其中亦包括柯洁)，还是腾讯绝艺在腾讯野狐平台率先晋升网络十段，此后在第10届UEC杯中称王，或是新近落幕的德州扑克人机对决中，卡内基梅隆大学开发的“冷扑大师AI”毫无悬念地战胜中国龙之队……在棋牌类人机大战中，人类已越来越心平气和地接受了自己的落败。

　　“AlphaGo与人类的对决已持续了很长时间，机器人确实很强大。比赛的胜负很重要，柯洁也表示将竭尽全力比赛并争取胜利，”围绕此次对决，国家体育总局棋牌运动管理中心主任罗超毅指出，“柯洁没有与AlphaGo进行慢棋比赛，现在谁输谁赢还没有落定。”

　　事实上，在年初Master的网络对局中，它采用的都是“20秒3次”的超快棋方式，几乎都是在中盘轻易取胜，然而在去年李世石对阵AlphaGo时采用的是慢棋，最终有一盘取胜。而在本次围棋峰会中，无论是柯洁与AlphaGo的“单挑”，还是顶级棋手组成“神经网络”与AlphaGo“车轮战”，都延长了行棋的时间，无形中对人类或将更加有利。

　　此外，罗超毅强调，胜负固然重要，却并非本次围棋峰会的全部，也不是峰会的主题。“柯洁与AlphaGo的对决，不仅仅是人机对战，而是科学家与棋手的智慧交流。”罗超毅指出，“柯洁曾提到，AlphaGo的许多招法是过去所没有想过的，这也恰好证明了围棋奇妙无穷，提升的空间很大，无论棋手还是深度学习团队，都将从中获益匪浅。”