<?xml version="1.0"?>
<?xml-stylesheet type="text/css" href="http://www.cslt.org/mediawiki/skins/common/feed.css?303"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="zh-cn">
		<id>http://www.cslt.org/mediawiki/index.php?action=history&amp;feed=atom&amp;title=%E6%95%99%E5%AD%A6%E5%8F%82%E8%80%83-31</id>
		<title>教学参考-31 - 版本历史</title>
		<link rel="self" type="application/atom+xml" href="http://www.cslt.org/mediawiki/index.php?action=history&amp;feed=atom&amp;title=%E6%95%99%E5%AD%A6%E5%8F%82%E8%80%83-31"/>
		<link rel="alternate" type="text/html" href="http://www.cslt.org/mediawiki/index.php?title=%E6%95%99%E5%AD%A6%E5%8F%82%E8%80%83-31&amp;action=history"/>
		<updated>2026-04-04T05:28:47Z</updated>
		<subtitle>本wiki的该页面的版本历史</subtitle>
		<generator>MediaWiki 1.23.3</generator>

	<entry>
		<id>http://www.cslt.org/mediawiki/index.php?title=%E6%95%99%E5%AD%A6%E5%8F%82%E8%80%83-31&amp;diff=39059&amp;oldid=prev</id>
		<title>Cslt：以“==教学目标==  * 了解围棋文化和围棋的困难，认识到机器下围棋的困难所在 * 了解AlphaGo的基础算法，以及与深蓝算法的不同 *...”为内容创建页面</title>
		<link rel="alternate" type="text/html" href="http://www.cslt.org/mediawiki/index.php?title=%E6%95%99%E5%AD%A6%E5%8F%82%E8%80%83-31&amp;diff=39059&amp;oldid=prev"/>
				<updated>2022-08-13T05:25:51Z</updated>
		
		<summary type="html">&lt;p&gt;以“==教学目标==  * 了解围棋文化和围棋的困难，认识到机器下围棋的困难所在 * 了解AlphaGo的基础算法，以及与深蓝算法的不同 *...”为内容创建页面&lt;/p&gt;
&lt;p&gt;&lt;b&gt;新页面&lt;/b&gt;&lt;/p&gt;&lt;div&gt;==教学目标==&lt;br /&gt;
&lt;br /&gt;
* 了解围棋文化和围棋的困难，认识到机器下围棋的困难所在&lt;br /&gt;
* 了解AlphaGo的基础算法，以及与深蓝算法的不同&lt;br /&gt;
* 了解AlphaZero自我学习的重要意义&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
==教学内容==&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
===围棋===&lt;br /&gt;
&lt;br /&gt;
* 围棋，中国古称“弈”，英文名称“Go”。围棋起源于中国，传说为帝尧所作。围棋使用矩形格状棋盘，纵横19条线，361个落子点。对弈双方执黑白二色棋子交替行棋，以所围占区域多者为胜。&lt;br /&gt;
* 围棋局面千变万化，围棋经典著作《棋经十三篇》中将之称之为 “势”。对于人类棋手，围棋高手们往往把对 “势” 的把握看作是对事物的洞察力和对全局把控力。因此，围棋经常被神秘化，与攻伐、理政、怡情、处世等高级智慧联系起来。 �&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
===深蓝能下围棋吗？===&lt;br /&gt;
&lt;br /&gt;
* 1997年IBM的深蓝击败国际象棋冠军卡斯帕罗夫，从此以后机器在各种棋类对弈上鲜有人类对手。那么，为什么不让深蓝来下围棋呢？&lt;br /&gt;
* 我们首先看一看深蓝击败卡斯帕罗夫所用的α-β剪枝算法。这一算法的基本思路是一个极小-极大搜索过程。简单地说，就是从当前棋局往前看几步，努力选择一条“即使对方应对最合理，我依然可以得到高分”的走法，如右图所示。然而，单纯的极小-极大过程速度非常慢（深蓝如果用这一算法，走一步棋要花17年），α-β剪枝算法对此进行了改进，去掉那些不必要的分枝，从而极大提高了搜索效率。&lt;br /&gt;
* α-β剪枝算法的一个关键问题是需要判断几步之后的棋局形势。在国际象棋中，这一判断还是容易的，但对围棋则困难的多。这是因为围棋太过灵活，即便是人类棋手都只能靠直觉来判断，机器就更困难了。&lt;br /&gt;
* 基于上述原因，在深蓝获胜后的十多年时间里，并没有哪一款计算机围棋程序能击败人类顶尖棋手。因此，直到2016年AlphaGo与李世石交战的前两天，棋圣聂卫平还曾评论说“我认为人百分百会取胜。电脑战胜人脑这种说法完全是忽悠。”他的判断依据是：“围棋中对于几百万种形势哪种最好，人脑可以做出最有利于自己的判断，但电脑面对复杂的情况完全无法判断。”这一评价可谓中肯。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
===AlphaGo===&lt;br /&gt;
&lt;br /&gt;
* 2016年，DeepMind的AlphaGo战胜了韩国顶尖棋手李世石，标志人工智能在对弈领域的完胜。在此之后，AlphaGo以Master为名横扫中日韩顶级棋手，无一败绩。2017年，AlphaGo击败中国柯洁九段，此后再无对手，宣布退役。&lt;br /&gt;
* 蒙特卡洛树（MCT）搜索是AlphaGo取得辉煌胜利的最大功臣。围棋对弈中最大的问题是对棋局的评价。 MCT采用模拟走棋到终局的方式对棋局进行评估。如右图一所示，MCT保持一棵搜索树，经过大量模拟后，每个节点记录的胜率即可作为局面评估的依据。&lt;br /&gt;
* 深度神经网络是AlphaGo取得成功的另一个重要因素。AlphaGo训练了两个卷积神经网络，策略网络用来预测基于当前棋局下每个落子的概率，值网络用来预测棋局本身的胜率。这两个网络与MCT搜索互相配合，一方面用神经网络提高MCT的搜索效率，另一方面用神经网络学习MCT模拟走棋的结果。&lt;br /&gt;
* 最后，自我对弈在AlphaGo的训练和走棋中占有重要分量。自我对弈不仅是MCT模拟走棋的基础，而且可以不断生成新数据，使模型更加强大。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
===自学成材的AlphaZero===&lt;br /&gt;
&lt;br /&gt;
* AlphaGo虽然强大，还是有人类知识的影子。首先它用到了了人类16万盘棋谱，同时也用到了一些人为定义的知识，如什么时候放弃走子。&lt;br /&gt;
* 2017年，DeepMind推出AlphaGoZero，完全抛弃了人类知识，通过自我对弈自学成材。&lt;br /&gt;
* 同年，DeepMind将AlphaGoZero扩展到AlphaZero, 在国际象棋、将棋、围棋等各种棋类对决中完败对手。&lt;br /&gt;
* AlphaZero的成功意味着在目标明确的封闭任务中，机器可能通过自我学习找到比人类更好的解决方案。&lt;br /&gt;
* 从图灵1947年的国际象棋程序开始到2017年AlphaZero完胜，人们整整研究了70年。&lt;/div&gt;</summary>
		<author><name>Cslt</name></author>	</entry>

	</feed>