击败柯洁的是采用了谷歌TPU的单机版AlphaGo

发布时间:2017-05-25 00:00
作者:Ameya360
来源:网络整理
阅读量:443

  AlphaGo采用了十颗TPU在云上运行,跟去年相比,本次对弈的新版AlphaGo计算量小了十倍,自我对弈能力更强,运行起来更简单,更好,功耗也更小。

  23日起跑的“中国乌镇围棋峰会”,由柯洁对战AlphaGo掀开序幕。 历时四个多小时的比赛,最终执黑棋先行的柯洁以1/4子之差落败,由AlphaGo取得第一胜。 赛后发布会上,柯洁和AlphaGo创始人、DeepMind首席执行官哈萨比斯(Demis Hassabis)以及DeepMind 强化学习团队首席程序员David Silver出席并回答了提问。

  赛后柯洁的心情看起来还不错,言辞也十分谦虚。他先是称赞了AlphaGo强大的实力,又坦言棋手们可以从中学到很多东西,AlphaGo下的很精彩,自己尽了全力:“它下的太好了,很值得棋手学习和探讨。我们需要开拓自己的思维,不能停留在原地了。” 柯洁承认,虽然自己对比赛仍然充满自信,但还完全没有摸到AlphaGo的弱点,甚至自嘲“只能等AlphaGo自己出bug”了。不过有意思的是,DeepMind创始人哈萨比斯在现场表示,不仅是DeepMind,甚至连AlphaGo自己也不知道自己有哪些bug……

  哈萨比斯称:“AlphaGo采用了十颗TPU(Tensor Processing Units)在云上运行,跟去年相比,本次对弈的新版AlphaGo计算量小了十倍,自我对弈能力更强,运行起来更简单,更好,功耗也更小。”

  DeepMind方面表示,本次与柯洁对弈的AlphaGo乃是单机版,与过去跟李世石对战时不同,当初是分布式版本。 这一次AlphaGo拥有更强大的算法,运算起来更简单也更好。 单机版的速度更快,运算结果也更好,采用了TPU,并架设在Google Cloud之上。 而根据DeepMindCEO哈萨比斯的补充,这一次的AlphaGo计算能力少于过去(对战李世石的)1/10。

  换句话说,就是“AlphaGo已经是自己的导师”,甚至于它已经不满足于只是单纯取得胜利,而是控制胜利的概率以及输赢的差距。这个说法已经得到了DeepMind工程师的现场验证:“我们的确在研究如何通过多线路决策来扩大胜率,甚至是去控制胜率,这是我们的一个探索方向。”

  根据2016年3月份,当初替AlphaGo落棋的黄世杰博士表示,与李世石对战的AlphaGo是分布式版本,与当时单机版本AlphaGo对战的话,胜率大约是70%。

  哈萨比斯表示,我们在科学杂志《自然》发表了论文,这周之后我们会公布更多细节和计划,众所周知目前也有很多强大人工智能软件,我们也会在今后公开AlphaGo更多技术细节,使其他实验室或团队能够建造自己的AlphaGo。

  关于谷歌第二代TPU

  谷歌前不久刚刚推出第二代TPU(相关阅读),对于标榜可发挥高达180TFLOPS的第二代TPU (Tensor Processing Unit),Google说明此项处理器依然是针对开放学习框架TensorFlow加速为主,因此无法像NVIDIA提出Tesla V100等GPU加速模式可额外支持Caffe、Cognitive Toolkit等学习框架。

  相比第一代TPU仅能针对逻辑推演作加速,Google此次宣布推出的第二代TPU不但大幅提升运算效能,更增加对应深度学习应用加速设计,配合越来越多人使用的TensorFlow学习框架,将使TPU应用领域变得更加多元,甚至直接挑战NVIDIA以GPU加速的深度学习应用模式。

  不过,在Google I/O 2017期间进一步向Google询问,确认第二代TPU设计依然是以针对开放学习框架TensorFlow加速为主,本身并不像NVIDIA Tesla V100等藉由GPU加速模式可额外支持Caffe、Cognitive Toolkit等学习框架,因此在实际布署应用弹性可能相对受限。 只是从TPU大幅去除非必要组件,仅针对深度学习、逻辑推演加速功能优化,预期仍将使NVIDIA面临不少竞争压力。

在线留言询价

相关阅读
  去年,AlphaGo以4比1完胜李世石,人工智能展示出和人类顶级智者不是同一个维度的学习和计算能力。在经过一年的沉寂,AlphaGo使用“Master”代号大师的ID横扫全球围棋冠军,创造不可思议的60场连胜纪录,震惊中韩围坛,让棋圣聂卫平拜服。作为近年来中国围棋界诞生的天才巨子——柯洁并不认为AlphaGo不可战胜,在半年前,正式向AlphaGo发起挑战。在5月23日,人机大战第二季第一局在浙江桐乡打响,经过猜先柯洁执黑先行。  现在,第一局比赛结束,最终成绩:围棋人工智能AlphaGo执白,仅以1/4子战胜目前等级分排名世界第一的中国棋手柯洁,暂时1比0领先。  人机大战前夜:发生的两个小插曲  在柯洁与AlphaGo人机大战开赛前夜,发生了两个小插曲。一个是明知不可为而为之,一个是明知不可为而不为。  5月22日,柯洁更新长微博,称这是“无论输赢,这都将是我与人工智能最后的三盘对局”,“不眠夜,且看且珍惜,请大家欣赏我最后的三盘人机大战”。  决战前夕,感慨万千。  在这个特殊的时间,我有些话想和热爱围棋、关注围棋、关注我的朋友们说:  无论输赢,这都将是我与人工智能最后的三盘对局  很多人可能会问为什么?  其实私底下我已经与朋友家人说了很多次这样的想法,现在的AI进步之快远超我们的想象。像国产的绝艺、日产的ZEN虽然和AIphago还有着较大差距,但已经表现出超强的实力了。我相信未来是属于人工智能的。  可它始终都是冷冰冰的机器,与人类相比,我感觉不到它对围棋的热情和热爱。对它而言。它的热情——也只不过是运转速度过快导致CPU发热罢了。  我会我用所有的热情去与它做最后的对决,不管面对再强大的对手——我也绝不会后退!至少这最后一次。  拼尽全力后,无论结果。管他口中是是非非,来一首《沧海一声笑》。岂不美哉、快意?我淡然笑到。  不眠夜,且看且珍惜,请大家欣赏我最后的三盘人机大战。  此前,AlphaGo世纪大战李世石引发中国科技界极大关注,搜狗CEO周小川也因直播报道点评5场系列赛走红网络。这一次,备受全球瞩目的人机大战第二季比赛,作为主办方,本可以激发国内人工智能产业热情,却无奈被泼了一盆冷水。  有互联网业者爆料称,柯洁迎战alphago,三番棋决胜,这是围棋界翘首以待的一件大事,也是媒体界非常关注的一件事,但就在各大主流媒体做好全部准备,推出全明星阵容来直播报道的时候,某有关部门却紧急喊停,几大直播平台和主流媒体均被要求取消直播,后经过几轮磋商,相关部门终于还是达成妥协:报道只允许从围棋角度谈及,不允许展开讨论信息技术层面,不允许信息技术专家参与。  所以,在今年的世纪决战上,屏幕前只有围棋一方的国家级选手们的热烈讨论,而另一方的人工智能技术资深专家的观点被埋。  人机大战第一局:柯洁仅以1/4子小负  本局柯洁开局就采用了“以其人之道还治其人之身”的策略,连走了两个三-三。开局第3手占了个三-三,第7手又点了个三-三。  可是本局白6已经在左边守角,黑7马上点三-三,很容易让白方形成互相呼应的外势。白22打吃,如果黑3不是在三-三而是在星位,则黑方征子有利,白22不能打吃。  白26打入后,世界冠军罗洗河认为黑27拆二过分,会遭到白棋的反击。果然,AlphaGo的白30反击,但白32有避战嫌疑,罗洗河认为在35位扳头更为严厉。黑39粘出乎  罗洗河意料,他认为二路小尖是正常下法,实战柯洁就是想挑起战斗,但是至黑47角上被吃,多数棋手认为白棋得利。  黑55顽强打入,柯洁意识到形势不利,早早放出非常手段。至黑65虽然活了角,但白方外势雄厚,白68夹击后黑方苦战。黑69再次下出非常着法,柯洁拼劲儿十足。黑83断吃一子,黑棋大龙得以治孤,但是全局来看,依然白方形势乐观。  白84在高位打入很特别,AlphaGo轻松破掉了柯洁的右上角。黑97是天马行空的一着,但罗洗河认为还是平凡的拆边更好。白98打入,黑99进攻,这也许是柯洁下97时想要的结果,但白棋治孤很轻松,黑方的攻击没什么实效,至150手,将在相谈棋出场的某位世界冠军认为,再过半小时柯洁可能就要认输了。  官子阶段,AlphaGo一如既往拣厚实着法下,虽然不一定是目数最多的,却是最稳妥的,电脑在这方面的胜率判断比人类强太多。柯洁在已知败局已定的情况下,坚持  收完了官子,可能想尽可能多的了解AlphaGo的特点。  至289手终局,柯洁以1/4子小负。  负责解说罗洗河认为黑97是明显的败着,如果改为平凡的拆边还有希望。纵观全局,柯洁着法强硬,虽然几处都达到了战略目的,但全局依然不乐观;AlphaGo全局着法自然,虽然没下出什么特别巧妙的棋,但大局始终领先。  中国围棋队总教则对柯洁很有信心,“我认为这个比赛也不是没有看头,虽然非常困难,但是柯洁争取一胜还是有机会的。”  对于这件事,创新工场李开复评价道,此次对决人类胜率几乎为零。  战罢:AlphaGo和柯洁对弈是否有意义?  这个问题的答案是肯定的,但并不是外界理解的“这对Google来说是一种宣传行为”。  石博盟解释说,AlphaGo在围棋方面已经做得很好了,但今天的结果是DeepMind的人工智能科学家和世界各国的围棋顶尖选手共同探索的结果。在这个过程中,其实并不是人类在与人工智能对战,而是科学家和围棋选手在共同探索。  科学家探索的是人工智能,而围棋选手探索的是围棋艺术。AlphaGo的每一次升级,都意味着DeepMind的人工智能科学家对“如何在有限信息下做出更优选择”这一问题有了更深刻的认识,而这一问题正是让人工智能理解人类、产生思维的关键。  在获取棋局信息后,AlphaGo 会根据策略网络(policy network)探索哪个位置同时具备高潜在价值和高可能性,进而决定最佳落子位置。在分配的搜索时间结束时,模拟过程中被系统最频繁考察的位置将成为 AlphaGo 的最终选择。在经过先期的全盘探索和过程中对最佳落子的不断揣摩后,AlphaGo的搜索算法就能在其计算能力之上加入近似人类的直觉判断。20170523-AI-6  对棋手而言,柯洁也谈到,与人工智能的多次对弈是十分有收获的。在AlphaGo胜过李世石后,中国围棋队的成员多次复盘了所有比赛,从中发现了很多新的思路。  在以往的围棋比赛过程中,总有一些“套路”是不会被打破的,这些套路曾被奉为人类经验知识的圣殿,是不可更改的。但AlphaGo正是通过突破这些规矩,达到了新的高峰,这对人类本身来说也是一种启发。  对了,这次比赛之所以选在浙江的乌镇,是因为浙江自古围棋氛围就很浓厚。浙江的烂柯山,就是传说中人类围观仙人下棋,回家后却发现时间已过百年的地方。所以从某种程度上说,你看的其实并不是围棋比赛,而是一次第三类接触。
2017-05-24 00:00 阅读量:569
  • 一周热料
  • 紧缺物料秒杀
型号 品牌 询价
TPS61021ADSGR Texas Instruments
PCA9306DCUR Texas Instruments
TPIC6C595DR Texas Instruments
TL431ACLPR Texas Instruments
TXB0108PWR Texas Instruments
TPS5430DDAR Texas Instruments
型号 品牌 抢购
TXS0104EPWR Texas Instruments
ULQ2003AQDRQ1 Texas Instruments
TPS5430DDAR Texas Instruments
TPS63050YFFR Texas Instruments
TPS61256YFFR Texas Instruments
TPS61021ADSGR Texas Instruments
热门标签
ROHM
Aavid
Averlogic
开发板
SUSUMU
NXP
PCB
传感器
半导体
相关百科
关于我们
AMEYA360商城(www.ameya360.com)上线于2011年,现 有超过3500家优质供应商,收录600万种产品型号数据,100 多万种元器件库存可供选购,产品覆盖MCU+存储器+电源芯 片+IGBT+MOS管+运放+射频蓝牙+传感器+电阻电容电感+ 连接器等多个领域,平台主营业务涵盖电子元器件现货销售、 BOM配单及提供产品配套资料等,为广大客户提供一站式购 销服务。