纯能量的NAGA学习心得(上)
一、沧海桑田,万象更新——人工智能的变革
(资料图)
1997年,深蓝击败国际象棋世界冠军加里·卡斯帕罗夫;
2016年,AlphaGo击败围棋世界冠军李世石;
2019年,Pluribus在无限德扑六人桌击败人类顶尖选手;
人工智能带来的变革,开始无可避免地波及到每一个人类智力运动的领域,而麻将并非例外。Suphy,NAGA25先后问鼎天凤十段,akochan,mortal的开源AI看谱服务引起热潮,无论是支持还是反对者,都无可否认这样的一个事实:人工智能已经给麻将带来了天翻地覆的变化。
作为AI时代兴起的日麻玩家,我希望在此谈谈我对AI的看法,以及学习NAGA的心得与体会。
1.抛弃意会,格物致知——我对AI麻将的看法
开门见山地说,我对于AI的实力持有肯定态度,甚至属于是信任AI麻将的水平和实力的激进派。我时常会这么说:“有缺点的AI毕竟是AI,而再完美的人类也不过是人类。”只此一言,就足以说明我对AI麻将的态度。
世界观决定方法论,就我个人形成的日麻体系而言,有相当的部分都是通过学习NAGA逐步建立、改良、强化的。我目前的半庄谱,NAGA评分中位数大致在91分,而总成绩多在88-95分之间进行波动,可以说,我对NAGA的理解学习已经迈入了攻坚克难的深水区。
如果有人问我,学习AI打牌,和阅读各类战术书、询问何切、高段讲谱最大的区别是什么,我的回答是:前者是格物致知,后者是意会言传——很显然,AI不会告诉你它为何这么打,不会给你任何的讲解。举个例子,高段看谱、阅读战术书与何切如同通过老师授课、课本知识和课后习题认识牛顿三定律,而AI就像一个近似光滑的平面和两个小球,一切的规律只能靠自己去领悟,这里没有现成的知识,学习AI的过程就如同物理学实验,只有一次次的尝试最终才能总结出规律。
有人说:人工智能好是好,但是丢掉了“神韵”。我的回答是,只要你肯定一副图画是无数个像素点的组合,一盘围棋是一场完美信息博弈,一局麻将是无数个随机事件组成的游戏——那么,这里便没有什么“神韵”,只有“形体”。学习AI,从来不是学什么“AI的神韵”,而是它那么打,那么下,你也跟着这么打,这么下罢了。前几十年,开局“点三三”还被称为围棋中“丑陋的一手”,如今又变成了“AI的深意”,被众多人学习。
有人说,AI之所以能点33,是因为它改变了定式啊。对的,但为什么AI之前研究围棋千百年的人类没有想到这一小小的变化呢?日麻中难道就没有这样的情况吗?从我学习AI的经历来看,这样的情况不仅有,而且很多——大多都被冠以“牌风”、“流派”的名号,甚至被写入了各种战术书中。本质上,这些东西都和定式一样,是人类对望而兴叹信息集数目的一种不得已之策略而已,谁又能说这些定式不会有出错的一天呢?
2.学而不思,难得存进——我学习NAGA的方法
世界观决定方法论,可以说,我学习NAGA的原则,全部建立在我对AI水平激进的信任之上:但凡没有证据表明NAGA是错误的地方,我通通认为是正确的并加以采纳和学习,所谓“AI的正确推定”。
有人觉得这种属于是“先射箭再画靶子”的行为,一个看似离谱的行为非要替它找个理由。但是,AI是客观的,是绝对中立的,不会因为主视角或者何切人是什么日麻界的大红大热争议人物就受到干扰,或者给出不一样、不明确的答案。与其说是“先射箭再画靶子”,不如说是“以绝对的箭为基准建立一个体系”。
当然,这里的“绝对”也是相对的,随着NAGA版本的更迭,不同模式的选取之下,同样的局面也可能会给出不同的答案。比如说,前些年大火大热的355m355p11344556s何切,随着版本更迭,NAGA也给出了许多不同的答案。可以说,NAGA现有的体系也肯定也不是最优秀的。但是我认为,它的确比我更接近最优秀的体系,所以排除掉那些显然错误的BUG与缺陷选项,全盘向NAGA学习是有助于水平提高的。
此外,相比于就向人类强者学习而言,向AI学习拥有时空和效度的优势。时空的优势无需多提,没有人类可以随时随地回答何切,提供看谱服务;而效度的优势如我文章开头所言:有缺点的AI毕竟是AI,而再完美的人类也不过是人类,人总会受到各种影响与干扰,无法保证自己的切牌与回答是与自身体系完全契合的,即“随机误差”,这会强烈干扰对体系精细层面的学习,而AI则没有这样的问题。
正是以上这些原因,使我坚定了向NAGA学习的战略,并设立了“AI的正确推定”法则。
在具体的操作层面,我向AI的学习可以细分为看谱、复盘、研讨、总结这些部分。
看谱,无需多言,有条件的将自己的所有牌谱上传进行NAGA分析,没有条件的利用tenhou.net/6 的自定义牌谱编辑功能,将一些有具体疑惑的局面进行解析。在遇到困惑的何切时,也采用类似的方法。
复盘,NAGA会给出4个级别的指标,用以区分主视角选择和NAGA最优选择之间的差距。一般来讲,前两级的差距可以不用过多关注,它们大多都是两可的,但是仍然需要研究NAGA给出的不同选项之间的差别和优劣;针对后两级的差距,需要重点关注,这些差别可能代表着这一打已经偏离了AI的打法体系,也可能标志着一个BUG的存在。
这里需要着重强调,有的雀士在使用AI时往往纠结“为啥它打A不打B呢?”实际上,某些微差的何切,本身就是打A打B都可以的,甚至于完美的策略本身可能就是分别给A和B一定的概率打出。这些微差何切,与其去纠结“为啥不打B”,不如去考虑“为啥能打A”,这样对水平的提高才更有帮助。
NAGA的分级制度也给我回答何切一定的启发,使用“100%、铁、两可、四六开、三七开”等词语优化我的何切回答描述。
研讨,针对后两个级别的差距,需要分析NAGA选项的优势,自己选项的不足,并将其补充进自身的体系内。又或者,你发现了一个BUG,需要格外关注此类情况下NAGA存在的问题。倘若自身无法分析,那么还需要进一步研讨。比如询问各高段的意见,利用牌谱编辑设置几个不同的类似局面进行分析,便于找出规律,纳入体系。实际上,NAGA的行牌和现有数据麻将的理论有相当部分都是契合的,少部分不能以现有理论合理解释的都是少数具有明显特点的特殊情况。对于这些问题,如果我找不出打法上明显的问题和漏洞,仍然会选择去学习。
总结,这是最高层次的学习,是针对NAGA在某一种或某一类特殊情况下行牌规律的归纳,是一种由特殊到一般的提炼,它往往需要对大量相似局面的统一分析才能做出。当然,由于NAGA和现行数据麻雀体系的高度一致性,所以数据麻雀的结论往往就是NAGA行牌规律的近似。另外,需要注意的是,总结必须要分析大量局面才能做出,单一或少量何切的结果都不能进行总结。第一个原因是,何切的结果可能是多种原因导致的,通过少量试验将其归纳到单一原因上,未必可靠;第二个原因是,AI虽然不存在随机误差,但存在系统误差,比如不同花色数牌之间的差别,三元牌之间的差别等等,没有对比对照的少量试验,很可能将结论和误差混淆。(题外话,为何NAGA七对不再更新了呢?也是因为上述两种原因,导致我认为结论未必可靠,并且工作量实在太大)
因此,我建议,雀士在利用NAGA总结某种规律时,应该尽可能满足物理实验的要求和标准,设置对照、重复实验,以保证结论的可靠性(虽然,这显然会大大增加工作量和花费,因此通过实战牌谱学习仍然是最优的选择)
3.思而不学,墨守成规——科学看待AI的缺点
经常有人会将一张AI给出的离谱何切回答发到群里,然后群内瞬间便充满了快乐的气息。我认为,以一两种特殊情况下AI存在的问题,来否认其它情况下AI的实力,是不正确的。正如同我们不会用点错的一打去评价主视角的实力一样。(虽然,这可能代表了心态、注意力等等之类的“软实力”)因此,对AI的思辨与批判不应影响对AI的学习
我认为,就NAGA而言,其缺点主要包括以下三点:BUG,设计问题,强逻辑,这是其远不如人类的地方,如果一个何切涉及到了这三个部分的内容,那么可对NAGA的选择进行取舍,甚至抛弃NAGA的建议。
(1)BUG
有程序的地方就会有BUG,NAGA作为AI也不例外。NAGA目前仍然具有许多BUG,本文就详细地说明一下NAGA目前存在的各类BUG。
I.碰暗刻BUG 置信度:极高 危害性:小(一般人一眼就能看出不合理,不会有人真的去学)
表现:当手牌存在一个暗刻,其它家打出第四张时,NAGA有概率给出极大的“碰”的推荐度。当暗刻为役牌时,情况更加明显。
II.绿一色BUG 置信度:极高 危害性:极小
表现:NAGA不认识绿一色。
III.途中流局BUG 置信度:高 危害性:小
表现:NAGA似乎没有途中流局概念。
IV.多种立直/副露选择BUG 置信度:极高 危害性:极大
表现:当一副牌同时存在多种、可选的、拥有推荐度的、立直(或副露)选择时,NAGA有时无法给出准确的立直(或副露)推荐度。
V.接近流局时副露/立直判断BUG 置信度:中 危害性:中
表现:当剩余枚数极少时,NAGA的副露/立直判断可能会出现极大偏移。
VI.ALL LAST判断问题BUG 置信度:低 危害性:中
表现:NAGA有时在ALL LAST做出匪夷所思的操作,有时又和其它BUG发生杂糅,尚不明确是BUG还是本该如此。
VII.前后一致乱打BUG 置信度:中 危害性:中
表现:如果一副牌,主视角在前面开始乱打(比如一直掉线摸切),那么NAGA在此后也会开始乱打。怀疑这是因为NAGA具有保持前后一致性的特点。同样基于此,NAGA几乎不会留立,表现为只要听牌时选择DAMA,只要此后牌型没有任何变化,立直推荐度都极低。
VIII. 数据不准确BUG 置信度:极高 困扰性:高
表现:NAGA给出的数据(和率,铳率,流局率,横移动率,听牌确率,每张牌的铳率)在特定的情况下可能与实际出现较大偏移。
此外,由于此BUG还额外诞生一个误解,即NAGA不看手摸切。实际上,NAGA会注意到手摸切,此误解产生的原因是因为在A家打出牌x,B家摸切后,牌x又显示出对B家的铳率,(虽然理论上确实有见逃山越的可能)因此有人认为NAGA不看手摸切,这是错误的。显示铳率是因为铳率本来在特定情况下就不准,而不是NAGA不看手摸切。
IX.立直暗杠BUG 置信度:100%(显示BUG)低(行牌BUG) 困扰性:高 危害性:中
表现:同时能立直和暗杠的牌,NAGA只会显示暗杠推荐度,立直推荐度需要黑科技才能看见。并且,同时能立直和暗杠的牌,NAGA可能做出一些奇怪的操作,尚不知晓这些操作是BUG还是本该如此。
(2)设计问题
AI麻将在设计时没有考虑一些情况,这导致AI在相关局面的判断出现问题。
1:AI不会读卡顿,这导致切牌丢失了卡顿信息。
2:部分AI不会见逃,除了4确和之外通通和。(NAGA根本不提供和牌推荐度)在考虑见逃时,我推荐采用模拟器框架的AI(akochan)进行分析。
3:在同时存在5和红5时,5和0被视为一样的牌,NAGA永远先打5。(这点在牌谱解析的时候也能看出来,5和0推荐条是一样长的,NAGA始终先打5)在特定情况下,打0会比打5更好。
4:空切问题。比如,主视角手中有一张7m,此时又摸到一张7m,NAGA对手切与摸切7m不加区分。
5:顺位分布问题。按照天凤段位避四、零和的规则进行训练的NAGA,在面对不同的规则和顺位分布时,结论可能出现偏差。
(3)强逻辑
其实,第一部分中的很多BUG,都可以算作是强逻辑的问题。比如,一个明显可以错海底的副露,NAGA却选择不做,等等。这些何切,人类可以通过严谨的推理和运算做出显著有利的选择,但这对NAGA却似乎很难掌握。类似的还有“一点读”的判断问题。所谓“读牌”,大致可分为两种,一种是统计学上的规律(比如4-2切立直,1危险度高),这点NAGA的水平不错,但另一种读牌,或者被称为“一点读”,基于人类对牌河的推理和逻辑性分析,NAGA就不太行了。一个从“一点读”角度显著危险,铳率超过50%的牌,NAGA却可以毫不犹豫地打出去。
我个人认为,这是因为“一点读”往往需要多个微小的逻辑组成部分,每一个部分都是彼此分离且相关性很低的,但当他们组合在一起时,却可以得到一个逻辑链条,形成一个强结论。倘若运用统计方法分析,那么这些部分各自容易淹没在“噪音”之中,找不出与结论的显著关系。比如说,有人打8m——副露家手切8m——8m是“没有碰的牌”——8m跨筋铳率低,这样的一个一点读,在统计学上似乎很难找到统计的方法和规律。
这么来看,监督学习似乎在读牌方面更加有利,只是我并未研究过苏菲牌谱,不知道在有“全能先知”指引下的苏菲,是否对一点读有不同的看法。
关键词: ALPHAGO 物理实验 性的特点 AI学习 围棋世界 象棋世界 DAMA 人工智能 墨守成规 随机事件 一般来讲 开门见山 举个例子 这里没有 匪夷所思 第一部分 可以通过
相关阅读
- 06-14
- 06-14
最近更新
- 06-14
- 06-14
- 06-14
- 06-14