www.亚洲男人天堂_欧美最顶级的aⅴ艳星_国产精品免费网站_欧美日韩在线一区_欧美床上激情在线观看_日韩av色在线_国产精品亚洲综合天堂夜夜_欧美做爰性生交视频_国产成人高潮免费观看精品_久久天天躁夜夜躁狠狠躁2022_国产美女久久精品香蕉69_亚洲专区在线视频_国产精品夜间视频香蕉_国产成人综合一区二区三区_国产精品69av_岛国av午夜精品

網絡消費網 >  IT > > 正文
AAAI 2022大獎出爐!中科院德州撲克程序AlphaHoldem獲卓越論文獎
時間:2022-02-28 21:07:10

近日,人工智能國際頂會 AAAI 2022 正在召開,大會論文獎也陸續公布。AI科技評論獲知,中國科學院自動化所的興軍亮教授團隊獲得 AAAI 2022 的卓越論文獎(Distinguished Paper)!

AAAI 的英文全稱是“Association for the Advance of Artificial Intelligence”(美國人工智能協會)。該協會是人工智能領域的主要學術組織之一,具有一定的學術權威性。

興軍亮團隊此次獲獎的工作是他們所開發的輕量型德州撲克 AI 程序——AlphaHoldem。據介紹,該系統的決策速度較 DeepStack 的速度提升超1000倍,與高水平德州撲克選手對抗的結果表明其已經達到了人類專業玩家水平。

論文名稱:《AlphaHoldem: High-Performance Artificial Intelligence for Heads-Up No-Limit Poker via End-to-End Reinforcement Learning》

作者團隊:趙恩民,閆仁業,李金秋,李凱,興軍亮

1德州撲克AI的意義

與圍棋任務相比,德州撲克是一項更能考驗基于信息不完備導致對手不確定的智能博弈技術。

德州撲克是國際上最為流行的撲克游戲,由于最早起源于20世紀初美國德克薩斯州而得名。

德州撲克的規則是使用去掉王牌的一副撲克牌,共52張牌,至少2人參與,至多22人,一般參與人數為兩人和十人之間。

游戲開始時,首先為每個玩家發兩張私有牌作為各自的“底牌”,隨后將五張公共牌依次按三張、一張、一張朝上發出。在發完兩張私有牌、三張共有牌、第四張公共牌、第五張公共牌后玩家都可以多次無限制押注,這四輪押注分別稱為“翻牌前”、“翻牌”、“轉牌”、“河牌”。圖1展示了一場德州撲克游戲的完整流程示意。

圖1:兩人無限注德州撲克一次游戲過程示意

經過四輪押注之后,若仍不能分出勝負,游戲進入“攤牌”階段,所有玩家亮出各自底牌并與公共牌組合成五張牌,成牌最大者獲勝。圖2給出了德州撲克不同組合的牌型解釋和大小。

圖2:德州撲克不同牌型大小說明和比較

德州撲克博弈的問題復雜度很大,兩人無限注德州撲克的決策空間復雜度超過10的161次方;其次,德州撲克博弈過程屬于典型的回合制動態博弈過程,游戲參與者每一步決策都依賴于上一步的決策結果,同時對后面的決策步驟產生影響;

另外,德州撲克博弈屬于典型的不完美信息博弈,博弈過程中玩家各自底牌信息不公開使得每個玩家信息都不完備,玩家在每一步決策時都要充分考慮對手的各種可能情況,這就涉及到對手行為與心理建模、欺詐與反欺詐等諸多問題。

研究者認為,由于德州撲克游戲規則又非常簡單且邊界確定,特別適合作為一個虛擬實驗環境對博弈的相關基礎理論方法和核心技術算法進行深入探究。

近年來,國際研究者在德州撲克這一大規模不完美信息博弈問題的優化求解中也取得了長足進步。

比如,之前加拿大阿爾伯特大學和美國卡內基梅隆大學的研究者就設計出 AI 程序 DeepStack 和 Libratus,并先后在兩人無限注德州撲克中均戰勝了人類專業選手,隨后卡內基梅隆大學設計的 Pluribus 又在六人無限注德州撲克中戰勝了人類專業選手。

但目前主流德州撲克AI背后的核心思想是利用反事實遺憾最小化(Counterfactual Regret Minimization, CFR)算法逼近納什均衡策略。

具體來說,首先利用抽象(Abstraction)技術[3][7]壓縮德撲的狀態和動作空間,從而減小博弈樹的規模,然后在縮減過的博弈樹上進行CFR算法迭代。

這些方法嚴重依賴于人類專家知識進行博弈樹抽象,并且CFR算法需要對博弈樹的狀態結點進行不斷地采樣遍歷和迭代優化,即使經過模型縮減后仍需要耗費大量的計算和存儲資源。

例如,DeepStack使用了153萬的CPU時以及1.3萬的GPU時訓練最終AI,在對局階段需要一個GPU進行1000次CFR的迭代過程,平均每個動作的計算需耗時3秒。Libratus消耗了大于300萬的CPU時生成初始策略,每次決策需要搜索4秒以上。

這樣大量的計算和存儲資源的消耗嚴重阻礙了德撲AI的進一步研究和發展;同時,CFR框架很難直接拓展到多人德撲環境中,增加玩家數量將導致博弈樹規模呈指數增長。另外,博弈樹抽象不僅需要大量的領域知識而且會不可避免地丟失一些對決策起到至關作用的信息。

2AlphaHoldem是何方神圣?

這個問題也吸引了很多中國研究者,中科院自動化所的興軍亮教授團隊便是其中之一。去年12月,他領導的博弈學習研究組針對德州撲克任務,提出了一種高水平、輕量化的兩人無限注德州撲克AI程序——AlphaHoldem。

不同于已有的基于CFR算法的德州撲克AI,中科院博弈學習研究組所提出的架構是基于端到端的深度強化學習算法(如圖4所示)。

圖4:端到端學習德州撲克AI學習框架

根據團隊介紹,AlphaHoldem采用Actor-Critic學習框架,其輸入是卡牌和動作的編碼,然后通過偽孿生網絡(結構相同參數不共享)提取特征,并將一種改進的深度強化學習算法與一種新型的自博弈學習算法相結合,在不借助任何領域知識的情況下,直接從牌面信息端到端地學習候選動作進行決策。

他們還指出,AlphaHoldem的成功得益于其采用了一種高效的狀態編碼來完整地描述當前及歷史狀態信息、一種基于Trinal-Clip PPO損失的深度強化學習算法來大幅提高訓練過程的穩定性和收斂速度、以及一種新型的Best-K自博弈方式來有效地緩解德撲博弈中存在的策略克制問題。

AlphaHoldem 使用了1臺包含8塊GPU卡的服務器,經過三天的自博弈學習后,戰勝了Slumbot和DeepStack。

每次決策時,AlphaHoldem都僅用了不到3毫秒,比DeepStack速度提升超過了1000倍。同時,AlphaHoldem與四位高水平德州撲克選手對抗1萬局的結果表明其已經達到了人類專業玩家水平。

3團隊部分成員介紹

趙恩民,論文一作。中國科學院自動化研究所模式識別與智能系統專業博士四年級研究生,2018年于清華大學獲得工學學士學位。研究方向為計算機撲克和深度強化學習。

興軍亮,中國科學院自動化研究所研究員、博士生導師、特聘青年骨干,中國科學院大學崗位教授,中國科學院人工智能創新研究院創新專家組專家。興教授2012年畢業于清華大學計算機科學與技術系,獲工學博士學位。

此外,他還是美國電器與電子工程學會(IEEE)高級會員、美國《科學》雜志中國官方公眾號特邀評論員、中國計算機學會(CCF)高級會員、計算機視覺專委會委員。

他的主要研究領域為計算機視覺和計算機博弈。目前已在包括頂級國際期刊如TPAMI、IJCV、AI以及頂級國際會議上如ICCV、CVPR、AAAI、IJCAI上發表論文100多篇,谷歌學術引用超過10000次,出版計算機視覺譯著2部,參與撰寫深度學習領域著作1部、人工智能領域著作1部。

曾獲清華大學計算機系“學術新秀”、“谷歌學者”、多次頂級國際和國內會議最佳論文獎等榮譽和獎勵,以及十余次在人臉識別、車輛識別、視頻識別等國際和國內挑戰賽中獲獎。

目前作為項目和課題負責人承擔多項國家重點項目,研發的視覺感知相關技術在國家廣電總局、華為、微軟等得到了多次驗證應用和落地推廣,取得了良好的經濟效益和社會價值。

近年來主要圍繞深度強化學習相關的智能感知和決策問題,研發了多款針對不同游戲的博弈決策AI,其中研發的星際爭霸AI曾獲2017年IEEE CIG星際爭霸AI第2名,研發的德州撲克AI程序AlphaHoldem勝率超過了目前公開的最好德州撲克AI程序DeepStack,速度提升超過1000倍。開放了學界首個大規模不完美信息博弈平臺OpenHoldem。

關鍵詞: AAAI 2022大獎出爐中科院德州撲克程序Alp

版權聲明:
    凡注明來網絡消費網的作品,版權均屬網絡消費網所有,未經授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明"來源:網絡消費網"。違反上述聲明者,本網將追究其相關法律責任。
    除來源署名為網絡消費網稿件外,其他所轉載內容之原創性、真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考并自行核實。
熱文

網站首頁 |網站簡介 | 關于我們 | 廣告業務 | 投稿信箱
 

Copyright © 2000-2020 www.yushuoyun.cn All Rights Reserved.
 

中國網絡消費網 版權所有 未經書面授權 不得復制或建立鏡像
 

聯系郵箱:920 891 263@qq.com

備案號:京ICP備2022016840號-15

營業執照公示信息

www.亚洲男人天堂_欧美最顶级的aⅴ艳星_国产精品免费网站_欧美日韩在线一区_欧美床上激情在线观看_日韩av色在线_国产精品亚洲综合天堂夜夜_欧美做爰性生交视频_国产成人高潮免费观看精品_久久天天躁夜夜躁狠狠躁2022_国产美女久久精品香蕉69_亚洲专区在线视频_国产精品夜间视频香蕉_国产成人综合一区二区三区_国产精品69av_岛国av午夜精品

        午夜欧美视频| 欧美精品日韩一本| 国产一区二区剧情av在线| 在线综合+亚洲+欧美中文字幕| 尤物99国产成人精品视频| 亚洲欧美一区二区三区久久| 一区二区三区欧美在线观看| 国产一区二区三区四区五区美女| 亚洲欧美视频| 日韩一区二区高清| 亚洲一区二区三区777| 一区二区在线不卡| 快播亚洲色图| 一区在线播放| 欧美日韩国产另类不卡| 欧美一区二区三区视频免费| 国产在线精品一区二区中文| 99视频精品免费观看| 欧美视频在线一区二区三区| 欧美日韩一区二区三区四区五区| 狠狠色2019综合网| 亚洲欧美日韩中文在线制服| 欧美日韩国产精品| 一本色道久久综合一区| 中文亚洲视频在线| 亚洲大胆av| 日韩一级成人av| 欧美chengren| 欧美精品三级在线观看| 欧美国产欧美亚洲国产日韩mv天天看完整| 久久精品麻豆| 欧美精品三区| 久久国产色av| 伊人久久亚洲美女图片| 久久精品欧美| 欧美精品午夜视频| 亚洲小说欧美另类婷婷| 亚洲国产欧美在线人成| 91久久精品一区| 亚洲国产精品一区| 亚洲国产精品热久久| 亚洲欧美视频一区二区三区| 国产精品videossex久久发布| 国产在线精品一区二区夜色| 国产九九精品视频| 亚洲国产精品尤物yw在线观看| 国产精品影院在线观看| 亚洲综合精品四区| 男女视频一区二区| 在线观看亚洲精品| 国产一区二区三区视频在线观看| 亚洲人成绝费网站色www| 亚洲欧洲精品一区二区三区| 欧美一区激情| 国产精品日韩高清| 欧美激情欧美狂野欧美精品| 欧美人在线视频| 国产精品高潮呻吟久久av无限| 久久爱www| 在线亚洲高清视频| 在线一区二区日韩| 国产精品va在线| 国产一区 二区 三区一级| 国产日本欧美视频| 亚洲精品美女在线| 欧美日韩午夜剧场| 国产日韩精品在线观看| 久热综合在线亚洲精品| 欧美色欧美亚洲另类二区| 国产九九视频一区二区三区| 国产精品久久久久99| 欧美不卡一卡二卡免费版| 欧美精品在线极品| 国产精品在线看| 亚洲欧美日韩天堂一区二区| 国产女同一区二区| 伊人一区二区三区久久精品| 欧美日本一区二区三区| 国产精品theporn| 怡红院精品视频在线观看极品| 亚洲精品一区在线观看| 亚洲欧洲精品一区二区三区不卡| 久久精品夜色噜噜亚洲a∨| 久久国产精品一区二区三区| 久久综合一区| 久久久久99| 亚洲欧美一区二区三区在线| 欧美另类变人与禽xxxxx| 久久综合九色99| 久久久亚洲国产美女国产盗摄| 亚洲毛片在线看| 国产专区精品视频| 国产精品久久久久天堂| 伊人影院久久| 亚洲一区三区电影在线观看| 国产婷婷色一区二区三区| 欧美视频日韩视频在线观看| 欧美自拍丝袜亚洲| 国产精品一区一区三区| 亚洲国产一区二区视频| 亚洲黄色av一区| 国产夜色精品一区二区av| 欧美精品一区在线发布| 免费成人性网站| 麻豆成人91精品二区三区| 国产精品免费看| 亚洲在线视频| 午夜视频一区在线观看| 国产精品成人观看视频国产奇米| 中日韩男男gay无套| 欧美在线国产精品| 欧美在线啊v一区| 亚洲一区二区不卡免费| 亚洲一区二区在线看| 国产美女精品| 日韩视频免费看| 欧美一区二视频| 欧美bbbxxxxx| 国产自产高清不卡| 亚洲黄色成人| 亚洲人成亚洲人成在线观看| 久久精品国产久精国产思思| 国产精品女主播在线观看| 亚洲乱码国产乱码精品精98午夜| 国产精品国产自产拍高清av王其| 国产三级欧美三级日产三级99| 国产综合色在线| 欧美视频一区| 久久精品日韩一区二区三区| 久久久无码精品亚洲日韩按摩| 久久久久久一区| 欧美精品一区二区三| 亚洲高清视频在线| 国产日产欧美a一级在线| 夜夜嗨av一区二区三区中文字幕| 亚洲电影免费在线观看| 国产在线欧美| 欧美日韩一区二区免费视频| 国产精品毛片a∨一区二区三区| 国产欧美在线| 欧美h视频在线| 国产精品热久久久久夜色精品三区| 日韩一区二区精品在线观看| 久久久夜精品| 亚洲人精品午夜| 99国产精品视频免费观看| 欧美午夜无遮挡| 欧美激情视频在线播放| 国产喷白浆一区二区三区| 亚洲国产成人在线视频| 亚洲第一主播视频| 国产精品久久久久永久免费观看| 国产日韩欧美在线观看| 久久久久9999亚洲精品| 欧美成人免费在线观看| 欧美激情视频网站| 欧美一区二区三区在线免费观看| 欧美日韩一区在线播放| 欧美日韩中文字幕日韩欧美| 国产一区二区三区在线播放免费观看| 91久久香蕉国产日韩欧美9色| 国产精品久久久免费| 久久久人成影片一区二区三区观看| 久久久精品国产免大香伊| 亚洲免费av观看| 国产一级一区二区| 狠狠色综合色综合网络| 一区二区三区 在线观看视频| 久久国产综合精品| 欧美久久久久久久久久| 国产精品vip| 久久久爽爽爽美女图片| 久久成人人人人精品欧| 亚洲免费在线看| 欧美美女bbbb| 亚洲第一区中文99精品| 亚洲日本欧美日韩高观看| 欧美亚州一区二区三区| 亚洲精品一区二区三| 亚洲作爱视频| 狠狠色丁香久久婷婷综合丁香| 亚洲精品免费一二三区| 欧美另类极品videosbest最新版本| 国产精品扒开腿做爽爽爽软件| 亚洲婷婷在线| 国产精品久久久久久久久久直播| 国产精品美女久久久久久2018| 久久精品视频网| 国产精品欧美在线| 亚洲一区激情| 99re6这里只有精品| 国产夜色精品一区二区av| 久久精品人人做人人爽| 亚洲自拍偷拍色片视频| 国产精品每日更新在线播放网址| 午夜激情亚洲| 亚洲女人天堂成人av在线| 欧美成人免费在线| 欧美视频专区一二在线观看| 国产日韩欧美在线| 日韩视频中文字幕| 午夜精品影院在线观看| 亚洲精品免费网站| 欧美sm重口味系列视频在线观看| 亚洲综合第一页| 国内精品嫩模av私拍在线观看| 欧美色图一区二区三区| 欧美在线国产| 欧美日韩中文字幕日韩欧美| 亚洲欧美综合精品久久成人| 久久久久九九九九| 国产九九视频一区二区三区| 国内精品伊人久久久久av一坑| 国产亚洲综合性久久久影院| 欧美日本一区二区三区| 91久久线看在观草草青青| 国产精品免费观看在线| 亚洲激情在线视频| 久久青草欧美一区二区三区| 欧美电影打屁股sp| 欧美一区国产在线| 国产亚洲一区精品| 国产精品99久久久久久久vr| 一区二区三区你懂的| 亚洲视频免费观看| 久久综合伊人77777尤物| 久久精品国产精品亚洲| 免播放器亚洲| 一区二区三区国产盗摄| 久久久精品免费视频| 亚洲欧美久久久| 亚洲欧洲av一区二区三区久久| 国产在线观看91精品一区| 国产日韩欧美制服另类| 国产欧美日韩另类视频免费观看| 亚洲男女自偷自拍图片另类| 一本色道久久88精品综合| 久久乐国产精品| 亚洲一区二区日本| 99精品热视频| 欧美大片第1页| 国产毛片一区| 亚洲欧洲另类国产综合| 亚洲精品久久久久久久久久久久久| 久久成人羞羞网站| 欧美日本国产精品| 国产欧美日韩高清| 久久精品二区| 国产网站欧美日韩免费精品在线观看| 国产午夜精品视频免费不卡69堂| 欧美主播一区二区三区美女 久久精品人| 亚洲日本乱码在线观看| 午夜一区二区三视频在线观看| 欧美系列电影免费观看| 欧美jizz19hd性欧美| 亚洲一区免费看| 久久精品人人做人人爽| 久久综合九色综合欧美就去吻| 国产精品视频精品视频| 欧美精品日韩精品| 亚洲国产高清一区| 日韩亚洲一区二区| 亚洲午夜激情在线| 欧美精品1区| 欧美大片在线看免费观看| 国产在线精品自拍| 激情欧美一区二区三区| 久久久国产视频91| 亚洲国产日韩综合一区| 亚洲欧美日韩专区| 亚洲国产精品一区二区尤物区| 国产综合色精品一区二区三区| 亚洲国产天堂久久综合网| 亚洲午夜精品福利| 午夜免费在线观看精品视频| 国产一区二区三区四区hd| 亚洲欧美日韩精品久久久久| 在线免费不卡视频| 国产精品扒开腿做爽爽爽软件| 国产精品久久久久99| 欧美不卡一卡二卡免费版| 狠狠做深爱婷婷久久综合一区| 欧美系列精品| 国产精品初高中精品久久| 亚洲激情电影中文字幕| 香蕉久久夜色精品| 欧美成人精品一区二区三区| 久久久综合香蕉尹人综合网| 欧美性猛交xxxx免费看久久久| 久久久精品性| 六月丁香综合| 国产一区日韩一区| 亚洲成色999久久网站| 国产美女精品人人做人人爽| 亚洲综合视频一区| 国产女主播一区二区| 欧美日韩国产不卡在线看| 老妇喷水一区二区三区| 国产精品大片免费观看| 亚洲欧美日韩精品一区二区| 韩国在线视频一区| 亚洲一区中文字幕在线观看| 中文久久精品| 欧美美女日韩| 麻豆精品传媒视频| 欧美视频一二三区| 免费观看成人网| 亚洲欧美三级伦理| 亚洲国产成人在线| 欧美亚洲免费电影| 亚洲人成网站999久久久综合| 欧美国产视频在线观看| 欧美在线播放一区二区| 午夜精品一区二区三区在线播放| 久久精品国内一区二区三区| 亚洲免费福利视频| 亚洲人人精品| 精品不卡在线| 欧美精品不卡| 亚洲国产精品一区二区久| 亚洲在线成人| 亚洲一区二区三区四区视频| 欧美日韩国产大片| 国产欧美成人| 一区二区三区成人精品| 蜜月aⅴ免费一区二区三区| 欧美a级一区二区| 美女诱惑一区|