Вештачка интелигенција против најбољих гејмера: један-нула

Играјући Texas hold’em покер против неких од најбољих играча света, програм вештачке интелигенције Pluribus однео је убедљиву победу

Текст: Ивана Николић

Амерички научници са Универзитета Карнеги Мелон у Питсбургу недавно су у часопису Science објавили студију о свом компјутерском програму Pluribus који побеђује у покеру чак и када игра више од два играча.

Тако је Pluribus, играјући најпознатији онлајн покер, Texas hold’em, освојио виртуелних 48.000 долара. Претходно је победио петоро елитних играча који су својевољно пристали да се такмиче са компјутером. Да је реч о правим професионалцима у покеру потврђује и податак да је сваки од њих освојио преко милион долара у овој игри.

„Ово је први пут да је вештачка интелигенција постигла надљудски учинак у игри у којој учествује више играча“, објашњава проф. Томaс Сендхолм, који је, заједно са својим докторандом Ноамом Брауном развио и усавршио програм Pluribus.

„Способност да победи петоро играча у исто време у тако сложеној игри блефа и скривених информација отворила је нове могућности за вештачку интелигенцију, која би сада могла да се ухвати у коштац са стварним проблемима у свету“, додаје проф. Сендхолм.

Он објашњава да алгоритам који су направили има разнолику примену – од банковних улагања и стратегија за преговарање у ратним околностима до помоћи приликом доношења одлука о томе колико пара амерички политички кандидати треба да троше на рекламе у медијима у различитим савезним државама. Сендхолм каже и да су у току истраживања у којима се користи алгоритам за планирање третмана који ће прецизно одредити популације имуних ћелија у борби против специфичних болести.

Али, како је Pluribus уопште научио да игра покер? Проф. Сендхолм објашњава да је усвојио неке „изненађујуће и видно не-људске стратегије“ које су његови противници брже-боље почели да примењују. На пример, Pluribus користи веома различите величине улога – нешто што људски играчи нашироко избегавају. Људи избегавају и тзв. donk betting, односно да завршавају први круг клађења са позивом и отварају следећи са опкладом, док је Pluribus брзо прогрлио ову тактику. Професионалци кажу да је donk betting лош и слаб потез, који ретко кад има смисла. За Pluribus је то другачије:

„Ја то не разумем, али Pluribus разуме“, каже проф. Сендхолм.

Међу Pluribus-овим противницима била су и два искусна покераша, Дерен Алајас, који има највише World Poker Tour награда, и Крис Фергусон, који је освојио шест турнира World Series of Poker.

„Pluribus је веома тежак противник. Стварно је тешко оборити га“, каже Фергусон.

Иначе, програм покрећу два Intel Hasvell процесора, а он користи скромних 128 GB током игре. Када игра против себе самог, потребно му је око 20 секунди за једну руку – што је два пута брже од типичног професионалца, кажу чланови тима из Питсбурга.

„У игри која ће вас најчешће наградити када испољавате менталну дисциплину, фокусираност и доследност, и свакако вас кажњавати када вам недостају ове особине, такмичити се сатима против бота који очигледно не мора да брине о овим недостацима је напоран задатак“, каже Шон Руане, један од играча који је изгубио од Pluribus-а.

Истраживачи, ипак, наводе да људска интелигенција има вишеслојне квалитете и да није ограничена уско одређеним задацима.

ЦПН

23.07.19.

Вештачка интелигенција против најбољих гејмера: један-нула

Ванземаљски језици