Использование теории игр применительно к блефу 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Использование теории игр применительно к блефу



 

В этой главе нас в основном интересует, насколько теория игр может быть применима в покере к искусству блефа и уравнивания возможного блефа. В связи с этим мы побеседуем о смешанной стратегии, при которой вы делаете конкретный ход - а именно, блефуете или уравниваете возможный блеф - в заранее определенном числе случаев, но вносите элемент случайности так, чтобы оппонент не мог знать, есть ли у вас игра или нет.

Из предыдущей главы вы помните, что при прочих равных условиях игрок, который никогда не блефует, и тот, что блефует слишком много, имеют значительный минус перед игроком, который блефует правильно. Для иллюстрации этого положения и того, как теория игр может подсказать правильное решение, когда стоит блефовать, рассмотрим конкретный пример.

Играем в лоуболл с обменом без джокера; я сдаю вам следующую готовую комбинацию (pat – пэт):

а себе

 

Вы стоите без прикупа, я же должен поменять одну карту. Если вытягиваю 5,6,7,8 или 9, то я выиграл, поскольку у меня лучший лоу (low - последовательность нижних карт), чем ваш. Если я вытаскиваю любую другую карту, вы выигрываете. Это означает, что из 42 карт, остающихся в колоде, для меня 18 выигрышных (четыре 5-ки, четыре 6-ки, четыре 7-ки, три 8-ки и три 9-ки) и 24 проигрышных, что даёт мне шансы проиграть 24 к 18 или 4 к 3. Каждый из нас вносит по $100 на анте, но после обмена - который вы не видите - я могу поставить ещё $100.

Предположим, я согласился каждый кон делать ставку, то есть, по $100 каждую сдачу. Естественно, каждый раз вы будете ее уравнивать, поскольку вам гарантировано выиграть по $200 24 раза, когда я буду блефовать, и проиграть по $200 18 раз, когда у меня будет лучшая рука, что даёт вам суммарную прибыль $1200. Теперь положим, я решил не блефовать вообще, а ставить, только если моя карта побьёт ваш 9,8-лоу. В этом случае вы будете скидываться всякий раз, когда я буду ставить, и снова выиграете 24 раза (когда я не поставлю), а проиграете 18 раз (когда я поставлю), что даёт суммарную прибыль $600, поскольку вы выигрываете или проигрываете по $100 в каждой сдаче. Поэтому при этих двух вариантах моей игры у вас явно лучшее положение.

Однако если я блефую лишь в некоторых случаях, ситуация сильно меняется. Предположим, буду блефовать только на короле пик. Другими словами, буду ставить, если придёт любая из 18 хороших карт, а также на короле пик. Если я блефую настолько редко, ваша тактика остается прежней - сбрасываться на моих ставках, поскольку шансы против того, что я блефую, 1,8 к 1. Но давайте посмотрим, как изменилось мое положение. Блеф на короле пик не прибавляет мне дивидендов, но позволяет выиграть 19 раз вместо 18, а проиграть только 23 вместо 24. Этот единственный случай блефа один раз из 19 начал сокращать разрыв между вами как фаворитом и мной как претендентом. Заметьте также, что вы никак не можете знать, когда я блефую, поскольку я рандомизирую свой блеф, используя карту - неодушевленный предмет, такой же, как монета в игре чет-нечет, - для выбора решения, блефовать или нет.

Если блеф на одной карте делает меня менее уязвимым, чем вовсе без него, теперь представим, что я выбрал две карты - скажем, короля пик и валета пик. И опять правильной тактикой для вас будет скидываться, когда я ставлю. Предположив, что вы никак не можете догадаться, когда я блефую а когда нет, использование всего двух ключевых карт для блефа в дополнение к моим 18 хорошим картам сократило ваши выигрышные шансы с 24 к 18 до 22 к 20, то есть с 4 к 3 до 11 к 10.

 

Такой блеф наводит на размышление, что его можно продолжить. Положим, вместо двух карт я выбираю пять ключевых карт - короля пик и все четыре валета. Это значит, я буду ставить 23 раза - 18 раз на лучшей руке и пять раз на блефе. И сразу же вы оказываетесь в нехорошем положении, несмотря на ваш пэт 9,8, поскольку вам приходится гадать, блефую я или нет, когда делаю ставку. Я даже могу рассказать вам в точности тактику, которую я использую, но вы всё равно вынуждены будете терять деньги.

Что получилось? Вы знаете, что есть 18 карт, дающих мне комбинацию, и пять других, с которыми я буду блефовать. Таким образом, шансы против моего блефа составляют 18 к 5 или 3,6 к 1. С учётом $200 на анте и моей ставки $100 банк составляет $300. Так что вы получаете шансы банка 3 к 1. Поэтому вы не можете выгодно уравнять шансы победного прихода 3,6 к 1, так как выиграете максимум только 3 к 1. Подумать только: выбрав пять карт для блефа, я сорву банк 23 из 42 раз, а вам останется всего 19. Мой доход составит $400. Таким образом, этот случайный хаотичный блеф превратил руку с потенциальным проигрышем 24 к 18 в выигрышную с шансами 23 к 19.

Если хотите убедиться, что здесь нет арифметического подвоха, можете просчитать, что получится, если вы будете уравнивать каждый раз, когда я буду ставить. Вы выиграете пять раз по $200 на моем блефе и 19 раз по $ 100, когда я буду ставить, что даёт $2900. Но вы проиграете 18 раз по $200, когда у меня лучшая рука, что равняется $3600. Ваш суммарный проигрыш в случае уравнивания моих ставок составит $700, что на $300 больше, чем вы проиграли бы, если бы просто сбрасывались, когда я ставлю.

Если бы я выбрал семь карт для блефа вместо пяти, шансы были бы 18 к 7 против блефа, и поскольку вы получаете шансы банка 3 к 1, вам бы надо было уравниваться, когда я ставлю. Однако это всё равно закончилось бы проигрышем! Семь раз, когда я блефую, вы бы выиграли по $200 от меня, что даёт $1400, и 17 раз, когда я ничего не ставлю, вы бы выиграли по $100, что равняется $1700. Ваш выигрыш после 42 сдач составит $3100. А я выиграю 18 раз по $200, когда поставлю на хороших картах, в сумме $3600, что обеспечивает мне в итоге выигрыш, а вам проигрыш $500 после 42 сдач.

Следует отметить - никаких арифметических подставок тут нет, - что вы теряете даже больше, если будете сбрасываться каждый раз, когда я ставлю на 18 хороших и семи блефовых картах. Вы выиграете 17 раз по $100, когда я не буду ставить, тогда как я выиграю по $100 25 раз, когда поставлю. В таком случае ваш суммарный проигрыш составит $800 вместо $500.

ОПТИМАЛЬНАЯ СТРАТЕГИЯ БЛЕФА

Предположим, я выбираю шесть ключевых карт для блефа. Это означает, что я сделаю ставку 24 раза. 18 из них у меня лучшая рука, а шесть раз я блефую. Следовательно, шансы против моего блефа ровно 3 к 1. В банке $200, и если я поставлю, станет $300. Таким образом, ваши шансы банка также 3 к 1. Вы уравниваете $100, чтобы выиграть $300. Теперь, когда шансы против моего блефа идентичны шансам, которые вы получаете из банка, нет абсолютно никакой разницы, будете ли вы уравниваться или сбрасываться. Более того, что бы вы ни делали, вы всё равно проиграете $600 после 42 сдач. Если вы сбрасываетесь каждый раз, когда я ставлю, я выиграю у вас 24 раза по $100, когда я ставлю, и потеряю 18 раз по $100, когда не ставлю; суммарный выигрыш $600. Если вы каждый раз уравниваете мою ставку, вы возьмёте у меня шесть раз по $200 на блефе и 18 раз по $100, когда я не ставлю, в сумме $3000; но я выиграю у вас 18 раз по $200, когда поставлю на хороших руках, что в сумме равняется $3600. И вновь моя прибыль составляет $600. Поэтому, кроме психической атаки, нет другого способа в мире не дать мне выиграть эти $600 после 42 сдач, что даёт мне положительное ожидание $14,29 со сдачи. Блефуя ровно шесть раз из 24, я превратил свои карты из проигрывающих 4 к 3, когда я не блефовал совсем, в выигрышные 4 к 3 - независимо от стратегии, которую вы изберёте против меня.

 

Мы приближаемся к основе основ теории игр и блефа. Заметим для начала, что процент сдач, в которых я блефовал, был определён заранее: один раз из 19 ставок, пять раз из 23 или семь из 25. Далее отметим, что блеф был совершенно случаен; сигналом для него служили определенные ключевые карты, которые я брал из колоды и которые мой оппонент никак не мог увидеть. Он никогда не мог знать наверняка, вытащил ли я одну из 18 хороших или карту для блефа. И, наконец, заметим, что произошло, когда я блефовал ровно с шестью картами - когда шансы против моего блефа в данном конкретном случае точно равнялись шансам банка, которые получал оппонент. В этом единственном случае было предрешено, что оппонент теряет одинаковое количество денег, какую бы тактику он ни избрал - уравнивание или сброс.

Это оптимальная стратегия блефа - когда нет разницы, как играет противник. Значит, можно сказать, что если вы используете стратегию блефа, которая заставляет оппонента поступать одинаково плохо, как бы он ни играл, это и есть оптимальная стратегия. И эта оптимальная стратегия заключается в том, что вы блефуете так, чтобы шансы против вашего блефа в точности равнялись шансам банка, которые получает оппонент. В ситуации, которую мы обсуждали, у меня было 18 хороших карт, и когда я поставил свои $100, доведя банк до $300, оппонент получал 3 к 1 из банка. Следовательно, оптимальной стратегией был блеф на шести дополнительных картах, что делало шансы против блефа 3 к 1 - идентично шансам банка, которые получал оппонент.

Предположим, что банк бы равнялся $500 вместо $200 до того, как я сделал ставку. Вновь я имел бы 18 выигрышных карт, а оппонент мог побить только блеф. Ставка $100, поэтому оппонент получал бы шансы банка $600 к $100, когда уравнял мою ставку. В данном случае оптимальной стратегией для меня был бы блеф на трёх картах. С 18 хорошими картами и тремя блефовыми шансы против блефа были бы 6 к 1 - идентично шансам банка, которые получал оппонент, прими он мою ставку. Если же в банке было бы $100, и я поставил бы $100, я должен был бы блефовать на девяти картах при 18 хороших, что делало шансы против блефа 2 к 1 идентичными шансам, которые оппонент получал с банка.

Важно сознавать, что если результат одинаков независимо от того, как играет оппонент - уравнивается он или сбрасывается, в среднем у вас всё равно будет получаться одна и та же сумма, даже если он будет перемежать сброс с уравниванием. Возвращаясь к первоначальному примеру оптимальной стратегии, где я блефую с шестью картами по $100 и делаю такую же ставку на 18 хороших картах в банк, равный $200, я всё равно в среднем получу плюс $600 через 42 сдачи на длинной дистанции независимо от того, уравняет ли оппонент 12 и сбросит столько же раз, или же он уравняет 6 раз, а сбросит 18, или как угодно ещё. Невозможность найти какое-либо противодействие для устранения своего убыточного положения является ключом ко многим проблемам теории игр, хотя большинство книг по теории игр не дают такой формулировки.

Блеф на основе теории игр можно также расписать в процентах. Предположим, у вас 25-процентные шансы набрать комбинацию, в банке $100, и ставка $100. Таким образом, если вы поставите, оппонент получает шансы банка 2 к 1. Поскольку шансы сделать руку у вас 25%, вероятность того, что вы блефуете, должна быть 121/2процентов, что делает шансы против блефа равными 2 к 1, что и есть оптимальная стратегия. К примеру, в обменном лоуболле 48 карт вам неизвестны, когда вы тянете одну, и предположим, 12 из них (25 процентов) дают вам комбинацию. Поэтому для блефа следует избрать шесть других карт (121/2процентов) из 48.

Вы назначаете карты для блефа, конечно же, для того, чтобы рандомизировать ваши ставки. Без этого фактора случайности хорошие противники, на которых вы примените теорию игр в отношении блефа, быстро разгадают вашу систему и сотрут вас в порошок. Красота и изюминка теории игр состоит в том, что если даже оппонент знает, что вы ее используете, он всё равно ничего не может с этим поделать.



Поделиться:


Последнее изменение этой страницы: 2016-12-27; просмотров: 251; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.15.156.140 (0.01 с.)