
Si sente sempre più spesso parlare di GTO. Questa sigla sta per “Game Theoretical Optimum” ed è utilizzata per indicare una strategia contro la quale è impossibile vincere o avere valore atteso positivo. Ma come è possibile?
COS'E' IL GTO?
In ogni gioco con un limitato numero di variabili e possibili decisioni, vi è una strategia “perfetta” grazie al cui utilizzo è impossibile perdere, ma al massimo pareggiare contro qualcun altro che usi la stessa strategia. Questo concetto vale per giochi semplici come la morra cinese ma anche per giochi più complessi come gli scacchi.
Il poker non ne fa un’eccezione, pertanto esiste dal punto di vista teorico una soluzione che consente di non perdere mai. Le variabili sono tuttavia tantissime rispetto ai giochi sopracitati, pertanto anche la soluzione è più complessa e difficile da raggiungere, se non impossibile nella pratica.
Nondimeno è possibile avvicinarsi a questa soluzione e trarne beneficio in innumerevoli situazioni.
Il poker non ne fa un’eccezione, pertanto esiste dal punto di vista teorico una soluzione che consente di non perdere mai. Le variabili sono tuttavia tantissime rispetto ai giochi sopracitati, pertanto anche la soluzione è più complessa e difficile da raggiungere, se non impossibile nella pratica.
Nondimeno è possibile avvicinarsi a questa soluzione e trarne beneficio in innumerevoli situazioni.
L'IMPORTANZA DELLE FREQUENZE
La soluzione è di tipo matematico, pertanto la lettura delle mani altrui e il flow della partita non sono variabili prese in considerazione. Il GTO mira al bilanciamento delle proprie frequenze di gioco per rendersi non exploitabili e funziona contro qualsiasi avversario che gioca in modo bilanciato. Utilizzando il GTO, in ogni momento della mano le proprie frequenze saranno tali per cui l’avversario non avrà alcun incentivo a compiere una scelta piuttosto che un’altra. Se in un sng un giocatore dovesse utilizzare l'equilibrio di Nash per la strategia push/fold, un modo per annullare le sue possibilità di profitto potrebbe essere quello di rispondere con lo stesso equilibrio in call. Contro un giocatore che gioca GTO non vi è una scelta migliore da compiere perché il suo range sarà bilanciato e non exploitabile.
La soluzione è di tipo matematico, pertanto la lettura delle mani altrui e il flow della partita non sono variabili prese in considerazione. Il GTO mira al bilanciamento delle proprie frequenze di gioco per rendersi non exploitabili e funziona contro qualsiasi avversario che gioca in modo bilanciato. Utilizzando il GTO, in ogni momento della mano le proprie frequenze saranno tali per cui l’avversario non avrà alcun incentivo a compiere una scelta piuttosto che un’altra. Se in un sng un giocatore dovesse utilizzare l'equilibrio di Nash per la strategia push/fold, un modo per annullare le sue possibilità di profitto potrebbe essere quello di rispondere con lo stesso equilibrio in call. Contro un giocatore che gioca GTO non vi è una scelta migliore da compiere perché il suo range sarà bilanciato e non exploitabile.
DUE APPUNTI
Tuttavia, è bene fare attenzione su un particolare. Se e quando l'avversario smette di essere bilanciato e devia dall'equilibrio, sta creando i presupposti per una strategia exploitativa e non bilanciata, per cui la nostra medesima azione potrebbe non avere più un valore atteso positivo o nullo.
Inoltre, è da sottolineare che il GTO non è necessariamente la strategia a maggior valore atteso possibile, ma solo una strategia non exploitabile a valore atteso positivo fino a quando l'avversario è bilanciato.
Inoltre, è da sottolineare che il GTO non è necessariamente la strategia a maggior valore atteso possibile, ma solo una strategia non exploitabile a valore atteso positivo fino a quando l'avversario è bilanciato.
L'ESEMPIO DEL GIOCO DELLA MORA
Il poker è un gioco troppo complesso e pieno di scelte da compiere e variabili di cui non si è pienamente a conoscenza. Si fanno alcune ipotesi sui range avversari. Ed ecco perchè il GTO non sarà mai una strategia applicabile in pieno, ma verso cui tendere contro i giocatori equilibrati.
Per spiegare in modo più semplice gli ultimi due appunti analizzati in precedenza, si pensi di giocare a sasso-forbici-carta.
Se si ipotizza che l'avversario scelga sempre sasso, una strategia GTO sarebbe quella di scegliere in egual misura e in modo casuale sasso, forbici e carta. L'avversario non potrebbe mai vincere contro questa strategia.
Tuttavia...è la strategia a miglior valore atteso?
No! Se si volesse il massimo del profitto, si dovrebbe scegliere sempre carta.
E ancora...se l'avversario modifica le sue frequenze, questa strategia improntata funzionerà ancora?
E' probabile di no, ciò che è sicuro è che avrà un valore atteso diverso.
GTO NEL POKER
Si riesce a comprendere come nel poker il GTO non sia la strategia definitiva e che spesso non sarà nemmeno applicabile, ma trovare una strategia bilanciata dà alcuni vantaggi:
GTO NEL POKER
Si riesce a comprendere come nel poker il GTO non sia la strategia definitiva e che spesso non sarà nemmeno applicabile, ma trovare una strategia bilanciata dà alcuni vantaggi:
- trovare il punto per cui una scelta equivale a un'altra per il tuo avversario: questo significa che l'avversario non saprà quale scelta tra le sue, possa avere un maggior profitto nel lungo periodo.
- imparare a identificare chi non gioca GTO: una volta che si sa riconoscere chi non è bilanciato, si riuscirà a improntare una strategia exploitativa contro di lui.
- imparare a identificare chi non gioca GTO: una volta che si sa riconoscere chi non è bilanciato, si riuscirà a improntare una strategia exploitativa contro di lui.
Ecco un esempio pratico.
Un range bilanciato di bet al river
Si è detto che lo scopo del GTO è quello di rendere i propri avversari indifferenti nelle proprie decisioni, in quanto non avranno alcun guadagno nel compiere qualsivoglia aggiustamento.
Prendiamo ad esempio una puntata pari al pot al river. Si supponga un pot di 100€ al river e che Hero decida di andare all-in per 100€. A questo punto l'avversario può scegliere di chiamare investendo 100€ per vincere 200€ (la bet di Hero più il pot preesistente), ricevendo odds di 2:1. Dovrebbe di conseguenza vincere il piatto all’incirca il 33% delle volte affinchè il call sia profittevole. Ovviamente chiamerà sempre con i suoi punti più forti e folderà sempre le mani senza valore di showdown, ma cosa dovrebbe fare con tutto il resto, i cosiddetti bluffcatchers?
SE HERO ADOTTASSE UNA STRATEGIA EXPLOITATIVA...
Si è detto che lo scopo del GTO è quello di rendere i propri avversari indifferenti nelle proprie decisioni, in quanto non avranno alcun guadagno nel compiere qualsivoglia aggiustamento.
Prendiamo ad esempio una puntata pari al pot al river. Si supponga un pot di 100€ al river e che Hero decida di andare all-in per 100€. A questo punto l'avversario può scegliere di chiamare investendo 100€ per vincere 200€ (la bet di Hero più il pot preesistente), ricevendo odds di 2:1. Dovrebbe di conseguenza vincere il piatto all’incirca il 33% delle volte affinchè il call sia profittevole. Ovviamente chiamerà sempre con i suoi punti più forti e folderà sempre le mani senza valore di showdown, ma cosa dovrebbe fare con tutto il resto, i cosiddetti bluffcatchers?
SE HERO ADOTTASSE UNA STRATEGIA EXPLOITATIVA...
Se Hero si ritrovasse con una frequenza di bluff molto elevata, Oppo sarebbe incentivato a chiamare con tutti i suoi bluffcatchers. Al contrario, se Hero non bluffasse mai, Oppo dovrebbe foldare tutti i suoi bluffcatchers.
SE HERO ADOTTASSE UNA STRATEGIA GTO...
Ma cosa può fare Oppo se Hero in questo spot sta bluffando esattamente il 33% delle volte e puntando per valore il restante 67%? In questo caso Hero sta giocando in GTO e la decisione dell'avversario non ha più importanza perché le frequenze di Hero non possono essere exploitate. L’EV della scelta di Oppo sarà sempre 0, quindi nessuna delle sue opzioni si rivela vincente.
SE HERO ADOTTASSE UNA STRATEGIA GTO...
Ma cosa può fare Oppo se Hero in questo spot sta bluffando esattamente il 33% delle volte e puntando per valore il restante 67%? In questo caso Hero sta giocando in GTO e la decisione dell'avversario non ha più importanza perché le frequenze di Hero non possono essere exploitate. L’EV della scelta di Oppo sarà sempre 0, quindi nessuna delle sue opzioni si rivela vincente.
GTO CONTRO GIOCO EXPLOITATIVO
Un gioco che non presenta alcuna debolezza, come il GTO, non è tuttavia quasi mai quello che garantisce un guadagno maggiore. Gli unici avversari contro i quali il GTO è la scelta ottimale sono altri giocatori che utilizzano la stessa strategia. Contro giocatori che compiono decisioni scorrette, deviare dal GTO per adattarsi ai loro errori ha un’aspettativa di guadagno migliore.
Riprendendo come esempio lo spot al river sopracitato, Hero avrebbe un’aspettativa di vincita maggiore a bluffare più spesso del 33% se l'avversario foldasse più del necessario. Allo stesso modo se l'avversario fosse una calling station, Hero dovrebbe bluffare molto meno del 33% per massimizzare il proprio guadagno.
In questi casi si parla di gioco exploitativo, in quanto si devia dalla strategia ottimale solo per sfruttare un leak del proprio avversario. Bisogna tuttavia essere cauti quando si decide di deviare dal GTO in quanto ogni adattamento apre il fianco a delle contromisure potenzialmente rovinose da parte dei giocatori più attenti.
Il Gioco Teoricamente Ottimale è uno strumento molto potente da avere nel proprio arsenale e dovrebbe essere la prima scelta contro avversari bilanciati. Quando le informazioni a propria disposizione saranno maggiori si potrà passare ad un gioco più exploitativo, rimanendo comunque con la consapevolezza che ogni deviazione dal GTO può essere a sua volta sfruttata dai giocatori più abili.