Minimax - Vad är det, definition och koncept

Innehållsförteckning:

Minimax - Vad är det, definition och koncept
Minimax - Vad är det, definition och koncept
Anonim

Minimaxen, i spelteorin, är en metod som syftar till att minimera den förväntade förlusten. För att göra detta antar spelaren att hans motståndares beslut kommer att vara ogynnsamt. Det vill säga det värsta scenariot förväntas före motståndarens rörelse.

För att uttrycka det på ett annat sätt, består minimax-metoden av hur man tar det bästa beslutet förutsatt att den andra spelaren väljer det värsta fallet för dig.

Vi måste ta hänsyn till att denna metod är tillämplig i ett spel för två personer (två spelare) och att det inte är samarbetsvilligt utan ett nollsummespel. Det betyder att vad en spelare vinner förloras av den andra och tvärtom. Följaktligen kommer varje agent att vara intresserad av att maximera sin egen nytta, även om det skadar den andra.

Vid denna tidpunkt måste vi också komma ihåg att spelteori är en gren av matematik och ekonomi som studerar val som optimerar en individs situation när kostnader och fördelar inte är fasta i förväg utan beror på andras beslut.

Minimax-algoritm i ett beslutsträd

Vi kan se hur minimax-metoden tillämpas i ett beslutsträd med flera noder. Spelet börjar längst ner och slutar med ett resultat på toppnivån.

Vid basen av trädet gör motståndaren det första steget, så det sämsta resultatet förväntas. På andra nivån är det upp till spelare x som kommer att försöka maximera sin vinst med hänsyn till det beslut som tidigare gjorts av motståndaren.

På tredje nivå är det återigen motståndarens tur och så vidare. Vi visar ett exempel nedan.

Minimax-algoritmsexempel

I följande beslutsträd visar vi de resultat som spelaren x erhållit vid varje ögonblick av spelet. På basen, på första nivån, tar motståndaren beslutet. Av den anledningen ges scenarierna där spelaren kan förlora -10 eller vinna 5.

På andra nivån är det upp till spelare x, så han maximerar sin vinst. Mellan att förlora 10 eller vinna 1 vinner du 1. På samma sätt, mellan att vinna 5 eller 7, kommer du att vinna 7.

Sedan är det motståndarens tur igen, så scenarierna kommer att ges i vilken spelare x har det sämsta resultatet, -3 och 4, beroende på fallet. Slutligen, mellan att förlora 3 eller vinna 4, kommer spelare x att fatta beslutet som tillåter den senare.

Vi måste ta hänsyn till att värdena för varje nod beror på en verktygsfunktion.

För att bättre förstå trädet, antar att beslutet i grunden handlar om distribution av produkten. Tävlingen (motståndaren) kan lägga ut distributionen (se trädets vänstra sida). I så fall måste han till exempel välja mellan återförsäljare A och B. Således väljer han den förra, vilket får spelaren x att förlora 10 (Om han valde B, skulle spelaren x vinna 12).

Men kanske föredrar motståndaren att distribuera sina varor själv genom att kunna hyra motorfordon eller köpa en lastbil. Av båda scenarierna, välj den första som är mindre smickrande för spelare x eftersom han vinner 5 och inte 10.