Hver brætspilsmekaniker har en matematisk identitet. Et terningkast har en forventet værdi og en varians. Et korttræk har en sandsynlighedsfordeling. En ressourcehandel har en valutakurs, der kan udtrykkes som et forhold. Designere, der forstår denne matematik, træffer bedre beslutninger end designere, der arbejder efter følelse – ikke fordi matematik erstatter intuition, men fordi intuition ofte er uenig med virkeligheden på måder, som test alene er langsom at rette op på.
Denne artikel dækker de matematiske begreber, der betyder mest for brætspilsdesign og -spil: sandsynlighedsfordelinger, forventet værdi, varians og den psykologiske kløft mellem, hvad matematikken siger, og hvad spillerne oplever. Uanset om du designer et spil eller bare prøver at forstå, hvorfor dine terningsessioner føles så katastrofalt uheldige, vil rammerne her ændre, hvordan du tænker om tilfældighed i spil.
Hvorfor matematik er vigtigt i spildesign
En spildesigner, der ikke har beregnet den forventede værdi af deres spils kernehandlingsøkonomi, ved ikke, om deres spil virker. Det lyder hårdt, men det er funktionelt sandt. Hvis den forventede indkomst fra den bedst tilgængelige handling er 4 ressourcer pr. runde, og prisen for sejrs-betingelse-handlingen er 30 ressourcer, skal designeren vide, om denne indkomstrate er opnåelig over spillets typiske varighed - før playtesting, ikke efter seks sessioner og spekulerer på, hvorfor ingen nogensinde vinder.
Matematik og playtesting er komplementære værktøjer, ikke alternativer. Matematik fortæller dig, hvad teorien forudsiger. Playtesting fortæller dig, om menneskelig adfærd matcher teorien. Det meste af tiden divergerer de - ikke fordi matematikken er forkert, men fordi spillerne ikke altid vælger den teoretisk optimale handling. Gabet mellem teoretisk optimalt spil og faktisk menneskeligt spil er i sig selv en designvariabel: et spil, hvor kun optimalt spil producerer interessante beslutninger, er et værre spil end et, hvor suboptimalt spil også skaber interessante situationer.
Enhver mekaniker har en forventet værdi, og designere skal vide det. Når en Neutronium: Parallel Wars-spiller får indtægt fra Nuclear Ports, modtager de en præcist beregnet forventet værdi pr. port pr. runde. Når de vælger at angribe frem for at bygge, træffer de en beslutning, der har beregnede forventede resultater under forskellige scenarier. Designeren, der kender disse tal, kan træffe meningsfulde balancebeslutninger; designeren, der ikke gør det, gætter.
Den kritiske asymmetri er, at tilfældigheden føles uretfærdig, selv når den er afbalanceret. En 50/50 møntvending producerer hoveder seks gange i træk cirka 1,6 % af tiden - sjældent, men ikke umuligt. Når det sker for en spiller i et spil, oplever de det som, at spillet bliver brudt, ikke som en normal statistisk hændelse. At forstå hvorfor dette sker – og hvordan designere kan strukturere tilfældigheder for at føle sig mindre straffende og samtidig bevare de samme underliggende sandsynligheder – er den mest praktisk værdifulde anvendelse af spildesignmatematik.
Terning sandsynlighed 101
Single d6 er det mest almindelige randomiseringsværktøj i brætspil og også et af de mest misforståede. En standard d6 producerer en ensartet fordeling: hver side (1 til 6) har 1/6 sandsynlighed for at forekomme, og den forventede værdi er 3,5. Spillere forstår intuitivt dette, men de forstår ofte ikke, hvad det betyder for gentagne kast over en session.
Den single d6 versus 2d6 sondring er grundlæggende for at forstå, hvorfor forskellige terningmekanikker føles anderledes. En enkelt d6 har en flad sandsynlighedsfordeling - hvert udfald fra 1 til 6 er lige sandsynligt. To d6 summerede giver en klokkekurve: 7 er det mest sandsynlige resultat (sandsynlighed 6/36 = 16,7%), mens 2 og 12 hver har sandsynlighed 1/36 = 2,8%. 2d6-fordelingen koncentrerer resultater nær midten og gør ekstreme resultater sjældne. Dette er grunden til, at Catan, som bruger 2d6 til ressourceproduktion, føler sig mindre straffende på individuelle ruller end enkeltmatricesystemer - distributionen begrænser naturligvis ekstreme resultater.
Tilpassede terninger med ikke-standardiserede ansigtsfordelinger giver designere præcis kontrol over sandsynlighedsprofiler, som standardterninger ikke kan give. En terning med flader [0, 0, 0, 1, 1, 2] har en meget anden karakter end en d6: den producerer nul 50 % af tiden, en 33 % af tiden og to 17 % af tiden med en forventet værdi på 0,67. Neutronium: Parallel Wars bruger brugerdefinerede D6-terninger med farvekodede ansigter: blå ansigter repræsenterer standard kampresultater, røde ansigter repræsenterer kritiske resultater, og grønne ansigter repræsenterer særlige evneudløsere. Fordelingen af ansigtstyper - ikke kun antallet af ansigter - bestemmer sandsynligheden for hvert udfald. En terning med tre blå ansigter, to røde ansigter og et grønt ansigt giver blå udfald 50 % af tiden, rød 33 % og grøn 17 %. Designeren kan justere disse forhold ved at ændre ansigtsantal i stedet for at skabe matematisk komplekse opløsningssystemer.
Eksploderende terninger er terninger, der, når man kaster den maksimale værdi, kastes igen, og resultaterne tilføjes. En d6, der eksploderer på 6, har en forventet værdi på (1+2+3+4+5+6)/6 + (1/6 × forventet værdi af en d6) = 3,5 + (1/6 × 3,5) = 3,5 + 0,583 = 4,083. Den åbne natur skaber teoretisk ubegrænsede resultater - en heldig sekvens af eksplosioner kan producere meget høje totaler - hvilket producerer de "følelses heldige" øjeblikke, som nogle spil bevidst dyrker. Afvejningen er høj varians og den lejlighedsvise spildefinerende heldige kast.
Afgrænsede terninger er den modsatte filosofi: at begrænse det maksimale resultat for at begrænse variansen. Terningpuljesystemer, hvor du kaster flere terninger og kun tager de bedste N-resultater (fordelsystemer som D&D 5E's fordelsmekaniker eller Gumshoe's multiple terning-tak-højeste) reducerer matematisk variansen, mens den bevarer sandsynlighedsfølelsen. Ved at tage den højeste af to d6-kast flyttes den forventede værdi fra 3,5 til 4,47 – en forbedring på 28 % – samtidig med, at sandsynligheden for lave udfald reduceres betydeligt.
Forventet værdi i ressourcespil
Ressourceakkumuleringsspil – euro, motorbyggere, økonomiske strategier – er bygget på forventede værdiberegninger, som designeren skal forstå præcist, selvom de aldrig optræder eksplicit i regelbogen. Når en spiller vælger mellem to handlinger, sammenligner de (bevidst eller ej) den forventede værdi af disse handlinger over den relevante tidshorisont.
Neutronium: Parallel Wars's Nuclear Port indkomstsystem er et eksplicit eksempel på designet forventet værdi. Indkomstformlen fastslår, at en spiller med N Nuclear Ports modtager indkomst med en sats, der skaleres ikke-lineært med N. Den specifikke formel — 1 port giver 2 Neutronium enheder pr. runde; 10 porte giver 220 Nn pr. runde — er ikke tilfældigt. Det er designerens eksplicitte udtalelse, at portakkumulering bør producere eksponentielle snarere end lineære afkast, fordi eksponentielle afkast skaber koalitionstærsklen, der driver spillets konkurrencedynamik.
Denne formel er tilsigtet spildesign udtrykt som matematik. Gabet mellem 7-ports indkomst (42 Nn/runde) og 10-ports indkomst (220 Nn/runde) er det økonomiske argument for, hvorfor koalitioner dannes ved 7-ports tærsklen frem for at vente til 9 eller 10 porte. Ved 7 havne har spilleren nok indkomst til at være truende - men koalitionsaktion kan stadig være afgørende, før indkomstfordelen bliver matematisk uoverkommelig. En designer, der nåede frem til disse tal gennem playtesting alene, kunne måske få dem nogenlunde rigtige; en designer, der forstod den eksponentielle funktion fra begyndelsen, kunne angive tærsklen præcist.
Det bredere princip: når eksponentiel skalering er bevidst spildesign, skal designeren dokumentere skaleringsfunktionen og verificere, at de tærskler, den skaber, er, hvor de vil have dem. Hvis koalitionstærsklen skal være på 6 havne i stedet for 7, skal indkomstformlen justeres - hvilket kræver, at man ved, hvad formlen er, ikke blot observerer, at "spillet føles afbalanceret."
Varians og spilleropfattelse
Varians er et mål for, hvor meget de faktiske resultater spredes omkring den forventede værdi. Høj varians betyder, at individuelle resultater kan afvige dramatisk fra forventningerne; lav varians betyder, at resultaterne klynger tæt omkring gennemsnittet. For spildesignere er varians en kontrolknap, der påvirker både spillets matematiske retfærdighed og den subjektive oplevelse af at spille det.
Den vigtigste psykologiske indsigt: høj varians føles dårlig, selv når den er matematisk afbalanceret. Et møntskift er helt fair - 50/50, forventet værdi nøjagtigt ens for begge spillere - men at spille et spil, hvor enhver beslutning bliver løst ved møntvending, føles vilkårligt og ikke givende. Spillere skal føle, at deres beslutninger betyder noget, hvilket betyder, at de har brug for årsagssammenhængen mellem gode beslutninger og gode resultater for at kunne opfattes i spilsessionen. Høj varians afbryder denne forbindelse.
7 versus 2 Catan hex-problemet illustrerer dette tydeligt. I Catan er tallet 7 trykt på flest hexes, fordi det har den højeste sandsynlighed med 2d6 (16,7%). Tallet 2 er trykt på de færreste sekskanter (2,8%). Erfarne spillere ved, at de skal prioritere ressourcer på 6'ere, 8'ere, 5'ere og 9'ere - højsandsynlige hexes. Men i en given session kan en spiller, der korrekt placerer deres indledende afregninger på disse hexes, stadig blive væsentligt underpræsteret af en spiller med lavere sandsynlighedsplaceringer, hvis de faktiske terningkast afviger fra de forventede værdier. Dette er ikke uretfærdigt - det er normal statistisk variation. Men det føles uretfærdigt, fordi forholdet mellem beslutningen (god placering) og resultatet (hyppig ressourceindkomst) er sløret af varians.
Designløsningerne til håndtering af opfattet uretfærdighed fra varians omfatter: afbødningsmekanik (genudkast, ressourcebanker, indhentningsmekanismer, der aktiveres ved uheldsløb), beslutningspunkter, der forbliver meningsfulde, selv efter uheld (så en spiller, der kaster dårligt, stadig har interessante valgmuligheder) og favoriserer gennemspilning af spillere, og varians: den førende spiller ønsker stabil, forudsigelig indkomst, drager fordel af tilgange med høj varians, der kan lukke hullet hurtigt, selvom den forventede værdi er den samme).
Kingmaker-øjeblikke fra terninger - hvor et tilfældigt kast afgør, hvilken spiller der vinder eller taber i sidste runde - er de mest skadelige variansresultater for spillernes tilfredshed. Løsningen er ikke at eliminere terninger, men at strukturere det sene spil, så terningeresultaterne påvirker vejen til sejr i stedet for at bestemme den direkte. Når flere spillere har levedygtige vinderpositioner i den sidste runde, er et heldigt kast tilfredsstillende for vinderen, men det føles ikke illegitimt for taberne – fordi taberne også havde en vej til at vinde, som kunne have været muliggjort af deres egne heldige kast.
Balancetest med matematik
MEQA-rammen (Målbarhed, Engagement, Kvalitet, Tilgængelighed) giver en struktureret tilgang til test af spilbalance. Målbarhedssøjlen - M'et i MEQA - er det sted, hvor matematik går formelt ind i designprocessen: Før playtesting begynder, definerer designeren, hvad "balanceret" betyder i målbare termer.
For et spil med asymmetriske fraktioner som Neutronium: Parallel Wars betyder målbar balance: hver fraktion skal opnå en gevinstrate inden for et defineret tolerancebånd på tværs af et tilstrækkeligt udvalg af spil på sammenlignelige færdighedsniveauer. Hvis målet er 50 % vinderrate (ren balance) med et ±10 % acceptabelt interval, så er en fraktion, der vinder 42 % af spil, inden for tolerancen, og en fraktion, der vinder 63 % er det ikke. Men at opnå denne standard kræver, at man kender målet før test – ikke at erklære post-hoc, at de observerede gevinstrater er "tæt nok."
Definition af metrics før playtesting ændrer det, du observerer. Hvis du ved, at du måler gevinstraten pr. fraktion, sporer du fraktionsopgaver og resultater på tværs af sessioner. Hvis du ved, at du måler den gennemsnitlige spillængde, optager du tidsstempler. Disse beslutninger skal træffes før den første playtest-session, fordi retrospektive metrics er upålidelige – hukommelsen er selektiv, og mennesker husker naturligvis sessioner, der understøtter eksisterende overbevisninger.
Krav til prøvestørrelse til balancekonklusioner er ofte større, end designere forventer. For et 2-spillers spil med 2 fraktioner giver 30 spil basisdata til at detektere ubalancer større end 15 % med 80 % konfidens. For 4-spillers spil med 6 fraktioner er kombinationsrummet meget større: 30 spil giver dig cirka 5 spil pr. fraktionspar - knap nok til at opdage ekstrem ubalance og utilstrækkelig til at opdage subtile fordele. Indie-udgivere har sjældent ressourcer til streng statistisk validering; den praktiske tilgang er at bruge matematik til at verificere forventede værdier, playtesting for at fange outliers og community-feedback efter udgivelsen for at identificere overlevende problemer.
For den fulde ramme - inklusive hvordan målbarhed integreres med de andre MEQA-søjler - se MEQA game balance framework guide, som dækker den komplette tilgang til at definere, måle og opnå balance på tværs af spilsystemer.
Indkomstskaleringsformlen i Neutronium forbinder direkte til mekanikdetaljerne på /mechanics/nuclear-port-scaling, hvor den eksponentielle funktion er dokumenteret sammen med designbegrundelsen for hver tærskelværdi.
Sandsynlighedsværktøjer til designere
Flere værktøjer gør spildesign matematik tilgængelig uden at kræve avanceret statistisk træning. Det er dem, der fungerer i praksis.
AnyDice (anydice.com) er standard terning-sandsynlighedsberegneren for spildesignere. Den accepterer terningnotation med naturligt sprog (2d6, d4+d8, 3d6 beholder højeste 2) og returnerer sandsynlighedsfordelinger, forventede værdier og kumulative sandsynligheder. For enhver mekaniker, der involverer terninger, bør AnyDice være det første værktøj, der konsulteres. Dens outputgrafer gør distributioner umiddelbart læselige og sammenlignelige - indsæt to forskellige terningudtryk side om side for at se med det samme, hvordan deres distributioner adskiller sig.
Regnearkssimuleringer (Google Sheets, Excel) håndterer beregninger, som AnyDice ikke kan: ressourceakkumulering over flere runder, indkomst med flere kilder, forventet spillængde under forskellige strategiske antagelser. En grundlæggende regnearksmodel af et spils økonomi - med kolonner for hver tur, rækker for hver ressourcetype og formler, der repræsenterer spillets kerneindkomst og forbrugsmekanik - tager 2-3 timer at bygge og afslører balanceproblemer, som det ville tage mere end 20 spilletest at opdage empirisk.
Monte Carlo-simulering er det højeste præcisionsværktøj: at køre et spils mekanik tusindvis af gange beregningsmæssigt for at producere statistiske fordelinger på tværs af alle mulige udfald. For designere med programmeringsbaggrund er Python med NumPy tilstrækkelig til de fleste spilsimuleringsbehov. For designere uden programmeringsbaggrund er der visuelle Monte Carlo-værktøjer og endda regnearksbaserede simuleringer, der giver meningsfulde resultater med begrænset teknisk viden. Monte Carlo er mest værdifuldt for spil med komplekse indbyrdes afhængigheder, hvor analytisk beregning er vanskelig - når flere tilfældige hændelser interagerer, producerer simulering mere pålidelige distributionsestimater end manuel beregning.
Hvornår skal du stole på matematik versus hvornår du skal spilletest: Brug matematik til at verificere teoretisk balance og fange åbenlyse designfejl, før du investerer i playtesting. Brug playtesting til at opdage, hvordan menneskelig psykologi interagerer med matematikken - de steder, hvor den optimale strategi adskiller sig fra, hvad spillerne rent faktisk gør, og de steder, hvor matematikken forudsiger balance, men oplevelsen føles uretfærdig. Begge dele er nødvendige. Ingen af delene er tilstrækkelig alene.
Ofte stillede spørgsmål
Et spil, hvor matematikken er designet til at være synlig
Neutronium: Parallel Wars's indkomstskalering, koalitionstærskler og terningssystem er bygget på eksplicit sandsynlighedsmatematik. Tilmeld dig ventelisten for lanceringsopdateringer.
Tilmeld dig ventelisten →