fredag 6. mai 2011

En ting alle bør kunne om statistikk

For over tre hundre år siden oppdaget en engelsk prest en formel som senere har fått navnet Bayes regel. Det har vist seg, spesielt i de siste tiårene, at Bayes tilnærming er svært viktig og relevant. Det gjelder for eksempel spørsmål som hvor farlig det er å bruke visse antidepressiva eller i hvor stor grad forbudet mot oppstilling av tobakk i butikkene påvirker salget.

Bayes regel handler om hvordan man skal beregne en sannsynlighet gitt den informasjonen man har. Utgangspunktet er at man starter med det man tror, og så endrer det i den retningen informasjonen peker. Desto mer og bedre informasjon, desto mer endrer man sin oppfatning. Et godt eksempel er en artikkel om en mulig sammenheng mellom paroxetine (antidepressiva) og selvmord. Ved å bruke informasjon om hvor mange selvmordsforsøk man hadde blant pasienter som fikk paroxetine og de som fikk placebo, fant Ivar Aursnes og medforfattere at det trolig var en sammenheng mellom paroxetine og selvmordsforsøk. Sjansen er, selvfølgelig, fremdeles liten og man kan vurdere fordeler og ulemper, men selve tilnærmingen er interessant og viktig.


Det interessante er faktisk ikke formelen i seg selv, men måten man bruker sannsynlighetsbegrepet. Mange mener man bare kan snakke om sannsynligheter når det gjelder ting som gjentas. Sjansen for å få en sekser i terningspill er 1/6. Hvordan vet jeg det? Jo, når jeg kaster en terning mange ganger, får jeg en sekser i omtrent 1/6 av tilfellene. Med en slik frekvensbasert tilnærming til sannsynligheter, er det vanskelig å si noe om engangshendelser og spørsmål som "Hvor sannsynlig er det at forbudet mot oppstilling av tobakk har ført til et redusert salg av tobakksvarer." Det er dette som er Bayes egentlige nyvinning. Ikke en formel, men at han bruke ordet sannsynlighet om ting som ikke kunne gjentas. I hans tilnærming var sannsynligheter uttrykk for hvor sterkt man tror på noe, ikke hvor ofte det skjer.

Hvorfor er det så viktig? Ta eksempelet med oppstillingsforbudet mot tobakk. En vanlig tilnærming er her å teste om det har vært en spesielt stor ("statistisk signifikant") nedgang i salget av tobakk etter innføringen av oppstillingsforbudet. Problemet er den vanlige tilnærmingen ofte antar at man trenger svært sterke bevis for å konkludere at oppstillingsforbudet har en effekt. Det kan høres fornuftig ut å "være sikker" før man konkluderer, men det er ikke nødvendivis det beste. I mange tilfeller når man må ta en beslutning, ønsker man å vite hva som er mest sannsynlig, ikke hva som er sikkert. Paroxetine er et godt eksempel. Det ville være tullete å starte med en antagelse om at det ufarlig og så bare endre den oppfatningen dersom man er "95 % sikker." Det ville jo bety at selv om man var svært sikker på at det å gi medisin hadde en alvorlig bieffekt, så ville man fortsette fordi man "bare" var 90% sikker på at det kunne være skadelig. Det synes innlysende feil. Sannsynlighet bør tolkes som en grad av sikkerhet, ikke som en grense der man tror en ting og så plutselig forandrer oppfatning og tror noe annet når man får veldig sterke bevis.

Når man ser på sannsynlighet som et utrykk for hvor sterkt man tror på noe, vil man kunne ta bedre avgjørelser om man skal fortsette å bruke et legemiddel. Det betyr også at man kan ta bedre avgjørelser når man skal godkjenne nye legemidler. I dagens system er det slik at man skal må være "veldig sikker" på at et legemiddel har en effekt før det blir godkjent. Det vi trenger er en gradvis tilnærming. Det er hoderystende feil å avgjøre slike ting basert på om en p-verdi er signifikant eller ikke. Beslutningen handler om grader av sikkerhet og størrelsen på positive og negative konsekvenser, ikke om å være helt sikker på at noe virker eller ikke virker.

 
Share |

Postscript (halvteknisk): Det er en del krangling på dette feltet og man trenger selvsagt ikke være "bayesianer" for å mene at man skal vurdere graden av sikkerhet mot eventuelle positive og negative konsekvenser når man tar en beslutning.  Det er mulig i en vanlig tilnærming også. Problemet er at dette ofte ikke blir gjort fordi man har et utgangspunkt der sannsynlighet tolkes som frekvenser og ikke "hvor sikker man er" og at man tradisjonelt har valgt å kreve svært sterke beviser før man forkaster det man opprinnelig tror. Det er som om man legger inn en antagelse om at det man først tror bør veie mye mer enn den retningen den nye informasjonen peker. Bayesianerene er mye mer eksplisitte på dette. De har ikke en fast utgangssannsynlighet, men en fordeling som som representerer en subjektive mening. Noen mener dette er problematisk, andre sier at det handler om å være eksplisitt på at man starter et sted uansett hvor nøytral man mener å være. Bayesianerne har også en mer naturlig tolkning av "hvor sikker man kan være" i den forstand at man ikke trenger å anta at man gjentar en "enkelthendelse" hundre ganger for å kunne tolke hvor sikker man skal være.



Ingen kommentarer:

Legg inn en kommentar