Sygdomsforudsigelse – big data

posted in: Smart data, Tips | 0

Walgreens (USAs andenstørste apotekskæde) publicerer løbende og hurtigt deres salgstal for influenza vaccine. Det er smart. Tallene har de alligevel og så kan de (måske) bruges til noget andet. Men det ville nu være rart, hvis deres brugergrænseflade tillod, at man kunne kigge på ældre data, så man kunne se den historiske udvikling – se hvor influenzaen “kommer i næste uge”.

Men der er nu et lidt stort “måske” knyttet til deres “flu index” for selv om det er en del år siden, jeg har arbejdet professionelt med epidemiologi, så kan jeg da hurtigt pege på et par åbenlyse fejlkilder:

Mængden af solgt influenzavaccine fra Walmart er et godt tal, men kan ikke stå alene: Hvor stor markedsandel har Walgreens i hvert område? Hvad er indkomstfordelingen specielt med henblik på om folk har råd til at købe vaccinen? Og måske lidt mere perifert, men dog ikke uden betydning: Er der en geografisk bestemt udbredelse af vaccinebenægtere? Og så er der spørgsmålet om befolkningstætheden: Vurdering af omfanget af influenza kan være som andel af hvert distrikts befolkningstal, men også som et absolut antal – begge optællinger er interessante til besvarelse af forskellige spørgsmål. Men man har i hvert fald brug for at kende befolkningstallet. (Se Walgreens Flu Index fane, hvor de har forsøgt at tage højde for dette – men dog uden at fortælle præcist hvordan).

Og så er der spørgsmålet om Walgreens tilstedeværelse i hvert distrikt – det hjælper de os heldigvis med, da der på samme hjemmeside er en visning af Walgreens salgssteder:

Synes du, der er en vis form for sammenlignelighed mellem de to kort? Så snupper vi da lige et kort med USAs befolkningstæthed også:

Altså Walgreens sælger mest influenzavaccine, der hvor der er flest mennesker og de har salgssteder. Men det betyder dog ikke at oplysningerne er trivielle – blot at der skal arbejdes lidt mere med dem, så man kan finde overhyppigheder (fx hele Midtvesten) og underhyppigheder (fx Florida). I Danmark er vi gunstigere stillet, hvis vi laver noget tilsvarende: Lægemiddelstyrelsen har salgstal for al medicin, uanset hvilket apotek, der har solgt det eller sygehus, der har udleveret det. Til gengæld skal en evt. demografisk kortlægning tage højde for, at man i Danmark kan få gratis influenza vaccination, hvis man tilhører nogle bestemte befolkningsgrupper, se Sundhedsstyrelsens hjemmeside herom.

Du kan også læse TechRepublics artikel om sagen her. De er nok lidt mindre skeptiske end jeg er, men ikke mindst den indlagte video er interessant: I forbindelse med epidemier: Fx på globalt plan, kan det være af afgørende betydning, at man er i stand til at allokere ressourcer hurtigt og dermed måske være med til at inddæmme en epidemi inden den spreder sig voldsomt. (Se Sonia Shah’s hjemmeside her.)

Interessen for influenza er ekstra stærk i USA lige nu: De har tilsyneladende en kraftig influenza epidemi i øjeblikket. Den sidste epidemi krævede anslået 56.000 døde. Et voldsomt stort tal, men faktisk det samme som man anslår en influenzaepidemi rammer i DK: Ca 1.000 dødsfald – primært hos ældre og andre med svækket immunforsvar (eller 0,017 % af befolkningen). usatoday.com flu-season.

DR har lavet en artikel om de sundhedsdata, der findes tilgængeligt for forskningsformål i Danmark: dr.dk saadan-registreres-dine-private-helbredsoplysninger-fra-vugge-til-grav.  Jeg fornemmer lidt at journalisten mener, det er et problem – jeg mener mest det er et problem, hvis dataene ikke bliver brugt til noget.