Določanje alarmov pri epidemiji COVID-19 v Sloveniji
Janez Stare, Nina Ružić Gorenjec
Posodobljeno 18. 1. 2021 (prvič objavljeno 14. 5. 2020)
Pri epidemiji COVID-19 je za pravočasno in primerno reagiranje ključnega pomena, da čim bolj pravilno ocenimo, kdaj je prišlo do ponovnega zagona oz. poslabšanja epidemije. Postavlja se vprašanje, na kakšen način in preko katerih podatkov lahko to čim bolj natančno ocenimo. Podatki o smrtih so sicer najbolj zanesljivi, vendar pa se smrti zgodijo z velikim zamikom glede na okužbo. Ob ocenjevanju preko smrti bi bili zato prepozni, podobno je s hospitalizacijami. Prva informacija, ki je na voljo, so seveda potrjeno okuženi, temeljni pomislek za njihovo uporabo pa je vpliv strategije testiranja. Predlagamo preučevanje deleža potrjeno okuženih izmed testiranih, ki je bistveno manj občutljiv na strategijo testiranja kakor samo število potrjeno okuženih.
Na podlagi že razvite statistične metodologije (več o tem spodaj) določimo na podlagi slovenskih podatkov za obdobje 4. 3. – 28. 5. 2020 pragove, pri katerih je zelo verjetno, da se je epidemija bolj razširila. Po 28. 5. 2020 spremljamo dnevne deleže potrjeno okuženih izmed testiranih in opazujemo, v katero območje se uvrstijo (spodnji sliki). Pri tem za vsak dan dodamo še delež okuženih izmed testiranih v zadnjih 7 dneh (v sivem), ki je v času bolj stabilen kakor dnevni delež okuženih.
Stran redno posodabljamo s podatki iz COVID-19 sledilnika.
Analiziramo delež okuženih izmed testiranih s PCR testi (podatkov hitrih testov ne upoštevamo).
Podrobneje o metodologiji
Naša statistična metodologija za zaporedje po velikosti urejenih vrednosti (v tem primeru delež potrjeno okuženih izmed testiranih) določi prag, do katerega je še možno, da imajo vrednosti enako povprečje. Natančen opis metodologije, ki upošteva ocenjene deleže z njihovo standardno napako in temelji na Monte Carlo pristopu, je v članku Random Cancers as Supported by Registry Data, avtorjev Stare, Henderson in Ružić Gorenjec, ki je bil objavljen septembra 2020 v reviji Statistics in Medicine. Koda, ki implementira metodo v programskem jeziku R, je dostopna na tej povezavi.
Deleže potrjeno okuženih izmed testiranih za obdobje 4. 3. – 28. 5. 2020 uredimo od najmanjšega do največjega. Ko določimo prvi prag po opisani metodologiji, vrednosti do tega praga odstranimo, še enkrat uporabimo metodo, s čimer dobimo drugi prag in ta postopek ponavljamo do konca. Rezultati so prikazani na spodnji sliki. Prva dva pragova sta zaradi kar nekaj dni brez potrjeno okuženih (takih je bilo deset dni) enaka 0, prvi neničelni prag je tako 0.001 (zeleno območje), naslednji prag je enak 0.013 (modro območje), zadnji pa 0.036 (svetlo rdeče območje). Vrednosti nad 0.036 so v temno rdečem območju, ko je bil delež okuženih največji.
Isti podatki in pragovi so prikazani na drugi sliki, tokrat urejeni po dnevih. Navpična zelena črta (zelo kratka) prikazuje prvi dan, od katerega dalje so vse vrednosti v zelenem območju, navpična modra črta pa prvi dan, od katerega dalje so vse vrednosti v modrem ali zelenem območju, podobno velja za rdečo navpično črto.
Na zgornjih slikah nato spremljamo deleže po 28. 5. 2020 in opazujemo, v katero območje se uvrstijo. Ob preskoku iz zelenega oz. modrega območja v rdeče lahko sklepamo, da se je delež dejansko povečal (z majhno verjetnostjo napake), do takrat pa podatki o deležu potrjeno okuženih izmed testiranih ne nasprotujejo domnevi, da so razlike med deleži posledica naključne variabilnosti. Alarmi so zaenkrat nastavljeni pri vrednosti p = 0.05, lahko jo poljubno spremenimo.
Do 5. 6. 2020 smo spremljali deleže glede na pragove določene na podatkih 4. 3. – 1. 5. 2020, ta analiza je dostopna na tej povezavi.