Določanje alarmov pri epidemiji COVID-19 v Sloveniji
Janez Stare, Nina Ružić Gorenjec
Posodobljeno 19.01. 2022 (prvič objavljeno 14. 5. 2020)
Pri epidemiji COVID-19 je za pravočasno in primerno reagiranje ključnega pomena, da čim bolj pravilno ocenimo, kdaj je prišlo do ponovnega zagona oz. poslabšanja epidemije. Postavlja se vprašanje, na kakšen način in preko katerih podatkov lahko to čim bolj natančno ocenimo. Podatki o smrtih so sicer najbolj zanesljivi, vendar pa se smrti zgodijo z velikim zamikom glede na okužbo. Ob ocenjevanju preko smrti bi bili zato prepozni, podobno je s hospitalizacijami. Prva informacija, ki je na voljo, so seveda potrjeno okuženi, temeljni pomislek za njihovo uporabo pa je vpliv strategije testiranja. Predlagamo preučevanje deleža potrjeno okuženih izmed testiranih, ki je bistveno manj občutljiv na strategijo testiranja kakor samo število potrjeno okuženih.
Na podlagi že razvite statistične metodologije (več o tem spodaj) smo na podlagi slovenskih podatkov za obdobje 1. vala (natančneje 4. 3. – 28. 5. 2020) določili pragove, pri katerih je zelo verjetno, da se bo epidemija bolj razširila. Po 28. 5. 2020 smo spremljali dnevne deleže potrjeno okuženih izmed testiranih in opazovali, v katero območje se uvrstijo (sliki A in B spodaj). Pri tem smo za vsak dan dodali še delež okuženih izmed testiranih v zadnjih 7 dneh (v sivem), ki je v času bolj stabilen kakor dnevni delež okuženih. Sliki A in B nakazujeta, da so bili pragovi ustrezno postavljeni - ko je delež na začetku slike B v začetku septembra 2020 presegel zadnji prag 0.04 (temno rdeča), se po tem ni nikoli več spustil pod to mejo - kontrolo nad epidemijo smo izgubili.
Od jeseni imamo zelo visoke deleže, ki jih ni več smiselno primerjati s postavljenimi pragovi iz prvega vala, ko so bili vsi dnevni deleži občutno nižji. Poleg tega je primerjava prolematična zaradi številnih sprememb strategije testiranja (tj. vzorčenje testiranih iz populacije ni konsistentno; glejte tudi opombo z dne 13. 2. 2021), nenazadnje pa tudi zaradi precepljenosti (le-to spremeni dinamiko širjenja bolezni). V letu 2021 zato spremljamo le še delež potrjeno okuženih izmed testiranih (skupaj z delež v zadnjih sedmih dneh), brez primerjave s pragovi iz prvega vala. V obdobjih, ko je strategija približno primerljiva, nam to vseeno daje neko informacijo o stanju epidemije.
Stran redno posodabljamo s podatki iz COVID-19 sledilnika.
Opombe:
- Ves čas analiziramo delež okuženih izmed testiranih s PCR testi (podatkov hitrih testov ne upoštevamo).
- S 13. 2. 2021 (siva navpična črta spodaj) se vsi pozitivni hitri testi potrjujejo še s PCR testi. Ob takšni spremembi strategije testiranja se delež pozitivnih PCR testov izmed opravljenih PCR testov poveča, saj vključujemo podpopulacijo, pri kateri je verjetnost okužbe večja (ker je že potrjena s hitrim antigenskim testom). Te podpopulacije žal ne moremo izločiti iz naših izračunov, saj od tega dne dalje nimamo niti podatka o številu pozitivnih hitrih testov (poleg tega bi potrebovali še podatek o številu pozitivnih hitrih testov, ki so bili potrejni tudi s PCR testom). Deleži po 13. 2. so torej zelo verjetno nekoliko višji zaradi te spremembe strategije testiranja, ne moremo pa oceniti, v kolikšni meri k temu doprinese strategija testiranja in v kolikšni meri morebitno dejansko povečanje okužb. Med seboj je mogoče primerjati deleže po 13. 2. in na ta način zopet opazovati dinamiko potrjenih okužb, ko se nabere dovolj podatkov.
Podrobneje o metodologiji
Naša statistična metodologija za zaporedje po velikosti urejenih vrednosti (v tem primeru delež potrjeno okuženih izmed testiranih) določi prag, do katerega je še možno, da imajo vrednosti enako povprečje. Natančen opis metodologije, ki upošteva ocenjene deleže z njihovo standardno napako in temelji na Monte Carlo pristopu, je v članku Random Cancers as Supported by Registry Data, avtorjev Stare, Henderson in Ružić Gorenjec, ki je bil objavljen septembra 2020 v reviji Statistics in Medicine. Koda, ki implementira metodo v programskem jeziku R, je dostopna na tej povezavi.
Deleže potrjeno okuženih izmed testiranih za obdobje 4. 3. – 28. 5. 2020 uredimo od najmanjšega do največjega. Ko določimo prvi prag po opisani metodologiji, vrednosti do tega praga odstranimo, še enkrat uporabimo metodo, s čimer dobimo drugi prag in ta postopek ponavljamo do konca. Rezultati so prikazani na spodnji sliki. Prva dva pragova sta zaradi kar nekaj dni brez potrjeno okuženih (takih je bilo deset dni) enaka 0, prvi neničelni prag je tako 0.001 (zeleno območje), naslednji prag je enak 0.013 (modro območje), zadnji pa 0.036 (svetlo rdeče območje). Vrednosti nad 0.036 so v temno rdečem območju, ko je bil delež okuženih največji.
Isti podatki in pragovi so prikazani na drugi sliki, tokrat urejeni po dnevih. Navpična zelena črta (zelo kratka) prikazuje prvi dan, od katerega dalje so vse vrednosti v zelenem območju, navpična modra črta pa prvi dan, od katerega dalje so vse vrednosti v modrem ali zelenem območju, podobno velja za rdečo navpično črto.
Na zgornjih slikah nato spremljamo deleže po 28. 5. 2020 in opazujemo, v katero območje se uvrstijo. Ob preskoku iz zelenega oz. modrega območja v rdeče lahko sklepamo, da se je delež dejansko povečal (z majhno verjetnostjo napake), do takrat pa podatki o deležu potrjeno okuženih izmed testiranih ne nasprotujejo domnevi, da so razlike med deleži posledica naključne variabilnosti. Alarmi so zaenkrat nastavljeni pri vrednosti p = 0.05, lahko jo poljubno spremenimo.
Do 5. 6. 2020 smo spremljali deleže glede na pragove določene na podatkih 4. 3. – 1. 5. 2020, ta analiza je dostopna na tej povezavi.