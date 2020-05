Hejtman jihočeského kraje Martin Kuba (ODS) si nechal vypracovat vlastní studii promořenosti novým koronavirem. Podle předběžných výsledků má protilátky proti nemoci 5 až 10 procent Jihočechů, řekl hejtman v neděli Radiožurnálu.

Hynek Cígler Hynek Cígler působí na katedře psychologie a při Institutu pro výzkum dětí, mládeže a rodiny na Fakultě sociálních studií Masarykovy univerzity v Brně. Zaměřuje se na metodologii a statistiku v psychologii, zejména v oblasti tvorby metod psychologické diagnostiky, je autorem či spoluautorem různých testů a podílel se na zpracování dat z mezinárodních studií OECD TALIS. Budoucí psychology proto učí zejména v psychometrických kurzech; v současnosti se pak výzkumně zaměřuje zejména na způsoby, jakým lidé odpovídají na položky dotazníků, a s tím související zkreslení.

Výsledky by se tak výrazně lišily od národní studie promořenosti, kterou koncem dubna realizoval Ústav zdravotnických informací a statistiky a kterou se řídí vláda. Rozdíl je údajně způsoben testováním na jiný typ protilátek a odběrem žilní namísto takzvané kapilární krve – tedy odběru z bříška prstu.

Podle psychometrika Hynka Cíglera z Fakulty sociálních studií Masarykovy univerzity v Brně je příčina jednodušší: vědci špatně interpretují výsledky testu.

V čem jsou závěry studie chybné?

Chyba je v tom, že u předběžných výsledků, které autoři studie oznámili, chybí jedna výpočetní operace – korekce proti chybovosti použitých testů.

Co to znamená?

Pro použité testy, kterými jsou podle autora studie Anti-SARS-CoV-2 ELISA IgA, uvádí jejich distributor spolehlivost u zdravých osob kolem 88 až 92 procent. Když to řeknu ve velké zkratce: i kdyby v celém vzorku populace, který testovali, nebyl ani jeden nakažený, tak se dá očekávat, že až 10 procent lidí bude identifikováno jako falešně pozitivních v důsledku chybovosti toho testu. Takže pět až deset procent je prostě výsledek chybovosti testů.

A to se řeší zmíněnou korekcí?

Přesně tak. I když máte nějakou chybovost, dá se poměrně snadno dopočítat, kolik je skutečně nakažených. Potřebujete k tomu znát tři čísla: podíl pozitivně testovaných; senzitivitu – tedy pravděpodobnost, s jakou test odhalí skutečně nakaženého člověka; a specificitu neboli pravděpodobnost, s jakou korektně rozhodne, že zdravý člověk je zdravý.

Testy v Jihočeském kraji ukázaly, že promořenost Čechů je řádově vyšší. Prymulu rozdíl nepřekvapil Číst článek

Pokud je třeba senzitivita 90 procent, ukáže test u 10 procent nakažených, že nakažení nejsou. Tohle není u testů na protilátky problém, senzitivitu mají zpravidla vysokou. Schopnost odhalit nemoc se postupně zvyšuje a po nějakých 21 dnech od nákazy je pravděpodobnost chyby blízká nule. Problém u testů na protilátky, které se běžně používají, je se specificitou. Pokud například dosahuje 90 procent, u 10 procent nenakažených mi test nepravdivě řekne, že nakažení jsou.

Když známe oba parametry a pozorovaný počet pozitivně testovaných, dá se skutečný počet nakažených velmi jednoduše korigovat. Možných postupů je víc, ale korekce na základě těch dvou čísel je nejjednodušší a pro výpočet orientačních čísel postačuje.

A tohle přesně počítá aplikace na vašem webu?

Stačí vložit tyhle tři parametry a ten vzorec to zkoriguje.

Klíčový je náhodný výběr

Říkáte, že těch problémů je v jihočeské studii víc.

Je k ní poměrně málo informací, ale podle toho, co jsem dohledal, tvořili polovinu z 2000 testovaných dobrovolníci a polovinu zástupci exponovaných povolání, jako třeba hasiči, prodavačky, řidiči a podobně. Takže v žádném případě nemůžeme mluvit o náhodném vzorku, který je pro projekci na celou populaci klíčový.

Rozdíl mezi výsledky národní a jihočeské studie je tedy podle vás pouze v tom, že autoři té první korekci provedli, autoři té druhé ne?

Z dostupných zdrojů vyplývá, že u celostátní studie s korekcí pracovali, navíc se podle dostupných údajů zdá být použitý čínský test Wantai o něco spolehlivější, než se dříve spekulovalo v médiích. Je dokonce zřejmě spolehlivější než test použitý v jižních Čechách.

Je potřeba měřit jiný parametr, zpochybňuje výsledky studie promořenosti vakcinolog Beran Číst článek

To v Jihočeském kraji neproběhlo?

U toho, co ohlásili jako předběžné výsledky, ne. Je otázkou, co přesně znamenají předběžné výsledky. Pravděpodobně ta data ještě budou čistit, vážit, a podobně. Chyba je v tom, že na základě předběžných výsledků rozporují vládní studii. Oznámili prostě počet pozitivně testovaných místo toho, aby udělali korekci, která je pro někoho na deset sekund.

Co je vlastně převážení dat? Jak moc se mohou změnit výsledky?

To je technika, která se používá, pokud vzorek není vybraný úplně náhodně. Používá se v okamžiku, kdy mám ve vzorku například víc mužů než žen nebo třeba věkově neodpovídá demografickému složení ČR. Vážení vzorku probíhá tak, že respondentům v podreprezentovaných skupinám dám větší vliv na ovlivnění všech statistik, například průměru.

Takže pokud mám třeba ve vzorku dvakrát víc žen než mužů – což je v psychologii a sociologii typické –, tak těm mužům dám dvakrát větší váhu. Všichni muži dohromady pak vzorek ovlivňují stejně jako všechny ženy, což je běžný postup. Převažuje se obvykle na základní demografické charakteristiky: pohlaví, věk, vzdělání, geografické rozložení, a podobně.

Chytrou karanténu prověří až běžný život. ‚Lidé byli doma, je potřeba nechat to rozjet,‘ říká spoluautor Číst článek

Když se vrátím k té národní studii: jak velký problém je podle vás v tom, že většina z 27 tisíc testovaných byli dobrovolníci, takže opět nešlo o náhodný vzorek?

Pokud by opravdu bylo všech 27 tisíc vybráno nenáhodně, byl by to ohromný problém. Protože ve chvíli, kdy výběrové kritérium – dobrovolnost – může souviset se zkoumanou vlastností – infikovaností –, tak vždycky zkreslí výsledky a nejde to žádným způsobem korigovat. To, že se pak vzorek převáží, aby na základě demografických proměnných odpovídal populaci, je sice pěkné, ale celkem k ničemu.

Zkreslení může být v tomhle případě zásadní. U takhle nízké prevalence (podílu nakažených, pozn. red.) může být třeba trojnásobná nebo čtyřnásobná prevalence než ve skutečnosti. Anebo naopak menší, to když se častěji nechali testovat lidi, kteří mají z koronaviru velké obavy, schovávají se doma a nemohli se s ním potkat? Tohle ovlivnění je prostě naprosto nepredikovatelné a i když můžeme mít nějaké nápady, jak to zkresluje výsledek, tak ho neumíme ani odhadnout.

Když se pak objevilo k té celorepublikové studii víc informací, částečně jsem se uklidnil. Část vzorku byla vybraná ne sice náhodně, ale aspoň z předem vybraného populačního panelu, který vznikl ještě před epidemií. Takže ti lidi byli do panelu zařazeni nezávisle nebo téměř nezávisle na tom, jestli mohli nebo nemohli onemocnět koronavirem. Tenhle malý poměrně náhodný vzorek pak umožňuje říct, jak moc jsou ty velké vzorky zkreslené návalem dobrovolníků.

Stomatolog není sociolog

Takže máme velkou studii, která říká jedno číslo. A pak jihočeskou studii, která říká něco jiného...

A pak máme ještě vzorek 400 stomatologů, kteří se nechali otestovat na Stomatologické D. C. M. klinice v Hradci Králové. Vyšla jim prevalence 14 procent a teď tvrdí, že jsou za vodou, protože je promořenost velká a nikdo z nich nepozoroval příznaky. To číslo, 14 procent, ovšem neříká nic o skutečnosti. Při zvážení chybovosti testu může být prevalence v daném vzorku mezi 3 a 8 procenty při zvážení výběrové chyby.

Říkáte, že vám zveřejnění těch předběžných závěrů jihočeské studie přišlo na hraně šíření poplašné zprávy?

K celé epidemii je potřeba přistupovat zodpovědně. Nestrašit lidi víc, než je nutné, ale zároveň situaci nezlehčovat. V okamžiku, kdy rozhlásím do médií, že 10 procent populace koronavirus prodělalo, drtivá většina z nich nepozorovala žádné příznaky a úmrtnost je tedy zanedbatelná, nižší než u klasické chřipky, tak to dost zamává motivací lidí používat ochranná opatření.

Pokud rozhlásím do médií něco takového, tak zároveň znevěrohodňuji další výstupy včetně té národní studie, která byla jakž takž dobře provedená, a vlastně snižuji důvěru lidí v instituce, které chrání jejich zdraví, což je potenciálně dost nebezpečná věc.

Je samozřejmě pěkné, že si v jižních Čechách udělali studii, to jsou dobře vynaložené peníze, ale to vyhodnocení je totálně neprofesionální. Při řešení takových situací se potřeba řídit se daty a adekvátně je komunikovat.