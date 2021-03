Sčítání lidu bude letos jednodušší a primárně online. Povinné údaje se oproti cenzu před deseti lety zúží téměř na polovinu, statistici totiž budou zjišťovat jenom takové informace, které nejsou dostupné z databází státu. Sčítání lidu 2021 startuje v sobotu. Formuláře lze posílat elektronicky do 9. dubna. Kdo nevyužije možnosti online, musí od 17. dubna do 11. května vyplnit papírový formulář. Praha 10:44 25. března 2021 Sdílet na Facebooku Sdílet na Twitteru Sdílet na LinkedIn Tisknout Kopírovat url adresu Zkrácená adresa Kopírovat do schránky Zavřít Sčítání lidu 2021 startuje v sobotu (ilustrační foto) | Zdroj: Pexels

Český statistický úřad předpokládá, že se elektronicky sečte výrazná většina obyvatel. Už při posledním cenzu, tedy sčítání lidu v roce 2011 poslala elektronický formulář čtvrtina Čechů. Pro předvyplnění sčítacích formulářů i pro zpracování se už dalo využít údaje dostupné v registrech.

Váš prohlížeč nepodporuje přehrávání audia. Přehrát 00:00 / 00:00 Digitalizaci sčítání lidu přibližuje reportáž vědecké redaktorky Martiny Rasch

Podobně tomu bude i letos, statistici využijí devět registrů včetně dat ministerstva školství, ministerstva práce nebo České správy sociálního zabezpečení. I díky tomu bude potřeba zadat údajů o polovinu méně.

„Platí, že elektronický formulář pomáhá řadě nelogičností v odpovědích předejít už při vyplňování respondentem,“ vysvětluje mluvčí Sčítání 2021 Jolana Voldánová. „Součástí tohoto procesu je anonymizace dat, tedy odstranění identifikačních údajů osob, jako jsou jména, čísla dokladů nebo rodných čísel.“

Bezpečně a pod mlčenlivostí

Data budou statistici ukládat na servery Státní pokladny Centra sdílených služeb, které mají nejvíce zabezpečené kybernetické prostory v České republice.

„Vámi poskytnuté údaje jsou ukládány šifrovaně, a to ve vysoce zabezpečeném prostředí Státní pokladny Centra sdílených služeb na území České republiky. Státní pokladna Centra sdílených služeb disponuje vlastními bezpečnými datovými centry s nejmodernější architekturou. Data jsou následně v tomto zabezpečeném prostředí zpracovávána za účelem vytvoření statistických informací,“ ujišťuje Voldánová.

Údaje, které lidé do elektronického formuláře zadají, by tak měly být chráněné od vstupu do systému přes zpracování a uložení dat až po publikaci výsledků. Systém by měl zvládnout i nápor respondentů ve špičkách.

„V rámci sběru údajů prostřednictvím elektronických sčítacích formulářů při online sčítání je z důvodu zajištění potřebné propustnosti a rychlého obsloužení velkého počtu požadavků, zejména ve špičkách, propojení realizováno prostřednictvím globální služby Azure Front Door.“

Po zpracování Český statistický úřad data vymaže, aby se nedala v budoucnu zneužít. Zveřejňují se pak pouze sloučené, ne individuální statistické výsledky. Jinými slovy se data z formulářů budou využívat výhradně pro účely tvorby souhrnných statistik.

Jak doplňuje Voldánová, při sběru i zpracování dat je bude přítomný jen omezený počet pracovníků, kteří přijdou s údaji do styku: „Zúčastnění zaměstnanci jsou ze zákona vázaní mlčenlivostí, která trvá i po skončení sčítání. V souladu se zásadou minimalizace, kterou vyžaduje GDPR, uchováváme údaje pouze po nezbytnou dobu.“

Papíry ani letos nezmizí

K elektronickému formuláři na stránkách www.scitani.cz se půjde připojit buď pomocí elektronické identity, nebo datové schránky. Pokud k nim ale lidé přístup nemají, umožní jim statistici přihlášení po zadání platného dokladu a data narození.

Listinné formuláře ovšem nezanikají. Pokud se lidé nesečtou online, od 17. dubna budou tiskopisy k dispozici buď u komisařů v terénu, na vybraných pobočkách České pošty nebo přímo na pracovištích krajských správ Českého statistického úřadu. Vyplněné papírové formuláře se pak sváží na digitalizační pracoviště s velkokapacitními skenery.

„Po naskenování jednotlivých stran každého formuláře proběhne rozpoznávání znaků, které respondenti zapsali. Rozpoznávání je automatizované, ale pokud je odpověď obtížně čitelná, pokusí se písmena a čísla ‚rozluštit‘ pracovníci digitalizace,“ popisuje Voldánová.

S chybami pomůže elektronický formulář

Dalším krokem bude identifikace přesného významu odpovědí. To se děje převážně automatizovaně. Pokud odpověď obsahuje podstatnější chyby, posuzují pracovníci to, co měl respondent na mysli, zase individuálně. Následující fáze zpracování už jsou stejné jak pro data z listinných tak i elektronických formulářů. I když v případě těch listinných je zpracování vždy náročnější.

„Často respondenti chybují například v adresách. I proto doporučujeme využít elektronický formulář, který respondentům pomůže zapsat odpověď správně, navíc díky našeptávačům a nabídkám výrazně rychleji,“ uzavírá Voldánová.

Údaje z formulářů se pak propojují s daty z registrů a databází státu. Odstraňují se duplicitní informace, řeší se nelogické odpovědi a celá řada dalších nesrovnalostí. Teprve po těchto úpravách je možné začít se samotným výpočtem výsledků. Vyhodnocení dat trvá nejméně několik měsíců. Výsledky proto statistici plánují zveřejnit na přelomu roku.

Zajímavostí je, že se v roce 2011 v obálkách s listinnými formuláři našly stovky dokumentů, které tam sčítané osoby vložily omylem. Byly to například občanské průkazy, rodné listy, školní vysvědčení, nájemní smlouvy nebo dokonce i dětské kresby.