O prezidentské volby je mezi voliči velký zájem, což dokazuje účast. Pravidelně to bývá přes 60 procent. Jsou průzkumy pro tento typ hlasování  v něčem náročnější?
Práce s volebními výzkumy má dva efekty. Jednak je to práce velice napínavá, a to čistě z takového toho analytického „nerd“ pohledu, ale z druhé strany je tam i poměrně velký sociální tlak. Každý máme nějaký politický názor, nějaké favority, žijeme v nějaké sociální bublině.

Pro nás ve STEM jsou volby celkově tak desetina práce z objemu, který během roku zpracováváme. Navíc je to služba veřejnosti. Společnost by bez práce výzkumníků ztratila jeden typ zpětné vazby a byla by odkázána jen na spekulativní a dodatečné informace či zhodnocení situace komentátory. Letošní prezidentské volby však samozřejmě budí velkou pozornost. Lidé by si měli uvědomit, a my se to snažíme trpělivě vysvětlovat, i když se to často nedaří, že když má nějaký kandidát preference 26 procent nebo 28 procent, je to vlastně dost podobné, protože vždy musíme počítat se statistickou chybou.

Prezidentský volební model Deníku, stav k 9. lednu 2023
Do 2. kola půjdou Babiš a Pavel, ukazuje poslední model Deníku před volbami

Jak budete volební dny prožívat vy?
Ačkoli všechny volby prožívám pracovně, k nelibosti své rodiny, a hlavně dětí, těším se na to. Teď před prvním kolem prezidentské volby neustále odpovídám médiím a dávám komentáře. Volební sobotu 14. ledna strávím ve studiu CNN Prima NEWS, kde budeme sledovat průběžné volební výsledky, budeme počítat prediktivní modely. Přiznávám, že pro mě je zázemí televize vždycky hrozně zajímavé, protože některé momenty v takových médiích vypadají jako v nějakých dramatických seriálech, a jsem rád, že tam vstupuji jen jako host.

Zmiňujete CNN Prima NEWS. Ta diváky láká na to, že díky predikcím STEM a STEM/MARK oznámí jména postupující dvojice kandidátů na prezidenta jako první, a ještě dřív, než budou sečteny všechny výsledky. Jak se taková predikce tvoří?
Vždy, když sledujete průběžné sčítání výsledků, vidíte nějaký postup. Začíná to okrsky, které jsou malé, mají nízkou volební účast, taky můžete sledovat, kolik takových okrsků je v rámci celé republiky už sečtených. Praha bývá logicky sečtena jako poslední. To vše je dané tím, že města volí jinak než vesnice, vstupují do toho regiony, kde je třeba vysoká nezaměstnanost, nebo místa, kde žijí lidé s vyššími příjmy.

Všechny tyto aspekty ovlivňují volební chování. A my máme model, který určuje, jak dopočítat ze sečtených okrsků ty, které ještě nejsou dopočítané. Máme popsané skupiny, které volí na různých místech podobně, a podle toho dopočítáváme okrsky, které ještě nejsou sečtené. Vždy ale čekáme na sečtení 60-65 procent okrsků. Také víme, že odchylka průběžných výsledků od finálního čísla je přibližně sedm procentních bodů, to znamená, že pokud má kandidát v průběhu například 30 procent, výsledek se může dostat až na 23 procent.

V posledních parlamentních volbách předpověděla vaše technologie přesně výsledek voleb, tedy triumf hnutí SPOLU v době, kdy bylo sečteno teprve 60 procent hlasů a vypadalo to na vítězství hnutí ANO. Kolik dat je potřeba k získání tak přesných výsledků?
Celé volby v České republice jsou zajištěny tak, aby byly hodně transparentní a nevznikaly nějaké pochyby. Jednotliví občané, ale i diváci televizního vysílání vlastně sledují aktuální stav webu Českého statistického úřadu, jak jsou sčítány jednotlivé volební okrsky. Média tedy mají určitou výhodu, kterou je vlastní datový tok, například i zabezpečený proti útoku hackerů. My ve STEM a STEM/MARK tedy také sledujeme, jak se data sčítají, a k tomu přidáváme zmiňovaný matematický model, který dopočítává chybějící místa.

Jiří Přibáň
Babiš může vyhrát snáz, než mu průzkumy předpovídají, říká Jiří Přibáň

Můžete popsat rozdíl mezi predikcemi výsledků a tzv. Exit Polls, které se používají například v zahraničí?
To jsou naprosto rozdílné disciplíny. Predikce využívá dat už zmíněného statistického úřadu. Exit Polls funguje tak, že si vytipujete určité okrsky, pošlete tam tazatele a ti se ptají například každého desátého voliče, který vychází z volební místnosti, jak volil. A z toho se pak sestavují výsledky. Výhoda využívání predikce je určitě ta, že je méně finančně náročná – nepotřebujete 500 tazatelů, kteří dva volební dny někde stojí. Určitou nevýhodou ale je, že pro predikci musíme počkat na sečtení alespoň 60 procent volebních okrsků. Exit Polls má k interpretaci data prakticky hned po uzavření volebních místností. Už jsem tu zmínil statistickou chybu, a právě ta se týká i formy Exit Polls. Například v 90. letech lidé tajili volbu komunistů, proto byly výsledky zkreslené.

Celkově je průzkum Exit Polls postupně nahrazován predikcemi. Už nežijeme v devadesátkách, kdy všechno bylo technicky složitější. Dnes výpočetní technika zvládá rychle i náročné operace, a zpracování dat výsledků je tak otázkou chvíle.

Martin Buchtík je sociolog a od roku 2018 ředitel analytického ústavu STEM. Zabývá se tématy spojenými s dynamicky se proměňující společností v širším kontextu a dalšími otázkami, jako je formování veřejného mínění, kvalita života, soudržnost a nerovnost. V minulosti mimo jiné řídil Centrum pro výzkum veřejného mínění Sociologického ústavu Akademie věd ČR. Doktorské studium absolvoval na Univerzitě Karlově se zaměřením na metodologii sociologického výzkumu.

Zdroj: https://www.stem.cz/nas-tym/