Odhady pravděpodobnosti vítězství Hillary Clintonové, vycházející z agregovaných modelů, se před americkými volbami pohybovaly mezi 70 a 99 %. U brexitu se volební realita posunula oproti průměru předpovědí zhruba o 5 %. Ani na jaře na Slovensku nedopadly předvolební průzkumy příliš dobře, přecenily stranu SIEŤ a podcenily sílu radikála Mariana Kotleby. Svádí to k úsudku, že výzkumy obecně přestávají vypovídat o volební realitě a systematicky podceňují antiestablishmentové strany. Není to ale tak docela pravda.

Clintonová měla v celostátních amerických průzkumech náskok průměrně 3,5 % a na počet hlasů vyhrála o 2,2 %. To není nijak nadstandardní odchylka. Problematicky však vyšly volební modely ve státech tzv. rezavého pásu (Wisconsin, Michigan, Pensylvánie), v nichž Trump nakonec získal klíčové volitele.

Na Slovensku se zase výrazně lišila přesnost u jednotlivých agentur. Výzkumy AKO a MEDIAN SK sbírané jeden a půl měsíce před volbami měly průměrnou odchylku u strany 2,5 %. SIETI, která nakonec ve volbách získala pod 6 %, odhadovaly tyto agentury okolo 8 %, zatímco ostatní mezi 13 a 17. AKO a MEDIAN SK navíc lépe zachytily i nástup Kotleby.

V Česku se pak výzkumy veřejného mínění v posledních letech dokonce zpřesňují. Výzkumy ČT (MEDIAN a STEM/MARK) před krajskými volbami správně odhadly vítěze ve 12 ze 13 krajů.

Detailnější pohled ukazuje, že univerzální není ani podhodnocování antiestablishmentových stran. Naopak – rakouský zelený prezident Alexander Van der Bellen vyhrál zrušené květnové i opakované prosincové volby, ačkoli v obou případech průzkumy favorizovaly nacionalistu Hofera. Van der Bellen překonal agenturní odhady v prvním duelu o 2,6 %, ve druhém dokonce o 8 %. Také francouzská Národní fronta Marine Le Penové v posledních regionálních volbách oproti průzkumům klesla o 2 %. Španělští Podemos v letních volbách o 5 %. Není tedy pravda, že by předvolební výzkumy systematicky nadhodnocovaly preference zavedených stran. To ale neznamená, že důvody odchylek u výzkumů není třeba analyzovat.

Hlavním zdrojem chybovosti je u nich čas. Vypovídají totiž vždy o situaci v době sběru. A tato situace se rozpadem tradičních štěpících linií a stranické loajality v řadě zemí mění rychleji, než bývalo zvykem. Vynesení přesnosti výzkumů z českých sněmovních voleb 2013 na časovou osu ukazuje, že ty sbírané dva měsíce před volbami mají průměrnou chybovost okolo 3 % na stranu, kdežto ty sbírané týden předem už jen 1,5 %. Faktor změny postojů v čase nelze obejít, jsou tu však jiné možné problémy, které by se agentury měly snažit vyřešit.

Marian Kotleba

Marian Kotleba

FOTO: Václav Šálek, ČTK

Průzkumy ve Wisconsinu Trumpa podcenily o 7 %, v Michiganu a v Pensylvánii o 3 až 4 %. Mohly přitom být výrazně přesnější, kdyby se vyvarovaly minimálně tří problematických postupů.

Ten první vyplývá ze snahy ušetřit. Telefonické dotazování má ve Státech malou návratnost, jen 2 až 10 %, agentury často za jeden až dva dny pro vytvoření tisícového vzorku provolají automatickým dotazníkem desítky tisíc čísel. Aby to šlo rychleji a ony ušetřily, lidí, kteří řeknou, že nejspíš volit nepůjdou, už se dál neptají. Neznáme tak u nich vzdělání ani etnicitu. Výsledkem je vzorek pravděpodobných voličů. Potíž je, že když v něm má 50 % osob vysokoškolské vzdělání a v populaci jen 27 % (příklad z Pensylvánie), není jasné, zda je to tím, že vysokoškoláci ochotněji odpovídali, nebo že se více chtějí zúčastnit voleb.

Některé výzkumy pracují s předpokladem, jak bude vypadat populace voličů (třeba podle toho, kdo volil minule), a dovažují vzorek na tuto strukturu. Jenže když se z voleb na volby nečekaně zvýší například účast bílých Američanů bez vysokoškolského titulu, výzkum se nutně proti realitě vychýlí. A přesně to se ve zmíněných státech stalo.

Druhým problémem amerických průzkumů je práce s nerozhodnutými voliči. Ve Wisconsinu, Michiganu a Pensylvánii si v nich až 7 % voličů nedokázalo mezi Trumpem a Clintonovou vybrat. Agentury je odřezávaly ze vzorku, čímž vlastně předpokládaly, že se jejich hlasy rozdělí stejně jako u voličů rozhodnutých. Tedy že jich mírná většina nakonec ukáže na Clintonovou. To ale neplatilo, protože dle exit polls si lidé, kteří se rozhodovali v posledním týdnu před volbami, vybrali ze 70 % Trumpa.

Nerozhodnutí občané přitom nebývají nepopsané listy a lze u nich zjistit, ke kterému kandidátovi mají blíž. Můžete se zeptat, jaká je pravděpodobnost, že budou volit toho a toho. Zkušenosti ukazují, že pravděpodobností přístup k preferencím nerozhodnutých respondentů výsledky výrazně zpřesňuje.

Třetím systémovým nedostatkem amerických výzkumů je práce s účastí. Týden před oficiálním termínem voleb agentury do vzorku zahrnuly se stejnou vahou respondenty, kteří říkali, že půjdou volit, i ty, kteří již volili v předtermínu. Tím ale nezohledňovaly, že u voličů v předtermínu je účast už jistá, kdežto u zbytku jen pravděpodobná. Ani to, že se voleb nakonec zúčastní i část těch, kteří zatím odpovídali, že k nim spíše nedorazí.

Preference těchto lidí přitom mohou být specifické. Ukázalo se to na Floridě. Voleb se zde zúčastnil rekordní počet občanů. K urnám zřejmě přišlo i dost lidí, kteří účast jen neurčitě zvažovali. To pomohlo smazat náskok Clintonové mezi early voters. Pokud by se výzkumníci dotazovali na preference i těch, kteří účast jen nevylučovali, a s nižší vahou je zařadili do svých modelů, dokázali by tento stav nejspíš předvídat lépe.

Daniel Prokop

Daniel Prokop

FOTO: Petr Horník, Právo

Potíž je i ve způsobu, jakým se s výzkumy pracuje. Zmiňovaná úskalí totiž obsahovala většina amerických průzkumů. Ani jejich průměrování tak nevede ke zdaleka tak jistým predikcím, jak si mnozí mysleli. Když deset lidí změří něco stejně vychýleným pravítkem, přesnější to nebude.

A slovenské volby ukázaly ještě na další problém. AKO a MEDIAN SK nebyly nejpřesnější náhodou, ale protože přísně kontrolovaly sběr pomocí nahrávek rozhovorů, a vyloučili tím pochybení na straně tazatelů.

Faktor změny situace v čase výzkumníci neobejdou, ale jejich počínání lze v rámci možností zpřesňovat. I proto jsem ve své praxi v rámci agentury MEDIAN přešel k pravděpodobnostní práci s preferencemi. Model zohledňuje, jaké strany respondent zvažuje, v jakém pořadí, i pravděpodobnost účasti. Spolu s kontrolami a důslednou reprezentativitou dat zahrnující faktory, jako jsou ekonomický status, kombinace věku a vzdělání a chování v minulých volbách, to správnosti výsledků (zatím) pomáhá.