5 powodów, dla których model wyborczy CU jest niewłaściwy

Грязная посуда — не повод для ссоры. Как пройти испытание бытовухой. 5 советов

Dwaj polityczni ekonomiści z University of Colorado niedawno opublikowali analizę wyborów prezydenckich w 2012 roku, które przewidywały, że Romney wygra. Model przyjrzał się wielu zmiennym ekonomicznym i twierdził, że ten model "prawidłowo przewidziałby wszystkie wybory od 1980 roku".

Natomiast model wyboru Nerd Wallet został stworzony przez analityków, którzy badali analizę ekonometryczną w Princeton i Stanford i przewiduje, że Obama łatwo wygra wybory.

Oba modele twierdzą, że są bezstronnymi prezentacjami faktów statystycznych bez osobistych opinii, ale dochodzą do przeciwnych wniosków. Jak to może być? Mówiąc prościej, model University of Coloado jest głęboko wadliwy. Dlatego:

5 powodów, dla których model wyborów na University of Colorado jest martwy

1. Kod modelu CU

Gdybym powiedział ci, o której godzinie pojawiłem się w pracy każdego dnia w zeszłym tygodniu, byłbyś w stanie przewidzieć, która godzina pojawiałam się w pracy każdego dnia w zeszłym tygodniu? Chcesz? Świetny! Jesteś równie dobry w modelowaniu predykcji statystycznych jak University of Colorado.

Twierdzenie, że stworzyło model, który "poprawnie przewidywałby wszystkie wybory od 1980 r." Jest kompletnym nonsensem, gdy model został stworzony przy użyciu danych ze wszystkich wyborów od 1980 r., Które same dane mają przewidzieć. W statystykach nazywamy to eksploracją danych. Właściwą procedurą byłoby wykorzystanie podzbioru danych do stworzenia modelu (być może wybory z 1980 i 1984 roku), a następnie przetestowanie modelu na "próbie historycznej" danych, które nie zostały wykorzystane do stworzenia modelu (wybory 1988-2008). Dopiero wtedy dostaniesz pretensje, że twój model jest dobry w prognozowaniu.

2. Model CU zależy od błędnych założeń.

Bezrobocie wpływa na szanse ponownego wyboru demokratycznych operatorów, ale nie na Republikanów? Wyniki republikanów są powiązane z dochodem na mieszkańca, podczas gdy demokraci nie są? Naprawdę? W statystykach należy zacząć od założeń, które mają sens, a następnie je przetestować, nie rozpoczynać od danych, a następnie pozwolić na tyle szalonych założeń, ile trzeba stworzyć model, który "poprawnie przewidział" wszystkie dane.

3. Model CU zawiera zmienne, których nie powinien …

Powrót do mojego pokazu do przykładu pracy. Gdybym dał ci dodatkowe dane na temat tego, jaką koszulę koloru nosiłbym każdego dnia i co jadłem na śniadanie, czy byłbyś w stanie lepiej przewidzieć o której godzinie pojawiłem się w pracy? Prawdopodobnie nie, ale twój model tego nie wie. Najprawdopodobniej twój model zacznie ci mówić zwariowane rzeczy (pokażę się pięć minut wcześniej w czasie, gdy jem śniadanie na śniadanie, ale dwadzieścia minut później, jeśli mam na sobie niebieską koszulę), aby dopasować wszystkie dodatkowe zmienne do dane.

Model Uniwersytetu w Kolorado robi to, ale jeszcze bardziej ekstremalnie. Używa co najmniej SIX zmiennych objaśniających, mimo że ma tylko osiem punktów danych dotyczących wyborów. Jest to zbyt wiele z punktu widzenia statystycznego i prawdopodobnie doprowadzi to do "fałszywych korelacji" (tzn. Niebieskie koszule powodują, że spóźniasz się do pracy lub bezrobocie dotyka tylko demokratów).

4 … i ignoruje ważne zmienne (jak kandydat!)

Model oparty wyłącznie na wskaźnikach ekonomicznych może być kompleksowy tylko wtedy, gdy wskaźniki ekonomiczne są jedynymi czynnikami, które napędzają wyniki wyborów. Oni nie są. Istnieją dowody na to, że kandydatura, wydatki na kampanie, a nawet pogoda, odgrywają rolę w wynikach wyborów. Weźmy skrajny przykład: co, jeśli Republikanie zdecydują się na prowadzenie konia zamiast osoby jako kandydata? Model University of Colorado powiedziałby, że koń byłby wybierany ze względu na warunki ekonomiczne, ponieważ ich model w ogóle nie uwzględnia kandydata. Każdy dobry model przewidywania wyborów musi uwzględniać gotowość wyborców ludzkich do głosowania na konkretnego kandydata.

5. Wyniki modelu CU są praktycznie niemożliwe

Nawet jeśli zignorujemy wszystkie wady metodyki modelu CU, jej wyniki są trudne do zaakceptowania, ponieważ są statystycznie prawie niemożliwe. Na przykład model CU twierdzi, że Romney wygra Pensylwanię. Jednak kiedy spodziewano się wyborców w Pensylwanii, stanęli po stronie Obamy 51-42, 49-40, 47-42, 53-42, 49-43 itd. W rzeczywistości żadna pojedyncza ankieta wśród prawdopodobnych wyborców w Pensylwanii przez cały rok nie przewiduje wygranej Romneya. Obama przewodzi prawie 10 punktom, praktycznie niemożliwym do pokonania, biorąc pod uwagę, że ponad 95% historycznych sondaży było dokładnych w 7 punktach. Nawet jeśli przyznamy model CU w Pensylwanii, nadal istnieje Ohio … Virginia … Wisconsin …

W skrócie, model CU jest kompletnym nonsensem. To naprawdę nie jest zaskakujące, biorąc pod uwagę, jak biedni polityczni ekonomiści robią prognozy, jak podaje New York Times. Ale nie wierz nam na słowo. Poniżej znajduje się podsumowanie tego, co inne modele i rynki myślą o szansach Romneya:

Modele i rynki	Oparte na	Romney	Obama	Zwycięzca?
Uniwersytet Princeton	Ankiety	12%	88%	Obama
Investmentmatome	Ankiety	20.2%	78.4%	Obama
New York Times	Ankiety	28.7%	71.3%	Obama
Washington Post	Wskaźniki ekonomiczne	41.6%	58.4%	Obama
Uniwersytet Amerykański	Wskaźniki ekonomiczne	Obama był bardzo uprzywilejowany	Obama
Betfair	Rynek zakładów	37.0%	62.1%	Obama
W handlu	Rynek zakładów	44.0%	55.2%	Obama

Szacuje się na dzień 28 sierpnia 2012 r

Joanna Pratt jest Wiceprezesem ds. Rynków Finansowych w Investmentmatome Investing, stronie internetowej zajmującej się analfabetyzmem finansowym, która pomaga inwestorom wybrać lepsze fundusze inwestycyjne na ich plany 401 (k), znaleźć lepsze usługi brokerskie online oferujące konta opcji i podejmuj mądrzejsze decyzje inwestycyjne.