Domov Baze podatkov Uporaba algoritmov za napovedovanje volitev: klepet z risano linijo

Uporaba algoritmov za napovedovanje volitev: klepet z risano linijo

Anonim

Drew se bo predstavil na vrhu o velikih podatkih o inovacijah, 30. in 31. januarja v Las Vegasu: http://analytics.theiegroup.com/bigdata-lasvegas, poleg govornikov iz Obame za Ameriko, Best Buy, LinkedIn, New York Times, Nokia, Bitly, Barnes & Nobles, Walmart Labs in še veliko več.


Registracijska povezava: http://bit.ly/Zs3wms


Ta intervju je opravil George Hill in objavljen v reviji Big Data Innovation Magazine.


Kakšna reakcija je bila na vaše napovedi?


Večina reakcij se je osredotočila na razliko v natančnosti med tistimi, ki smo preučevali javnomnenjske raziskave, in na napovedi priljubljenih strokovnjakov in komentatorjev "črevesja". Na volilni dan so analitiki, kot sem jaz, Nate Silver (blog New York Times FiveThirtyEight), Simon Jackman (univerza Stanford in Huffington Post) in Sam Wang (Princeton volilni konzorcij), vse Obamove možnosti za ponovno izbiro postavili na več kot 90% in pravilno predvideli 332 volilnih glasov za Obamo kot najverjetnejši izid. Medtem so strokovnjaki, kot so Karl Rove, George Will in Steve Forbes, rekli, da bo Romney zmagal - in v nekaterih primerih enostavno. To je vodilo do pogovora o "zmagi za kvante", za katero upam, da bo prišla do prihodnjih volitev.


Kako ocenjujete algoritem, uporabljen v svojih napovedih?


Moj model napovedovanja je ocenjeval izid glasovanja države in končno volilno glasovanje na vsak dan kampanje, ki se začne junija. Želel sem, da bi bila ocena teh napovedi čim bolj poštena in objektivna - in mi ne bi pustila nobenega mahanja, če bi se zmotile. Približno mesec dni pred volitvami sem na svoji spletni strani objavil nabor osmih meril za ocenjevanje, ki jih bom uporabil, ko bodo rezultati znani. Kot se je izkazalo, je model deloval brezhibno. Čez poletje je napovedovalo, da bo Obama osvojil vse svoje države iz leta 2008, zmanjšane za Indiano in Severno Karolino, in komaj popustil od te napovedi, tudi potem, ko se je septembra Obama podprl navzgor in nato po prvi predsedniški razpravi popustil.


Količina podatkov, ki jih v tej kampanji uporabljajo neodvisni analitiki in kampanje, je ogromna, kakšne posledice ima to za uporabo podatkov v letu 2016?


Kampanja 2012 je dokazala, da je mogoče z različnimi viri količinskih informacij upravljati, jim zaupati in jih uspešno uporabiti za različne cilje. Zunanji ljudje smo lahko napovedovali izid volitev daleč vnaprej. Znotraj kampanj je bilo ogromno korakov pri usmerjanju volivcev, spremljanju mnenja, zbiranju sredstev in volilni udeležbi. Zdaj ko vemo, da te metode lahko delujejo, mislim, da nazaj ni. Pričakujem, da bodo novinarji in komentatorji kampanj v letu 2016 veliko bolj resno jemali združevanje raziskav. Čeprav se zdi, da imata Obama in demokrati prednost v kampanjski tehnologiji, bi bil presenečen, če se republikanci ne bi hitro dohiteli.


Ali menite, da je uspeh te kampanje, ki temelji na podatkih, pomenil, da morajo vodje kampanj zdaj biti analitik in tudi strateg?


Voditeljem kampanj morda ni treba, da so sami analitiki, vendar bi morali bolj ceniti, kako lahko podatke in tehnologijo izkoristijo v svojo korist. Kampanje so vedno uporabljale raziskave raziskav za oblikovanje strategije in merjenje občutkov volivcev. Zdaj pa je na voljo vrsta drugih močnih orodij: spletna mesta za družbena omrežja, baze podatkov o volivcih, mobilni pametni telefoni in e-poštni marketing, če naštejem le nekaj. In to je poleg nedavnega napredka v metodologijah anketiranja in statističnega modeliranja mnenja. Trenutno se v ameriški politiki kampanje dogaja veliko inovacij.


Uspeli ste napovedati volilne rezultate 6 mesecev prej, kakšen je po vašem mnenju realni najdaljši časovni okvir za natančno napovedovanje rezultata z uporabo analitičnih tehnik?


Približno štiri ali pet mesecev je približno toliko, kolikor nas znanost zdaj dopušča; in to celo nekoliko pritiska. Pred tem ankete preprosto niso dovolj informativne o morebitnem izidu: preveč ljudi je neopredeljenih ali pa niso začeli biti pozorni na kampanjo. Zgodovinski ekonomski in politični dejavniki, za katere se kaže, da so v povezavi z volilnimi izidi, prav tako začnejo izgubljati svojo napovedno moč, ko dosežemo približno 4-5 mesečno območje. Na srečo to kampanji še vedno daje dovolj časa, da oblikujejo strategijo in sprejemajo odločitve o razporejanju svojih virov.

Uporaba algoritmov za napovedovanje volitev: klepet z risano linijo