
De ce sunt sondajele electorale adeseori gresite? De ce este rasismul gresit? De ce facem de multe ori presupuneri care se dovedesc nefondate? Raspunsurile la aceste intrebari si la multe altele similare au de-a face cu non-ergodicitatea populatiei umane. Multi oameni de stiinta sunt de acord ca ergodicitatea este unul dintre cele mai importante concepte din statistica. Asa ca, ce anume este ea?
Ergodicitatea este de obicei descrisa in termenii unor proprietati obiective ale unui ansamblu de obiecte si de multe ori discutia se pierde in detalii matematice. In felul acesta, ea devine greu de inteles. Cu toate acestea, eu o voi descrie in termeni bayesieni, subiectivisti; poate ca asa conceptul va deveni mai accesibil.
Sa presupunem ca va intereseaza sa vedeti care sunt cele mai vizitate parcuri din oras. O idee ar fi sa luati un fel de fotografie momentana: sa vedeti cati oameni sunt in acest moment in parcul A, cati sunt in parcul B si asa mai departe. O alta idee ar fi sa urmariti un individ (sau pe cativa) de-a lungul unei perioade de timp, sa zicem un an. Astfel veti putea observa cat de des se duce el in parcul A, cat de des se duce in parcul B si asa mai departe.
In felul acesta, ati obtine doua rezultate diferite: o analiza statistica a intregului ansamblu de oameni la un anumit moment de timp; si analiza statistica a unei persoane de-a lungul unei perioade de timp. Prima s-ar putea sa nu fie reprezentativa pentru mult timp, in timp ce a doua s-ar
putea sa nu fie reprezentativa pentru toti oamenii.
Un ansamblu este numit ergodic daca rezultatele celor doua tipuri de statistica coincid. Multe ansambluri, de pilda populatia umana, nu sunt ergodice.
Importanta conceptului de ergodicitate devine clara daca va ganditi asupra felului in care noi inferam diferite lucruri, cum anume noi tragem o concluzie despre ceva pe baza unor informatii despre altceva. De exempu, cineva merge la un restaurant si este incantat de felul in care a fost pregatit pestele, iar a doua oara se duce la acelasi restaurant si comanda pui, increzator ca si acesta va fi bine pregatit. De ce este el atat de increzator? Sau cineva observa ca un ziar a publicat niste informatii gresite si trage concluzia ca ziarul va publica si in viitor unele informatii gresite. De ce sunt aceste inferente corecte, in timp ce altele precum "multe dintre furturi sunt facute de tigani si prin urmare fiecare individ care este tigan este de neincredere" nu sunt corecte?
Raspunsul este ca articolele publicate intr-un ziar formeaza un ansamblu mai mult sau mai putin ergodic, in timp ce ansamblul tiganilor nu este deloc ergodic. Daca ne apucam sa cautam cate greseli sunt intr-un anumit numar al unui ziar (comparativ la numarul total de articole), iar apoi urmarim cate greseli face de-a lungul timpului un anumit ziarist (comparativ la numarul total de articole pe care le scrie) vom vedea ca cele doua rezultate sunt aproximativ egale. Daca insa vedem intr-o anumita zi cati tigani au comis un furt si impartim la numarul total de tigani, iar apoi urmarim de-a lungul vietii sale un tigan oarecare ales la intamplare, nu vom gasi ca el fura de-a lungul timpului in acelasi ritm ca rata de furturi observata la nivelul intregului ansamblu (el poate sa fure mult mai des sau mult mai rar). Prin urmare, informatiile statistice obtinute pe un ansamblu de oameni nu pot fi folosite pentru a infera ceva despre un individ particular.
Sau, pentru a lua un exemplu si mai clar: In alegeri fiecare partid obtine un anumit procent din numarul total de voturi, partidul A ia a% din voturi, partidul B ia b% si asa mai departe. Acest lucru nu inseamna insa ca fiecare om in parte voteaza de-a lungul vietii sale a% din cazuri cu partidul A, b% din cazuri cu particul B si asa mai departe (sau ca intr-o conversatie este o sansa de a% sa ia partea partidului A, b% sa ia partea partidului B si asa mai departe).
Acestea sunt exemple de cazuri de non-ergodicitate, in care nu putem folosi informatii statistice obtinute pe un ansamblu pentru a infera ceva despre un individ. Exista insa si cazul complementar, cand incercam sa inferam ceva despre ansamblu pe baza unor informatii despre cativa indivizi. Acesta este cazul de care se izbesc realizatorii de sondaje de opinie. Pentru a face aceste sondaje cat mai bine, ei nu aleg pur si simplu la intamplare indivizii ci in prealabil partitioneaza populatia in clase pe baza unor criterii (precum varsta, veniturile etc.) si numai apoi aleg la intimplare o serie de indivizi din fiecare clasa. Ideea ar fi ca, in principiu, fiecare clasa in parte sa fie un ansamblu ergodic. Acest lucru desigur nu se intampla (aceste clase sunt si ele destul de putin ergodice, cu toate ca sunt mai ergodice decat ansamblul intregii populatii), acesta fiind si motivul pentru care sondajele de opinie nu sunt prea de incredere. Mai merita de mentionat si faptul ca acea asa zisa eroare a sondajului pe care institutele de statistica o afiseaza odata cu un sondaj nu este eroarea adevarata a sondajului (eroarea reala este mult mai mare). Acea eroare afisata este calculata pe baza presupunerii ca populatia ar fi un ansamblu ergodic. (Pana in prezent nu exista nici o metoda de a cuantifica non-ergodicitatea pentru a o include in eroare.)
O problema similara este intilnita de oamenii de stiinta in general, atunci cand incearca sa deduca niste legi generale plecand de la niste experimente particulare. Cand este o generalizare corecta si cand nu? Raspunsul are de-a face cu ergodicitatea. Daca generalizarea conduce de la cazurile particulare individuale catre un ansamblu general care este ergodic, atunci ea are toate sansele sa fie corecta.
RESURSECe este formula lui Bayes?