Pandemija koronavirusa preplavila je javnost informacijama koje su se ogromnom brzinom širile medijima i društvenim mrežama. Zbog neizvjesnosti situacije ljudi su bili motivirani informirati se, a mediji su bili motivirani pružiti sve informacije koje imaju, što je dovelo do objavljivanja i dijeljenja različitih informacija upitne kvalitete. Postavlja se pitanje kako čitatelji mogu prepoznati koje su informacije one ispravne i čije su izjave vjerodostojne?

Svima ponekad može biti teško uspješno razlikovati kvalitetne od nekvalitetnih informacija te pronađene informacije interpretirati na adekvatan način. Dodatno, u situaciji visokog stresa, poput pandemije, mnogi nisu bili motivirani kritički promišljati o informacijama koje su dobivali, već im je važnije bilo dobiti što više informacija u što kraćem roku (više o tome možete čitati i u našem članku o lažnim vijestima). Preobilje (često kontradiktornih) informacija u javnosti je izazvalo zbunjenost i frustraciju te potaknulo sumnju u stručnjake i vlast. Ono što ljudima može pomoći u navigiranju kroz informacije koje pronalaze na internetu i u medijima jest znanstvena pismenost. Nju je najlakše definirati kao razinu razumijevanja znanosti koja je prosječnom građaninu potrebna da bi uspješno pronalazio kvalitetne i relevantne informacije te na temelju njih donosio odluke. Ne možemo svi biti stručnjaci u svim područjima znanosti, ali možemo imati osnovno razumijevanje nekih znanstvenih pojmova i postupaka kako bismo mogli prepoznati tko jest stručnjak i kojim zaključcima možemo vjerovati.

U ovom ćemo članku zato pokušati razjasniti neke osnovne znanstvene i statističke pojmove kako bismo vam olakšali prepoznavanje nepouzdanih informacija. Statistika je ogromno područje koje ne možemo sažeti u jedan članak, ali možemo vam preporučiti neke izvore za daljnje čitanje koji će vam osnove statistike objasniti puno bolje nego mi. Na engleskom jeziku to mogu biti CrashCourse Statistics, Fundamental Statistics ili Seeing Theory. Na hrvatskom jeziku preporučamo knjigu profesora Petza, Kolesarića i Ivaneca Petzova statistika – Osnovne statističke metode za nematematičare

Ukratko rečeno, statistika je skup postupaka kojima iz prikupljenih podataka pokušavamo opisati promatrane pojave i donijeti neke zaključke. Ono što statističare najčešće zanima jest: razlikuju li se neke grupe po nekim karakteristikama, jesu li neke pojave povezane, uzrokuje li jedna pojava drugu pojavu i može li se neka pojava predvidjeti na temelju neke druge pojave. Ova osnovna saznanja omogućuju nam da bolje razumijemo svijet oko sebe, da predvidimo određene ishode te da prilagodimo svoje ponašanje kako bismo povećali vjerojatnost pozitivnih ishoda i izbjegli negativne ishode. U statistici se sve zasniva na vjerojatnosti – ne možemo predvidjeti budućnost, ali možemo predvidjeti koja je budućnost izglednija, iako naše predviđanje neće uvijek biti točno jer nikada nismo 100% sigurni u svoje zaključke. Statističari uglavnom prihvaćaju maksimalno 5% rizika da su njihovi nalazi rezultat slučaja. To znači da, ako istraživanjem zaključimo da npr. smeđokose osobe imaju veće noseve od plavokosih osoba, postoji vjerojatnost od 5% da smo, primjerice, nehotice usporedili smeđokose osobe s neuobičajeno velikim nosevima i plavokose osobe s neuobičajeno malim nosevima te došli do netočnog zaključka. Tih 5% rizika smatra se dovoljno malom šansom da bismo mogli zaključiti da je naš zaključak ipak vjerojatno točan, a ako statističke analize pokažu da je taj rizik manji, povećava se šansa da smo doista na temelju svojih podataka donijeli ispravan zaključak. Ipak, sjetite se potresa u Petrinji – šansa za jači udar nakon prvotnog udara od 5 stupnjeva po Richteru bila je oko 5%, pa se idućeg dana jači udar ipak dogodio. To ne znači da je procjena od 5% bila netočna – vjerojatnost jačeg udara bila je mala, ali je postojala.

Osim statistike, u donošenju kvalitetnih zaključaka pomaže nam cijeli niz metodoloških pravila, postupaka i praksi, ali najvažniji čimbenik ipak su podaci koje prikupljamo jer ne možemo ispravno zaključivati iz nekvalitetnih ili nerelevantnih podataka. Stoga trebamo pažljivo odabrati, ne samo koje podatke prikupljamo i kako to točno činimo, već i sudionike svog istraživanja, odnosno svoj uzorak.

 

Uzorak

Uzmimo za primjer da nas zanima prosječna visina svih hrvatskih državljana. Kako bismo donijeli najtočniji mogući zaključak, trebali bismo izmjeriti visinu svih 4.076 milijuna građana RH te iz tih podataka izračunati prosjek. To bi trajalo prilično dugo i zahtijevalo puno ljudi, novca i truda. Zato se istraživači najčešće oslanjaju na uzimanje uzorka iz populacije: odabrat ćemo određen broj ljudi i izmjeriti njihovu visinu. Prvo trebamo paziti kako te ljude odabiremo – ako su u našem uzorku samo muškarci u dobi od 20-30 godina, ne možemo reći da ćemo saznati prosječnu visinu Hrvata. Ono što bismo iz takvog uzorka mogli saznati jest prosječna visina hrvatskih muškaraca od 20-30 godina. Zato nam je važno da uzorak po svojim karakteristikama bude što sličniji populaciji koja nas zanima (što se u znanosti naziva reprezentativnim uzorkom). Drugim riječima, ne smije postojati neka karakteristika koja vrijedi za uzorak, ali ne i za populaciju iz koje taj uzorak uzimamo. To se najjednostavnije postiže slučajnim (nasumičnim) odabirom sudionika, kada svaki pripadnik populacije ima jednaku šansu postati dijelom uzorka, i kada uzorak možemo smatrati „populacijom u malom”.

Drugi važan čimbenik je veličina uzorka. Ako smo izmjerili visinu deset osoba, vjerojatno ćemo dobiti različitu prosječnu visinu nego da smo izmjerili visinu tisuću osoba. Jedinu potpuno točnu prosječnu visinu dobili bismo tako da doista izmjerimo visinu svih 4.076 milijuna stanovnika, ali ako izmjerimo visinu dovoljnog broja ljudi, dobit ćemo približno točnu vrijednost. Približno točna vrijednost najčešće je dovoljno točna da bi nam bila informativna i korisna, zbog čega se znanstvenici fokusiraju na to da prikupe dovoljan broj ljudi za istraživanje. Nitko zapravo ne zna što je dovoljan broj sudionika, no pravilo jest da što prikupimo podatke od većeg broja ljudi, to ćemo točnije zaključke moći izvesti.

U stvarnosti je često teško doći do vrlo velikih uzoraka, kao i do pravih slučajnih uzoraka. Najveće su prepreke logističke prirode jer nisu svi ljudi u mogućnosti niti voljni sudjelovati u istraživanjima. Srećom, kvalitetna metodologija i ispravno provedene statističke analize nam mogu omogućiti da donosimo valjane zaključke na razmjerno malom broju ljudi. Upravo je zato osim odabira uzorka važna i provedba istraživanja, odabir alata i instrumenata koje ćemo koristiti te cijeli niz drugih aspekata kojih se u ovom članku nećemo doticati jer su o njima napisane knjige, udžbenici, znanstveni i stručni radovi.

Dotaknut ćemo se ipak još nekoliko stavki.

 

Povezanost i uzročnost

Početkom pandemije bolesti COVID-19 pojavila se teorija o povezanosti izbijanja virusa SARS-CoV-2 s pokrivenosti novom 5G mrežom. Pobornici te teorije zaključili su da 5G signal uzrokuje COVID-19, a taj su zaključak često potkrepljivali sljedećim dokazom:

 

Iz gornjih je karti vidljivo kako su novi slučajevi zaraze koronavirusom doista raspoređeni vrlo slično kao i 5G signalni tornjevi. Na prvi pogled ovaj se podatak čini intrigantnim i nije teško vidjeti zašto bi netko pomislio da su ove dvije pojave povezane, odnosno da 5G signal možda uzrokuje bolest. Međutim, stvari nisu uvijek onakve kakvima se čine. Pogledajmo još neke karte:

 

 

 

 

Ispostavilo se da u pozadini „povezanosti” 5G mreže i broja novih slučajeva bolesti COVID-19 leži nešto sasvim drugo: gustoća naseljenosti. Tamo gdje je više ljudi, bit će više 5G tornjeva i više novih slučajeva zaraze (a i više restorana brze hrane, centara za obnovu kose, mjesta održavanja koncerata itd.). Ovo je samo jedan od mogućih uzroka naizgledne povezanosti 5G mreže i koronavirusa. Pogledajmo još neke zanimljive povezanosti:

 

Možemo li na temelju ovih povezanosti zaključiti da količina konzumiranog margarina utječe na broj razvoda u nekoj saveznoj državi ili da filmovi Nicolasa Cagea na neki način povećavaju vjerojatnost utapanja u bazenu? Ne zvuči baš logično. Samo zato što jedna pojava prati neku drugu pojavu, što će ih u statističkom smislu činiti povezanima, ne znači da ta povezanost ima neki praktični značaj. Isto tako, kad istraživači utvrde da neke dvije pojave doista jesu povezane, to ne znači odmah da jedna od njih uzrokuje ili utječe na drugu. Istraživači jako paze na to da obične povezanosti ne proglase uzročnima i postoje rigorozni metodološki uvjeti koje istraživanje mora zadovoljiti kako bi istraživač smio zaključiti da je otkrio uzročno-posljedičnu vezu između nekih pojava.

 

Zaključivanje

Znanost je općenito oprezna sa zaključivanjem jer su znanstvenici bolno svjesni ograničenja i mana svojih istraživanja (nijedno istraživanje nije savršeno, zato se njihovi nalazi ponavljaju i provjeravaju). U znanstvenom žargonu uvriježene su formulacije poput može utjecati, postoje indikacije da utječe, moguće je da je povezano, postoje dokazi da i slično – to se naziva tentativnim izražavanjem, odnosno izražavanjem koje uvažava činjenicu da smo svjesni kako nikada nismo 100% sigurni u svoje zaključke. Istina nije apsolutna i posao znanosti nije otkriti istinu, nego doći do trenutno najboljih znanja. Tek nakon puno istraživanja, metaanaliza (analiza koje daju pregled dosad provedenih istraživanja i mogu imati kolektivne uzorke od više desetaka tisuća ljudi) i usporedbi s podacima iz prakse možemo zaključiti da neke stvari doista znamo: primjerice, znamo da pušenje može uzrokovati karcinom pluća i da sjedilački način života povećava rizik od razvoja kardiovaskularnih bolesti. I takvi se zaključci trebaju pažljivo interpretirati (neće svaki pušač sigurno dobiti karcinom pluća niti će svaki uredski radnik dobiti infarkt), ali svakako smo nešto iz njih saznali (pušenje je generalno štetno za zdravlje, a redovita tjelovježba je generalno dobra za zdravlje).

Znanost je proces, a znanstveni zaključci rezultat su suradnje cijele mreže ljudi. Istraživač prvo treba odrediti što želi istraživati, zatim treba pregledati postojeću literaturu i na temelju nje formulirati svoje hipoteze, nakon toga osmisliti istraživanje i pronaći kvalitetan uzorak, provesti istraživanje i prikupiti podatke, a potom te podatke treba analizirati prikladnim postupcima i iz dobivenih rezultata donijeti kvalitetne zaključke. No, tek kada istraživač dovrši svoj rad, počinje pravi znanstveni proces: rad treba proći recenziju drugih stručnjaka koji će provjeriti postoje li u njemu neke logičke, metodološke ili statističke greške, a čak i nakon što rad prođe recenziju i bude objavljen, drugi stručnjaci koji ga pročitaju mogu u njemu naći manjkavosti ili nova istraživanja mogu dati sasvim drugi uvid u donesene zaključke. Današnja tendencija medija da pišu senzacionalističke naslove kako bi privukli što veći broj klikova dovodi do objavljivanja rezultata istraživanja prije nego što je dovršen proces recenzije, kao i do prikazivanja rezultata na iskrivljen ili preuveličan način koji će privući više čitatelja. Neizbježno je da će se neki od tih prerano ili preuveličano objavljenih rezultata kasnije pokazati netočnima, a takvo klackanje može u čitateljima izazvati frustraciju i poljuljati njihovo povjerenje u znanost. Dodatno, tijekom ove pandemije javnost je dobila uvid u onaj dio znanstvenog procesa koji inače ne vidi jer znanstvenici na van prezentiraju samo one zaključke u koje su dovoljno sigurni. Prije te faze dolazi uobičajno i nužno razdoblje postavljanja i testiranja hipoteza koje se ispostave točnima ili netočnima, prikupljanje podataka te mijenjanje zaključaka, mišljenja i smjernica u skladu s tim podacima. Taj se proces tijekom pandemije odvijao pred očima javnosti i on ne dokazuje da znanost ne funkcionira – jer ona upravo tako funkcionira, uvijek, samo se takvi preliminarni rezultati inače ne obznanjuju – ali vjerujemo da je bilo frustrirajuće i zbunjujuće ne biti siguran u smjernice koje daju oni kojima bismo inače trebali vjerovati.

 

Znanstvenici nisu nepogrešivi i podložni su svim uobičajenim ljudskim slabostima. Ipak, najveći udio znanstvenika odlučio se na taj karijerni put kako bi otkrili neka nova saznanja o svijetu i ljudima. Kako bi to što bolje činili, obrazovali su se i vježbali u specifičnom području kojim se bave. Važno je razmišljati kritički i vlastitom glavom, ali još je važnije prepoznati kada su drugi u nekom području stručniji od nas i vjerovati njihovim argumentima.

Nadamo se da smo vam ovim tekstom uspjeli približiti neke osnovne ideje o znanstvenom procesu. Mogli bismo napisati još tucet ovakvih članaka i svejedno ne bismo gotovo niti zagrebali površinu ovog kompleksnog područja. Ipak, za bolje snalaženje u dobu informacija potrebno je samo malo truda i čitanja. Za kraj vam donosimo neke prijedloge: