Iz Medijskog arhiva

Suradnja na ukupnosti znanja kroz različite jezike

Piše: Denny Vrandečić

— objavljeno u sklopu izdavačkog projekta Wikipedia@20 (izdavač MIT Press, 2020.)

Wikipedija je dostupna na gotovo tri stotine jezika, od kojih svaki ima neovisno razvijen sadržaj i perspektive. Nastavno na naučene lekcije projekata Wikipedije i Wikipodataka po pitanju običnog teksta i strukturiranog sadržaja, može se dijeliti više sadržaja među različitim jezicima te svakom jezičnom izdanju dozvoliti da se fokusira na svoje jedinstvene doprinose i unaprijediti njihovu sveobuhvatnost i aktualnost.

 

Svako jezično izdanje Wikipedije piše se neovisno o svakom drugom jezičnom izdanju. Suradnik koji piše novi članak može konzultirati postojeći članak na nekom drugom jezičnom izdanju ili čak upotrijebiti alat za prijevod sadržaja kako bi pomogao da se članak s jednog jezika prevede na drugi, ali ne postoji ništa čime se osigurava da su članci na različitim jezičnim izdanjima u skladu ili konzistentni jedan s drugim. Ovo se često smatra doprinosom raznolikosti znanja jer omogućuje da svako jezično izdanje raste neovisno o svim ostalim jezičnim izdanjima. Dakle, bi li se stvaranjem sustava kojim se sadržaji više usklađuju jedan s drugim žrtvovala ta raznolikost?

Razlike između jezičnih izdanja Wikipedije

Wikipedija se često opisuje kao čudo suvremenog doba. Na njoj postoji više od pedeset milijuna članaka na gotovo tri stotine jezika. Cilj kojim je svima omogućeno dijeljenje ukupnog znanja je postignut, zar ne?
Još ne.

Znanje na Wikipediji je neujednačeno distribuirano. Pogledajmo do kud nas je dovelo prvih dvadeset godina uređivanja Wikipedije.

Broj članaka razlikuje se između različitih jezičnih izdanja Wikipedije: englesko, najveće izdanje, ima više od 5,8 milijuna članaka; cebuano – jezik kojim se govori na Filipinima – ima 5,3 milijuna članaka; švedsko izdanje ima 3,7 milijuna članaka; a njemačko izdanje ima 2,3 milijuna članaka (cebuano i švedsko izdanje imaju veliki broj strojno generiranih članaka). U stvari, najvećih devet jezika sami imaju više od polovine svih članaka svih jezičnih izdanja Wikipedije – a ako se uzme donja polovina svih Wikipedija poredanih po veličini oni zajedno nemaju ni 10 posto ukupnog broja članaka Wikipedije na engleskom.

Različita izdanja se ne razlikuju samo po broju članaka već i po njihovoj obuhvatnosti: članak o Frankfurtu na engleskoj Wikipediji ima 184.686 znakova, sadržaj se proteže na osamdeset sedam poglavlja i potpoglavlja, devedeset pet slika, tabela i grafova te devedeset dvije reference – dok članak na hausa Wikipediji navodi da je to grad u njemačkoj pokrajini Hesse te izlistava stanovništvo i gradonačelnike. Hausa je jezik kojim izvorno govori četrdeset milijuna ljudi, a njime se kao drugim jezikom služi još dvadeset milijuna.

Nije uvijek slučaj da velika jezična izdanja Wikipedije imaju više sadržaja na neku temu. Iako čitatelji često smatraju da su velike Wikipedije obuhvatnije, lokalne Wikipedije često znaju imati više sadržaja na neku temu koja je od lokalnog značaja: engleska Wikipedija zna o luci Călărași to da je jedna od najvećih rumunjskih riječnih luka koja se nalazi na Dunavu blizu grada Călărași – i to je to. S druge strane, rumunjska Wikipedija nudi nekoliko paragrafa sadržaja o toj luci.

Teme koje različite Wikipedije pokrivaju se također preklapaju manje nego što bi se moglo pretpostaviti. Engleska Wikipedija ima 5,8 milijuna članaka a njemačka 2,2 milijuna – no samo 1,1 milijun tema obrađeno je na obje Wikipedije. Čak 1,1 milijun tema ima članak na njemačkom, ali ne i na engleskom. Prvih deset Wikipedija po aktivnost – svaka od njih s više od milijun članaka – imaju zajedničke članke samo na sto tisuća tema. Ukupno, Wikipedije na različitim jezicima pokrivaju preko osamnaest milijuna različitih tema u preko pedeset milijuna članaka – a engleska pokriva samo 31 posto tih tema.

Osim pokrivenosti tu je i pitanje koliko su aktualna različita jezična izdanja. U lipnju 2018. godine San Francisco je za svoju novu gradonačelnicu izabrao London Breed. Nakon devet mjeseci u ožujku 2019. godine proveo sam analizu tko je naveden za gradonačelnika San Francisca u različitim jezičnim verzijama Wikipedije (vidi sliku 12.1). Od 292 jezična izdanja njih 165 je imalo članak o San Franciscu. Od tih je osamdeset šest navodilo ime gradonačelnika.

Dobra vijest je da nijedan Wikipedija popis ne navodi krive gradonačelnike, ali ih je velika većina zastarjelo. Engleski se promijenio iste minute kad je London Breed položila zakletvu. No šezdeset dva jezična izdanja Wikipedije navode ranije gradonačelnike i to ne samo neposredno ranijeg Eda Leeja koji je postao gradonačelnik 2011. godine, već i Gavina Newsoma (2004-2011) kao i njegovog prethodnika Willieja Browna (1996-2004). Najzastarjeliji unos može se naći na cebuano Wikipediji koja navodi Dianne Feinstein za gradonačelnicu San Francisca. Ona je odigrala ulogu nakon ubojstva Harveyja Milka i Georga Mosconea 1978. godine i ostala je na toj poziciji cijelo desetljeće do 1988. godine – cebuano članak je bio više od trideset godina zastario. Samo dvadeset četiri jezična izdanja od osamdeset šest koji su uopće naveli popis gradonačelnika navela su trenutnu gradonačelnicu London Breed.

Još važnija metrika za uspjeh Wikipedije je broj suradnika. Engleska Wikipedija ima više od trideset jednu tisuću aktivnih suradnika – tri od sedam aktivnih wikipedista. Njemački koji je druga najaktivnija zajednica na Wikipediji ima već 5.500 aktivnih suradnika. Samo jedanaest jezičnih izdanja imaju više od tisuću aktivnih suradnika, a više od polovine svih Wikipedija ima manje od deset aktivnih suradnika. Pretpostaviti da manje od deset aktivnih suradnika može napisati i održavati obuhvatnu enciklopediju u svoje slobodno vrijeme je u najboljem slučaju optimistično. Ovi brojevi u osnovi osuđuju na propast misiju Wikimedija pokreta da ostvari svijet u kojem svatko može doprinijeti ukupnom znanju.

Wikipodatci dolaze na scenu

Projekt Wikipodatci je pokrenut 2012. godine i nudi besplatnu i slobodnu, kolaborativnu, višejezičnu bazu podataka koja prikuplja strukturirane podatke za podršku Wikipediji, Commons tj. Zajedničkom poslužitelju, drugim wikijima Wikimedija pokreta i za bilo koga drugog u svijetu. Wikipodatci sadrže strukturirane informacije u obliku jednostavnih tvrdnji kao što su „San Francisco – gradonačelnica – London Breed“, kvalifikatore kao što je „od – 11. lipnja 2018.“ i reference za te tvrdnje – na primjer poveznicu na službene izborne rezultate koje je objavio grad San Francisco.

Jedna od ovih strukturiranih tvrdnji bila bi na stranici Wikipodatci o San Franciscu koja navodi ime gradonačelnice, kako smo ranije opisali. Pojedinačne Wikipedije onda mogu poslati upit na Wikipodatke o trenutnoj gradonačelnici. Od dvadeset četiri Wikipedije koje navode trenutnu gradonačelnicu osam ih je bilo ažurirano jer su poslale upit na Wikipodatke. Nadam se da će taj broj rasti. Većim korištenjem Wikipodataka može dugoročno omogućiti obuhvatniji, aktualniji i pristupačniji sadržaj te smanjiti teret održavanja suradnicima.

Wikipodatci su razvijeni u duhu sve veće želje Wikipedije da doda strukturu člancima na Wikipediji. Primjeri toga uključuju već 2002. godine uvođenje infoboxa (infookvira) – brzog tabelarnog prikaza činjenica o temi članka – te kategorija, 2004. Kroz godine strukturirane funkcionalnosti postale su sve zamršenije: infobox se prebacio u tzv. predloške; predlošci su počeli koristiti sve sofisticiranije funkcije MediaWikija te kasnije zahtijevali razvoj još jačih MediaWiki funkcionalnosti. Kako bi se održavali strukturirani podaci stvoreni su botovi – softverski agenti koji bi trebali čitati sadržaj s Wikipedije ili nekog drugog izvora i zatim izvršavati automatska ažuriranja na drugim dijelovima Wikipedije. Prije uvođenja Wikipodataka botovi su držali sinkronizaciju jezičnih poveznica između različitih Wikipedija i doprinijeli 50 posto ili više svih uređivanja u mnogim jezičnim izdanjima.

Wikipodatci omogućili su pristup mnogim od tih aktivnosti i oslobodili Wikipedije od toga da moraju imati botove za sinkronizaciju poveznica ili za velike zadatke održavanja infoboxova. No iz ovih aktivnosti sam naučio imati povjerenja da će zajednica savladati kompleksne tokove rada rasporedivši ih među svojim članovima s različitim sposobnostima: u stvari, mali broj suradnika koji rade na zapetljanom kodu predloška i razvijaju botove može pružiti iznimno vrijednu podršku suradnicima koji se više fokusiraju na održavanje članaka i one koji pišu većinu proznog teksta. Zajednica je vrlo heterogena a različite sposobnosti i predznanja se nadopunjuju kako bi stvorile Wikipediju.

Međutim, strukturirane tvrdnje Wikipodataka imaju ograničenu ekspresivnost: njihov predmet mora uvijek biti tema stranice; svaki objekt tvrdnje mora postojati kao pojedinačan unos i stoga kao stranica na Wikipodatcima. Ako se ne uklapa u kruti model podataka, jednostavno se ne može zabilježiti na Wikipodatcima – a ako se ne može zabilježiti na Wikipodatcima, ne može se učiniti dostupnim Wikipedijama.

Na primjer, pogledajmo sljedeće četiri rečenice iz članka “Donji Humac” na otoku Braču s hrvatske Wikipedije:
Uz naselje je nalazište cijenjenoga bračkoga bijeloga kamena, što je dijelom usmjerilo njegov razvoj. I danas je tradicija obrade kamena dobro sačuvana pa je mjesto dalo poznate kamenoklesare i kipare. Stariji stanovnici bave se poljoprivredom, uzgojem domaćih životinja i lovom, a mlađi spomenutim granama, klesarstvom, ugostiteljstvom ili gravitiraju Nerežišćima gdje često pronalaze posao u raznim poljima. Ovo se mjesto ističe po lijepim starinskim kamenim kućama i zdanjima, po sačuvanoj tradiciji i raznim pučkim običajima.
Ne postoji mogući način da se izrazi sadržaj ove četiri rečenice u Wikipodatcima – jednostavna tvrdnja i struktura kvalifikatora koje podržavaju Wikipodatci ne može zabilježiti suptilnost situacije koja je ovdje opisana.

Apstraktna Wikipedija

Predlažem da pokret Wikimedija razvije Apstraktnu Wikipediju, Wikipediju u kojoj je stvarni tekstualni sadržaj predstavljen na način koji je neovisan o jeziku. Ovo je ambiciozan cilj—on zahtijeva da značajno probijemo trenutne granice predstavljanja znanja,6 stvaranja prirodnog jezika, i izgradnje kolaborativnog znanja.

Apstraktna Wikipedija mora omogućiti:
1. odnose koji povezuju više od samo dva sudionika s heterogenim ulogama;
2. kompoziciju unosa u hodu od vrijednosti i drugih unosa;
3. izražavanje znanja o proizvoljnim temama, ne samo o temi stranice;
4. poredak sadržaja kako bi se moglo predstaviti narativnu strukturu; i
5. izražavanje suvišnih informacija.

Pogledajmo zadnji od ovih zahtjeva: za razliku od rečenica baze deklarativnog formalnog znanja, ljudski jezik je obično pun suvišaka. Baze formalnog znanja obično pokušavaju izbjeći viškove, i to opravdano. No u tekstu prirodnog jezika viškovi se događaju često. Primjer toga je i sljedeća rečenica:
“Marie Curie je jedina osoba koja je dobila dvije Nobelove nagrade za dvije različite znanosti.”

Rečenica je suvišna jer postoji popis dobitnika Nobelove nagrade i disciplina u kojima su dobili nagradu – popis koji u biti sadrži svaka velika Wikipedija. No sadržaj ove rečenice se ipak pojavljuje u mnogim člancima o Marie Curie na različitim jezicima, obično u prvom paragrafu. Znači očigledno postoji nešto vrlo zanimljivo u toj rečenici, iako je znanje izraženo u njoj već u potpunosti sadržano u većini Wikipedija u kojima se pojavljuje. Ovaj oblik viška je uobičajen u prirodnim jezicima, ali ga se obično izbjegava u bazama formalnog znanja.

Tehnički detalji prijedloga Apstraktne Wikipedije navedeni su na drugom mjestu. No tehnička arhitektura je samo pola priče. Puno važnije je pitanje mogu li zajednice odgovoriti na izazove ovog projekta.
Wikipedija i Wikipodatci pokazali su da su zajednice sposobne odgovoriti na teške izazove – bilo da su oni predlošci u Wikipediji ili ograničenja Wikipodataka, zajednice su dokazale da mogu provesti obuhvatnu promjenu politike i toka rada kao i nužni razvoj tehnoloških funkcionalnosti. Ne mora svatko razumjeti cijeli sustav da bi funkcionalnost kao što je predložak postao ključni dijel Wikipedije.

Apstraktna Wikipedija je ambiciozan budući projekt. Vjerujem da je ona jedini način da pokret Wikimedija postigne svoj cilj prije nego razvije umjetnu inteligenciju koja će pisanje sveobuhvatne enciklopedije ionako učiniti zastarjelim.

Molba za raznolikošću znanja?

Kad se predstavlja ideja Apstraktne Wikipedije obično je prvo pitanje „Zar to neće uvelike smanjiti raznolikost znanja na Wikipediji?“ Zar ujednačavanje sadržaja među različitim jezičnim izdanjima ne nameće jednu točku gledišta svim jezicima? Oduzima li Apstraktna Wikipedija govornicima manjinskih jezika sposobnost da održavaju vlastite enciklopedije, imaju mjesto na kojem će na primjer izvorni govornici jačati i razvijati svoje poglede bez prisiljavanja da ih ujednačavaju s perspektivom kojom dominiraju Zapad i SAD?

Suosjećam s namjerom ovog pitanja. Njegov cilj je osigurati da se bogata raznolikost znanja zadrži i da manjinske skupine imaju prostore na kojima se mogu izraziti i održati živim svoje znanje. To su po mom mišljenju vrijedni ciljevi.

Pretpostavka da će Apstraktna Wikipedija, iz koje bilo koja Wikipedija na pojedinom jeziku može crpiti sadržaj, nužno smanjiti raznolikost je kriva. U stvari, vjerujem da je pristup većem znanju i brojnijim perspektivama ključna kako bi se postigla učinkovita raznolikost znanja te da raznolikost znanja kako je trenutno doživljavamo u projektima na različitim jezicima nije učinkovita u najboljem slučaju, a u najgorem je štetna. U ostatku eseja argumentirat ću zašto je tome tako.

Jezik nije isto što i kultura

Prvo, pogrešno je koristiti jezik kao dimenziju kojom se povlači linija razgraničenja između različitih sadržaja ukoliko pokret Wikimedija zaista vjeruje da različite zajednice trebaju razvijati i održavati svoje enciklopedije.
Ukoliko pokret Wikimedija zaista vjeruje da različite skupine ili kulture trebaju imati svoje Wikipedije, zašto postoji jedno jedino jezično izdanje Wikipedije za govornike engleskog iz Indije, Engleske, Škotske, Australije, Sjedinjenih Država i Južne Afrike? Zašto postoji samo jedna Wikipedija za Brazil i Portugal, što dovodi do mnogo sukoba? Zašto ne postoje dvije Wikipedije za američke Demokrate i Republikance?

Zaključak je da pokret Wikimedija ne vjeruje da je jezik prava kategorija po kojoj se znanje razdvaja – to je povijesna odluka koja se vodila praktičnošću. Politika koja se nalazi u srži Wikipedije, njezina vizija i misija su usmjerene na omogućavanje pristupa ukupnom znanju svakom pojedinom čitatelju/ci bez obzira na jezik, a ne na bilježenju ukupnog znanja koje se onda radi korištenja dijeli na jezike koje čitatelj/ica koristi.

Podjela po jezicima dovodi do problema kojim je manjim zajednicama govornika lakše „ispasti iz tračnica“– bilo da postanu vrlo pristrane u cjelini ili da usvoje problematična pravila i procese. Činjenica da veće zajednice imaju različita pravila, procese i ishode može biti vrlo dobro za Wikipediju u cjelini jer mogu eksperimentirati s različitim pravilima i pristupima. No ne čini se da je to točno u slučaju kad zajednice padnu ispod određene veličine i razine aktivnosti, kad nema dovoljno očiju, čime bi se izbjegao razvoj loših ishoda i tradicija.

Na primjer, članak o suknjama u bavarskoj Wikipediji ima slike ispod suknje, jedne porno glumice, anime i video koji pokazuje crtež žene čija suknja postaje sve kraća. Članak je postao takav u roku dan dva nakon što je nastao i iako ga je od tad uređivalo nekoliko različitih suradnika ostao je takav posljednjih sedam godina. (Ovdje se opisuje članak u trenutku pisanja ovog teksta – nadam se da će se objavom ovog poglavlja taj članak konačno očistiti).

Pogled na neke Wikipedije na južnoslavesnkim jezicima

Drugo, prirodni eksperiment je u tijeku tamo gdje suradnici, razdvojeni više političkim nego jezičnim razlikama, imaju zasebne Wikipedije. Postoje pojedinačna jezična izdanja Wikipedije za hrvatski, srpski, bosanski i srpsko-hrvatski jezik. Lingvističke razlike među hrvatskim dijalektima su često veće od razlika između standardnog hrvatskog i standardnog srpskog. Postojanje srpsko-hrvatske Wikipedije naročito postavlja zanimljiva pitanja o ovim linijama razgraničenja.

Hrvatska Wikipedija okrenula se gledištu koje se smatra problematičnim. Određeni događaji i hrvatski akteri tijekom Domovinskog rata 1990-ih ili marionetska fašistička država 1940-ih su ponekad predstavljeni u boljem svjetlu nego u većini drugih Wikipedija.

Ovdje su dvije opservacije utemeljene na mom radu na Wikipedijama na južnoslavenskim jezicima:
Prvo, tvrdnja da mišljenja kojima se opravdava fašizam unutar Wikipedije povećavaju raznolikost znanja u svim Wikipedijama može tehnički biti točna, ali je praktično nedostatna. Da bise od te raznolikosti profitiralo od čitatelja zahtijeva ne samo da čita na nekoliko različitih jezika već i da se udubi toliko da uloži vrijeme i interes u čitanje samog članka na nekoliko jezika što je uglavnom nevjerojatno dosadno jer se puno sadržaja preklapa. Nalaženje sočnih razlika je sve samo ne lagano, naročito kad se ima na umu da većina čitatelja čita Wikipediju s telefonskih uređaja i zanima ih samo brza informacija iz izvora čijoj uredničkoj politici vjeruju.

Većina čitatelja čita samo jednu jezičnu verziju pa je stoga bilo kakva raznolikost koja postoji u različitim jezičnim izdanjima praktično izgubljena. Samo postojanje ove raznolikosti bi moglo biti kontraproduktivno jer se može argumentirati da zajednice ne bi trebale trošiti resurse na reflektiranje stvarne raznolikosti jedne teme u svakom pojedinom jeziku. To bi zacementiralo praktičnu beskorisnost raznolikosti znanja u svim jezicima.

Drugo, mnogi suradnici koji pišu članke s određene točke gledišta u hrvatskoj Wikipediji također doprinose engleskoj Wikipediji u člancima na iste teme, ali tamo su iznenada prisiljeni na kompromis i na uključivanje puno šireg raspona mišljenja. Možemo se nadati da bi suradnici preuzeli raznolikija mišljenja i prenijeli ih u svoju domaću Wikipediju, ali to često nije tako. Ako suradnici imaju određeno mišljenje (a tko nema?) ono često dovodi do situacije u kojoj oni to mišljenje nameću onoliko koliko im se u svakom projektu dozvoli.
Trebamo primijetiti da najočiglednija odstupanja od neutralnog mišljenja u Wikipedijama poput hrvatske Wikipedije nećemo naći u središnjim člancima već u velikoj periferiji članaka oko tog središnjeg članka na koje je puno teže paziti.

Apstraktna Wikipedija i raznolikost znanja

Prijedlog Apstraktne Wikipedije ne zahtijeva da je koristi ijedno jezično izdanje. Svaka jezična zajednica može odlučiti u svakom pojedinom članku želi li ga povući iz Apstraktne Wikipedije ili ga želi stvoriti zasebno u svom jeziku. Čak se i ta odluka može preciznije baždariti: za pojedini članak suradnik može odlučiti da u njega uključi dijelove ili paragrafe iz apstraktne Wikipedije.

Ovo omogućava pojedinačnim zajednicama Wikipedije luksuz da se u potpunosti koncentriraju na razlike koje su njima važne. Dobro se sjećam situacije kad sam započeo hrvatsku Wikipediju: osjećao sam breme da prvo napišem članak o svakoj zemlji na svijetu prije nego sam mogao pisati članke koji su mi bili važni poput onoga o maminom rodnom selu, jer kako bi itko mogao opravdati opću enciklopediju koja ne bi imala ni jedan članak o Nigeriji, zemlji koja ima sto milijuna stanovnika, ali bi imala članak o Donjem Humcu, selu sa 157 stanovnika? Zar ne biste trebali imati prvo članak o svim kemijskim elementima od kojih se sastoji svijet pa onda pisati o lokalnoj hrani?

Apstraktna Wikipedija oslobađa neko jezično izdanje ovog tereta i dozvoljava svakoj zajednici da se u potpunosti posveti onim dijelovima koji su im najvažniji – i da jednostavno uveze članke iz zajedničkog izvora za one teme koje su im manje važne. Ona omogućava zajednici da donese takve odluke. Kako se zajednice razvijaju i mijenjaju mogu se vratiti tim odlukama u bilo kojem trenutku i promijeniti ih.

Istovremeno, Apstraktna Wikipedija čini razlike vidljivijima jer one postaju eksplicitne. Trenutno ne postoji jednostavan način da se odredi je li Dianne Fenstein u cebuano Wikipediji navedena kao gradonačelnica San Francisca zbog kulturne posebnosti jezične zajednice cebuano ili ne. Jesu li različiti brojevi stanovnika u Frankfurtu na različitim jezičnim izdanjima namjerni izraz raznolikosti znanja? S Apstraktnom Wikipedijom pojedine zajednice bi mogle eksplicitno odabrati koje članke žele pisati i održavati sami, te istovremeno maknuti mnogo nenamjernih razlika.

Čineći ove odluke eksplicitnijim postaje moguće zamisliti učinkovit tok rada koji poštuje te namjerne razlike i koji utire put njihovoj integraciji u zajednički članak u Apstraktnoj Wikipediji. U ovom trenutku postoji 166 različitih jezičnih verzija članka o kemijskom elementu heliju. U osnovi je nemoguće da ih jedna osoba pročita i pronađe sadržaj koji je namjerno različit u njima. S Apstraktnom Wikipedijom koja sadrži zajednički dijeljeno znanje, suradnici , istraživači i čitatelji mogu zaista pročitati one članke koji namjerno zamjenjuju ili dodaju sadržaj tekstu članka koji je zajednički dijeljen, procijeniti razlike i odlučiti žele li suradnici integrirati te razlike u zajednički članak.

Razlike u sadržaju možda odražavaju razliku u pravilima, naročito pravilima značaja i pouzdanosti. Iako se na prvi pogled može činiti da Apstraktna Wikipedija zahtijeva jedinstvene kriterije značaja i pouzdanosti u svim Wikipedijama tome nije tako: zahvaljujući činjenici da lokalne Wikipedije mogu preklapati i potisnuti sadržaj iz Apstraktne Wikipedije one mogu prilagoditi prikazani sadržaj na svojoj lokalnoj Wikipediji na temelju svojih pravila. A veća vidljivost takvih odluka dovest će do lakše identifikacije pristranosti kao i do, nadajmo se, ažuriranih pravila kojima bi se smanjile te pristranosti.

Nova infrastruktura za inicijativu

Apstraktna Wikipedija će razviti Wikipedijinu infrastrukturu za inicijativu.

Trenutno se mnogi manje zastupljeni jezici koriste u višejezičnim područjima. Često se neki drugi jezik kojim se govori u tom području smatra prestižnijim jezikom pa je stoga on jezik obrazovanja i književnosti, a manje zastupljeni jezik ima manji prestiž. Pa i kad manje prestižni jezik ima više govornika najvjerojatnije će suradnici Wikipedijine zajednice – obrazovani ljudi koji si mogu priuštiti pristup internetu i dovoljno slobodnog vremena – moći doprinositi na oba jezika.

Na kojem bih jeziku trebao doprinositi? Ako pišem članak o majčinom rodnom selu na hrvatskom učinit ću ga dostupnim za nekoliko milijuna ljudi. Ako članak o majčinom rodnom selu pišem na engleskom, on postaje dostupan za nekoliko stotina puta više ljudi! Posao bi mogao biti isti, ali korist je za nekoliko redova veličine veća: postavlja se pitanje želim li podučiti svijet o lokalnoj tradiciji ili svom narodu pričam o njegovoj tradiciji? Svijet je veći i time je vjerojatnije da će reagirati pa se tako stvara pozitivna povratna sprega.

Na ovaj način se zajednice lokalnih jezika kanibaliziraju jer se okreću engleskoj Wikipediji koja se smatra globalnom zajednicom znanja (ili drugim prestižnijim jezicima poput ruskog ili francuskog). Ovo se odražava i u mnogim novinskim i akademskim člancima o Wikipediji pri čemu se engleska Wikipedija shvaća kao prava Wikipedija. Iako je poznato da Wikipedija postoji na mnogim drugim jezicima, novinari i istraživači, često nenamjerno, smatraju englesku Wikipediju Jedinom pravom Wikipedijom.

Druga važna prepreka za regrutiranje suradnika za manje zajednice Wikipedije se vrlo rijetko eksplicitno proziva. Prilično je jasno s obzirom na trenutnu arhitekturu da su ove Wikipedije osuđene na propast kad je u pitanju postizanje njihove misije. Kako smo gore argumentirali više od polovine jezičnih izdanja Wikipedije imaju manje od deset aktivnih suradnika – a pisanje obuhvatne aktualne Wikipedije nije cilj koji se može postići s tako malo ljudi koji pišu u svoje slobodno vrijeme. Alati za prijevode koje Zaklada Wikimedija nudi mogu uvelike pomoći u nekim okolnostima 12—ali za većinu jezika Wikipedije automatski model prijevoda niti ne postoji i stoga ne može pomoći onim jezicima kojima je najpotrebniji.

S Apstraktnom Wikipedijom, međutim, cilj da se pruži sveobuhvatna i aktualna enciklopedija na gotovo svim jezicima postaje mnogo opipljiviji. Umjesto da se preuzima zadatak stvaranja i održavanja cijelog sadržaja, trebalo bi se stvoriti samo gramatičko i leksičko znanje nekog jezika. To je daleko manji zadatak. Nadalje, ovo gramatičko i leksičko znanje je komparativno statično – ono se ne mijenja toliko često kao enciklopedijski sadržaj Wikipedije pa se tako ogromni stalni zadatak pretvara u razvoj i održavanje sadržaja bez velike potrebe za održavanjem koje moraju osigurati pojedinačne jezične zajednice.

Da, Apstraktna Wikipedija će zahtijevati više različitih sposobnosti od neke zajednice koja se tek ima stvoriti, a izazov će biti koliko nov toliko i velik. No zajednice mnogih Wikimedija projekata iznova dokazuju da se mogu nositi s kompleksnim izazovima s genijalnom kombinacijom procesa i tehnoloških napredaka.13 Wikipedija i Wikipodatci su pokazali sposobnost da se crta na tehnološki prilično jednostavnim platnima i stvori izvanredno bogato i kompleksno djelo koje može odoljeti zubu vremena. Apstraktna Wikipedija nastoji postaviti još jedan izazov zajednicama a ovaj put obećava ništa manje nego napokon postići konačni cilj: omogućiti svima, bez obzira na njihov materinji jezik, da dijele ukupno znanje.

Zahvale:
Hvala Jamie Taylor, Daniel Russell, Joseph Reagle, Stephen LaPorte, i Jake Orlowitz na vrijednim savjetima za unapređenje članka.

Prevela: Miljenka Buljević

 

više