Ole Palnatoke Andersen: Wikipedia – til at stole på?

Dette var mit manus til et arrangement i Copenhagen Skeptics in the Pub:

Alle bruger Wikipedia, og alle kan redigere, så hvordan undgår projektet at blive fyldt med skrammel? Hvem sidder i redaktionen og hvilke værktøjer bruger de? Og hvilke muligheder har jeg som læser for at vide om man binder mig noget på ærmet?

Baggrund

Wikipedia er en encyklopædi, som produceres ved hjælp af en åben wiki. Det udsagn kan vi gå i dybden med, men lad os tage emnet ved hornene først:

Ja, generelt er Wikipedia lige så meget til at stole på som alle mulige andre sekundærkilder med ukendte forfattere. Og sådan skal det også være. Indholdet kan være det pureste vrøvl, men som læser kan man på forskellige måder undersøge troværdigheden, og det er i høj grad de samme, vi som redaktører bruger.

Troværdighed

Vi kan dele troværdighedsspørgsmålet op i to vinkler, der supplerer hinanden.

Den ene er velkendt og gennemtæsket og gammeldags. Den handler om kilder og kildeangivelser. Wikipedia er ikke primærkilde, og skal ikke være det, og derfor må vi jo læne os op ad hvad der er publiceret andetsteds. Det kan vi så være bedre eller dårligere til, og i forskellige artikler vil det være mere eller mindre vigtigt.

Den anden vinkel er “wisdom of the crowd”-vinklen, hvor vi baserer os på at der er mange, der læser med og kan korrigere fejl. Her er det af betydning at artikler om vigtige emner ses af mange mennesker og at disse mennesker let kan rette de fejl, der måtte være.

Koblingen mellem vigtige emner og mange mennesker lægger naturligvis op til en cirkelslutning: Når der er mange, der læser det, er det vel vigtigt. Og det er den direkte vej til googlekratiet, som vel næppe er hvad vi vil have. På den anden side giver Google os et indblik i hvad læserne interesserer sig for.

Om det så er let at rette fejl – tja. På den ene side er det jo let nok til at vi har 184.000 artikler på dansk og 4,4 millioner artikler på engelsk. På den anden side er det åbenlyst at der er potentielle bidragydere, som standses af tekniske eller sociale barrierer.

Konkret

Historikken i den enkelte artikel gemmes jo, så man kan finde enhver tidligere version frem og sammenligne, og hvis den nye version er dårligere end en gammel, kan man ændre tilbage. Og man kan i historikken se om der har været uenighed om indholdet.

En anden ting, man kan gribe fat i, er diskussionssiden, hvor man kan se om andre har haft kommentarer til indholdet, og hvor man selv kan kommentere.

Man kan også i historikken se hvem der har bidraget, og der er naturligvis folk med større eller mindre troværdighed på forskellige områder. Det er naturligvis lidt sværere at vurdere, men efter et stykke tid får man en fornemmelse af hvilke bidragydere, der ved noget om hvad.

“Wikipedia er en encyklopædi, som produceres ved hjælp af en åben wiki.”

Tilbage til “Wikipedia er en encyklopædi, som produceres ved hjælp af en åben wiki.”

Det kan vi pinde ud – og lad os tage delene i omvendt rækkefølge:

“Wiki” – vi benytter en wiki-software, som gør at vi kan genfinde enhver version af enhver artikel. Det giver os mulighed for altid at sammenstille to versioner og vælge den bedste. Det giver os også mulighed for at kreditere hver eneste bidragyder.

“En åben wiki” – som udgangspunkt er alle velkomne; vi har ingen forhåndsgodkendelse af bidragyderne, og alle bidrag er synlige med det samme.

Og så er der produktions-vinklen: Der er ikke nogen deadline – eller også er deadline lige nu! I alt fald er alle bidrag frit tilgængelige for andres kritik og redigering, det øjeblik, man har trykket på ‘Gem’. Det er en detalje, som kan være lidt svær for nogle.

“En encyklopædi” – vi taler om en tekstmasse i en bestemt genre, og det sætter naturligvis nogle rammer for hvad vi skriver om og hvordan vi skriver om det. Disse rammer kan naturligvis justeres og skal også tilpasses til de forhold, som er anderledes for os end for Diderot.

Redaktionen

Og hvem sidder så i redaktionen? Det gør I. Og jeg. Og en masse andre. Nogle bidragydere ser vi hver dag, andre mere sjældent, men vi har hver måned over 200 skribenter med fem eller flere redigeringer. Hvad de meget aktive (over 100 redigeringer pr måned) angår, er vi derimod nok lidt pressede: I november var der kun 29 af disse – og så lavt et tal har vi ikke set siden 2006.

Vore værktøjer er netop dem, jeg har nævnt før – og her især siden med seneste ændringer, som vi er nogle stykker, der har som fast base.

Og skjulte værktøjer: Her vil jeg kun nævne et, nemlig patruljeringen, som gør at alle redigeringer bliver gennemset. Er det en træls opgave? Ja, nogle gange.

Links

https://da.wikipedia.org/wiki/Speciel:Seneste_%C3%A6ndringer

https://da.wikipedia.org/wiki/Hj%C3%A6lp:Vejledning_for_administratorer

Statistikker

http://stats.grok.se/da/latest90/Leonhard_Euler

http://tools.wmflabs.org/wikitrends/danish-uptrends-this-week.html

http://tools.wmflabs.org/wikitrends/2013.html#danish

http://stats.wikimedia.org/EN/Sitemap.htm

http://stats.wikimedia.org/EN/SummaryDA.htm

http://stats.wikimedia.org/EN/TablesWikipediaDA.htm

http://reportcard.wmflabs.org/

By Ole on 13. januar 2014 | wikipedia | A comment?

Open Data (Hack) Day 2014

Den 22. februar er det tid til Open Data (Hack) Day, og fra en del organisationer, der arbejder med den slags på forskellig vis, er vi gået sammen for at finde ud af hvad og hvordan. 2013-udgaven var med vilje ikke særligt ambitiøs, og mest af alt resulterede den i at nogle fornuftige mennesker fik talt sammen. Der blev også kodet lidt og vi var nogle stykker, der fik en intro til OpenStreetMap. Det kan vi godt gøre større næste år.

Vi har nogle hensyn at tage, for arrangørkredsen har allerede arrangementer, der ligner: #hack4dk for kultur(arvs)sektoren og Open Gov Camp for offentlige myndigheder, og naturligvis skal Open Data Day ikke kopiere disse to, men det oplagte ville jo være at sige alle sektorer og både offentlig og privat, og så prøve om vi kan få folk til at lave hacks, der går på tværs, men naturligvis også tage samtalen om hvordan også den private sektor kan få noget ud af åbenhed..

By Ole on 13. november 2013 | Ikke kategoriseret | A comment?

Open Gov Camp

I går var vi en bunke mennesker, der gemte os for regnen og legede med offentlig åbenhed til Open Gov Camp. Man kunne deltage i flere workshops, hvor forskellige myndigheder fokuserede på forskellige emner, som de gerne ville have hjælp til. SKAT ville således gerne vide, hvordan de kunne hjælpe så godt som muligt, uden at borgeren føler sig automatiseret ud på et sidespor, Kulturministeriet og -styrelsen ville gerne have inspiration til overgangen fra kulturbruger til kulturborger, og Digitaliseringsstyrelsen ville i det hele taget have folk til at rode med åbne data fra forskellige dele af den offentlige sektor. Kernen i arrangementet var Cathrine Lipperts Google-ark, som absolut er et besøg værd, også her bagefter. Hvis man er lidt til data. Jeg fik ikke hacket noget i går, men snakkede en del og fik en masse input.

Post hack stuff, 2

På opfordring lidt mere med Sejrs Sedler:

  • Kort over emnesedler (zoom, træk osv – eller se her):

    Prikkerne i USA og Belgien er vist mest af alt Google-fnidder (OK; vi fatter “Graven” i Belgien, men “Ågade” i Boston??)
  • Netværksgraf over kilder (blå) og emner (gule) (se evt. her):

    Bemærk at der er både “A.St.” og “A. St.” (og flere andre varianter) – ligegyldigt, når man bare skal se på den enkelte post, men forstyrrende for overblikket (begge forkortelser er Aarhus Stiftstidende, som er kernen i seddelsamlingen).
  • Emner i lagkagediagram (se her):

    Jeg synes der er så mange emner, at det er svært at få ordentligt overblik. Måske skal der ske noget gruppering?
  • En anden netværksgraf: emner (blå) og geodata (gule) (se her):

    Den store gule blob i midten er der, hvor der ikke er anført geodata i feltet. Det er muligt at nogle af de andre netværksforbindelser giver mening for folk med lokalkendskab?
By Ole on 7. oktober 2013 | hack4dk | A comment?

Post hack stuff

Jeg deltog en smule i #HACK4DK, men fik kun lige snuset til de præsenterede datasæt. Jeg besluttede mig til at dykke ned i et par af sættene fra Open Data Aarhus, primært Fur Fossils, men også lidt i Sejrs Sedler.

Jeg lavede ved hjælp af Google Fusion Tables fem visualiseringer:

Sejrs Sedler

  • Top 10 navne i Sejrs Sedler – diagrammet snyder med Y-aksen, men det ses, at der er 166 personer ved navn Chr. Christensen. Nogle af dem er den samme, men det er åbenbart derudover et populært navn.
  • Anførte lokationer på kort – her er der en masse data, som måske er/var entydige i Aarhus, men som ikke er det globalt. Den Skolegade 16, der er landet i Aulum, skulle jo nok være i Aarhus, og jeg kan slet ikke gennemskue, hvad der får en prik til at lande i Belgien…

Fur Fossils

  • Fossiler med geolokation. Det forlød, at alle fossilerne var fra tre steder på Fur, og at der ikke var data i tabellen om præcist hvor. Det er nok også sådan for de fleste poster, men der var alligevel nogle stykker, der var kommet langvejs fra.
  • Netværksgraf for felterne FUM-nr. og X – dette diagram giver egentlig ikke mening, men det viser noget om sammenhængen mellem de to felter. Den store blå blob forbinder alle de FUM-numre, som ikke har en værdi i ‘X’, mens blobben med nr. 2048 forbinder alle de X’er, som hører til FUM-nr. 2048 (FUM-nr. 2048 har X-numre op til 154). Tallene ude til højre er andre FUM-numre med værdier i ‘X’.
  • Fossiler efter bevaringstilstand. 81,4% af rækkerne har ingen anført bevaringstilstand, hvad der forhåbentlig betyder at denne viden ligger andre steder. Ellers må man jo få fagfolk på banen. Men ser man så på de resterende rækker, ser man behovet for datavask: 151 gange ‘ok’, 22 gange ‘OK’, 14 gange ‘Ok’. Mon ikke de betyder det samme? 90 gange ‘God’ og 54 gange ‘god’. Disse to er jo nok også synonyme. Men er god så bedre end ok? Det ved jeg så ikke, men det bør naturligvis beskrives, og dataejer skal bestemme sig for hvordan der skrives.

Dette viser værdien af visualisering i arbejdet med opkvalificering af data og af lægfolksinvolvering i kvalitetssikringen. Som det ses, har jeg ikke lavet dybe analyser, men blot brugt nogle timer på at lade Fusion Tables gøre sin ting.

By Ole on 29. september 2013 | hack4dk | A comment?


By Ole on 7. november 2012 | Ikke kategoriseret | A comment?


Jeremiah was a BullFrog – Three Dog Night – Sing-a-long


To billeder

Disse to billeder er vist af samme islandske(?) hus (nok på Frilandsmuseet):
Transplanted Iceland Home(herfra)

Jordkælder, Kongens Lyngby(herfra)
men er det et hus, som er fjernet igen, og hvor er det så i dag?

By Ole on 11. juni 2012 | wikipedia | A comment?

Geo-wiki-filosofisk spørgsmål

By enfore (Frilandsmuseet Köbenhavn) [Public domain], via Wikimedia CommonsJeg har netop oprettet en dansk Wikipedia-artikel om Frilandsmuseets tvillingegård – delvis en overættelse af den svenske artikel om Tvillinggården från Näs, og da jeg kom til bunden af artiklen, skulle jeg så finde ud af artiklens kategori-tilhørsforhold og geografi. Heldigvis kan Wikipedia-artikler udmærket være i flere kategorier, så “Skåne” og “Frilandsmuseet” udelukker ikke hinanden, men hvis man nu gerne vil have én lokation at linke til oppe i toppen af artiklen, hvad skal det så være?

By Ole on 5. juni 2012 | wikipedia | 1 comment

Comics
Hack4dk
Ikke kategoriseret
Open thread
Politik
Socialt
Statistik
Wikipedia