Hoten mot Wikipedia

https://commons.wikimedia.org/wiki/File:Wikidata_Map_October_2015_Big.png, Addshore, CC0

Det här är texten till en 12-minuterspresentation som Lennart Guldbrandsson höll under konferensen ReadMe den 13 april 2016. Rubriken i programmet var ”Wikipedias särställning i faktalandskapet – kommer den att bestå?” Bilderna finns här.

Varje månad har Wikipedia en halv miljard besökare. Det är den enda informationssajten på världens tio mest besökta webbplatser.

De som läser tar Wikipedia på allvar. Journalister citerar Wikipedia. Politiker fattar beslut baserade på Wikipedia. Pubquiz avgörs av det som står på Wikipedia.

Och som vi brukar säga: När Wikipedia ligger nere då blir hemtentorna försenade.

Snacka om vilket ansvar vi har, att det blir rätt.

Men det finns några hot och utmaningar.

Först tänkte jag bara visa de här bilderna:


https://commons.wikimedia.org/wiki/File%3ACarcharodon_carcharias.jpg, Sharkdiver.com, public domain, https://commons.wikimedia.org/wiki/File%3A20140805_liege12.JPG, Jean Housen, CC BY- SA 4.0

Vilken är farligast?

Det är lätt att tro att hajen är farligast. Med den där hemska musiken…

I själva verket är godisautomaterna dubbelt så farliga.

Inte nog med att godisautomater kan falla över en eller ge en stötar. De är dessutom fulla med godis…

Anledningen till att jag tar upp det här är att det finns en hel del exotiska faror som kanske egentligen inte är så farliga.

Innan vi kommer till verkliga hoten ska vi därför titta på fem saker som folk brukar tro är de stora hoten, men som egentligen inte är det.

Går det att lita på Wikipedia?

Uppenbarligen.

Media ställer den frågan hela tiden, men allmänheten fortsätter att använda Wikipedia. Jag tror att det beror just på att vi wikipedianer sätter ut de där skyltarna om att det till exempel saknas källor.

Folk gillar att man säger till när man inte vet.

Ironiskt sett visar det sig att de som är mest kritiska till Wikipedia, det är faktiskt de som skriver på Wikipedia.

Vi skriver helt enkelt för att göra något åt bristerna.

Är klotter ett hot?

När folk hör att vem som helst kan skriva på Wikipedia brukar de alltid undra om det blir mycket klotter.

Visst klottrar folk, men i genomsnitt tas klottret bort på 1-2 minuter.

Det går så snabbt eftersom vi har automatiska filter. Lite har vi ju lärt oss genom åren.

Dessutom finns det många frivilliga som bevakar det som händer.

Risken att man stöter på klotter är alltså mycket liten.

Vi har helt enkelt löst problemet med de elaka kommentarsfälten.

Hur är det med alla som vill marknadsföra sig på Wikipedia då?

En del företag och politiker betalar folk för att skriva positiva Wikipedia-artiklar.

Det här tar nästan lika kort tid att upptäcka. Resultatet blir en blockering för att ha brutit mot Wikipedias regler. Eller att media får reda på det.

Castle_reflecting_in_the_water_-_Gustave_Le_Gray
https://commons.wikimedia.org/wiki/File:Castle_reflecting_in_the_water_-_Gustave_Le_Gray.jpg, Gustave Le Gray, public domain

Är upphovsrätt ett problem?

Nyligen kom ett beslut från Högsta Domstolen – och jag ska inte gå in på det i detalj, men det kunde låta som att vi på Wikipedia stjäl bilder. Det gör vi verkligen inte.

Wikipedia är i själva verket en av de mest upphovsrättsmedvetna sajterna.

All text ligger under en fri licens.

Alla bilder är fria att använda, så länge man anger källa, skapare och licens, så att nästa person kan hitta bilden och använda den.

Alla ofria bilder raderas.

Det här gör att vi får massor av bilddonationer från arkiv, bibliotek och museer runt om i världen.

Fotografiet här ovan exempelvis har vi fått från Regionarkivet i Göteborg. Det är ett exempel på tidig bildmanipulering, från någon gång på 1850-talet.

Är Wikipedias programvara föråldrad?

Vi vet att de flesta tänker på Wikipedias programvara som lite utdaterad, jämfört med hur enkelt det är att twittra eller facebooka.

Men testa den nya redigeringsfunktionen! Du kommer nog att bli positivt överraskad. Det är ungefär som att skriva i ett vanligt ordbehandlingsprogram.

Och man får gärna lägga till bilder och filmer. Det vet vi att det saknas. Så länge de är fritt licensierade, vill säga.

Wikipedia har dessutom många verktyg som få andra av de stora webbplatserna har: Vår sökfunktion har massor av möjligheter.

Och det finns massor av extrafunktioner.

Men vi är alldeles för blygsamma för att göra en stor sak av det. Det kanske är det som är problemet.

Därmed kommer vi in på vad de verkliga hoten mot Wikipedia är. Vilka är godisautomaterna?

Jag ska ta upp tre sådana stora hot.

Nybörjarna vs veteraner

Ni har säkert hört om det här. Någon har försökt att redigera på Wikipedia för första gången och kraschat rakt in i några av våra veteraner.

Det här är naturligtvis inte kul för nybörjarna. Många slutar efter sina första försök och kommer inte tillbaka.

Det är inte kul för veteranerna heller. De står mitt i floden av skolklotter. Kanske har de inte tid att förklara reglerna för femtionde gången den dagen.

Risken är att vi skrämmer bort alldeles för många nybörjare. Vem ska då hjälpa till att ta hand om alla artiklar?

Än så länge är det ingen överhängande fara, men vi behöver ändra på det här nu.

Skrivstuga i Göteborg i juni 2014, Lennart Guldbrandsson, public domain
Skrivstuga i Göteborg i juni 2014, Lennart Guldbrandsson, public domain

Ett grepp för att få bort den här motsättningen är att välkomna nybörjarna in i gemenskapen och se till så att de stannar tillräckligt länge för att lära sig systemet.

Engelskspråkiga Wikipedia startade en sida där nybörjarna får ställa frågor i lugn och ro. Där har de faddrar som hjälper dem tillrätta.

De som började på den här sidan fortsatte oftare att redigera Wikipedia.

I Sverige har vi istället satsat på skrivstugor.

I Göteborg där jag bor har vi haft skrivstugor en gång i veckan i över två år vid det här laget.
Där hör vi hela tiden hur intressant det är för besökarna att få ansikten på någon som skriver på Wikipedia. Och någon som pushar en att fortsätta skriva. Som en personlig tränare.

Dessutom får man fika.

Wikipedia är inte globalt

Det andra hotet, eller godisautomaten om man så vill, är lite lättare att se.

https://commons.wikimedia.org/wiki/File:Wikidata_Map_October_2015_Big.png, Addshore, CC0
https://commons.wikimedia.org/wiki/File:Wikidata_Map_October_2015_Big.png, Addshore, CC0

På den här bilden har vi placerat ut alla artiklar (på Wikidata) som har koordinater i sig.

Det ser väldigt tunt ut på vissa ställen, va? Om inte Wikipedia kan minska bristen på information där den behövs som bäst, då är det ett ganska meningslöst projekt.

Vi är med andra ord inte särskilt globala, utan skriver om sådant som finns omkring oss. Alltså samma problem som Blankspot försöker lösa.

En del av lösningen är att ta hjälp av program som tar information från öppna databaser och sen skriver artiklar.

Det visar sig att artiklarna lockar både läsare och nya skribenter.

Framför allt är det här en utmärkt hjälp till små språkversioner där det inte finns så många wikipedianer. Och kanske inte så många uppslagsverk heller.

På det sättet kan vi ge flera miljarder människor den information de behöver.

Det här problemet kräver förstås att fler får tillgång till internet, men vi har ett så gott rykte att folk vill hjälpa oss. Så vi är hoppfulla där.

Kvinnounderskottet

Nu kommer vi till det sista övergripande problemet.

Det är inte bara personer utanför USA och Europa som inte bidrar till Wikipedia. Den största gruppen som är frånvarande är kvinnor.
10 män 1 kvinna utan Elsa-page001

Våra bästa undersökningar tyder på att bara omkring en av tio som skriver på Wikipedia är en kvinna.

Man har alltså mer än dubbelt så stor chans att stöta på en kvinnlig säkerhetsvakt än en kvinnlig wikipedian.

De flesta är överens om att det här påverkar innehållet på olika sätt.

  • I dagsläget är det bara en av fyra biografier som handlar om en kvinna.
  • Artiklar om kvinnor blir oftare raderade för att männen inte känner till dem.
  • Artiklarna om kvinnor fokuserar mer på deras familjer än på deras prestationer.

Vad vi kan se är den här vinklingen oftast inte gjord av illvilja, utan bara av gammal vana.

Därför har vi ägnat tid åt att göra folk uppmärksamma på den här skevheten.

Men problemet försvåras av att Wikipedia nästan alltid är en spegling av samhället.
Vi är bland annat styrda av vilka källor som finns. Och media skriver mer om män än om kvinnor. Den saken kan vi alltså inte lösa på egen hand.

Det som är positivt i den här frågan är att folk tenderar att överskatta hur stort problemet är.

Jag sa nyss att det bara är en av tio som är kvinna. Men hur många är de där tio egentligen?

10 män 1 kvinna-page001I Sverige föds det ungefär 750 flickebarn varje år som får namnet Elsa.

Om lika många kvinnor hade gjort fem redigeringar per månad hade det varit jämnt med männen.

Det är allt. 750 kvinnor som gör mer än 5 redigeringar per månad. Det är lite som att se jordens atmosfär. Det är bara en tunn hinna som skyddar jorden.

På engelskspråkiga Wikipedia behövs det 30 000 kvinnor som gör mer än 5 redigeringar i månaden. Men de har omkring en halv miljard kvinnor att ta av.

5 redigeringar på en månad. Det motsvarar en halvtimme om dagen, högst.

Det mest framgångsrika sättet att lösa kvinnounderskottet är de studentprogram vi har i USA, där mer än hälften av alla som deltar är kvinnor.

De får lära sig hur Wikipedias system fungerar och att komma in i gemenskapen, som en del i universitetsutbildningen. De älskar det.

Nu hoppas vi bara att de ska fortsätta att redigera när de slutar, för då kommer problemet att vara löst.

Så småningom. De har ju mer än ett dussin år att ta ikapp.

Så där har ni de tre stora hoten mot Wikipedia: veteranerna och nybörjarna som krockar, den globala snedfördelningen och kvinnounderskottet.

Alla de här hoten är alltså mycket större än klotter och försök att vinkla artiklarna.

Men det vi uppfattar som hot säger också något om oss själva.

Många gånger innebär hotet nämligen att vi måste ändra på oss.

Det kan handla om att vi måste byta inställning, som i krocken mellan nybörjare och veteraner.

Eller så kan det handla om att vi måste försöka fokusera på någon annan, utanför vårt vanliga intresseområde, som i behovet av att göra Wikipedia mer globalt.

Eller så kan det handla om att öppna ögonen för sina egna fördomar eller våga testa något nytt, som i fallet med kvinnounderskottet.

Om vi gör det, tror jag att vi kan göra något större.

Wikipedia står på giganters axlar. Men vi vill hitta fler giganter i hela världen så att nästa generation har ännu högre axlar att stå på.

Det vore fantastiskt om ni hjälpte till.

Tack.

Media uppmärksammar problemet med Digidaily

Kungliga Biblioteket (KB) har ett viktigt uppdrag: att vara Sveriges nationalbibliotek. Det innebär bland annat att samla ihop allt som trycks i Sverige. Många som jobbar där gör fantastiska insatser.

Men det finns en uppenbar lucka i deras uppdrag: internet. Hur ska man göra med internet-sidor? Ska de också samlas in och bevaras för eftervärlden? Ett tag gjorde man det. Det är en sida av myntet, som vi ska se.

I dagarna har KB fått kritik från blivit uppmärksammade av de två största aftontidningarna, Expressen och Aftonbladet. I serien Samlandets vånda skrev Per Wirtén under rubriken In i dimman om projektet Digidaily som KB driver, och som går ut på att digitalisera svenska dagstidningar. Det låter väl bra? Så här skriver Wirtén:

Med pengar från EU, i samarbete med Riksarkivet och med lite extra sponsorpengar från mediakoncernen Schibsted har de, på eget initiativ, digitaliserat hela Aftonbladets och Svenska Dagbladets utgivning fram till 2010. Utländska experter är lyriska. Kvaliteten är i världsklass och kostnaderna rekordlåga.

Svenska kultur- och forskningspolitiker borde åka på europaturné med Digidaily, men ingen verkar särskilt engagerad. I stället för succé ligger projektet i limbo. De har tre miljoner tidningssidor klara. Men ingen kan läsa dem. Digidaily avslöjar digitaliseringspolitikens frånvaro.

De har inte haft pengar att ta fram ett så kallat gränssnitt, den programvara som gör att man enkelt kan läsa och göra snabba sökningar på sin datorskärm. Deras mål är att få fram ett till nästa sommar. Men för att helt säkert undvika bråk om upphovsrätten kommer bara tidningar före 1863 göras tillgängliga.

Några dagar senare skriver Aftonbladets Oisín Cantwell en artikel med rubriken Sveriges upphovsrätt – ibland är den helt fel. Han tar också exemplet Digidaily:

Cirka 1,5 miljoner sidor har scannats in, men tidningen kommer dessvärre bara att vara sökbar från grundandet 1830 fram till och med 1863, året då Alfred Nobel för övrigt uppfann dynamiten.

Orsaken: Ett verk är skyddat i 70 år efter upphovsmannens död. Och strängt taget vilket trams som helst kan utgöra ett sådant.

Säg att någon vid tio års ålder på 1800-talet fick en teckning införd i Aftonbladet och sedan kämpade vidare tills hen avled vid 90.

80 år hade då förflutit sedan publiceringen. Lägg till 70 upphovsrättsliga år och vi får 150. Så långt tillbaka i tiden måste vi gå för att någon slug advokat inte ska börja tjafsa.

Det är med denna matematik jurister har kommit fram till att Aftonbladet efter 1863 inte görs tillgänglig.

Det är verkligen glädjande att svensk mainstream-media börjar ta upp den här grejen. Själv har jag argumenterat tillsammans med flera andra på Digidailys blogg. De ställde nämligen frågan öppet om hur allmänheten såg på det här med tillgängliggörandet. Och de fick svar… Övervägande antalet personer – nej, stryk det – alla som skrev på deras blogg tyckte att de gott kunde tillgängliggöra saker längre fram i tiden. Digidaily skrev då ett blogginlägg där de förklarade att de visserligen efterlyst åsikter, men att de inte tänkt lyssna på dem. De hade ju rätt! (Läs gärna kommentarerna också för ett exempel på ”skygglappar på!”)

Här kommer frågan om internet tillbaka, för Digidaily har alltså fått massor av pengar för att genomföra ett projekt, nämligen att digitalisera dagstidningar. När KB såg den projektbeskrivningen lade de pengarna på scanningsutrustning, löner och mjukvara för att tolka texterna så att de skulle bli läsbara. De hävdar nu att de inte har fått några pengar för att tillgängliggöra materialet (ett gränssnitt kommer 2014, sägs det). Men det ligger i deras tolkning av projektbeskrivningen. Man kan också se det så här: de har fått massor av pengar för att skjutsa sin sambo till jobbet och då köpt en bil för pengarna. När sambon sedan kommer ut till bilen startar inte bilen eftersom de inte köpt någon bensin, trots att det är en förutsättning för att bilen ska fungera. Om KB hade haft fokuset att tidningarna skulle digitaliseras på riktigt, då hade man lagt en del av pengarna på gränssnittet.

Hela processen ska vara med för att det ska kallas för digitalisering. (Klicka för större bild.)

Alternativt hade man kunnat vända sig till någon som redan har tillgängliggjort en massa upphovsrättsligt fritt material på internet under 20 år och fått hjälp med gränssnittet. Men det har inte varit aktuellt. På KB har man nämligen valt att bortse från alla som inte kan ta sig till KB. Internet ses där som ett problem, inte som ett verktyg. (”Och bilen gör sig ju bra i garaget.”)

Inom Wikimedia Sverige har vi arbetat tillsammans med många företrädare för arkiv, bibliotek och museer (vanligen förkortat ABM) eftersom vi har så många gemensamma mål. Vi har givetvis träffat KB, och de är både trevliga och hjälpsamma, men de får aldrig den där ordern uppifrån att göra material tillgängligt. Är det en pengafråga? Är det en upphovsrättsfråga?

Låt oss titta lite på grannarna i väst. I Norge har man ett Nasjonalbibliotek som har gjort en spännande resa. De har kastat om verksamheten. I en presentation under konferensen Digikult (som Wikimedia Sverige var med och anordnade) rapporterade Svein Arne Brygfjeld från deras projekt Bokhylla.no. I korthet går det ut på att Nasjonalbiblioteket gjorde en gigantisk överenskommelse med fackföreningarna för författare, etc, så att de skulle kunna ge ut böckerna på nätet, även för material som fortfarande skyddas av upphovsrätten. Just nu har de 128112 böcker och 100306 tidningar i fulltext (varav en del bara är läsbara inom Norges gränser). Och de har massor av besökare som gillar tjänsten.

Drömmen för många är att KB lyckas sluta samma sorts avtal. Tänk att kunna bläddra i i stort sett samtliga svenska böcker på nätet! Men kommer det att ske?

Mitt tips: håll inte andan. Om det dröjer ända till 2014 innan man börjar köpa bensin till bilen, då kan det dröja tills Povel Ramels verk hamnat i den kulturella allmänningen innan vi får se samma sorts projekt här. Tills dess kommer KB att bli ifrånsprungna av de flesta andra länders nationalbibliotek, för att inte tala om många svenska ABM-institutioner.

Så vad borde KB (och andra ABM-institutioner) göra? Här är ett enkelt recept:

1. Börja med allmänheten. Var finns de någonstans? Vad vill de ha?

2. Finns det något sätt ni kan ge dem det? Om man använder internet slipper man mycket återkommande hantering av samma material.

3. Vad finns det för juridiska möjligheter? Om problemet är upphovsrättslagen, lobba uppåt så att det går att göra någonting. Det här kommer troligen aldrig att bli en valfråga, så därför är det upp till dem som jobbar med området att berätta för lagstiftarna vad som behövs. Tänk då på nummer 1 ovan: allmänheten.

4. Prata med andra som redan gör det ni funderar på att göra. Vad är deras råd? Riksantikvarieämbetet, Livrustkammaren och Regionarkivet är tre förslag att börja med. Vad skriver de? Vad har de för praxis?

5. Titta inte enbart på avtalslicensfrågan som lärdom från Bokhylla.no. De flyttade ganska många av sina personalresurser till att jobba med internet eftersom det är där allmänheten befinner sig idag. Allt annat är att elda för kråkorna.

6. Läs Kulturskatter på nätet. Det är en trevlig skrift från Wikimedia Sverige där vi har samlat alla råd och tankar från våra möten med ABM-sektorn. Den bygger helt och hållet på uppphovsrättslagen. Den finns också i tryckt form. Dessutom: vi har gått igenom den gång på gång, men det kan ändå hända att vi begått något fel. Och om det finns några fel i den, så rättar vi dem gärna! Det är nämligen så man lär sig. Och därför blir det sista rådet att…

7. Testa. Se vad som händer. Det får myndigheter också göra! I alla fall om man är mån om att vara aktuell även i framtiden.

[17 juni: rättar påstående om att KB blivit kritiserade av kvällstidningarna. Den beskrivningen var lite hård. Alla poänger kvarstår dock.]

Filmer från Digikult-konferensen

Wikipedia börjar få ett bra samarbete med arkiv, bibliotek och muséer. Sedan Liam Wyatt och andra startade mer organiserat fokus internationellt på kulturarvet för flera år sedan har Wikimedia Sverige startat samarbeten med Centralmuseerna, och har haft en Wikipedian in Residence, skapat en handbok för ABM-sektorn, och föreläst vid ett otal konferenser. Vi har till och med en person som är anställd för att ta kontakter med ABM-sektorn, vi har en person som är anställd för att underlätta större uppladdningar av bildmaterial – och vi har ett strålande samarbete med Europeana, den stora europeiska kulturarvssamlingen.

Omslaget till Kulturskatter på nätet, version 2. Ladda ner hela broschyren genom att klicka på bilden.

Nu kommer nästa steg i det här. Under april ägde konferensen Digikult rum. Namnet är en sammanslagning av orden ”digitalt” och ”kulturarv”. Tanken var att skapa en praktisk konferens – d.v.s. en konferens där deltagarna skulle kunna ta med sig det föreläsarna talade om och direkt efteråt implementera det i sina egna organisationer. Mindre snack, mer verkstad, helt enkelt. Konferensen anordnades i ett samarbete mellan Wikimedia Sverige, Regionarkivet, Länsstyrelsen i Västra Götaland, Västarvet och Kultur i Väst.

I samband med Digikult kom också den nya versionen av Kulturskatter på nätet, se bild här bredvid. Ladda gärna ner.

Nu har äntligen filmerna därifrån lagts upp. Kultur i Väst filmade och har lagt upp dem på YouTube. Jag har sedan lagt dem i en spellista på YouTube så att det ska vara enkelt att se dem i rätt ordning. Det är sammanlagt 20 filmer som tillsammans tar drygt 8 timmar att titta igenom. De är väl värt att titta igenom allihop, men eftersom jag vet att många inte har 8 timmar över vill jag särskilt lyfta fram följande filmer:

1. Inledningen av landshövdingen Lars Bäckström – både underhållande och positiv. Inte minst var han hänförd över hackathonet

2. Peter Krantz om öppna data – satte tonen för konferensen

3. Karin Nilsson om Livrustkammarens öppna bildarkiv – som var mer pro-Wikipedia än jag hade vågat säga åt henne att vara

4. Kajsa Hartig om sociala medier och kulturarv – som råkade använda en bild som jag nyligen hade gjort om digitalisering utan att veta att det var jag.

Men det finns många andra som pratade intressant. Jag själv var lite för splittrad för att göra en bra föreläsning, och lyckades förolämpa en duktig Wikipedia-användare när jag skulle försöka skämta. (Det har jag bett honom om ursäkt för.)

Slutligen, vi hade nyligen ett slutmöte om Digikult. Vi diskuterade då bland annat om det kommer att bli en uppföljare. Vi vill naturligtvis, men återkommer med besked. Men det har redan kommit mycket positiv feedback och jag vet att det kommer ske saker i kölvattnet av det här. Vad det blir återkommer jag till så småningom.