En stolt datavaktmästare för hotat kulturarv

Mattias Östmar datavaktmästare på hack4heritage

När jag såg tjänsten som utvecklare för projektet kopplat öppet kulturarv i mitt flöde var jag inställd på att fortsätta frilansa som data scientist, men mer och mer för samhällsnyttiga och kunskapsintensiva institutioner som universitet och skolor. Men vad var detta för en fågel egentligen?

Att sprida kunskap fritt med Internet och öppen mjukvara som främsta verktyg var en självklarhet för mig och flera av mina skarpaste vänner hade talat sig varma för wikimedia, men själv hade jag i princip inte använt verktygen för att redigera och skapa innehåll och kulturarvssektorn var jag helt ny inför. Jag läste på och blev snart övertygad om att om universitet och minnesinstitutioner uppfunnits idag hade det sett ut som wikirörelsen. Ju mer jag såg desto mer fascinerad blev jag både filosofiskt, kulturellt och praktiskt – en upplevelse som fortsätter varje dag på jobbet!

Känslan av att wikirörelsen är den främsta moderna kunskapsplattformen i kombination med att få arbeta med att rädda åtminstone minnet av kulturarv utsatt för förstörelse ger en känsla av hedersuppdrag jag inte varit bortskämd med i marknadsföringsvärlden där jag oftast befunnit mig. Från mitt perspektiv som mycket intresserad av framsteg inom maskininlärning för analys av naturligt språk är det även extra kul att veta att Wikipedias fria innehåll i sin tur är en integral del  i nya metoder inom artificiell intelligens.

För mig är varje dag på kontoret som att stiga in i en överväldigande och till stora delar förvirrande värld – långt från prydliga rader av böcker och stillsam överblickbarhet. Hur hittar man? Hur vet en vem som göra vad? Dessutom är wikimedias tekniska plattformar, som en av Internetålderns äldsta stora framgångsrika projekt, en märkvärdig blandning av cutting-edge teknologier såsom  grafdatabasen wikidata och åldrad kod och syntax som känns främmande för mig som lärt mig programmera i de senaste årens tekniska miljö.

Om den tekniska miljön i detta gigantiska mänskliga projekt delvis är ålderdomlig så är kulturen det rakt motsatta. Ingenstans har jag sett ett så framgångsrikt och välfungerande exempel på att nätverkssamhällets kultur och värderingar av öppenhet, delande och självorganiserade grupper inte bara är en vacker idé i framtidsspanarnas böcker och föredrag, utan finns på riktigt.

Praktiskt då? I mitt arbete som utvecklare har jag hittills främst ägnat mig åt att hjälpa så kallade GLAM-institutioner (Galleries, Libraries, Archives and Museums) med massuppladdningar av bilder på arkeologiskt intressanta byggnader i krigsdrabbade områden i världen. Projektet Kopplat Öppet Kulturarv som bekostar min tjänst, syftar till att på många olika sätt bidra till att digitalt kulturarv från hela världen tillgängliggörs under fria licenser i stor skala globalt. Hittils rör det kulturarv från Syrien, Palestina, Georgien, Mali samt Bosnien och Hercegovina, områden där kulturarv riskerar att förstöras antingen på grund av krig, fattigdom eller klimatförändringar.

Projektet innefattar också att flytta metadata om ungefär 1,5 miljoner bilder på monument som klassats som kulturarv från över 50 länder till den moderna länkade databasplattformen Wikidata. Den unika omfattningen på den bildsamlingen är en anledning till att UNESCO, FN:s organ med uppdrag att verka för fred och säkerhet genom främjande av internationellt samarbete inom utbildning, vetenskap och kultur, är en samarbetspartner i projektet.

Det praktiska arbetet är, liksom det mesta man gör inom data science,  namnet till trots oftast helt o-GLAM-oröst (höhö). Precis som en vaktmästare på ett fysiskt bibliotek eller museum använder en uppsättning verktyg för att vårda och flytta dyrgripar mellan utställningsrum, är det datavaktmästarens arbete att med så liten inverkan som möjligt på material som tagits fram av kunniga författare, fotografer och andra innehållsskapare, se till att  tillgängliggöra det helst i bättre skick än det kom. Inte sällan sker arbetet även på natten, precis som på institutionerna.

Mitt specialintresse för textanalys kommer också väl till pass för att putsa och städa i de metadata-filer som kommer från fackexperter eller arkivpersonal från olika länder som behöver standardiseras och tvättas rena från mänskliga och maskinella fel och brister. Det finns exempelvis en oändlig variationsmöjlighet i hur två olika personer beskriver ett fotografis innehåll även om de är överens om att få med platsen, byggnaden och datumet då bilden togs. Att hjälpa till i arbetet med att beskriva och kategorisera så att bilder blir lättare att hitta och använda för forskare, fackexperter och allmänheten är själva hjärtat i datavaktmästens roll. En rolig del i jobbet är att utvinna nyckelord ur ostrukturerad text med datoriserad textanalys.

För att lyckas som datavaktmästare behöver man förstås ha god kännedom om olika programmeringstekniker för att läsa in, bearbeta och omforma datafiler. Men minst lika viktigt är att förstå hur de tusentals involverade volontärerna i wikimedia-rörelsen arbetar när de skapar bland annat världens största uppslagsverk, Wikipedia, med hjälp av datan.

En ren bonus är att reseracharbetet ibland leder till fascinerande kulturhistoriska insikter, som att Ummayadmoskén i Damaskus har en minaret döpt efter Jesus genom vilken han förväntas nedstiga innan den yttersta dagen för att bekämpa antikrist i det slutgiltiga slaget, enligt muslimsk tro. Bara en sån sak!

Kommentera

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com Logo

Du kommenterar med ditt WordPress.com-konto. Logga ut / Ändra )

Twitter-bild

Du kommenterar med ditt Twitter-konto. Logga ut / Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut / Ändra )

Google+ photo

Du kommenterar med ditt Google+-konto. Logga ut / Ändra )

Ansluter till %s