Ett tillgängligare Wikipedia genom Wikispeech: arbetet fortsätter

500px-wikispeech_logo_proposals_v1_logo_3-svg

For the blog post in English, see below.

Wikimedia Sverige har mottagit 3 miljoner kronor i finansiering från Post- och telestyrelsen för fortsatt utveckling av mjukvaran Wikispeech. Wikispeech är en talsynteslösning som kommer att göra Wikipedia mer tillgängligt för de som av olika orsaker inte kan läsa.

Arbetet med att utveckla Wikispeech kommer att ske tillsammans med Kungliga tekniska högskolan och Södermalms talteknologiservice AB. Därtill kommer vi att samarbeta runt utvecklingen med bl.a. vår tyska systerförening Wikimedia Deutschland samt Mozilla Foundation och få värdefull återkoppling från Dyslexiförbundet.

I projektet kommer vi att utveckla verktyg som gör det enkelt för alla att bidra till att göra talsyntesen bättre samt skapa röster och lexikon på andra språk. Beroende på intresse och kunskap hos den som bidrar till projektet kan detta till exempel innebära att volontären spelar in sin egen röst eller annoterar ljudfiler med lingvistisk information.

Inspelningar av ord kan användas direkt i exempelvis Wikipedias artiklar eller i den fria ordboken Wiktionary eller som strukturerad data på Wikidata. All denna taldata kommer även att vara tillgängliga för alla som vill använda den, från forskare till produktutvecklare till språkbevarare. För att förenkla återanvändning kommer allt material att vara uppmärkt med CC0, vilket innebär att det inte ställs några krav alls på den som återanvänder vår data.

Inledningsvis, i vårt arbete inom ramen för det här projektet, fokuserar vi på svenska, men vi kommer att bygga all mjukvara så att den fungerar på alla språk.

För AI-utveckling och forskning i Sverige och internationellt kommer dessa data att vara av stort värde för att förbättra talbaserade funktioner. Talbaserade lösningar kräver tusentals timmar med talinspelningar med viss lingvistisk information. Att samla in dessa data är dyrt, vilket är anledningen till att kommersiella aktörer bara erbjuder talbaserade lösningar på ett fåtal språk.

Eftersom vårt projekt kommer att nyttja crowdsourcing kan vi dock samla in stora mängder data, inte bara för de språk som är mest lönsamma för kommersiella produkter utan även för olika hotade språk och minoritetsspråk. Genom det stora globala nätverket av Wikimedia-volontärer kommer vi att kunna samla in data för språk som har få eller inga resurser idag. Att kunna lansera projektet i år, under Det internationella året för ursprungsspråk, känns därför extra kul.

Vi kommer också att arbeta för att ha en variation av talare även inom språken. Med hjälp av denna resurs kommer det att vara möjligt att skapa produkter som kommer kunna användas av så många som möjligt. Detta är centralt för att olika talbaserade system inte skall vara diskriminerande (och exempelvis bara fungera för manliga röster med Stockholmsdialekt).

Making Wikipedia accessible through Wikispeech: the work continues

Wikimedia Sverige has received a 3,000,000 SEK (ca. $322,000 or €285,000) grant from the Swedish Post and Telecom Authority for further development of the Wikispeech software. Wikispeech is a speech synthesis solution that’s going to make Wikipedia more accessible to people who for various reasons cannot read.

We are going work on Wikispeech together with the KTH Royal Institute of Technology in Stockholm and Södermalms talteknologiservice AB, a speech technology company. We are also going to collaborate with Wikimedia Deutschland, our sister chapter in Germany, and the Mozilla Foundation, among others. The Swedish Dyslexia Association is going to provide valuable feedback.

In this project we are going to build tools that make it easy for everyone to contribute and improve the speech synthesis and to create voices and glossaries in other languages. Depending on the contributor’s interests and knowledge, it could mean e.g. recording their own voice or annotating audio files with linguistic information.

The word recordings will be available for direct use e.g. in Wikipedia articles, in the free dictionary project Wiktionary or as structured data in Wikidata. The collected data will also be made available to anyone who wants to use it: from researchers to product developers to language preservers. All the data will be released under the CC0 Public Domain Dedication in order to make it as simple as possible to access and re-use – without any requirements imposed on the user.

Initially, within the scope of this project, we are focusing on Swedish, but all the tools we develop are going to be language-agnostic.

The collected data is going to be very valuable for AI researchers and developers in Sweden and internationally as they work on improving speech-based solutions. Those require thousands of hours of speech recordings, as well as certain linguistic information. Collecting all this data is expensive; as a consequence, commercial developers only provide speech-based solutions for a small number of languages.

However, because our project is going to make use of crowdsourcing, we will be able to collect large amounts of data – not only for the languages that rake in the most money for commercial actors, but also for minority languages and languages in danger of extinction. By tapping into the global network of Wikimedia volunteers, we will be able to collect data for languages that today have few, if any resources. That’s why launching the project during the International Year of Indigenous Languages feels especially appropriate.

We are going to strive for a diversity of speakers within any given language as well. That way, our resources will be useful for building products that can be used by as many people as possible. This is a key factor for developing speech-based systems that do not discriminate – such as by only recognizing male voices with a General American accent.

Följ uppladdade bilder från Wikimedia Sverige på Twitter

I samband med projektet Kopplat Öppet Kulturarv har André Costa skapat en twitterbot som automatiskt tweetat ut ett urval av de bilder som laddas upp till Wikimedia Commons.

I skrivande stund är det bilder från Nationalmuseum och Världskulturmuseerna som är aktuella. Twitterboten är ett sätt att uppmärksamma att arbete pågår med bilduppladdningar, vilket gör att fler intresserade kan bidra i både kvalitetssäkrings-arbete och användning i wikipediaartiklar eller annorstädes.

Exempel på bild av Isaac Grünewalds konst som nyligen släppts till public domain.

Twitterboten är gjord med hjälp av IFTTT (If This Then That), en gratis webbtjänst som låter användaren låta händelser som att en sida uppdateras trigga andra händelser som att en tweet skickas ut från ett visst konto. Programmering utan att skriva någon programkod, alltså.

Föremål från Sigvald Linnés utgrävningar i Teohuatican, Mexiko 1932.

Vinnare i Wiki Loves Monuments

Efter en lång och spännande väntan är det äntligen dags att berätta hur det gick i Wiki Loves Monuments, och vad juryn har kommit fram till. Liksom de senaste åren är kategorierna Skyddade byggnader, Fornminnen, Arbetslivsmuseer och K-märkta fartyg, dessutom ett pris för bästa serie av ett objekt och ett pris till den som har fotograferat flest unika objekt. Juryn, bestående av undertecknad, Helen Simonsson från Riksantikvarieämbetet och socialvideoninjan Björn Falkevik, har efter mycket funderande, granskande, uppskattande och bedömande hittat en totalvinnare och två favoriter per kategori bland dom 2332 bilder som skickats in av 78 deltagare. På resultatsidan på Wikimedia Commons finns alla bilder och mer info, och på den internationella resultatsidan finns de bilder som gick vidare till internationella finalen redovisade.

Bästa bild

Rött tåg, grönt fält, blå himmel och rök från ångloket.
Resa med ångtåg från Skånska Järnvägar. Motivering: Bland många bra bilder står den här ut med en blandning av tågets skärpa och gräsets röreslseoskärpa, färgernas olika fält och linjerna som sträcker sig bortåt och framåt samtidigt som fartvinden känns i håret och bilden ger en känsla av hur det var att resa med tåget på den tid det begav sig. Foto: Kristian Hedberg, CC BY-SA 4.0

Byggnader

Vit kyrka bland rimfrostiga träd och ett vitt fält under en vitgrå himmel.
Östra Ämterviks kyrka. Motivering: Vinterbild som står ut genom att visa kyrkans läge i landskapet och samtidigt fått med flera nyanser av vinterdag och rimfrost. Foto: Mararg, CC BY-SA 4.0
Feskekôrka på kvällen, med reflektion i vattnet.
Feskekôrka i Göteborg. Motivering: Kvällsbild som med reflektionen bjuder på fin geometri och med detaljer som gör bilden levande och visar på användningsområdet. Foto: Arild Vågen, CC BY-SA 4.0

Fornminne

Runsten i blomsterfält under en molnig himmel.
Runsten på Larva hed. Motivering: Stolt runsten som står stadigt inramad av gräs, skog och en molnig himmel. Bilden har ett fint ljus som lyfter fram hur stenen påverkats av tidens gång. Foto: Nicklas Larsson, CC BY-SA 4.0
Skeppssättningen Ales stenar i soluppgång under en molnig himmel
Ales stenar i soluppgång. Motivering: Dynamisk bild där det vendeltida skeppet stävar åt ena hållet samtidigt som ett modernare skepp anas vid den uppgående solen under en dramatisk himmel. Foto: Billy Palmius, CC BY-SA 4.0

Fartyg

Vitt fartyg förtöjt vid kanten av Göta kanal under en nattlig himmel
M/S Wilhelm Tham. Motivering: Stämningsfull bild som visar fartyget förtöjt mitt i sensommarnatten på resan genom Göta kanal. Foto: Patrik Backentoft, CC BY-SA 4.0
Vitt fartyg framför en grön skog och under blå himmel.
Ångfartyget Siljan. Motivering: Illustrativ och tydlig bild som visar fartyget i en naturskön miljö. Foto: Arild Vågen, CC BY-SA 4.0

Arbetslivsmuseer

Rött tåg, grönt fält, blå himmel och rök från ångloket.
Resa med ångtåg från Skånska Järnvägar. Motivering: Bland många bra bilder står den här ut med en blandning av tågets skärpa och gräsets röreslseoskärpa, färgernas olika fält och linjerna som sträcker sig bortåt och framåt samtidigt som fartvinden känns i håret och bilden ger en känsla av hur det var att resa med tåget på den tid det begav sig. Foto: Kristian Hedberg, CC BY-SA 4.0
Ånglok som släpper ut ånga med ett lokstall i bakgrunden.
Ånglok från Skånska Järnvägar. Motivering: Levande bild som med kombinationen av lok och ånga visar loket och området i sin rätta miljö. Foto: Susanne Nilsson, CC BY-SA 4.0

Bästa bildserie

Bästa bildserie på ett objekt är de 47 bilder Einar Spetz tog när han under en dag besökte Gripsholms Slott, med juryns motivering: En rik bildserie som visar både hela byggnader, detaljer, översikter och interiörer. Genomgående hög kvalitet på bilderna och många illustrativa enskilda fotografier.

Skärmdump av 47 bilder från Gripsholms slott.
47 bilder på Gripsholms slott. Foto: Einar Spetz, CC BY-SA 4.0

Unika objekt

I grenen flest bilder av unika objekt lönade det sig att gå långt. Vinnare är Jan Ainali som under sin vandring från Ystad till Stockholm samt besök i Visby och vid Skällviks borgruin och på andra ställen bidrog med totalt 619 bilder på 169 unika objekt.

Tack och grattis

Stort grattis till alla vinnare, och ett sort tack till alla inblandade i Wiki Loves Monuments! Alla deltagare för era fina bidrag till fri kunskap, alla partners för listor och data som gör att vi kan genomföra tävlingen, volontärer som sorterar bilder, ser till att dom kommer in i listor och artiklar, förbättrar kategorisering och metadata, till juryn som gör en ovärderlig insats i att bedöma bilder och kommer med kloka beslut, och till sist till kollegorna på Wikimedia Sverige som kommer med glada tillrop, teknisk support, frågor och funderingar och stöttande när det behövs.