Wikimedia Sverige

Fri kunskap åt alla

Inlägg märkta ‘MediaWiki’

Wikipedias tidigaste historia återfunnen

Skrivet av Lennart Guldbrandsson den 15 december 2010

Good news, everyone!

- Professor Farnsworth, Futurama (upprepad replik)

Tidigare har det hävdats att den tidigaste Wikipedia-artikeln som finns bevarad är artikeln UuU. Jag har själv skrivit det i min bok, Så fungerar Wikipedia. Och fram tills för några dagar sedan stämde det. Det gör det inte längre!

För lite drygt 20 timmar sedan annonserade nämligen Tim Starling, en av Wikimedia Foundations löjligt få utvecklare – och en av de bara tre personer som har en egen Wikipedia-dag – följande:

I was looking through some old files in our SourceForge project. I opened a file called wiki.tar.gz, and inside were three complete backups of the text of Wikipedia, from February, March and August 2001!

This is exciting, because there is lots of article history in here which was assumed to be lost forever.

I’ve long been interested in Wikipedia’s history, and I’ve tried in the past to locate such backups. I asked various people who might have had one. I had given up hope.

The history of particularly old Wikipedia articles, as seen in the present Wikipedia database, is incomplete, due to Usemod’s policy of deleting old revisions of pages after about a month. The script which Brion wrote to import the article histories from UseMod to MediaWiki only fetched those revisions which hadn’t been purged yet.

I didn’t want to believe that those revisions had been lost forever, and I even opened the UseMod source code and stared forlornly at the unlink() call. What I (and Brion before) missed is that UseMod appends a record of every change made to two files, called diff_log and rclog. In these two files is a record of every change made to Wikipedia from
January 15 to August 17, 2001.

I’ve put the two log files up on the web, at:

http://noc.wikimedia.org/~tstarling/wikipedia-logs-2001-08-17.7z

The 7-zip archive is only 8.4MB — much more manageable than today’s backups.

rclog contains IP addresses. The Usemod software made IP addresses of logged-in users public, so the people who made these edits had no expectation that their IP address would be kept private. That, coupled with the passage of time, makes me think that no harm to user privacy can come from releasing these files.

– Tim Starling (källa Foundation-mailinglistan)

Det här kommer riktigt lägligt när det bara är en månad kvar till Wikipedia fyller 10 år! Och nog kommer vissa forskare få mer material.

Hur ser då Wikipedias början ut? Tidigare har man kunnat gå till nostalgiversionen av Wikipedia, men nu finns det ”nytt” gammalt material, som inte hunnit läggas in där. Så här ser istället den första bevarade meningen ut:

”This is the new WikiPedia! The idea here is to write a complete encyclopedia from scratch, without peer review process, etc. Some people think that this may be a hopeless endeavor, that the result will necessarily suck. We aren’t so sure. So, let’s get to work!”

Och debatten om Larry Sangers roll som Wikipedias grundare kommer säkert att aktualiseras med sidor som den här.

Eller hans tilltro till wiki-konceptet:

None of this is to say that the Nupedia wiki will ”replace” the main encyclopedia; of course it won’t. But it will be an interesting ancillary endeavor!

För den som är intresserad av Wikipedias utveckling börjar det bli en ganska stor förteckning här.

Tim Starling har i alla fall gjort sig förtjänt av sin dag den här veckan.

Sparad i Wikipedia | Taggad: , , , , , , , , , , | 3 Kommentarer »

Microsofts nya översättningsverktyg

Skrivet av Lennart Guldbrandsson den 18 oktober 2010

Idag meddelade Danese Cooper, som är teknisk chef på Wikimedia Foundation, att Microsoft Research center kommit med ett nytt översättningsverktyg för att underlätta översättning mellan språkversioner av Wikipedia:

WikiBhasha takes content from a targeted Wikipedia page and displays a machine translation to a second language side-by-side.  Users can edit, add to or delete the translated content, preview their work and then submit it to the second language Wikipedia.

Verktyget är än så länge bara i beta-version, men går att ladda ner här och eftersom det är fri programvara kan det användas av alla MediaWiki-installationer. Du kan se en presentation av verktyget här:

För att redan nu svara på tänkbar kritik: det rör sig inte maskinöversatt text trots att det står så här på sidan:

[...] supported by Microsoft’s Machine Translation system

Man måste nämligen välja vad som ska översättas, och kan välja mellan flera alternativ, innan själva översättningen görs. Wikipedias texter behöver översättas och bearbetas av människor.

Moka Pantages, som är communications officer på Wikimedia Foundation, kommenterar likheten med Googles översättningsfunktion så här:

WikiBhasha is an open source layer of functionality running directly in the context of Wikimedia sites. Unlike Google’s tool, WikiBhasha is not primarily a translation tool, but rather focused on simplifying work across multiple languages. So it’s designed to help you compose articles drawing information from other languages. It does support direct translation, if that’s what people want to do.

We’re supportive of both efforts and hopeful that we’ll ultimately see consolidation of multi-language collaboration and translation functionality in a single open source toolkit.

Pröva gärna funktionen och kommentera hur du tycker att det fungerar.

Sparad i MediaWiki, Wikimedia Commons, Wikinews, Wikipedia, Wikiquote, Wikisource, Wikiversity | Taggad: , , , , , , , , , | 3 Kommentarer »

Du läste det här först

Skrivet av Lennart Guldbrandsson den 24 mars 2010

Så här kommer den nya versionen att se ut

Så här kommer den nya versionen att se ut

I slutet av april kommer en ny version av MediaWiki, programvaran som bl.a. Wikipedia använder. Det blir en stor omdaning. Anledningen är att Wikimedia Foundation för en tid sedan startade ett användbarhetsinitiativ för att göra Wikipedia lättare att använda, och då behövs en nyare version av MediaWiki. Som du kan se till höger kommer saker och ting att bli lite annorlunda, samtidigt som mycket kommer att vara likadant. Utfällbara flikar, förbättrad sökning och förenklade verktyg för att göra tabeller och länkar. Det här kommer att bli spännande.

Om du klickar på bilden kommer du till Wikimedia Foundations teknik-blogg. Klickar du däremot på den här länken finns där mer information om vad som kommer att hända framöver i användbarhetsinitiativet.

I teknikbloggen kan du också läsa om det stora mötet i Berlin där programmerare, hackare och datanördar från hela världen kommer att samlas för att diskutera saker som är på gång, saker som har hänt och hur man ska gå vidare för att göra Wikimedia Foundations sajter och i förlängningen alla MediaWiki-sajter bättre. Wikimedia Sverige kommer att ha representanter där. Om du har några saker du vill att de ska ta upp på mötet, lämna en kommentar nedan.

Sparad i MediaWiki, Wikipedia | Taggad: , , , , , , | Lämna en kommentar »

 
Följ

Få meddelanden om nya inlägg via e-post.

Join 832 other followers