What is happening in Russian language Wikipedia?

I interviewed Victoria in Tbilisi Georgia in CEE Meeting September 2023. Here is her interview and after it, a brief text. https://commons.wikimedia.org/wiki/File:What_Is_Happening_In_Wikipedia_Russia.webm

The Wikipedia community in Russia is divided about the war in Ukraine because the Wikipedia consists of people of whom some are in Russia, some abroad. There are a lot of processes happening. Since beginning of the full scale war in Ukraine there were two fork projects, that copied Russian Wikipedia, about two million articles. They were made by people who had prominent position in the society.

The first project was Runiversalis and the next was published in July 2023 called Ruwiki. Victoria asses that they are successful already because they remain stable. When Runiversalis was published everybody went to look at it, it crashed. Everything points out that it is backed by private money from a Russian bank. It is still below the Russian Wikipedia in Yandex search. They buy advertisements you can see on the side. They have a significant amount of editors that left Russian Wikipedia because they were able to pay them money. It is always every Wikipedians dream to earn money editing Wikipedia.

The community of Russian Wikipedia is ten times larger than the number that they have in the clones. Victoria says that she does not know for how long the Russian fork will remain stable, if the money runs out.

What is the situation with the small languages Wikipedias in Russia? Victoria says that the largest projects like the Tatar and Bashkir Wikipedias are supported by the fork. She hopes that the smaller Russian languages will stay with the Wikipedia, the real one, not the copy. The Russian Wikipedia can afford to loose five or ten (active) editors, but for the smaller ones it means that they stop developing.

Heikki Kastemaa Kulttuurinavigaattori

Tule mukaan tuomaan tiedettä Wikipediaan!

Virolainen ornitologi Tarvo Valker havainnoimassa merilintuja. Kuva on vuoden 2013 tiedekuvakilpailusta. (Mati Kose/Wikimedia Commons, CC-BY-SA 3.0)

Marraskuun alusta joulukuun puoliväliin on Wikipediassa tieteen aikaa, sillä Wikimedia Suomi järjestää kaksi tiedeaiheista kilpailua, joiden tavoitteena on saada tiedeyhteisön jäseniä tuomaan asiantuntemustaan ja osaamistaan Wikipediaan. Molemmat kilpailut alkavat 1. marraskuuta ja päättyvät 15. joulukuuta.

Tiedekuvakilpailussa tallennetaan tieteeseen liittyviä, vapaasti käytettäviä kuvia ja muita mediatiedostoja kuvapankki Wikimedia Commonsiin. Se on osa kansainvälistä Wiki Science Competition -kuvakilpailua ja järjestetään nyt Suomessa toista kertaa. Mukana on seitsemän kilpailusarjaa, jotka kattavat kaiken mikroskooppikuvista tieteilijöihin ja tähtitieteeseen. Jokaisen sarjan voittajalle on luvassa 70 euron lahjakortti valokuvaustarvikeliikkeeseen, ja lisäksi sarjojen voittajakuvat pääsevät kansainvälisen kilpailun finaaliin.

Tiede Wikipediaan -kilpailussa kerätään pisteitä luomalla, täydentämällä ja päivittämällä tieteeseen liittyviä tietosanakirja-artikkeleita suomeksi, karjalaksi sekä pohjois-, koltan- ja inarinsaameksi. Kolme eniten pisteitä kerännyttä saavat palkinnoksi Museokortin sekä Wikimedia Suomen tarjoaman illallisen. Osallistujat saavat myös Wikipedian käyttäjäsivulleen erityisrusetteja saavutettuaan tietyt pisterajat.

Kilpailuilla parannetaan Wikipediasta löytyvän tiedon määrää, laatua ja luotettavuutta. Wikipedia on maailman kymmenen vierailluimman sivuston joukossa, ja suomenkielinen Wikipedia on käytännössä ainoa suomenkielinen tietosanakirja, jota enää päivitetään. Sen rooli tiedon levittämisessä suurelle yleisölle onkin siis suuri.

Tieteen monipuolinen esittäminen Wikipediassa niin kuvien kuin artikkelien muodossa auttaa laajentamaan suuren yleisön käsitystä siitä, mitä tiede on ja mitä tieteilijät tekevät. Tule sinäkin siis mukaan!

Tbilisin CEE tapaaminen

Keski- ja Itä-Euroopan Wikimedioiden tapaamisessa Tbilisissä 15.-17.9. 2023 oli osallistujia isäntämaa Georgian lisäksi Albaniasta, Armeniasta, Asserbaizshanista, Venäjältä (Moskova, Pietari, Baškortostan), Valko-Venäjältä, Bosnia ja Hertsegovinasta, Tšekistä, Kyprokselta, Eestistä, Kreikasta, Kazakstanista, Makedoniasta (Shared Knowledge ja GLAM ryhmät), Kirgisiasta, Latviasta, Unkarista, Maltalta, Montenegrosta, Puolasta, Romania ja Moldovasta (UG), Serbiasta, Sloveniasta, Slovakiasta, Srpskan tasavallasta, Tadžikista, Tatarinkielten ryhmästä, Turkista, Ukrainasta ja Uzbekistanista.

Lisäksi vieraina oli edustajia Hollannista, Saksasta, Bulgariasta, sekä heprean, uzbekin ja italiankielisistä Wikipedioista. Itse osallistuin tapaamiseen Wikimedia Suomen lähettämänä, vaikka Suomi ei ole varsinaisesti CEE-maa.

Wikimedia CEE kokoontui yhteiskuvaan Tbilisin yliopiston portailla (kuva: Commons, Adem)

Osallistujien luettelossa kiinnittää huomiota CEE:n laajeneminen itään aina Keski-Aasian maiden ”staneihin” asti. Tapaaminen osoitti, että siellä on aktiivisia wikiyhteisöjä, olivatpa ne sitten käyttäjäryhmiä (User Groups) tai muita uusia intressi- tai kieliryhmiä.

CEE jatkaa organisoitumistaan eri kokoisissa hubeissa, joita yhteisöön on liittynyt yhteensä yli 40. Laajeneminen idän suuntaan lienee seurausta siitä, että hubien ideana on tukea toisia, esimerkiksi juuri syntyviä ja aloittavia yhteisöjä, olipa kyse tiedollisista tai rahallisista resursseista.

CEE onkin hankkimassa kolmatta työntekijää, jonka tehtävänä olisi juuri auttaa pieniä ja heikommin kehittyneitä hubeja. Suunnitellaan myös nuorempien ryhmien organisointia (Youth group project). Uusia aiheita CEE:n piirissä ovat myös mikrogranttien eli pienten avustusten myöntäminen. CEE:n toiminta päätettiin suunnitella kaksivuotisena ja ohjauskomiteaan (Steering Committee) valittiin jäsenet Turkista ja Serbiasta.

Iloisina uutisina kuulin, että Turkin Wikimedian ja Wikipedian toiminta on toipunut yli kaksi vuotta jatkunutta julkaisuestoa edeltävän ajan aktiivisuuteen. Ensi vuoden CEE-tapaamista haetaankin joko Istanbuliin tai Albaniaan.

Vapaan tiedon näkymätön vero

Vapaan tiedon ajatellaan yleisesti olevan puhdas julkishyödyke, mutta käytännössä se on kuitenkin ei-puhdasta julkista hyötyä. Näin väittää Kiril Simeonovski, joka on makedonialainen wikipedisti ja wikimedisti, joka toimii myös makedonialaisen avoimen tiedon organisaation johtajana. Kerron tässä lyhyesti hänen sekä Tbilisin CEE-tapaamisessa esittämiään analyyseja CEE-maiden tilanteesta, että elokuussa Singaporen Wikimaniassa esittämäänsä globaalia arviota.

Vapaan tiedon poissuljettavuus johtuu niistä rajoituksista, joita sen pääsyyn on ja näitä ovat taloudelliset, institutionaaliset ja sosiaaliset tekijät. Eli mitä vähemmän ihmiset voivat kuluttaa vapaata tietoa ja mitä vähemmän ihmiset pystyvät tuottamaan sitä, sitä enemmän on taloudellista tehottomuutta.

Simeonovski on tutkinut seuraavia kysymyksiä:

  • Miksi vapaa tieto ei ole puhdasta julkista hyötyä?
  • Mitä vaikutuksia epäpuhtaudella on?
  • Kuinka epäpuhtauden vaikutuksia voi mitata?
  • Kuinka suuria nämä vaikutukset ovat eri maissa?
  • Mitkä tekijät vaikuttavat epäpuhtauksiin?

Tutkimuslinjoina ovat puhtaan julkishyödykkeen määritelmä vs. epäpuhdas julkinen hyvä. Malli vapaasta tiedosta julkisena hyödykkeenä riippuu Wikimedia-liikkeen vertaistuotannosta ja joka käyttää Wikimedian sisältöä vapaan tiedon välityspalvelimena.

Simeonovski käyttää ”näkymättömän veron” käsitettä, joka tarkoittaa niitä esteitä tai ”kitkan” määrää, joita vapaalla tiedolla on. Hän kalibroi käyttäen Wikimedia-projektien maatietoja, sekä pyrkii tunnistamaan näkymättömään veroon vaikuttavat tekijät.

Tuloksia

Kiril Simeonovskin mukaan vapaan tiedon vero jakautui näin vuonna 2022.

Vapaan tiedon näkymätön vero oli vuonna 2022 55,5 prosenttia maailmanlaajuisesti (56,9 prosenttia vuonna 2021).

Matalimmat verot olivat Luxenburgissa (0,3 %), Norjassa (0,6 %) ja Suomessa (1,4 %).

Korkeimmat verot olivat Malawissa (99,8 %), Tšadissa (99,7 %) ja Lesothossa (99,6 %).

Globaalissa etelässä vero oli 77,2 prosenttia ja globaalissa pohjoisessa se oli 14,6 prosenttia.

Miksi poissulkemista tapahtuu?

Kirill mainitsee aluksi digitaalisen kuilun. Internetin käyttäjien keskimääräinen osuus internetissä vuonna 2022 globaalissa etelässä oli 53,4 prosenttia ja 88,8 prosenttia globaalissa pohjoisessa.

Toiseksi tekijäksi hän mainitsee netin neutraalisuuden vastaan nollatason veron. Nollatason verolla on monien lähteiden mukaan positiivisia taloudellisia vaikutuksia kuluttajille. Wikipedia Zero oli yritys vähentää poissulkevuutta.

Poissulkemista edisti sensuuri ja sisällön julkaisun estäminen, sekä syytteet muokkaajia vastaan, joita on tapahtunut Kiinassa, Venäjällä, Turkissa, Iranissa, Pakistanissa, Myanmarissa, Syyriassa, Venezuelassa, Valko-Venäjällä ja Saudi-Arabiassa.

Ja lopulta poissulkemista edistivät yksittäisiin artikkeleihin suuntautuvat väittelyt (UK, Australia, Ranska ja Saksa).

Venäjän tilanne

Valkovenäläinen, Britanniassa asuva henkilö selvitti Venäjän tilannetta. Hän kertoi aluksi venäjänkielisen Wikipedian suosiosta Venäjällä ja muissa maissa. Venäjän Wikimedian ”sateenvarjon” alla on yhteensä 29 Wikipediaa ja paljon muita Wikimedian tietojärjestelmiä.

Venäjänkielisen Wikipedian vastaanotto lokakuussa 2022.

Venäjän Wikipedian estämisen historia on lyhyesti seuraava. Vuonna 2012 presidentti Vladimir Putin allekirjoitti lain Lasten suojelemiseksi vaurioittavalta informaatiolta ja muita Venäjän Federaation säädöksiä. Heinäkuussa 2023 Putin vahvisti lain, joka kieltää sekä henkilöitä, että oikeushenkilöitä osallistumasta sellaisten ulkomaisten kansalaisjärjestöjen toimintaan, joita ei ole valtion rekisterissä. Rangaistukset niihin osallistumisesta vaihtelevat sakoista kolmen vuoden vankeuteen.

Tämän seurauksena kaikki Venäjän Wikipedian osoitepaljastimet (CheckUser) ja Wikinewsien muokkaajat ovat Venäjän ulkopuolella. Venäjän ja Valko-Venäjän nykypolitiikkaa koskevissa artikkeleissa kirjoittajat on anonymisoitu.

Forkkaukset

Venäjänkielisen Wikipedian forkkauksista eli Wikipedian kopioista seuraavaa. Runiversalis (RUNI): “Isännöidään Venäjän palvelimilla, ja se on Venäjän lakien mukainen”. Siinä on enemmän artikkeleita kuin venäjänkielisessä Wikipediassa, noin kaksi miljoonaa.

Toinen forkkausprojekti on RUWIKI (Bugopedia). Jokainen voi tulla kirjoittajaksi, mutta vain ammattilaiset takaavat aineisto laadun. Tavoitteena ”Mukavuus, avoimuus, neutraalisuus, luotettavuus”. Artikkeleita on noin 1 900 000. Esimerkiksi Venäjän hyökkäyksessä lähes kokonaan tuhotun kaupungin Iziumin artikkelissa Ruwikissa kaupungin historia päättyy vuoteen 2010.

Myös Elina Saarilahden perusteellinen artikkeli 1.8.2023 Hesarissa käsittelee Putinin suunnitelmaa vuodelta 2019 ja vertailee Venäjän ”vaihtoehtoisen Wikipedian” Rupedian ja venäjänkielisen Wikipedian sisältöjä.

Wikipedian forkkausten ongelmana on, pystyvätkö ne rekrytoimaan tarpeeksi, tai yhtä paljon vapaaehtoisia kirjoittajia ja ylläpitäjiä kuin ”perinteiset” Wikipediat? Toistaiseksi venäjänkieliset Wikipediat hallitsevat muokkauskenttää, mutta kun kysyin, onko venäjänkielisen Wikipedian blokkaus ajankohtainen, sain myönteisen vastauksen.

Ainakin seuraavat tiedot kertovat siitä, että viranomaiset sekä Venäjällä, että Valko-Venäjällä ottavat Wikipedian muokkaajat vakavasti.

Valkovenäläinen, venäjänkielistä Wikipediaa toimittanut Mark Bernstein tuomittiin kolmeksi vuodeksi kotiarestiin yhteiskuntajärjestystä häiritsevien toimien järjestämisestä ja valmistelusta, jota seuraa 3 vuoden kansainvälinen matkustusrajoitus. Toukokuussa 2022 Pavel Pernikaŭ sai kahden vuoden vankeustuomion ”Valko-Venäjän tasavallan häpäisemisestä”, johon kuului kaksi muokkausta Wikipediaan Valko-Venäjän poliittisista sorroista.

Mitä tehdä?

Alustajan mukaan Venäjällä pitäisi tehdä seuraavia. Poistaa geotagit ladatuista kuvista, olla jakamatta henkilökohtaisia tietoja, kuten käyttäjänimeä missään, kuten somessa. (WMF:lla on tästä säännöt, mutta kukaan ei noudata niitä). Älä käytä mobiililaitteella Wikipediaa. Jos otat osaa protesteihin, käytä ”burner phonea” eli prepaidia, koska tavallista puhelinta voidaan käyttää sinua syytettäessä ja pääsemään Wikimedia-tileillesi. Äläkä tee spontaaneja julkisia toimia pidätetyn käyttäjän tueksi – varsinkin IRL voi kostautua.

Yhtään onnellisemmaksi ei saa myöskään se lokakuun alussa uutisoitu asia, että Venäjän viestintäviranomainen Roskomnadzor on antanut määräyksen estää virtuaaliset yksityisverkot (VPN) ensi vuoden maaliskuun 1. päivästä alkaen.

Commonsilla gentrifikaatiota vastaan!

CEE tapaamisessa kohtaamistani uusista ideoista mainitsen albanialaisen Sonia Budinin toteuttaman idean. Hänen ryhmänsä taistelee Tiranan gentrifikaatiota vastaan käyttäen apunaan muun muassa Commons-kuvia. Tosiaankin, miksipä emme voisi taistella paremman rakennetun ympäristön puolesta, rakennussuojelun tai luonnonsuojelun puolesta Commons-kuvia käyttäen. Tässä hänen alustuksensa diat, joista voi ottaa mallia.

Sitten istutin Sonian viereeni ja kerroin hänelle myös virolaisten kehittämästä Ajapaik-systeemistä. Katsoimme, mitä kuvia voisi siirtää Commonsista Ajapaikkiin Tiranasta aihetta varten. Ei niitä paljon ollut, mutta kuulemma nekin kuvat riittäisivät havainnollistamaan aihetta.

Heikki Kastemaa

Wikimedia Euroopan aika Prahassa

Wikimedia Europen yleiskokous järjestettiin Prahassa. Osallistuin siihen Wikimedia Suomen edustajana ja kerron tässä tietoja ja huomiotani tapaamisesta.

Prahan tapaamisen osallistujat tutustuivat Tsekin kansalliskirjastoon.

Wikimedia Europen yhteisönä toimi aikaisemmin samanniminen Wikimedian edunvalvontaryhmä (advocacy group), jota tuki ja rahoitti Wikimedia Saksa. Itsenäiseksi kansalaisjärjestöksi INGO:ksi tai tarkemmin sanottuna kansainväliseksi, ei voittoa tuottavaksi kansalaisjärjestöksi Wikimedia Europe rekisteröitiin alkuvuodesta 2023. Yhdistys toimii Belgian lain alaisena. Wikimedia Suomi liittyi mukaan hallituksen päätöksellä ja kirjattiin jäseneksi elokuussa 2022.

Toiminta

WM Europe ei ole hubi eikä se ole Wikimedian yhteistyökumppanikaan (affiliate). Henkilökuntaa Brysselissä on tällä hetkellä kolme. Toimitusjohtaja on Anna Mazgal ja yksi henkilö vastaa rekrytointiprosessista. Yhdistyksen hallituksessa on viisi jäsentä, joista neljä valitaan ja yksi nimitetään. Hallituksen puheenjohtaja on Claudia Garád Itävallasta.

Perustajien hyväksymä toimintapolitiikka on seuraava:

  • EU:n politiikka (lobbaus) ja EU:n toimintatuki (rahankeräys)
  • oma toiminta ja jäsenien auttaminen
  • Euroopan kansainvälisten yhteistyökumppaneiden toiminnan koordinointi
  • tapaamiset ja tilaisuudet, joita ovat Wikimedia Europen yleiskokous ja Brysselissä järjestettävät Big Fat Brussels Meetingit

Päätoimijat

Yhdistyksen päätoimijoita ovat CEE hub, eli Keski- ja Itä-Euroopan Wikimedioiden hubi, WikiFranca, sekä sisältökumppanit (Content Partnerships Hub).

Osallistuin viime syksynä Ohridissa, Pohjois-Makedoniassa pidettyyn CEE-tapaamiseen ja raportoin siitä edellisessä blogikirjoituksessani. Prahan tapaamisessa ei tullut esille CEE:sta oleellista uutta, joten en kerro tästä laajasta Keski- ja Itä-Euroopan Wikimedioiden organisaatiosta enempää.

Paitsi sen, että CEE valmistelee nyt ensi syksyn CEE-tapaamista, joka on 15.-19. syyskuuta Tbilisissä, Georgiassa. Niin, ja myös kesällä 2024 järjestettävän Wikimania 2024:n valmistelut Krakovassa, Puolassa ovat jo käynnissä.

WikiFranca

WikiFranca on ranskaa puhuvien maiden wikimedioiden yhteistyöverkosto (siis erotuksena Ranskan Wikimediachapterista). Kesäkuussa 2023 sillä on 17 jäsentä kolmella mantereella. Suurin osa niistä on ranskankielisessä Afrikassa, kuten WMFI:n yhteistyökumppani Wikimédiens du Bénin. WikiFrancan päätavoitteena on vahvistaa sisäisiä prosesseja ja organisoida Ranskaa puhuvien Wikitapaaminen Norsunluurannikolla syyskuussa 2023. Se ottaa käyttöön kapasiteettiohjelman, valmistaa ranskankielisten yhteistyökumppaneiden mikroavustuksia ja jatkaa Afrikan yhteistyökumppaneiden tukemista.

Sisältökumppanien hubi (Content Partnerships Hub), tukee liikkeen yhteistyökumppaneiden toimintaa. Se ohjaa ja vastaa liikkeen tarpeista, mutta ei pyri tekemään päällekkäistä työtä ja toimii yhdessä yhteistyökumppanien kanssa ja tarjoaa tukea teknisessä ja asiantuntijuudessa.

Toiminta jakautuu kuuteen osaan: Tarpeiden arviointi, strategisen datan siirto, ohjelmistokehitys, helpdesk, kapasiteetin kehittäminen, kansainväliset kumppanuudet.

Wikimedia Europen jäsenyhteisöjen maat, jaostot (Chapters) ja käyttäjäryhmät (User Groups) syksyllä 2022.

Muita huomioita ja pikku-uutisia

Prahan tapaamisen yhteydessä tutustuttiin Tsekin kansalliskirjaston tiloihin, jonka jälkeen pidetyssä tilaisuudessa Tšekin Kansalliskirjaston johtaja ja Wikimedia Česká republikan johtaja allekirjoittivat yhteistyösopimuksen Wikipedian luomisesta, muun muassa kansalliskirjaston tietokantojen saatavuudesta Wikidatan kautta.

Espanjan Wikimedian edustaja kertoi suuren ja vaikutusvaltaisen museoalan organisaation ICOMin konferenssista Valenciassa Espanjassa ensi syyskuussa. Mukana on neljä Wikimediachapteria.

WMItalian edustaja kertoi vapaista ja avoimista ohjelmista, jotka ovat osa vapaata tietoa. Esimerkiksi onko nettitapaamisissa järkevää käyttää Zoomia, kun voi käyttää Big Blue Buttonia?

Pohjois-Euroopan rooli hukassa?

Wikimedia Northern Europe perustettiin Tukholmassa lokakuussa 2018. Seuraava tapaaminen oli Tartossa vuoden kuluttua. Ideana oli perustaa koko pohjoisen Euroopan kattava yhteistyörganisaatio. Mukana tapaamisissa oli Islannin, Tanskan, Norjan, Ruotsin, Suomen, Latvian ja Viron kollegoita. Liettuasta ei tavoitettu ketään.

Wikimedia Northern Europen toiminta vaikuttaa nyt hiipuneen, eikä pelkästään Covid-ajan takia. Osa suunnitelluista yhteistyökumppaneista toimii myös CEE-organisaatiossa. Huomasin myös Prahassa, että mikään Baltian maan jaosto ei ainakaan toistaiseksi ole ilmoittautunut myöskään Wikimedia Europen jäsenorganisaatioksi. Siis toistaiseksi.

Mutta jo perustettua Wikimedia Northern Europea ei siis esitelty tapaamisessa osana WMEU:n toimintaa. Juttelin asiasta Prahassa WMSE:n Eric Luthin ja WMEU:n johtajan Anna Mazgalin kanssa. Ei heilläkään ollut asiasta muuta sanottavaa, kuin että he tukevat pohjoisen yhteistyötä, jos vain tarvetta siihen on.

Olemme kaikki aktiivisesti ja avoimesti toimivia yhteisöjä, eikä meillä ole mitään syytä panna päätämme puskaan näissä asioissa. Ehkä tarve liittoutumiseen on pienempi kuin muilla Euroopan alueilla, mutta omasta mielestäni pohjoiseurooppalaisilla on ollut ja tulee olemaan sanottavaa kansainvälisessä Wikimedialiikkeessä. Olisiko hyvä, jos pohjoisen yhteistyön tavoitteita pohdittaisiin vielä kerran yhdessä tapaamisessa?

Heikki Kastemaa, kulttuurinavigaattori

Wikimedia Česká republikan toiminnanjohtaja Klára Joklová ja Tsekin kansalliskirjaston pääjohtaja Tomáš Foltýn allekirjoittivat järjestöjen välisen kumppanuus- ja yhteistyöpöytäkirjan kansalliskirjastossa 9.6.2023.

Wikimedia CEE tapaaminen Ohridissa tapahtui hubien nimissä

CEE tapaamisen väki Ohridissa. (Kuva: Miomir Magdevski, CC BY-SA 4.0 https://creativecommons.org/licenses/by-sa/4.0, lähde: Wikimedia Commons)

Sana sieni on tšekin kielellä hub, mutta sieniretki Keski- ja Itä-Euroopan Wikimedioiden tapaaminen ei ollut. Covidin jälkeen ensimmäinen CEE:n live-tapaaminen Serbian Belgradin (2019) jälkeen tapahtui maisemistaan tunnetun historiallisen Ohridin kaupungin lähellä Pohjois-Makedoniassa.

Mukana oli toista sataa osallistujaa seuraavista maista ja alueista: Albania, Armenia, Azerbaidžan, Bosnia, Don (Etelä-Venäjä), Georgia, Itävalta, Kazakstan, Kirgisia Kreikka, Kroatia, Latvia, Makedonia, Malta, Moldova, Montenegro, Puola, Serbia, Serbitasavalta, Slovenia, Tšekki, Turkki, Ukraina, Uzbekistan, Unkari, Viro ja Venäjä. Osallistujat olivat Wikipedian eri kieli- tai käyttäjäryhmistä sekä perinteisistä Wikimedioiden jaostoista eli Chaptereista.

Lisäksi kutsuttuina tai CEE:n ulkopuolisia oli Englannista, Saksasta ja minä Suomesta, sekä Wikimedia Foundationin (WMF) ja sen johtokunnan edustajia. Maailman tilanteen takia monet esimerkiksi Venäjältä eivät päässeet osallistumaan ja joitakin ohjelmaan merkittyjä esityksiä jäi pois. Esimerkiksi Iranin Wikimedian johtaja ei ollut paikalla ennakkotiedoista huolimatta.

Hubit organisoinnin perustaksi

Tämä oli viides CEE-tapaamiseni. Muistan kyllä sanan ”hub” mainitun aikaisemminkin, mutta nyt kävi selväksi, että tämä sana luonnehtii koko Keski- ja Itä-Euroopan Wikimedioiden organisoitumista.

Hubit voivat olla pieniä tai isompia yhteisöjä, erilaisia Wiki-klubeja tai temaattisia ryhmiä. CEE:n hubi aktivoi ja palvelee muita hubeja auttamalla niitä kehittämään organisaatiotaan tai ohjelmaansa, se voi myös auttaa hubia avustushakemusten kirjoittamisessa. On koettu ongelmaksi, että tieto ei aina kulje, eli ei aina tiedetä, mitä jollain alueella tapahtuu. Joskus taas viestintää on liikaa, joka aiheuttaa sen, että hubien toimintaa on työlästä seurata. Hubien virallistamiseen ja yhteyksien parantamiseen satsataan. Hubeilla ilmeisesti haetaan myös toimintaa, joka suuntautuu alhaalta ylöspäin.

Wikimedia CEE:n hubien koordinaattoriksi valittu Barbara Klen Kroatiasta sanoi, että häntä kiinnosti työtä haettaessa yhteisön arvot ja missio. Toisen CEE hubin työntekijän paikkaa haetaan ensi vuonna.

Niin, ja Keski- ja Itä-Euroopan organisaation nimi on nyt CEE Wikimedia Hub. Kansainväliset konferenssit muistuttavat aina jossain määrin suuren perheen tai suvun tapaamista, ja Ohridissa vitsailtiin vanhan Habsburgien suvun nimen muttamista Hubsburgiksi.

Wikimedian hubeja vitsailtiin Hubsburgiksi. (kuva: Miomir Magdevski, CC BY-SA 4.0 https://creativecommons.org/licenses/by-sa/4.0, lähde: Wikimedia Commons)

Sota-ajan Wikipedia

Ukrainan Wikimedian jäsenistä 68 prosenttia ilmoitti kesäkuussa toimintansa vähentyneen joko huomattavasti tai jonkin verran koko maahan kohdistuvan hyökkäyksen jälkeen. Syitä tähän olivat ajan vähyys (erityisesti uusien muokkaajien ja neuvonnan osalta), tekniset esteet (esimerkiksi ei internet-yhteyttä väestönsuojissa) tai psykologinen stressi.

Ukrainankielisen Wikipedian lukijakiinnostus kasvoi huomattavasti. Huhtikuussa UkWikin kävijämäärä oli historiansa toiseksi vilkkain, yli 106 miljoonaa kävijää. Sota-aiheet ovat suosituimpia, kuten voi odottaa ja ukrainankielisen Wikipedian kaikkien aikojen suosituin aihe on Venäjän hyökkäys.

Ukrainan Wikimedia organisoi Ukraine’s Cultural Diplomacy Month 2022 kampanjan, jossa oli osallistujia muun muassa seuraavista pienemmistä Wikipedioiden kielistä, kuten nahuatl, tašelhit, keskibikol, tagalog ja volapük. Ukrainassa on myös luetteloitu Ukrainan uhanalaista kulttuuriperintöä ja järjestetty Wiki Loves Earth kilpailu.

Pidin kaksi Ajapaik-istuntoa, joista toiseen osallistui kolme ukrainalaista wikipedistiä, joiden kanssa kävimme läpi heidän kotikaupunkiensa vanhojen kuvien aineistoa Commonsissa. Valitsimme kuvista sellaisia, jotka olisivat käyttökelpoisia siirrettäväksi Ajapaikiin ja kuvauksiin. Eräs wikipedisti kommentoi, että valokuvaaminen Ajapaikiin Ukrainassa vanhojen kuvien perusteella itse paikalla saattaisi olla hieman vaarallista, koska kuvaajaa saatettaisiin pitää jonkinlaisena vakoilijana.

Kiinnostusta Ajapaik-järjestelmän käyttöön Ohridissa tuntui kuitenkin olevan useista eri maista ja paikkakunnilta, kuten Ukrainan lisäksi Saksasta, Latviasta ja Serbiasta. Innostuneena työpajasta aion ehdottaa Viron ja Suomen Wikimediolle, että ne aloittaisivat ”Ajapaik goes Global” -strategian laatimisen.

Ajapaik jälleenkuvausistunto.

Estot ja sensuuri

Pettymyksekseni paikalla olleet Venäjän Wikimedian edustajat eivät pitäneet ohjelmaan merkittyä raporttiaan, eikä selitystä sille tarjottu. Wikimedia Foundationin lakiasiantuntija Leighanna Mixter selvitti etänä WMF:n suhtautumista Wikipediaan suuntautuneisiin estoihin, estoyrityksiin ja venäjänkielisen Wikipedian tilanteeseen.

Wikipedian estäjämaista tunnetuin lienee Kiina, jossa estettiin ensin valittujen Wikipedia-artikkelien julkaisu vuonna 2015, ja kaikkien kielten julkaisemisen estäminen alkoi vuodesta 2018 lähtien. Wikipediaa on vaadittu estettäväksi pääasiassa uskonnollisista syistä Intiassa ja Pakistanissa, sekä Venezuelassa vaaleja edeltävänä aikana.

Turkissa oli aluksi selektiivistä estoa, kunnes kaikkien kielten Wikipedioiden julkaisu estettiin maassa vuosina 2017-2020. Estohan päättyi siihen, kun WMF valitti siitä Turkissa ja maan korkein oikeus totesi eston laittomaksi. Turkinkielisen Wikipedian muokkaus ja käyttö ei ole palautunut estoa edeltävälle tasolle 2,5 vuoden eston jälkeen. Osallistujia Ohridissa oli Turkista kaksi ja yksi turkinkielisten käyttäjäryhmästä.

Venäjän viestinnän valvontaviranomainen Roskomnadzor on lähettänyt säännöllisesti vaatimuksia WMF:lle venäjänkielisen Wikipedian muokkaamisen estämiseksi. Mixter totesi, että Foundation ei poista informaatiota Wikipediasta pelkästään siksi, että jonkun maan hallinto sitä vaatii. WMF sanoo taistelevansa muokkaajien puolesta minkä tahansa haasteen edessä. Se sanoo myös jatkavansa wikipedistien auttamista ja auttavan heidän vastuunottoaan artikkelien muokkaamisesta. Tiettävästi yksi Wikipedian muokkaaja on pidätetty Valko-Venäjällä, josta Ohridissa ei ollut osallistujia.

Tilanne Venäjällä on siis se, että venäjänkielinen Wikipedia toimii. Kun huomattava osa somesta ja internet-julkaisuista, sekä perinteisestä journalismista on estetty Venäjällä, kysyin Leighanna Mixteriltä, minkä hän arvelee syyksi tähän? Hän arvioi Venäjän viranomaisten saattavan otaksua, että estosta saattaisi olla enemmän haittavaikutuksia kuin hyötyä. Venäjänkielisessä Wikipediassa saattaa olla arvoa, joka hyödyttää myös Venäjän viranomaisia. On myös arvioitu, että Venäjällä suunnitellaan oman meta-Wikipedian julkaisemista, mikä on sinänsä täysin laillista. Ongelma niissä on päivitys, jonka mobilisoiminen ei otaksuttavasti voi saada Wikipedian mittoihin nousevia muokkausmääriä.

CEE:n itälaajentuminen

Paljon muutakin voisi Ohridin tapaamisesta kertoa. Ilmapiiri oli innostunut, mutta myös jossain määrin varautunut maailmantilanteen takia. Esimerkiksi minulta useat tulivat kysymään tavatessa, miten Suomessa voidaan ja sotatilanne tuntui olevan kaikilla mielessä. Lieneekö syynä kolmen vuoden aikaero edelliseen tapaamiseen tai maailman meno yleensä, mutta arvioisin että Wikimedia CEE on suurempi ja voimakkaampi kuin koskaan.

Osallistuin CEE tapaamiseen Virossa vuonna 2015, jolloin arvelin, että Wikimedia laajentuu itään. Nyt se itälaajentuminen on jatkunut. Ja seuraava CEE tapaaminen on syksyllä 2023 Tbilisissä, Georgiassa.

Juteltuani Ohridissa tovin erään nuoren wikipedistin kanssa, hän antoi minulle tällaisen makean lahjan kotimaastaan.

Heikki Kastemaa, kulttuurinavigaattori

Suoria sitaatteja tietokirjallisuudesta ja tiedon käytöstä

Sanna Nyqvist kirjoittaa Kritiikin Uutisissa aiheesta ”Tiedon alkuperä ja reilu käyttö – lähteistä kertomiselle on monia tapoja luovassa tietokirjallisuudessa”. Aihe liittyy viimeaikaiseen keskusteluun tietokirjallisuudesta ja lähteiden käytöstä.

Wikipediaa ei juuri voi sanoa luovaksi tietokirjallisuudeksi, onhan tietolähteiden käyttö siinä määritelty tarkemmin kuin tietokirjallisuudessa. Mutta monet artikkelin ajatukset liippaavat läheltä wikipedistiäkin.

Mainittakoon aluksi, että Suomen Kirjankustantajat -verkkosivun mukaan ”Suomessa julkaistuista kirjoista 80 prosenttia on tietokirjallisuutta, ja peräti 90 prosenttia kotimaisesta kustannetusta kirjallisuudesta.”

Sanna Nyqvist toteaa, että lähteitä koskevan keskustelun taustalla ovat osaltaan kirjamarkkinoiden muutosten paineet. Yhä harvemmat teokset pääsevät julkisuuden valokeilaan, ja sovellusten algoritmit kasaavat näkyvyyttä entuudestaan tutuille nimekkeille.

Wikipedistin on hyvä ymmärtää, että hänen käyttämänsä tietolähteet ovat rajallisia. Nyqvist on huomannut, että lähdekiistojen yhteydessä vedotaan herkästi juuri tieteen käytäntöihin. ”Tieteellinen viiteapparaatti ei kuitenkaan ole yleispätevä lähteistä kertomisen normi muualla kuin tieteellisten julkaisujen maailmassa.”

”Tietokirjallisuudessa ei siis ole yhteisesti jaettuja tiedon jatkokäytön ja lähteiden ilmaisemisen sääntöjä.”

Ja tämän kirjoittajan oivalluksen voi todeta Wikipediassakin: ”…pelkkä muodollinen lähteiden listaus ei estä kritiikkiä lähteiden käyttötavoista ja ilmoittamisesta. Jos lähdeaineisto on kiistanalaista, aukkoista, epäselvää tai oma suhtautuminen siihen on poleemista, on yleensä varminta pelkän kirjallisuusluettelon lisäksi avata tapoja, joilla aineistoja on käytetty. Samoin on hyvä nostaa esille, mikäli jokin lähde on ollut merkittävästi muita olennaisempi. Muodollisesti pätevä luettelo ei aina ole riittävä tapa viestiä lähteiden käytöstä.”

Monet wikipedistit ajattelevat sinnikkäästi, että tieto on puhdasta tulkinnasta. Tähän Sanna Nyqvist toteaa, että tieteellinen historiantutkimus – kuten myös populaari kulttuurihistoria – perustuu faktojen ohella tulkinnoille.

”Kun tietokirjoittajina hyödynnämme toisten kirjoittajien ja tutkijoiden työtä, on olennaista ymmärtää faktojen ja tulkintojen suhde. Niitä ei voi täysin erottaa toisistaan – ei ole olemassa kovia faktoja ja selviä tulkintoja – mutta tulkintoihin tarvitaan muutakin kuin vain sitkeää arkistotyötä ja tietojen listausta. Välillä näkee tulkintoja lainattavan faktoina, kun lainaavalta kirjoittajalta puuttuu aihealueen syvempi tuntemus.”

Mieltäni lämmittivät nämä artikkelin ajatukset, joita myös Wikipedian kirjoittajien toivoisi hoksaavan:

”Vastavuoroisen kuppaamisen ja vastakkainasettelujen sijaan kannattaisin kuitenkin kollegiaalisuuden vahvistamista. Tietokirjoittaminen on aina yhteistyötä, kollaboraatiota, vaikka toiselta osapuolelta ei suostumusta kysytä (eikä tarvitsekaan kysyä). Vapaan tiedon käytön lähtökohtana on kunnioitus tuon työn tekijöitä kohtaan ja ymmärrys heidän asemastaan. Suurelle yleisölle tietoa popularisoivat kirjoittajat ovat asemassa, jossa voivat toimia koko kentän hyväksi. He voivat innostaa lukijoita syvemmille vesille ja lisätä laajapohjaista kiinnostusta tietokirjallisuuteen.”

Kulttuurinavigaattori

Upscaling Images in Helsinki Rephotography

It is the beginning of a new month, so it’s time again for me to write a summary about what we have been doing at Helsinki Rephotography in September. Last month was the Hack4OpenGLAM event, so most of our time went to preparing for that. We were participating with a project about upscaling images with machine learning and artificial neural networks. For this we used the OpenCV library which stands for Open Computer Vision.

Artificial neural networks are computing systems that are inspired by the real biological neural networks found in our brains. They can be used for example in pattern recognition, 3D reconstruction and machine translation. For testing, we used a neural network model trained for upscaling images called EDSR.

Setting everything up

I was the one responsible for doing the initial legwork and getting OpenCV up and running. This required compiling it from the source code, since the super resolution module necessary for upscaling images was not included in the pre-compiled version of OpenCV. I first did a test version without GPU acceleration just to see how fast the upscaling was with just the CPU power. This ended up working with simpler upscaling models such as FSRCNN, but that one obviously wasn’t as good as EDSR, which took well over a minute to upscale a small image with just the CPU.

I then figured out how to get CUDA working with OpenCV. This allowed the use of Nvidia GPUs in the upscaling process. It required installing the CUDA toolkit and recompiling OpenCV with support for it. After setting it up, I ran into another problem: my GPU had too little integrated memory to do the upscaling. This prompted Kimmo to set up an analytics server with a more powerful GPU that we could try, and this ended up working. It now only took 5 seconds to upscale the same picture that took over a minute just with the CPU.

The results

After this we could try it on different images and see how it worked. We ended up using 3 different image upscaling models; GFPGAN, Real-ESRGAN and ESRGAN. These models were based on a different neural network technique called generative adversarial network. In this technique, two neural networks compete against each other. The other creates data points, while the other tries to distinguish between the real ones and the ones created by the neural network.

The end result was that the images themselves looked good, but the AI sometimes tended to create weird things, such as badly shaven mustaches, faces inside faces and walls that were made from fabric. So, it was not perfect, but could work if you weren’t looking for the perfect result. Here is a good example of the upscaling that we did on an image provided to us by Fortepan, who we did this project in collaboration with. This image was upscaled with ESRGAN. In it you can clearly see the difference in sharpness and details between the original and the upscaled image.

For me it was interesting to see and learn what machine learning and neural networks can be used for. I hope that in the future we can also use this for something useful.

-Siru, intern

Suomen saaristo Wikipediassa

Suomi tunnetaan tuhansien järvien ja saarien maana. Iso osa saarista on merellä rannikolla ja keskeisessä asemassa ruotsalaiselle Suomelle – ja näin ollen kiinnostuksen kohde Projekt Fredrikalle. Miten Wikipedian tietoa saaristosta voisi jatkokehittää suomeksi, ruotsiksi ja muillakin kielillä? 

Saarien nykytila

Suomenkielisessä Wikipediassa artikkeleita saarista on 880 merialueilla ja 335 sisävesillä. Ruotsiksi vastaavat luvut ovat 17 235 (merellä) ja 23 219 (sisävesillä). Englanniksi, saksaksi ja muilla kielillä luvut ovat huomattavasti pienemmät. Jos googlettaa jonkun Suomen tuhansista saarista, niin hakutuloksiin saa melko todennäköisesti ruotsinkielisen Wikipedian artikkelin. 

Ruotsinkielisen Wikipedian artikkelit on luotu botilla useampi vuosi sitten. Lsjbot laski algoritmilla maastodatasta saarien koordinaatit, pinta-alan, korkeimman korkeuden ja muita tietoja, ja yhdisti näistä sivut. Saarien tiedot ovat siis “aika hyviä”, mutta vailla virallista lähdettä. 

Lsjbotin artikkelit voidaan mieltää ruotsinkielisen Wikipedian asiaksi, mutta tiedot ovat myös päätyneet kieliriippumattomaan Wikidataan ja ovat siten osa Suomen maantiedettä Wikidatassa.  

Artikkeleiden jatkokehitys ja hyödyt

Rannikon saarien artikkeleita voisi jatkokehittää monelta kannalta. Ensinnäkin olisi hienoa saada pois “automaattisesti luotu”-varoituskyltti jokaiselta ruotsinkieliseltä sivulta – tämä vaatisi tarkistustyötä ja tietojen verifiontia.

Abborrskärin artikkeli ruotsinkielisessä Wikipediassa
Abborrskärin artikkeli ruotsinkielisessä Wikipediassa

Lisäksi ruotsinkielisen saariartikkelin kartta on niin laaja, ettei se kerro paikalliselle mitään saaren tarkasta sijannista Suomen rannikolla. Itse artikkeleita voisi myös parantaa lisäämällä tietoa yhteysaluksista, saaren historiasta, asutuksesta, nimen lausumisesta, ja muusta – osa on mahdollista tehdä botilla, osa vaatii käsityötä. Fredrika on listannut näitä ajatuksia Nauvon saarien projektisivulle ruotsiksi ja suomeksi

Suomenkielisten olemassa olevien artikkeleiden tietoikkunoita olisi syytä yhtenäistää. Suurimmille, merkittävimmille saarille voisi luoda automaattisesti botilla tarpeeksi hyvät suomenkieliset tyngät, jotka mahdollistaisivat artikkeleiden laajentamisen myöhemmin. Esimerkkinä tyngästä ja tietoikkunasta olemme luoneet artikkelin Högsar.

Lisäksi saarien linkittäminen OpenStreetMapissa Wikidataan mahdollistaisi dynaamisien karttojen esittämisen artikkeleiden tietoikkunassa. Linkitys avaisi uusia mahdollisuuksia hyödyntää kokonaisvaltaisesti OSM:n, Wikidatan, Wikipedian ja Wikimedia Commonsin avointa dataa saaristosta. 

Nauvolla on 1220 saarta Wikidatassa joista osalla on Wikidatan tunniste OpenStreetMapissa. Katso haku.

Virallinen lähde

Jatkokehitystä ja bottiajoja jarruttaa se, ettei Lsjbotin luomia tietoja ole verifioitu, eikä saaria ole yhdistetty virallisen lähteen uniikkiin tunnisteeseen. Isomman artikkelimäärän luominen suomeksi ja muilla kielillä Lsjbotin tietojen perusteella ei ole perusteltua. 

Maalaisjärjen mukaan saaren perustietojen lähteenä pitäisi käyttää Maanmittauslaitoksen tai SYKEn tietoja (kuten järvi- ja meriwiki). Maanmittauslaitoksen tietokorteissa on tällä hetkellä tarjolla ainakin koordinaatit ja uniikki tunniste (esim Högsar, 10303715), mutta ei muuta Lsjbotin aikanaan laskemaa tietoa, kuten pinta-ala. Hyvä alku, mutta toivon mukaan Maanmittauslaitos tai muu virallinen taho alkaisi tarjoamaan lisää tietoa saarista. 

Saaren olemassa olon vahvistaminen

Voisiko olemassa oleville Wikidatan saarille lisätä Maanmittauslaitoksen tunnisteen (P4119) ja siten edes vahvistaa niiden olemassaoloa? Minkälainen työ se olisi? 

Vertasimme valitun alueen saarien koordinaatteja Wikidatassa Maanmittauslaitoksen APIsta saataviin koordinaatteihin (käyttämämme python-koodi). Rajasimme Wikidatan tiedot entisen Nauvon kunnan alueelle, koska sen alueella on paljon saaria ja meillä on henkilökohtaista kokemusta alueesta. MML:n tietoa pystyimme rajaamaan Paraisten kuntaan sekä “Saari tai luoto” ja “Saari- tai luotoryhmä” luokituksien avulla. 

Wikidatan Nauvon 1214 saarelle löytyi nimen perusteella Maanmittauslaitoksen tiedoista
– yksiselitteinen vastinpari 732 saarelle, 
– useampi vastinpari 378 saarelle ja 
– 104 saarta ilman vastinparia. 

Etäisyys Wikidatan ja Maanmittauslaitoksen koordinaateissa oli 732 yksiselitteisillä vastinparilla: 
– yli 1000 metrin etäisyys 8 saarella 
– 10-1000 metriä: 54 saarta 
– 0-10 metriä: 681 saarta

Yli 1000 metrin etäisyydet eivät tarkoittaneet väärää tietoa Wikidatassa, vaan API-haku oli erinäisistä syistä palauttanut väärän saaren Maanmittauslaitoksen tiedoista. 

Näillä tiedoilla voisi luottavaisin mielin lisätä 0-10 metrin etäisyydellä oleville 681 saarelle Maanmittauslaitoksen koordinaatit käyttäen Maanmittauslaitosta lähteenä. 

Suurimman tarkastustyön ennen lähteen lisäämistä aiheuttaisi useamman vastinparin saaneet (378 saarta) ja ilman vastinparia jääneet (104 saarta) – mutta sekään ei ole mahdotonta. 

Mitä sitten? Kysymyksiä lukijalle

Onko suuressa tarkastustyössä ja Maanmittauslaitoksen tunnisteen (P4119) lisäämisessä järkeä? Antaisiko tunniste toivottavaa pohjaa uusien artikkeleiden luomiselle? 

Jos saariartikkeleita luotaisiin botilla suomeksi, mitä ominaisuuksia artikkeleilta toivotaan? Mikä on pienin artikkelitynkä mitä sallitaan – onko Högsar sopiva? Missä vedetään raja saaren merkittävyydelle – saaren koko?

Tarvitaanko tarkempaa ja luotettavampaa tietoa saarista? Suomen järvistä on saatavilla tarkkaa valmista tietoa järvi & meri-wikissä, mm. järvien pinta-aloista. Ei vaatisi kuin geometrista matematiikkaa, että samaa voisi tarjota saarista, mutta kenen toimesta ja miten? Miten voisi kehottaa esimerkiksi Maanmittauslaitosta laskemaan ja tarjoamaan tietoa? 

Oma lukunsa on saarien ääriviivat OSM:ssä, joissa olisi paljon parantamisen varaa. Ääriviivoja voisi mieluiten parantaa automaattisella ajolla Maanmittauslaitoksen karttatietojen avulla manuaalisen piirtämisen sijaan. Kenen toimesta tämä onnistuisi? 

Projekti- ja keskustelusivut

Lisää aiheesta Kahvihuoneessa sekä Nauvon saarien projektisivuilla ruotsiksi ja suomeksi

August in Helsinki Rephotography

This month in Helsinki Rephotography we have worked on implementing IIIF using IIIPImage to Ajapaik. IIIF stands for the International Image Interoperability Framework, and it is a protocol for standardizing image retrieval. Using IIIF it is easy for users to manipulate images, like modifying size, scale, region of interest, rotation, quality, and format. IIIF also allows for easy implementation of image annotations, and with it users can comment, transcribe and draw on images.

The IIIF protocol has two parts, the image API, and the presentation API. The image API delivers images in a way that easily specifies the characteristics of the image, such as region, size, rotation, and quality. The presentation API on the other hand provides the information necessary to drive a compelling viewer experience.

IIPImage is a high-performance image server that can be used to stream high resolution images. It uses IIIF and the Fast CGI protocol in combination with a front-end web server (nginx in Ajapaik’s case). IIPImage can use images that are either in the TIFF format, or the JPEG2000 format. It also comes with an image converting tool called vips than can be used to convert images to the TIFF format.

During the month I have made a Python script that is used with the uWSGI server to download images from Wikimedia, convert them to the TIFF format and then display them over IIIF. uWSGI is a Web Server Gateway Interface server implementation that can be used in conjunction with a web server to forward requests to an external program.

The idea is to get this script to execute whenever a 404 Not Found error happens at the IIPImage server. It will parse the filename from the request and find out if the image can be found on Wikimedia Commons. If it can, it will download and convert the image to TIFF using vips. Lastly it will redirect the user to the IIPImage server that will serve the image using the IIIF protocol.

I did this by launching uWSGI with the Python script and a socket file as parameters. I then added a new location to the nginx site configuration that specifies that the requests to this location should be forwarded to the uWSGI server. This worked when the user directly accessed the location but didn’t when they were forwarded to it from a 404 error, since in that case only the request URL got forwarded to uWSGI instead of the full parameters.

To fix this we had to modify the script to parse the filename from the full URL. This was easy with Python’s urllib. Now we are in the process of implementing the presentation API of IIIF. During the Wikimania Hackathon we also added a link to IIIF to the user interface of Ajapaik.

-Siru, intern

Helsinki Rephotography From The Eyes of an Intern

My name is Siru, and I am an IT student at the Vaasa University of Applied Sciences. Currently I am an intern at Wikimedia Finland with the Helsinki Rephotography project, which is a collaboration project between Wikimedia Finland and the Estonian Ajapaik. The idea is to create a mobile app that allows users to rephotograph old photographs on Ajapaik with new, more modern versions and to see how those places have changed. 

Currently we are helping Ajapaik with their server migration, since they are in the process of upgrading to a more powerful server. We have now switched to using the new server and I have setup an automated backup system and a downtime notification system that sends notifications to Slack in case of errors. 

The backup system is a bash script that is made to run daily on both Ajapaik and the backup server. On Ajapaik the script makes a backup of the database and then compresses, encrypts, and digitally signs it. It also makes an unencrypted backup that only contains specific tables from the database. 

On the backup server the script first checks the available disk space and sends a notification in case it is running low. It then syncs the pictures and database backups from Ajapaik to a backup folder. After syncing it verifies the integrity of the database backups using the digital signature. If the syncing fails for some reason and/or the integrity can’t be verified, it then sends a notification. 

I have also made several other bash scripts, such as one that monitors the resources of Ajapaik and sends a notification in case disk space is running low, if CPU load is high for extended periods or if the memory or swap memory are running low. There is also a script that runs on startup of the Ajapaik server. It basically starts all the services and checks that Ajapaik is reachable with HTTP. There is also a similar script on the backup server that constantly monitors if the Ajapaik website is reachable and in case it isn’t it sends a notification. 

In the future I will be participating in the programming of the mobile app which we are programming in Flutter. It has been interesting to do the system maintenance tasks since that is something I am interested in and that I already have experience in from working with my own servers. The internship is being done remotely, which has its own challenges, but I think it works perfectly for this kind of job. 

-Siru, intern