Archive for the 'Web 2.0' Category

Tekijänoikeusneuvosto: Ruskea raita ei saa suojaa eikä parodia ole tekijänoikeuden rajoitus

Tekijänoikeusneuvosto on tuoreessa ratkaisussaan tutkinut teoskynnystä ja parodian käsitettä.

Internetsivuston sisältö oli osittain TekijäL 1 §:ssä tarkoitettu itsenäinen ja omaperäinen teos. Kyseisen TekijäL 1 §:n nojalla suojatun sisällön käyttäminen parodiatarkoituksessa ei ollut sallittua TekijäL 4 §:n 2 momentin nojalla. Käyttö merkitsi TekijäL 2 §:n mukaisten taloudellisten oikeuksien ja TekijäL 3 §:n moraalisten oikeuksien loukkausta.

Monessa kohtaa neuvoston ratkaisun kanssa on helppo olla samaa mieltä:

-Teoskynnys ei tyypillisesti ylity verkkosivuissa, ellei graafinen ilme ole erikoinen. Yksin ruskea raita tekstin kanssa ei ylitä teoskynnystä.
-Parodiaa ei ole määritelty tekijänoikeuslaissa.
-Neuvosto on onnistunut listaamaan joukon relevantteja oikeusohjeita sekä oikeuskirjallisuudesta että relevanteista tapauksista.

Parodiaa koskevaa lopputulemaa voidaan kuitenkin pitää epäonnistuneena. Miksi?

Neuvosto on erikoinen elin lainkäytössä. Tuomioistuimet joilla ei tyypillisesti ole käytössään tekijänoikeuslakia koskevaa erityisosaamista antaa monesti neuvoston ratkaisuille painoarvoa. Tämä näkyytekijänoikeustuomioissa joissa usein viitataan neuvoston ratkaisukäytäntöön. Tässä tapauksessa syyttäjä oli hakenut neuvostolta ratkaisua yksin. Neuvosto antaa ratkaisunsa hakijan tietojen perusteella. Neuvolla ei ole velvollisuutta kysyä asianosaisten mielipidettä asiaan edes tuomioistuinkäsittelyä varten annetuissa lausuntopyynnöissä. Parodian arvioimiseksi tulee kuitenkin selvittää parodian objektiivinen tarkoitus (joka selviää teoksesta) mutta yhtälailla parodian tekijän subjektiivinen tarkoitus. Ratkaisusta ilmenee, että neuvosto ei ollut tutustunut kokonaisuudessaan parodiateokseen eikä ollut selvittänyt sen tekijän motiiveja. Tästä syystä neuvoston oli mahdoton arvioida parodiateoksen tekijänoikeudellista luonnetta. Neuvoston arvaus parodian tekijän tarkoituksesta meni metsään:

Tekijänoikeusneuvosto katsoo, että Pelastakaa Pedofiilit -sivuston tarkoituksena on ilmeisesti ollut saattaa alkuperäisteos eli Pelastakaa Lapset ry:n sivusto arvostelun kohteeksi ja kyseenalaistaa Pelastakaa Lapset ry:n edustama aate.

Mikäli syyttäjä olisi toimittanut neuvostolle koko parodiasivuston, olisi neuvosto voinut lukea tekijän syyn teoksen luomiselle:

Sivuston tarkoitus onkin esittää kritiikkiä ja parodisoida tuota toista nettivihjettä. Nettivihjeen pohjimmaisena ideanahan on asettaa pedofiilit ja lapset vastakkainasetteluun, jossa pahat pedofiilit levittävät kuvia viattomista lapsista joita tulee suojella. Mikäli lukijasta tuntuu että pedofiilien puolustaminen on täysin absurdia, väitänkin että päinvastainen on myös aivan yhtä absurdia. Siinä missä pedofiilien puolustaminen on täysi mahdottomuus, on yhtälailla täysi mahdottomuus että lapsia ei puolustettaisi. Kuka voisi oikeasti olla eri mieltä jostain jonka perusteena on lasten suojeleminen?

Tämä “Pelastakaa Pedofiilit”-nettivihje onkin päällispuolin täysi kopio “Pelastakaa Lapset” nettivihjeesta. Perustuslain mukaan ihmisiä ei kuitenkaan saa pitää lain silmissä eriarvoisina henkilöön liittyvista syistä, jollaisia ovat mielipiteet ja seksuaalinen suuntautuminen. Tämänlaisen palvelun pyörittäminen ihan aikuisten oikeasti olisi siis täysin laillista, tai ainakin yhtä laillista kuin tuon toisen nettivihjeen. Erona on vain esitetty käyttötarkoitus, molemmissa tapauksissa laillinen mutta moraalisilta näkökohdiltaan poikkeava.

Neuvosto myös epäonnistui tulkitsemaan oikeusohjeita ja olemassa olevia ratkaisuja.Neuvoston näkemys on, että parodia elää yksinomaan “vapaasti muunneltuna teoksena”.

Parodioita on sen sijaan totuttu käsittelemään TekijäL 4 §:n 2 momentin tarkoittamina itsenäisinä teoksina eli niin sanottuina vapaina muunnelmina. TekijäL 4 §:n 2 momentin mukaan jos joku teosta vapaasti muuttaen on saanut aikaan uuden ja itsenäisen teoksen, ei hänen tekijänoikeutensa riipu tekijänoikeudesta alkuperäiseen teokseen. Yleensä on katsottu, että sallittu parodia hyödyntää alkuperäistä teosta täysin toisessa tarkoituksessa ja voi sen vuoksi olla itsenäinen teos. Kaikissa tapauksissa parodiakin saa suojaa itsenäisenä teoksena vain teossuojan yleisten edellytysten täyttyessä. (Sorvari, Katariina: Tekijänoikeuden loukkaus, Helsinki 2007, s. 179 ja Haarmann, Pirkko-Liisa: Tekijänoikeus ja lähioikeudet, Helsinki 2005, s. 67)

Parodian keskeinen tehtävä on kuitenkin tuoda alkuperäinen teos katsojan mieleen sen ivaamiseksi. Jotta tämä olisi mahdollista, parodian on lähes väkisin lainattava alkuperäisestä teoksesta eikä se voi olla vapaasti muunneltu. Kyseessä on sama vetoomusfunktio joka lainauksella on. (Tämän neuvosto on lainauksen osalta ratkaisuun osannut kirjata).

Tekijänoikeusneuvosto on katsonut, että Ruotsin Högsta domstolenin 23.12.2005 päivätty ratkaisu T 4739-04, on relevantti myös Suomen oikeuden kannalta. Ratkaisussa tuomioistuin katsoo, että teoksen muuntelua parodiatarkoituksessa on perinteisesti pidetty sallittuna, ja tällöin voidaan myös varsin laajasti käyttää alkuperäisteosta sanasta sanaan. Tapauksessa näyttelijä luki repliikkejä kirjasta, jotka oli yhdistetty toisen elokuvan ääniraitaan. Ilman parodiatarkoitusta tämä olisi varmasti katsottu oikeudenloukkaukseksi.

Siteerattaessa tekijän nimi ja lähde on mainittava siinä laajuudessa ja sillä tavoin kuin hyvä tapa vaatii. Teosta ei saa tekijän suostumuksetta muuttaa enempää kuin sallittu käyttäminen edellyttää. (TekijäL 11 § 2 momentti).

Mikäli teoksen käyttäminen parodiaan katsotaan sallituksi käytöksi ja vetoomusfunktio täytetään, ei muuttelun tulisi olla kiellettyä parodian osalta. Otetaan vaikka Jope-Ruonansuumainen sketsi, jossa sanotaan “Olen maksanut jokaisen tuppeensahatun lautakasan *Kröhm* saanut lahjuksena* eikä niiden osalta ole mitään epäselvyyksiä”

Disclosure: Olemme olleet mukana jutussa.

Luis von Ahn valjastaa sadat miljoonat Internetin käyttäjät töihin

Luis von Ahn esitteli vaikuttavaa tutkimustaan jota hän on tehnyt Internetin käyttäjien valjastamiseksi hyödyllisiin tehtäviin.

This talk is about harnessing human time and energy to address problems that computers cannot yet solve. Although computers have advanced dramatically in many respects over the last 50 years, they still do not possess the basic conceptual intelligence or perceptual capabilities that most humans take for granted. By leveraging human skills and abilities in a novel way, I want to solve large-scale computational problems and collect training data to teach computers many of the basic human talents. To this end, I treat human brains as processors in a distributed system, each performing a small part of a massive computation. Unlike computer processors, however, humans require an incentive in order to become part of a collective computation. Among other things, I show how to use online games as a means to encourage participation in the process.

von Ahnin kynästä on lähtöisin ReCaptcha ja Google Image Labeler. Luisin esitys oli viihdyttävä sekä samalla asiapitoinen. Näkee, että hän oli puhunut aiheesta aikaisemminkin. Luis myös raotti tulevaa projektiaan, joka liittyy käännösten tekemiseen. Kielen kääntäminen on varmasti sopiva hanke Recaptcha tyylisiin projekteihin. Moni aikuinen ihminen osaa ainakin kahta kieltä. Sen sijaan että ohjelma kysyisi mitä näytöllä näkyy, se voi helposti pyytää käyttäjää kääntämään tekstin toiselle kielelle. Melko pitkälle päästään kun käyttäjät kääntävät englanninkieliset sanat omalle kielelleen. Näin koostuvasta tietokannasta voidaan luoda toimiva käännöstietopankki vähän Wiktionaryn tapaan. Luisin esityksen inspiroimana asensin tähänkin blogiin ReCaptchan. Toivon mukaan spammi vähenee ja kommentit ilmestyvät välittömästi esille.

Minulla tuleva kesä menee Harvardissa pitkälti Googlen rahoittaman AudioImager softaprojektin kanssa. Projektin etenemistä voi seurata Kumaripaban blogista.

Luis von Ahn at Berkman Center Luncheon talk

Etätallennus tapetilla Yhdysvalloissa

IPR info julkaisi vuoden ensimmäisessä numerossa kirjoittamani artikkelin “TV:n etätallennus tapetilla”.

Yhdysvalloissa itärannikon valitustuomioistuin (2nd circuit) antoi vuonna 2008 ratkaisun TV- ja elokuvayhtiöiden ja kaapeli-TV-operaattori Cablevisionin välisessä riidassa.
Cablevision oli informoinut oikeudenhaltijoita uudesta palvelustaan, jolla sen asiakkaat voisivat tallentaa verkkokovalevylle ohjelmia käyttäen omaa kaapeliboksiaan näiden tallennusten ohjelmoimiseen. Oikeudenhaltijat vaativat kieltotuomiota, joka estäisi palvelun aloittamisen. Loukkaako kaapelioperaattori oikeudenomistajien yksinoikeuksia tallentamalla asiakkaidensa pyynnöstä televisio-ohjelmia? Samat kysymykset ovat hiljattain nousseet esille myös Suomessa.

Tallennuksen osalta vastaavat kysymykset ovat nousseet television lisäksi myös radiolla. Oikeudenomistajat ovat ottaneet herneen nenään satelliittiradiovastaanotin valmistajille, joiden vastaanottimet pystyvät myös tallentamaan yksittäisiä ohjelmia ja etukäteen valittuja kappaleita. Vastaanotin/tallentimen omistaja voi ohjelmoida laitteensa tallentamaan tietyt kappaleet. Radiokanavat lähettävät monesti RDS tai vastaavaa tietoa siitä mikä kappale radiosta soi. Laite käyttää tätä tietoa hyväkseen ja tallentaa laitteen kovalevylle halutut kappaleet. RIAA katsoo, että radiokanava + MP3 tallennin jolla sitä voi vastaanottaa muodostaa digitaalisten musiikkitiedostojen kappaleenjakelupalvelun.

Yhdysvalloissa yksityiskopioinnin rajat ovat häilyvämmät kuin Suomessa. Yhdysvaltojen kotitallennusta musiikin osalta säädellään erityisessä laissa, joka luotiin DAT-nauhojen tullessa markkinoille. Oikeudenomistajat pelkäsivät, että radioista tulee jakelukanava heidän musiikin maksuttomalle kotikopioinnille. Lobbauksen jälkeen kongressi sääti Audio Home Recording Actin. Siinä radiokanaville ja laitevalmistajille asetettiin tiukat ehdot. Radiokanavat eivät esimerkiksi saa täyttää kuulijoiden toiveita saman tien. Ajatuksena on, että toivoja  saattaa väijyä musiikkia digitaalisen tallentimen kanssa. Tallennusmedian ja laitteiden valmistajille laki asettaa tiukat ehdot vastuuvapauden saamiseksi. Laitevalmistajan mm. pitää varmistaa, että laitteisiin tallennettua musiikkia ei voi kopioida rajoittamattomasti.

Oletko joskus ihmetellyt miksi iPodista  ei saa MP3 musiikkia ulos tai miksi siinä ei ole radiota? Varmasti Cupertinon pojat ovat lukeneet AHRAnsa.

CC 3.0 lisenssit lähestyvät julkaisua

Täältä löytyy Release candidate 1 versio CC 3.0 suomenkielisestä lisenssistä.

Tiedän, että olen lupaillut lisenssiä jo pitemmän aikaa, mutta sen julkaisu on nyt loppusuoralla. Nyt on viimeiset hetket vaikuttaa lisenssikäännöksen sisältöön ja kommentoida sen laatua. Vielä muutaman viikon ajan siihen voi tehdä muutoksia, mutta sen jälkeen se toivottavasti siirtyy “tuotantoon”.

Erilainen vappu ROFLConissa

Kymmenen vuoden aikana olen kiertänyt monenlaisia seminaareja ja konferensseja. Ensi viikolla on kuitenkin ohjelman ja puhujien perusteella odotettavissa erityislaatuisin ja erikoisin tapahtuma -ROFLCon II. Kyseessä on Internetsukupolven Woodstock jossa kohtaavat progekoodaajat, Internet-meemien alkuunpanijat, omituisimmat tutkimushankkeet ja World Weird Webin sekopäisimmät verkkopalvelut. Keynoten pitää Microsoftin Clippy-klemmarin isä. Sessioiden esityksissä ei varmasti jäykistellä tai esitetä ensiksi neljää kalvoa yrityksen avainluvuista tai arvoista. Sen sijaan luvassa on kaksi päivää omituisia ilmiöitä ympäri kellon.

Moni kysymys saa varmasti vastauksen: Miten meemit saavat alkunsa? Saako susipaidasta yliluonnollisia voimia? Meneekö Autotune villitys koskaan ohitse? Voiko 4chania ohjata? Miksi mustat amerikkalaiset hallitsevat Twitteriä öisin? Montako Goatsea voi yhdessä esityksessä olla? Valitseeko David puudutuksen seuraavallakin kerralla hammaslääkärissä? Montako kirosanaa Winnibegoman saa mahtumaan dokumenttiinsa?

Välimäen Mikko muuten esiintyi eilen Harvardin Berkman Centerissä ja video esityksestä on katsottavissa Interwebissä. Mikolla on ollut kova viikko. Maanantaina Bostonin maraton aikaan 2:45, tiistaina esitys Harvardissa ja nyt hän on jumissa jossain keski-euroopassa tuhkapilvessä.

Tuomari haastaa lehden oikeuteen henkilöllisyyden paljastamisesta

Yhdysvaltalainen tuomari haastoi paikallisen lehden yksityisyyden loukkauksesta sekä lehden Privacy policy -sopimuksen sopimusrikkomuksesta. Juttu sai alkunsa, kun lehden toimittaja oli alkanut kaivella “lawmiss” nimimerkin takaa lehden juttuja kommentoineen kirjoittajan taustoja. Lehden käyttäjärekisterin tietojen perusteella toimittaja yhdisti nimimerkin tuomariin. Tuomari oli kommentoinut useita vireillä olevia oikeusjuttuja tavalla, jonka voidaan katsoa olevan ammattietiikan vastaista -mutta ei ilmeisesti kuitenkaan laitonta. Itse jutun kirjoittaminen ei ilmeisesti loukannut tuomaria.

On helppo ymmärtää, miksi hänen oikeustajunsa ei voinut sulattaa luottamuksellisen tiedon käyttämistä häntä vastaan suunnatussa uutisoinnissa. Oletus tulisi olla että, jos kirjoituksia saa jättää anonyyminä, ne myös pysyvät anonyymina. Näin siis, jos anonyymit kommentit eivät riko lakia.

Jos katsotaan asiaa pelkästään bisnesnäkövinkkelistä lehden päätös oli laskelmoitu. Nyt lehti katsoi jutun paljastamisen tärkeämmäksi kuin yleisön luottamuksen anonyymien kommenttien jättämiseen. Kyse oli luottamuksesta ja sen hinnasta. Onko lukijoiden luottamus siihen, että lehti kaivaa yhteiskunnan epäsuhdat kalliimpi kuin lehden lukijoiden luottanut yksityisyyden säilyttämiseen?

Linkki juttuun.

Kuvien oikeudet ja tekijän nimen ilmoittaminen

Lisensointu Creative Commons By 2.0 Kuvan ottaja: Glenn Fleishman

Artinfo.comissa on kiinnostava juttu iPadin mukana vakiona tulevan taustakuvasta. Kuvan ottaja Richard Misrach neuvotteli jo jonkin aikaa Applen kanssa kuviensa käytöstä, mutta sopimusta ei ole ilmeisesti vieläkään allekirjoitettu. 300.000 iPadia myöhemmin Richard toivoo saavansa Applelta hyvän sopimuksen oikeudesta käyttää kuvaa yksinoikeudella -Syytä olisikin. Sopimuksettomassa tilassa joku voisi väittää, että Apple on loukannut Misrachin oikeuksia jakaessaan kuvaa osana kaupallista tuotettaan.

he received an email from the company saying it had reconsidered and wanted to license Pyramid Lake (at Night), a 2004 photo he took at a Native American reservation in Nevada. Terms were set for a five-year exclusive deal, with the company saying they would use the image for screen-savers and other features. There was no mention of the iPad. “The funny thing is that I don’t even have a contract with them yet, so they must have decided on it at the eleventh hour,” Misrach says. “I’m sure they’ll send me one quickly now. But I’m very happy, I’m sure it’s fine, and the terms are good.”

Jutussa on käytetty kuvaa, jota Apple muuten ilmeisesti toivoo ainakin tulevaisuudessa käyttävänsä yksinoikeudella. Kuvan tiedoissa on sanottu:

Courtesy of Richard Misrach

“Pyramid Lake (at Night),” a 2004 photo by Richard Misrach (detail).
Toimittaja on todennäköisesti saanut kuvan Misrachilta ja käyttää sitä siis luvalla. Sen sijaan toimittaja on löytänyt ilmeisesti toisen jutussa käytetyn kuvan Wikipediasta. Kuva on lisensoitu CC-nimi mainittava lisenssillä, joten sen käyttöön ei liity kovin montaa ehtoa. Toimittaja onnistuu kuitenkin munimaan tekijätietojen ilmoittamisen.
Courtesy of Wikipedia Commons
Richard Misrach’s photo as seen on the iPad’s desktop.
Tutkin asiaa. Kuva on päätynyt Wikimedia commonsiin Flickr käyttäjä Glenn Fleishman valittua sille CC-by lisenssin. Toimittaja on tuskin saanut “Wikipedia Commonsilta” lupaa tuon käyttämiseen eikä tunnu käyttävän sitä CC lisenssin ehtojen mukaisesti. Taitaa seilata toimittaja samassa veneessä Applen kanssa.
Valitettavasti CC lisenssin loukkaaminen tuntuu olevan maan tapa. Useimmiten hyvääkin tarkoittavat lisenssinsaajat eivät osaa tai viitsi viitata lisenssiehtojen vaatimalla tavalla tekijään tai tämän tekijänoikeustiedot sisältäviin sivuihin. Monesti CC on mainittu, mutta linkki lisenssiin jää uupumaan. Käyttäjät tiputtavat helposti lisenssin nimenkin, vaikka verkossa sen ilmoittaminen ei maksa mitään.
Täytyypä myöntää, etten ole itsekään muistanut aina tuota linkkiä liittää käyttämiini CC teoksiin, mutta olen yrittänyt linkittää silloin alkuperäisiin sivuihin, josta tuo tieto selviää. Näin myös yllä olevassa teoksessa, jota on muutettu rajaamalla alkuperäisestä.
Jos CC-lisenssiehtojen noudattaminen tuottaa vaikeuksia, katsokaa malliesimerkki Wikimedian sivustoista. Ne ovat tyylinäyte siitä miten homma hoidetaan. Toinen hyvä esimerkki on Taloussanomille tehty CC lisensointitoteutus. Sen avulla kuka tahansa lisenssinsaaja voi ilmoittaa CC ehdot Talsan sisällölle. Kun homman kerran tekee kunnolla, ei murehtia sitä joka kerta kun lisensointikysymykset tulevat vastaan.

Meidän data

Minua on pitkään ihmetyttänyt se ettemme voi fiksusti hallita dataa jota useammat tahot keräävät meistä. Kaupat, luottolaitokset ja liikennelaitokset omaavat meistä dataa, josta ne louhivat arvoa omalle liiketoiminnalleen. Miksi datan generoija, siis yksittäinen ihminen, ei voi tehdä näin helposti omalle datalleen?

Olen käyttänyt puoli vuotta lähes ainoastaan luottokorttia maksujen tekemiseen. Korttiyhtiöni antaa käyttööni työkalut kulujeni seuraamiseen. Tiedän melko tarkasti kuinka paljon rahaa olen käyttänyt ruokaostoksiin ja kuinka paljon harrastuksiin. Luottokorttiyhtiöllä ei kuitenkaan ole kuitteja josta selviäisi kuinka paljon suolakurkkuja olen ostanut puolen vuoden aikana. Hyvä näin. Eikä heillä ole syytäkään olla tätä tietoa. Sen sijaan osalla käyttämistäni kaupoista on tämä tieto johtuen kanta-asiakaskorteista, joita olen käyttänyt alennusten saamiseksi. Minulla on finanssidata, mutta ei mansikankäyttödataani.

Suomessa jokaisella rekisteröidyllä on rekisterin tarkastusoikeus ja osa kaupoista antaa pääsyn dataan. Veikkaanpa, että tulevaisuudessa ihmiset vaativat tietonsa itselleen ja palveluntarjoajat alkavat tarjoamaan työkaluja datavirran järjestelyyn ja analysoimiseen. Samalla myös kaupat joutuvat kilpailemaan siitä miten ne palvelevat datanälkäisiä asiakkaitaan. Data, joka on tuottanut lisäarvoa kaupan käsissä, on potentiaalisesti asiakkaan käsissä vielä arvokkaampaa.Olen nähnyt vauvojen telemetriapalvelun, mutta milloin näemme ensimmäisen yksityishenkilöiden kokonaisvaltaisen telemetriapalvelun joka antaa meille hallinnan tuottamastamme datasta.

Ajattele, jos voisit automaattisesti selvittää edellisen kuukauden ruokakorisi hinnan eri kaupoissa automaattisesti? Mitä, jos voisit laskea kuinka monta kaloria ostit viime viikolla ja miten se vaikutti painoosi? Mitä, jos voisit itse lukea autosi “mustan laatikon” dataa?

Ajatus oma datan omistamisesta on loistava ajatus, mutta se aikaansaa ehkä enemmän ongelmia kuin ratkaisee. Miten teinien, jotka saavat auton ensi kertaa käyttöönsä, yksityisyyttä suojataan, jos vanhemmat pystyvät seuraamaan heidän joka liikettä? Entä jos vakuutusyhtiöt alkavat vaatia meidän oman telemetrian tietoa kohtuuhintaisten vakuutusten saamiseksi?

Julkinen data

Antti Poikola, Petri Kola ja Kari A. Hintikka julkaisivat tärkeän kirjasen: “Julkinen data”. Siinä käsitelläänmyös julkisen datan avaamiseen liittyvää pykäläviidakkoa ja erityisesti edellisessä kirjoituksessani sivuamaani tietosuojalainsäädäntöä vaikka julkaisun ansiot ovat muualla. Hyvää työtä ja tuore tuulahdus muutoin hitaasti etenevään keskusteluun.

Oppaan lopussa esitetään joukko ehdotuksia suomalaisten tietovarantojen
maksuttomalle avaamiselle. Ehdotukset jakautuvat viiteen aihealueeseen:
1) Avoimen datan perusinfrastruktuurin synnyttäminen
2) Lainsäädännön muutos ja kansallinen ohjaus
3) Hallinnon sisäiset käytännöt tukemaan avointa dataa
4) Julkishallinnon avoimen datan hyötyjen jalkauttaminen
5) Suomen kansainvälisen edelläkävijyyden ja tahtotilan mahdollistaminen
Suomessa ei vielä ole datan avaamista koordinoivia toimielimiä, kuten esimerkiksi
Isossa-Britanniassa. Jotta eteneminen olisi koordinoitua ja yksittäisen organisaation
kannalta vaivatonta, Suomeen voitaisiin luoda hallinnon avoimen
datan selvitystoimisto (clearing house). Se koordinoisi käytännön kysymyksiä,
opastaisi hallintoa ja toimisi myös mahdollisten ongelmatilanteiden ratkaisijana
esimerkiksi Kuluttajaviraston tavoin. Niin ikään Suomelle voitaisiin kehittää
datakatalogi, jossa olisi keskitetysti tarjolla tiedot kaikista hallinnon tuottamista
julkisista aineistoista.

Silmiini osui Tim O’Reillyn lyhyt puhe aiheesta, joka sopi päivän avoin/julkinen data teemaan:

DGREE—Tim O’Reilly from DGREE on Vimeo.

Netflixin haaste

Viime viikolla pitkään jenkkien suurin videovuokrausketju BlockBuster ilmoitti että se on ajautumassa konkurssiin. Vaikka konkurssi ei ole Yhdysvalloissa toiminnan loppu vaan uudelleenjärjestelyn paikka, on selvää, että videovuokraus toiminta on muuttunut viimeisen viiden vuoden aikana paljon. Netflix on yhdysvaltalainen videovuokrauspalvelu. Sen toiminnan ydin on verkossa toimiva palvelu joka suosittelee elokuvia katsojan aikaisempien elokuvien pohjalta. Olen itse arvotellut yli 1000 elokuvaa yhdestä viiteen tähteen -luokituksella.Netflix siis tietää makuni melko tarkkaan. Tuon tiedon ja miljoonien muiden samanlaisten makutietojen perusteella palvelu osaa arvioida minkä elokuvan saattaisin katsoa seuraavaksi. Aikaisemmin suosituksen saamiseksi piti kysyä kavereilta tai tiskin takana olevalta teinimyyjältä jonka maku ei välttämättä aina kohdannut omaa makua. Netflixin kautta valitut DVD tai Bluray -elokuvat saapuvat postilla kotiin. Palvelun kautta voi myös streamata osan elokuvista suoraan tietokoneelta tai sopivalta verkkoon kytketyltä laitteelta katsottavaksi.

NetFlixin todellinen innovaatio ja lisäarvon tuoja verrattuna muihin sen kilpailijoihin on kuitenkin suosittelujen tarkkuus. Omilla voimillaan yritys sai suosittelu algoritmit melko toimiviksi. 2009 se jakoi ensimmäisen Netflix prize kilpailun palkinnon: miljoona dollaria. Palkinnon sai ryhmä joka ensimmäisenä paransi suosittelualgoritmia kymmenellä prosentilla. Voittaja oli Team “BellKor’s Pragmatic Chaos”, jonka jäsenet olivat päivätöissä Yahoolla. Netflix sai Crowdsourcing menetelmällä halpaa työvoimaa sekä mittaamattoman arvokkaan parannuksen liikeomaisuuteensa. Tuloksista innostuneena yritys päätti toistaa kilpailun. Tuloksena oli joukkokanne. Netflix perääntyi kilpailusta ja joukkokanne on sovittu.

Mikä johti joukkokanteeseen? Netflix luovutti kilpailijoille datasetin algoritmin optimoimiseksi. Yritys oli tehnyt kaikkensa datan anonymisoimiseksi. Datasetti voidaan anonymisoida siten että yksin sen datan perusteella ei voi tunnistaa rekisteröityjä henkilöitä. Tutkijat kuitenkin selvittivät, että jos yhdistetään Netflix tietokanta ja IMDB tietokanta, anonymisoidut ihmiset voidaankin tunnistaa. Tässä tapauksessa tunnistaminen tapahtui arvostelun kellonajan perusteella. Vertaamalla tuota kellonaikaa IMDB tietokantaan pystyi yksittäiset käyttäjät tunnistamaan.

Suomessakin rekisteriselosteissa ja tietosuoja koskevissa pykälissä puhutaan rekisteritiedon käyttämisestä anonymisoituna. Rekisterinpitäjän on lähes mahdotonta tietää muihin rekistereihin tallennetuista tiedoista. Onko rekisteri anonymisoitu, jos sen data voidaan toiseen rekisteriin yhdistelemällä “deanonymisoida”? Tarvitseeko rekisterinpitäjän olla tietoinen joka ikisestä rekisteristä ja sen tiedoista vai riittääkö että anonymisointi tehdään vain omalle datalle? Näyttäisi, että nämä ongelmat saattavat estää monet crowdsourcing hankkeet.

Mitä ratkaisuja ongelmaan voisi olla?

-Rekisterin pitäjä voisi pitää kiinni datasetistä, mutta antaa queryvastauksia kilpailijoille. Näin voitaisi edes avustavasti varmistaa, että siitä ei voi yksilöidä henkilöä. Tämä vaikeuttaisi varmasti kilpailijoiden työtä verrattuna ensimmäiseen kierrokseen eikä välttämättä takaisi täydellisesti tietosuojaa.

-Rekisterinpitäjä voisi kerätä käyttäjiltään suostumuksen tutkimuskäyttöön. Tällöin myös tietosuojaongelmat voitaisiin sopimusteitse välttää. Suostumus olisi voinut olla myös jo alkuperäisessä käyttöehtosopimuksessa. Ongelmaksi tulee tosin erilaiset erityislait kuten Video privacyprotectio act jolla on muuten erittäin mielenkiintoiset taustat.

http://en.wikipedia.org/wiki/Video_Privacy_Protection_Act

http://en.wikipedia.org/wiki/Robert_Bork_Supreme_Court_nomination