Monthly Archives: June 2010

Magnus Blaker

Magnus Blaker er journalist og vaktsjef i Nettavisen. Han er en av journalistene som skriver mest om datalagringsdirektivet og personvern, og han skriver den populære spalten “Se hva vi fant på internett”.

Som en del av sommerens arbeid med å videreutvikle Gravemaskinen og gjøre den klar for lansering, tenkte vi å gjøre en kjapp liten journalyse av hans innsats hittil i år:

  • 177 artikler (Nettavisen:170, Bergensavisen:2, Teknofil:2, NA24:1)
  • 133 kilder (snitt:1,04, maks:4, min:0)
  • 244.392 tegn (snitt:2443,92, maks:7.151, min:410)

Gravemaskinen er ikke komplett ennå, og vi mangler blant annet artikler fra Nettavisen for januar, men jeg tror vi med utgangspunkt i disse tallene kan slå fast at Nettavisen’s Magnus Blaker ikke skriver korte notiser. Tvert i mot, med et snitt på nesten 2.500 tegn er dette lengre artikler enn de fleste papiraviser kan skilte med.

Nå har vi valgt ut en enkelt journalist denne gangen, men diverse stikkprøver viser at Nettavisen har en stor andel lange omfattende artikler med flere kilder. Magnus har et snitt på 1,04 kilder, noe som kan synes lavt, men det er fordi det inkluderer kommentarartikler og “Se hva vi fant på internett”-spalten der det brukes få eller ingen sitater. 29 av artiklene til Magnus har 2 eller flere kilder.

Her er artiklene til Magnus Blaker i et regneark.

NRKbeta

Sommerværet har ikke imponert så langt, men vi har ihvertfall kommet i gang med vår sommerjobb. Den går primært ut på å utvide kildegrunnlaget til Gravemaskinen slik at den, Siste Nytt, Sitatsjekk og kommende tjenester skal få et godt variert utvalg når høsten starter.

En av datakildene vi nettopp har lagt inn, er alle netthodenes favoritt: NRKbeta

Vi har indeksert opp 173 artikler fra og med 2007, og selv om det ikke er helt komplett, er det ikke langt unna er det likevel interessant å se på litt statistikk. Dette gjør oss blant annet i stand til å sjekke hvem som har skrevet flest av artiklene på NRKbeta:

Ikke overraskende er det Øyvind Solstad som topper listen, etterfulgt av Eirik Solheim og Marius Arnesen. Vi ser da også at NRKbeta får et tomrom som må fylles nå som han har gått over i ny jobb som kommunikasjonsrådgiver i Carat Interaktiv.

Tar vi en titt på listen over hvem som har skrevet de lengste artiklene, er det de samme gjengangerne der også:

Her er forøvrig et Google Spreadsheet med oversikt over artiklene på NRKbeta.

Oppdatert: Vi manglet litt flere artikler enn vi opprinnelig trodde, så vi må bruke litt tid på å oppdatere kildedataene før vi kan komme med en komplett liste. I skrivende stund er det nå 182 artikler, og ikke 173 som da artikkelen ble skrevet. Hvor mange det er totalt vet vi først når vi er sikre på at alle artikler er med.

Nye datakilder

Det skjer mye på utviklingssiden for tiden, selv om ikke alt er like synlig ennå.

En av de viktigste tingene vi har gjort, er å lage et nytt system for å indeksere ny informasjon. Det har tatt litt tid, men i forrige uke ble systemet klart, og i dag legges de første nye kildene inn i Gravemaskinen.

Det dreier seg om følgende:

  • blogg.abrenna.com
  • sitatsjekk.no
  • nrkbeta.no
  • datatilsynet.no
  • svomming.no
  • no.wikipedia.org

Det kreves ikke et spesielt godt trent øye for å se at disse kildene skiller seg litt ut fra de vanlige nettavisene som i dag dominerer innholdet i Gravemaskinen.

Vi har tidligere lagt inn noen få blogger, samt pressemeldingene fra Regjeringen. Dette er informasjon som vi tror blir svært interessant i fremtiden når vi får på plass flere struktureringsmekanismer, og vi er nå klare for å legge inn flere fortløpende. For å skille mellom forskjellig type innhold, har vi valgt å sette opp et par forskjellige kategorier:

Blogger er definert som blogger uten redaksjonelt ansvar i form av logoen til PFU. Denne inndelingen er selvsagt noe problematisk, men vi har valgt å prøve dette i første omgang, og så heller justere kursen etterhvert.

Fakta er en ny kategori beregnet på informasjon som sjeldent oppdateres. Vår første kilde blir Wikipedia, og det er i seg selv en liten utfordring med oppdateringene, men hver enkelt artikkel blir ikke oppdatert så ofte i snitt når den først har nådd et visst nivå. Her ser vi for oss flere nye kilder, som f.eks. Norges lover, statistikk, resultatlister og lignende, samt selvsagt også Store Norske Leksikon (SNL.no).

Informasjon er en ny kategori som delvis overlapper med pressemeldinger. Vi har valgt å legge inn Datatilsynet og Norges Svømmeforbund her, ettersom langt fra alle nyheter er direkte myntet på pressen. Dette blir en kategori med ganske mange kilder etterhvert, og vi ser for oss å legge inn flere etater, idrettsforbund, fagforeninger og organisasjoner som f.eks. Fagpressen der. Det kan også tenkes at vi velger å plassere kommunene der, men det får vi se på.

Nettaviser er den opprinnelige kategorien vår. Vi skal i løpet av sommeren utvide med langt flere lokalaviser, samt at vi prioriterer å få på plass så mange av Fagpressens medlemspublikasjoner som mulig. Det er også verdt å merke seg at Sitatsjekk og Siste Nytt foreløpig kun bruker kilder som er kategorisert under nettaviser. Hvorvidt vi kommer til å endre på det, avhenger litt av tilbakemeldinger og erfaringer vi selv gjør oss fremover.

Pressemeldinger er en kategori som vil skaleres opp ganske raskt, og vi kommer blant annet til å legge inn børsmeldinger her. I første omgang konsentrerer vi oss om å utvide i bredden med flere kilder, men etterhvert skal vi også forsøke å samle inn historiske pressemeldinger.

Vi har en lang arbeidsliste foran oss, men vi kan omprioritere litt ved ønsker og behov fra våre brukere. Vi er også spesielt interesserte i tilbakemeldinger på hva slags faktaopplysninger dere vil ha i Gravemaskinen.

Sitatsjekk 2.0

Sitatsjekk for iPhone er nå tilgjengelig i oppgradert utgave på App Store.

Programmet koster 55 kroner, men oppgraderingen er gratis for de som allerede har kjøpt da den var i versjon 1.0 eller 1.1. Sitatsjekk vil bli oppgradert fortløpende gjennom sommeren, og også kommende oppgraderinger forblir gratis.

Slik ser den ut:

Grensesnittet har blitt forenklet slik at det nå ligner mer på vanlige iPhone applikasjoner, samt at det har blitt lagt til menyvalg for å hente om de siste kildene som er sitert, samt de siste publiserte sitatene i egne lister. Det er også en søkehistorikk som viser de siste 10 søkene, slik at det blir lett å gjenta de, med eller uten en justering av søkestrengen.

Slik vises de siste siterte kildene. Når man klikker på et personnavn får man opp artiklene med sitater der vedkommende er sitert.

Sitatene er gruppert per artikkel.

Når man klikker på et sitat, åpnes artikkelen på vanlig måte i den innebygde nettleseren.

Sitatsjekk 2.0 har nå innebygd støtte for å tipse andre om artikler via e-post, uten å gå ut av Sitatsjekk applikasjonen.