Tag Archives: journalyse

Lunsjsnakkisene 25. juni

Lørdag er en god dag for å lese avisene, og det er dagen de fleste allmenne aviser prioriterer litt ekstra med sine artikler. Hvorvidt det gir utslag på nettet er jeg litt usikker på, men ved å se på det over tid vil vi finne ut av det.

Her er i hvert fall en oversikt over dagens snakkiser så langt i dag. Listen er generert av Gravemaskinens nye algoritme ca. 11:25 i dag:

  1. Sykt glad i deg
  2. Ja til homoekteskap i New York
  3. Jaget svensk paparazzi
  4. Ja til homoekteskap i New York
  5. Høylytte hverdagshelter
  6. Gutt (16) siktet for voldtekt etter ungkarsfestival
  7. Einar (35) drept på åpen gate: – Han var alltid blid og positiv
  8. Yoda (14) er «verdens styggeste hund»
  9. SV vil lovfeste rett til heltid i helsevesenet
  10. Minikamera avslørte 1500 år gamle Maya-hemmeligheter
  11. 5.000 har fått feilaktig varsel om avskilting
  12. Staten har betalt 2 milliarder for pasientskader
  13. Ja til homoekteskap i New York
  14. Maskerte menn ranet pokerklubb
  15. Bra start for Vannspeilet
  16. «Noen kastet ei søppelbøtte etter meg»
  17. Somalere gjorde opp seg i mellom
  18. Kom i form med GPS og andre treningsdingser
  19. Ny Falklandskonflikt
  20. Til sjukehus etter straumsjokk – tilstanden førebels ukjend
  21. Fem drept på flyplass i Peru
  22. Minst 10 omkommet i storm i Vietnam
  23. Hadde seksuell omgang med eget barnebarn
  24. Historisk homo-lov innført i New York
  25. Pågrepet etter væpnet politiaksjon

Onsdagens snakkiser

Her er en oversikt over de 25 største “snakkisene” i går (onsdag 22. juni 2011) i følge Gravemaskinen:

  1. – Har ikkje brukt senga på fem døgn
  2. Barna funnet i god behold
  3. Dette er hjernene bak «Hurtigruten»
  4. «Hele» verden har fulgt Hurtigruten
  5. Kapteinen som ble folkehelt
  6. Frykter mor ville selge baby for 5.300 kroner
  7. Her er Lars Monsens nye turgjeng
  8. Satser på «Harry Potterton»
  9. Dette husker vi fra hurtigruten
  10. Fikk seks barn på tre minutter
  11. Hurtigruten i DVD-boks – årets julegave eller årets flopp
  12. Disse skal sprenge nye grenser
  13. Kidnappede jenter (1 og 3) er funnet i god behold
  14. Verdensrekord i breisladd
  15. – Metadonbehandling virker ikke etter hensikten
  16. - Snarlig masseutryddelse av liv i havet
  17. Brudd for Clooney og kjæresten
  18. Hørte dere ikke at barna gråt?
  19. Nå er reisen over
  20. Dronningen vinket til Hurtigruten
  21. Lærerfest antente gymnas
  22. Han får mest blant norske bønder
  23. Mer ulv enn på 30 år
  24. Ashley Young enig med Manchester United
  25. Slik lures nordmenn i timesharefella – opptil fire ganger

Magnus Blaker

Magnus Blaker er journalist og vaktsjef i Nettavisen. Han er en av journalistene som skriver mest om datalagringsdirektivet og personvern, og han skriver den populære spalten “Se hva vi fant på internett”.

Som en del av sommerens arbeid med å videreutvikle Gravemaskinen og gjøre den klar for lansering, tenkte vi å gjøre en kjapp liten journalyse av hans innsats hittil i år:

  • 177 artikler (Nettavisen:170, Bergensavisen:2, Teknofil:2, NA24:1)
  • 133 kilder (snitt:1,04, maks:4, min:0)
  • 244.392 tegn (snitt:2443,92, maks:7.151, min:410)

Gravemaskinen er ikke komplett ennå, og vi mangler blant annet artikler fra Nettavisen for januar, men jeg tror vi med utgangspunkt i disse tallene kan slå fast at Nettavisen’s Magnus Blaker ikke skriver korte notiser. Tvert i mot, med et snitt på nesten 2.500 tegn er dette lengre artikler enn de fleste papiraviser kan skilte med.

Nå har vi valgt ut en enkelt journalist denne gangen, men diverse stikkprøver viser at Nettavisen har en stor andel lange omfattende artikler med flere kilder. Magnus har et snitt på 1,04 kilder, noe som kan synes lavt, men det er fordi det inkluderer kommentarartikler og “Se hva vi fant på internett”-spalten der det brukes få eller ingen sitater. 29 av artiklene til Magnus har 2 eller flere kilder.

Her er artiklene til Magnus Blaker i et regneark.

NRKbeta

Sommerværet har ikke imponert så langt, men vi har ihvertfall kommet i gang med vår sommerjobb. Den går primært ut på å utvide kildegrunnlaget til Gravemaskinen slik at den, Siste Nytt, Sitatsjekk og kommende tjenester skal få et godt variert utvalg når høsten starter.

En av datakildene vi nettopp har lagt inn, er alle netthodenes favoritt: NRKbeta

Vi har indeksert opp 173 artikler fra og med 2007, og selv om det ikke er helt komplett, er det ikke langt unna er det likevel interessant å se på litt statistikk. Dette gjør oss blant annet i stand til å sjekke hvem som har skrevet flest av artiklene på NRKbeta:

Ikke overraskende er det Øyvind Solstad som topper listen, etterfulgt av Eirik Solheim og Marius Arnesen. Vi ser da også at NRKbeta får et tomrom som må fylles nå som han har gått over i ny jobb som kommunikasjonsrådgiver i Carat Interaktiv.

Tar vi en titt på listen over hvem som har skrevet de lengste artiklene, er det de samme gjengangerne der også:

Her er forøvrig et Google Spreadsheet med oversikt over artiklene på NRKbeta.

Oppdatert: Vi manglet litt flere artikler enn vi opprinnelig trodde, så vi må bruke litt tid på å oppdatere kildedataene før vi kan komme med en komplett liste. I skrivende stund er det nå 182 artikler, og ikke 173 som da artikkelen ble skrevet. Hvor mange det er totalt vet vi først når vi er sikre på at alle artikler er med.

Kultur vs Sport vs Utenriks

Vi har som nevnt i forrige blogginnlegg lagt til et nytt søkeparameter for å søke på URL-strengen til artiklene.

Dette parameteret ble lagt inn etter et inspirerende møte med en potensiell kunde. De syntes det var interessant å se på hva Gravemaskinens “journalyse”-funksjonalitet kan brukes til, men påpekte at de helst ville ha en mulighet til å sammenligne forskjellige redaksjoner.

Ettersom det er veldig mange forskjellige publiseringssystemer som er i bruk rundt omkring, og selv de som bruker samme CMS velger ofte forskjellige kategorier og URL-syntakser, er det vanskelig å lage en generisk løsning som fungerer for absolutt alle.

Ved hjelp av vårt API kan hver enkelt nettavis lage egne løsninger for dette, men vi kom heldigvis frem til en generisk metode som vil virke for en svært stor andel av nettavisene.

Her har vi tre eksempler på URL-søk og hvilke nettaviser som bruker henholdsvis kategoriene kultur, sport og utenriks:

Kultur

Sport

Utenriks

Ettersom forskjellige nettaviser har forskjellige kategoriseringer, blir det feil å bruke slike rapporter til å avgjøre hvem som skriver mest om de forskjellige feltene, men de som ønsker å gjøre en sammenligning mellom 2 nettaviser får i hvertfall en mulighet til å gjøre det både raskt og enkelt.