Onsdagens snakkiser

Her er en oversikt over de 25 største “snakkisene” i går (onsdag 22. juni 2011) i følge Gravemaskinen:

  1. – Har ikkje brukt senga på fem døgn
  2. Barna funnet i god behold
  3. Dette er hjernene bak «Hurtigruten»
  4. «Hele» verden har fulgt Hurtigruten
  5. Kapteinen som ble folkehelt
  6. Frykter mor ville selge baby for 5.300 kroner
  7. Her er Lars Monsens nye turgjeng
  8. Satser på «Harry Potterton»
  9. Dette husker vi fra hurtigruten
  10. Fikk seks barn på tre minutter
  11. Hurtigruten i DVD-boks – årets julegave eller årets flopp
  12. Disse skal sprenge nye grenser
  13. Kidnappede jenter (1 og 3) er funnet i god behold
  14. Verdensrekord i breisladd
  15. – Metadonbehandling virker ikke etter hensikten
  16. - Snarlig masseutryddelse av liv i havet
  17. Brudd for Clooney og kjæresten
  18. Hørte dere ikke at barna gråt?
  19. Nå er reisen over
  20. Dronningen vinket til Hurtigruten
  21. Lærerfest antente gymnas
  22. Han får mest blant norske bønder
  23. Mer ulv enn på 30 år
  24. Ashley Young enig med Manchester United
  25. Slik lures nordmenn i timesharefella – opptil fire ganger

Magnus Blaker

Magnus Blaker er journalist og vaktsjef i Nettavisen. Han er en av journalistene som skriver mest om datalagringsdirektivet og personvern, og han skriver den populære spalten “Se hva vi fant på internett”.

Som en del av sommerens arbeid med å videreutvikle Gravemaskinen og gjøre den klar for lansering, tenkte vi å gjøre en kjapp liten journalyse av hans innsats hittil i år:

  • 177 artikler (Nettavisen:170, Bergensavisen:2, Teknofil:2, NA24:1)
  • 133 kilder (snitt:1,04, maks:4, min:0)
  • 244.392 tegn (snitt:2443,92, maks:7.151, min:410)

Gravemaskinen er ikke komplett ennå, og vi mangler blant annet artikler fra Nettavisen for januar, men jeg tror vi med utgangspunkt i disse tallene kan slå fast at Nettavisen’s Magnus Blaker ikke skriver korte notiser. Tvert i mot, med et snitt på nesten 2.500 tegn er dette lengre artikler enn de fleste papiraviser kan skilte med.

Nå har vi valgt ut en enkelt journalist denne gangen, men diverse stikkprøver viser at Nettavisen har en stor andel lange omfattende artikler med flere kilder. Magnus har et snitt på 1,04 kilder, noe som kan synes lavt, men det er fordi det inkluderer kommentarartikler og “Se hva vi fant på internett”-spalten der det brukes få eller ingen sitater. 29 av artiklene til Magnus har 2 eller flere kilder.

Her er artiklene til Magnus Blaker i et regneark.

NRKbeta

Sommerværet har ikke imponert så langt, men vi har ihvertfall kommet i gang med vår sommerjobb. Den går primært ut på å utvide kildegrunnlaget til Gravemaskinen slik at den, Siste Nytt, Sitatsjekk og kommende tjenester skal få et godt variert utvalg når høsten starter.

En av datakildene vi nettopp har lagt inn, er alle netthodenes favoritt: NRKbeta

Vi har indeksert opp 173 artikler fra og med 2007, og selv om det ikke er helt komplett, er det ikke langt unna er det likevel interessant å se på litt statistikk. Dette gjør oss blant annet i stand til å sjekke hvem som har skrevet flest av artiklene på NRKbeta:

Ikke overraskende er det Øyvind Solstad som topper listen, etterfulgt av Eirik Solheim og Marius Arnesen. Vi ser da også at NRKbeta får et tomrom som må fylles nå som han har gått over i ny jobb som kommunikasjonsrådgiver i Carat Interaktiv.

Tar vi en titt på listen over hvem som har skrevet de lengste artiklene, er det de samme gjengangerne der også:

Her er forøvrig et Google Spreadsheet med oversikt over artiklene på NRKbeta.

Oppdatert: Vi manglet litt flere artikler enn vi opprinnelig trodde, så vi må bruke litt tid på å oppdatere kildedataene før vi kan komme med en komplett liste. I skrivende stund er det nå 182 artikler, og ikke 173 som da artikkelen ble skrevet. Hvor mange det er totalt vet vi først når vi er sikre på at alle artikler er med.

Nye datakilder

Det skjer mye på utviklingssiden for tiden, selv om ikke alt er like synlig ennå.

En av de viktigste tingene vi har gjort, er å lage et nytt system for å indeksere ny informasjon. Det har tatt litt tid, men i forrige uke ble systemet klart, og i dag legges de første nye kildene inn i Gravemaskinen.

Det dreier seg om følgende:

  • blogg.abrenna.com
  • sitatsjekk.no
  • nrkbeta.no
  • datatilsynet.no
  • svomming.no
  • no.wikipedia.org

Det kreves ikke et spesielt godt trent øye for å se at disse kildene skiller seg litt ut fra de vanlige nettavisene som i dag dominerer innholdet i Gravemaskinen.

Vi har tidligere lagt inn noen få blogger, samt pressemeldingene fra Regjeringen. Dette er informasjon som vi tror blir svært interessant i fremtiden når vi får på plass flere struktureringsmekanismer, og vi er nå klare for å legge inn flere fortløpende. For å skille mellom forskjellig type innhold, har vi valgt å sette opp et par forskjellige kategorier:

Blogger er definert som blogger uten redaksjonelt ansvar i form av logoen til PFU. Denne inndelingen er selvsagt noe problematisk, men vi har valgt å prøve dette i første omgang, og så heller justere kursen etterhvert.

Fakta er en ny kategori beregnet på informasjon som sjeldent oppdateres. Vår første kilde blir Wikipedia, og det er i seg selv en liten utfordring med oppdateringene, men hver enkelt artikkel blir ikke oppdatert så ofte i snitt når den først har nådd et visst nivå. Her ser vi for oss flere nye kilder, som f.eks. Norges lover, statistikk, resultatlister og lignende, samt selvsagt også Store Norske Leksikon (SNL.no).

Informasjon er en ny kategori som delvis overlapper med pressemeldinger. Vi har valgt å legge inn Datatilsynet og Norges Svømmeforbund her, ettersom langt fra alle nyheter er direkte myntet på pressen. Dette blir en kategori med ganske mange kilder etterhvert, og vi ser for oss å legge inn flere etater, idrettsforbund, fagforeninger og organisasjoner som f.eks. Fagpressen der. Det kan også tenkes at vi velger å plassere kommunene der, men det får vi se på.

Nettaviser er den opprinnelige kategorien vår. Vi skal i løpet av sommeren utvide med langt flere lokalaviser, samt at vi prioriterer å få på plass så mange av Fagpressens medlemspublikasjoner som mulig. Det er også verdt å merke seg at Sitatsjekk og Siste Nytt foreløpig kun bruker kilder som er kategorisert under nettaviser. Hvorvidt vi kommer til å endre på det, avhenger litt av tilbakemeldinger og erfaringer vi selv gjør oss fremover.

Pressemeldinger er en kategori som vil skaleres opp ganske raskt, og vi kommer blant annet til å legge inn børsmeldinger her. I første omgang konsentrerer vi oss om å utvide i bredden med flere kilder, men etterhvert skal vi også forsøke å samle inn historiske pressemeldinger.

Vi har en lang arbeidsliste foran oss, men vi kan omprioritere litt ved ønsker og behov fra våre brukere. Vi er også spesielt interesserte i tilbakemeldinger på hva slags faktaopplysninger dere vil ha i Gravemaskinen.

Sitatsjekk 2.0

Sitatsjekk for iPhone er nå tilgjengelig i oppgradert utgave på App Store.

Programmet koster 55 kroner, men oppgraderingen er gratis for de som allerede har kjøpt da den var i versjon 1.0 eller 1.1. Sitatsjekk vil bli oppgradert fortløpende gjennom sommeren, og også kommende oppgraderinger forblir gratis.

Slik ser den ut:

Grensesnittet har blitt forenklet slik at det nå ligner mer på vanlige iPhone applikasjoner, samt at det har blitt lagt til menyvalg for å hente om de siste kildene som er sitert, samt de siste publiserte sitatene i egne lister. Det er også en søkehistorikk som viser de siste 10 søkene, slik at det blir lett å gjenta de, med eller uten en justering av søkestrengen.

Slik vises de siste siterte kildene. Når man klikker på et personnavn får man opp artiklene med sitater der vedkommende er sitert.

Sitatene er gruppert per artikkel.

Når man klikker på et sitat, åpnes artikkelen på vanlig måte i den innebygde nettleseren.

Sitatsjekk 2.0 har nå innebygd støtte for å tipse andre om artikler via e-post, uten å gå ut av Sitatsjekk applikasjonen.

Pressemelding om Siste Nytt

Selv om dette er bloggen til Sitatsjekk, faller det naturlig å informere litt om ett annet nytt iPhone-program her.

Siste Nytt er et program som viser de siste 100 nyhetene fra de samme kildene som Sitatsjekk bruker. Det er det andre programmet som bruker Gravemaskinens API, og det er nå tilgjengelig i App Store.

Programmet ble godkjent av Apple natt til lørdag i pinsen, og det ga oss noen tall å trekke frem før vi sendte ut en pressemelding i dag morges. Her følger den i sin helhet:

PRESSEMELDING:

Nytt norsk program til iPhone og iPod Touch viser de til enhver tid siste 100 nyhetene fra mer enn 50 norske nettaviser.

- Siste Nytt er laget for å raskt gi leserne et oppdatert og variert nyhetsbilde, sier medieutvikler Anders Brenna.

Medieutvikleren har laget iPhone-programmet Siste Nytt med utgangspunkt i den nye norske søkemotoren Gravemaskinen, som foreløpig er i lukket beta. Dermed kan leserne raskt holde seg oppdatert på nisjenyheter fra et bredt utvalg av norske nettaviser.

- Søker man på f.eks: datalagringsdirektivet, RBK, “Jens Stoltenberg”, iPad eller oljesand viser Siste Nytt de 50 siste artiklene fra et variert utvalg av redaksjoner, sier Brenna.

Med Gravemaskinen som søkemotor er det også mulig å søke på ord og uttrykk i artiklenes tekst, i tittelen og i sitater, samt søke på tekstlengde og hvilken journalist som har skrevet saken.

- Et søk på f.eks. artikler som har brukt ordet “sex” i tittelen gir et interessant innblikk i medie-Norges nyhetsprioriteringer. Mange får seg en overraskelse når de ser hvilke nettaviser som er mest sex-fikserte i sine artikler, sier Brenna.

I Siste Nytt gjøres et slikt søk ved å skrive title:sex i søkefeltet. Andre interessante eksempler er title:askefast og title:krise. Tilsvarende vil avanserte søk som journalist:”anders brenna”, quotes:sjokkert eller sources:”erna solberg” vise de siste 50 artiklene fra medieutvikleren som har laget Siste Nytt, artikler der noen er sitert på ordet sjokkert eller bare artikler der Høyre-leder Erna Solberg er sitert.

- Siste Nytt ble tilgjengelig lørdag i pinsen, og det ble solgt 54 programmer den første dagen. Det holdt til en 28. plass på topplisten til Apple, sier Brenna.

På sin andre dag solgte Siste Nytt 57 programmer i det norske markedet, samt 1 i det amerikanske. Det holdt til en 24. plass i Norge.

- Salgstallene viser at det norske iPhone-markedet fortsatt er umodent for salg av norsk innhold, men at det kommer seg, sier Brenna.

Medieutvikleren skrev tidligere i år en analyse i medienettavisen Kampanje om hva man kan forvente å tjene som norsk iPhone-utvikler etter lanseringen av Sitatsjekk, og vil bruke nye tall fra Siste Nytt til å skrive en oppfølger.

Siste Nytt er en relativt enkel applikasjon, selv om søkemotoren bak er svært avansert. Den er utviklet av Anders Brenna i samarbeid med Trondheimsselskapet Atbrox AS, der bl.a. tidligere Google-utvikler Amund Tveit bruker sin erfaring fra arbeidet med de nordiske utgavene av Google News. I motsetning til andre søkemotorer, er Gravemaskinen en tjeneste som er laget for journalister og mediebransjen.

- Gravemaskinen gjør det mulig for nettaviser og andre å raskt utvikle nye kommersiell programmer og tjenester, enten det er på web, til intranett eller i dedikerte applikasjoner på mobiler, PC-er og andre digitale enheter, sier Brenna.

Siste Nytt er den andre applikasjonen som bruker Gravemaskinen. Den første er Sitatsjekk, et program som lar brukerne sjekke hva politikere, næringslivstopper og andre tidligere har sagt, for å sjekk om de snur kappen etter vinden. Sitatsjekk har forøvrig blitt skrevet om fra bunnen av, og vil snart bli lansert i ny versjon. Oppgraderingen vil bli gratis for alle som har kjøpt tidligere utgaver, og den vil fortsatt koste 55 kr.

Selv om Siste Nytt nettopp er lansert, er arbeidet med å oppgradere den allerede i gang. Ivrige brukere meldte inn ønsker og behov bare noen få timer etter lanseringen. Øverst på listen står ønsket om å filtrere bort nyheter fra fremtiden.

- Flere norske nettaviser kan ikke klokka, og det skaper litt hodebry for Siste Nytt. Vi kommer til å filtrere nyheter som tilsynelatende er publisert i fremtiden, men det beste hadde vært om de aktuelle lokalavisene selv rettet feilen, sier Brenna.

Per i dag er det 57 norske nettaviser som får sine nyheter presentert i Siste Nytt, men det blir mange flere i løpet av kort tid. Brenna håper å slippe å måtte fjerne lokalaviser som ikke setter riktig dato og klokkeslett på sine artikler.

- Ett av målene med Siste Nytt er å fremheve nyheter og artikler fra lokalaviser og andre nisjeaviser slik at vi får et mer variert mediebilde i Norge, sier Brenna.

Les mer om Siste Nytt på bloggen til Anders Brenna. Der er det også bilder av programmet som fritt kan benyttes. Programmet koster 6 kroner, og prisen inkluderer fremtidige oppgraderinger. Siste Nytt kan kjøpes i App Store via PC/Mac eller direkte fra mobilen.

Ta gjerne direkte kontakt med Anders Brenna på 900 77 860 ved spørsmål om Siste Nytt, Sitatsjekk eller Gravemaskinen.

Anders Brenna er tidligere nettsjef i Teknisk Ukeblad og redaksjonssjef i digi.no. Nå skriver han en fast spalte om medieteknologier og forretningsutvikling i fagtidsskriftet Kampanje, samtidig som han utvikler medieløsninger for iPhone, iPad og web sammen med Trondheimsselskapet Atbrox.

Mvh
Anders Brenna
Medieutvikler
http://twitter.com/abrenna
http://blogg.abrenna.com
http://sitatsjekk.no
http://gravemaskinen.no

Som et eksempel på hvor raskt det går å utvikle nye medieapplikasjoner med utgangspunkt i Gravemaskinens API, kan jeg nevne at Terje Pedersen, som har laget Sitatsjekk for Android, klarte å lage en betautgave av Siste Nytt for Android i løpet av søndag kveld.

Nå må det poengteres at det ikke er programmeringen som tar lang tid når man utvikler slike programmer. Det mest tidkrevende er å finne frem til hvordan designet fungerer optimalt for brukeren. Det er et tilnærmet evigvarende prosjekt, og arbeidet med oppgradering av Siste Nytt er allerede i gang, men det er viktig at man er på rett spor og har et system som fungerer før man slipper den første utgaven. Det tror jeg vi har med Siste Nytt, men jeg er samtidig den som gleder meg mest til å få noen av de første oppdaterte funksjonenen på plass. :-)

Til slutt på vi bare si takk til de som allerede har kjøpt Siste Nytt. I skrivende stund er det to anmeldelser på App Store. Det er for få til at de vises til alle. Kanskje dere kan bidra med deres ærlige mening om Siste Nytt?

Nationen har 48 artikler om Datalagringsdirektivet

…og det er bare hittil i år.

Her er artiklene lagt ut i et oversiktlig regneark på Google Spreadsheets.

Nummer 2 på listen er digi.no, som forøvrig har flest artikler totalt.

Graf med mest siterte personer

Vi har lagt inn vår første graf i Gravemaskinen, og det er en graf som viser hvem som er de mest siterte personene. Den vises når man logger på Gravemaskinen, før man gjør et eget søk.

Hva synes dere?

Blogger i Sitatsjekk og Gravemaskinen

Vi har begynt arbeidet med å legge blogger inn i vårt system, og har begynt med norske blogger på *.blogspot.com.

Disse er allerede tilgjengelig for de som har kjøpt Sitatsjekk for iPhone eller Android, samt for de som deltar i den lukkede betatestingen av Gravemaskinen på web.

Vi skal legge inn støtte for flere bloggeplattformer. Kom gjerne med tips om hvilke norskspråklige blogger dere mener bør prioriteres.

Gravemaskinen indekserer blogger

Fra før av ligger mange nettaviser inne i systemet, samt pressemeldingene fra regjeringen.no. Nå har vi også begynt å legge til blogger, og først ute er Vampus.

Flere blogger vil bli lagt inn etterhvert, men vi kommer ikke til å indeksere alt og alle. Gravemaskinen er et redaksjonelt verktøy, og en god stund fremover kommer vi til å legge til blogger som på en eller annen måte relaterer seg til media.

Dette er ikke en manuell prosess i seg selv, og ettersom det er et ganske oversiktlig utvalg blogger, er det ingenting i veien for at vi på et senere tidspunkt kan gjøre et massivt løft og legge inn store antall blogger av gangen. Vi velger imidlertid å holde litt igjen, ettersom det er mange nye funksjoner som skal på plass i tiden fremover.

I skrivende stund er det også bare to av Vampus’ mange innlegg som er indeksert. Akkurat som med nettavisene har vi ikke prioritert å indeksere alt på alle med en gang. Noen er komplette, andre har kortere historikk. Dette blir fortløpende oppdatert, og så fort en kilde blir indeksert blir den automatisk fulgt opp fremover.

Gravemaskinen skal indeksere, analysere og strukturere innhold i mange forskjellige kildetyper, og åpne medierelatert innhold er bare begynnelsen. Teknikkene, systemene og algoritmene vi bruker for å indeksere og strukturere dette innholdet vil bli gjenbrukt og videreutviklet i arbeidet med andre kildedokumenter. Det inkluderer blant annet årsrapporter, domsavsigelser og offentlige utredninger.

Vi er fortsatt i en begrenset lukket beta, men denne helgen åpner vi opp for alle som har lyst til å prøve. Vi legger også opp til å utvide den lukkede betaen, og i første omgang tilbyr vi netthodene i NONA å registrere seg.

Gå hit for å teste Gravemaskinen.no.