Tag Archives: Gravemaskinen

VGs mest engasjerende artikler

Første halvår er straks over, og vi bruker anledningen til å spørre Gravemaskinen om hvilke saker som var de mest engasjerende i VG hittil i år:

  1. Dommedagsprofet: Jeg bommet med fem måneder
  2. Ungdom onanerte i medelevers brownies
  3. Amerikaner (19) i dameundertøy skal ha drept naboens pygmegeit
  4. Dommedagsprofet: Jorden går under lørdag
  5. - Lubne lever lengst
  6. Gutt (13) holdt fanget i hundebur, drept og begravd i sement
  7. Norge innfører datalagringsdirektivet
  8. Obama bin Laden skal være død
  9. Nadia gir bort alle konfirmasjonspengene
  10. Her får anda Veranda politieskorte over veien
  11. Vulkanutbrudd på Island
  12. Her slår læreren elevene sine
  13. Forskning: Mer miljøvennlig å ha SUV enn schæfer
  14. Nå kommer sommeren
  15. En liten historie om luft og kjærlighet
  16. VGTV direkte – i tilfelle jorden går under
  17. Ektepar fikk villsau i tv-kabelen
  18. Maria Amelie: – De bør si unnskyld
  19. - Hundeeier satte fyr på sin egen hund
  20. Har du sett et mer spektalulært straffespark?
  21. - Folk på vestkanten blir stadig penere enn på østkanten
  22. Krekar blir henrettet ved Irak-retur
  23. «Jackass»-stjerne døde
  24. Tykk og sunn bedre enn tynn og utrent
  25. Obama: Osama bin Laden ble drept på søndag

Lunsjsnakkisene 25. juni

Lørdag er en god dag for å lese avisene, og det er dagen de fleste allmenne aviser prioriterer litt ekstra med sine artikler. Hvorvidt det gir utslag på nettet er jeg litt usikker på, men ved å se på det over tid vil vi finne ut av det.

Her er i hvert fall en oversikt over dagens snakkiser så langt i dag. Listen er generert av Gravemaskinens nye algoritme ca. 11:25 i dag:

  1. Sykt glad i deg
  2. Ja til homoekteskap i New York
  3. Jaget svensk paparazzi
  4. Ja til homoekteskap i New York
  5. Høylytte hverdagshelter
  6. Gutt (16) siktet for voldtekt etter ungkarsfestival
  7. Einar (35) drept på åpen gate: – Han var alltid blid og positiv
  8. Yoda (14) er «verdens styggeste hund»
  9. SV vil lovfeste rett til heltid i helsevesenet
  10. Minikamera avslørte 1500 år gamle Maya-hemmeligheter
  11. 5.000 har fått feilaktig varsel om avskilting
  12. Staten har betalt 2 milliarder for pasientskader
  13. Ja til homoekteskap i New York
  14. Maskerte menn ranet pokerklubb
  15. Bra start for Vannspeilet
  16. «Noen kastet ei søppelbøtte etter meg»
  17. Somalere gjorde opp seg i mellom
  18. Kom i form med GPS og andre treningsdingser
  19. Ny Falklandskonflikt
  20. Til sjukehus etter straumsjokk – tilstanden førebels ukjend
  21. Fem drept på flyplass i Peru
  22. Minst 10 omkommet i storm i Vietnam
  23. Hadde seksuell omgang med eget barnebarn
  24. Historisk homo-lov innført i New York
  25. Pågrepet etter væpnet politiaksjon

Magnus Blaker

Magnus Blaker er journalist og vaktsjef i Nettavisen. Han er en av journalistene som skriver mest om datalagringsdirektivet og personvern, og han skriver den populære spalten “Se hva vi fant på internett”.

Som en del av sommerens arbeid med å videreutvikle Gravemaskinen og gjøre den klar for lansering, tenkte vi å gjøre en kjapp liten journalyse av hans innsats hittil i år:

  • 177 artikler (Nettavisen:170, Bergensavisen:2, Teknofil:2, NA24:1)
  • 133 kilder (snitt:1,04, maks:4, min:0)
  • 244.392 tegn (snitt:2443,92, maks:7.151, min:410)

Gravemaskinen er ikke komplett ennå, og vi mangler blant annet artikler fra Nettavisen for januar, men jeg tror vi med utgangspunkt i disse tallene kan slå fast at Nettavisen’s Magnus Blaker ikke skriver korte notiser. Tvert i mot, med et snitt på nesten 2.500 tegn er dette lengre artikler enn de fleste papiraviser kan skilte med.

Nå har vi valgt ut en enkelt journalist denne gangen, men diverse stikkprøver viser at Nettavisen har en stor andel lange omfattende artikler med flere kilder. Magnus har et snitt på 1,04 kilder, noe som kan synes lavt, men det er fordi det inkluderer kommentarartikler og “Se hva vi fant på internett”-spalten der det brukes få eller ingen sitater. 29 av artiklene til Magnus har 2 eller flere kilder.

Her er artiklene til Magnus Blaker i et regneark.

NRKbeta

Sommerværet har ikke imponert så langt, men vi har ihvertfall kommet i gang med vår sommerjobb. Den går primært ut på å utvide kildegrunnlaget til Gravemaskinen slik at den, Siste Nytt, Sitatsjekk og kommende tjenester skal få et godt variert utvalg når høsten starter.

En av datakildene vi nettopp har lagt inn, er alle netthodenes favoritt: NRKbeta

Vi har indeksert opp 173 artikler fra og med 2007, og selv om det ikke er helt komplett, er det ikke langt unna er det likevel interessant å se på litt statistikk. Dette gjør oss blant annet i stand til å sjekke hvem som har skrevet flest av artiklene på NRKbeta:

Ikke overraskende er det Øyvind Solstad som topper listen, etterfulgt av Eirik Solheim og Marius Arnesen. Vi ser da også at NRKbeta får et tomrom som må fylles nå som han har gått over i ny jobb som kommunikasjonsrådgiver i Carat Interaktiv.

Tar vi en titt på listen over hvem som har skrevet de lengste artiklene, er det de samme gjengangerne der også:

Her er forøvrig et Google Spreadsheet med oversikt over artiklene på NRKbeta.

Oppdatert: Vi manglet litt flere artikler enn vi opprinnelig trodde, så vi må bruke litt tid på å oppdatere kildedataene før vi kan komme med en komplett liste. I skrivende stund er det nå 182 artikler, og ikke 173 som da artikkelen ble skrevet. Hvor mange det er totalt vet vi først når vi er sikre på at alle artikler er med.

Nye datakilder

Det skjer mye på utviklingssiden for tiden, selv om ikke alt er like synlig ennå.

En av de viktigste tingene vi har gjort, er å lage et nytt system for å indeksere ny informasjon. Det har tatt litt tid, men i forrige uke ble systemet klart, og i dag legges de første nye kildene inn i Gravemaskinen.

Det dreier seg om følgende:

  • blogg.abrenna.com
  • sitatsjekk.no
  • nrkbeta.no
  • datatilsynet.no
  • svomming.no
  • no.wikipedia.org

Det kreves ikke et spesielt godt trent øye for å se at disse kildene skiller seg litt ut fra de vanlige nettavisene som i dag dominerer innholdet i Gravemaskinen.

Vi har tidligere lagt inn noen få blogger, samt pressemeldingene fra Regjeringen. Dette er informasjon som vi tror blir svært interessant i fremtiden når vi får på plass flere struktureringsmekanismer, og vi er nå klare for å legge inn flere fortløpende. For å skille mellom forskjellig type innhold, har vi valgt å sette opp et par forskjellige kategorier:

Blogger er definert som blogger uten redaksjonelt ansvar i form av logoen til PFU. Denne inndelingen er selvsagt noe problematisk, men vi har valgt å prøve dette i første omgang, og så heller justere kursen etterhvert.

Fakta er en ny kategori beregnet på informasjon som sjeldent oppdateres. Vår første kilde blir Wikipedia, og det er i seg selv en liten utfordring med oppdateringene, men hver enkelt artikkel blir ikke oppdatert så ofte i snitt når den først har nådd et visst nivå. Her ser vi for oss flere nye kilder, som f.eks. Norges lover, statistikk, resultatlister og lignende, samt selvsagt også Store Norske Leksikon (SNL.no).

Informasjon er en ny kategori som delvis overlapper med pressemeldinger. Vi har valgt å legge inn Datatilsynet og Norges Svømmeforbund her, ettersom langt fra alle nyheter er direkte myntet på pressen. Dette blir en kategori med ganske mange kilder etterhvert, og vi ser for oss å legge inn flere etater, idrettsforbund, fagforeninger og organisasjoner som f.eks. Fagpressen der. Det kan også tenkes at vi velger å plassere kommunene der, men det får vi se på.

Nettaviser er den opprinnelige kategorien vår. Vi skal i løpet av sommeren utvide med langt flere lokalaviser, samt at vi prioriterer å få på plass så mange av Fagpressens medlemspublikasjoner som mulig. Det er også verdt å merke seg at Sitatsjekk og Siste Nytt foreløpig kun bruker kilder som er kategorisert under nettaviser. Hvorvidt vi kommer til å endre på det, avhenger litt av tilbakemeldinger og erfaringer vi selv gjør oss fremover.

Pressemeldinger er en kategori som vil skaleres opp ganske raskt, og vi kommer blant annet til å legge inn børsmeldinger her. I første omgang konsentrerer vi oss om å utvide i bredden med flere kilder, men etterhvert skal vi også forsøke å samle inn historiske pressemeldinger.

Vi har en lang arbeidsliste foran oss, men vi kan omprioritere litt ved ønsker og behov fra våre brukere. Vi er også spesielt interesserte i tilbakemeldinger på hva slags faktaopplysninger dere vil ha i Gravemaskinen.

Pressemelding om Siste Nytt

Selv om dette er bloggen til Sitatsjekk, faller det naturlig å informere litt om ett annet nytt iPhone-program her.

Siste Nytt er et program som viser de siste 100 nyhetene fra de samme kildene som Sitatsjekk bruker. Det er det andre programmet som bruker Gravemaskinens API, og det er nå tilgjengelig i App Store.

Programmet ble godkjent av Apple natt til lørdag i pinsen, og det ga oss noen tall å trekke frem før vi sendte ut en pressemelding i dag morges. Her følger den i sin helhet:

PRESSEMELDING:

Nytt norsk program til iPhone og iPod Touch viser de til enhver tid siste 100 nyhetene fra mer enn 50 norske nettaviser.

- Siste Nytt er laget for å raskt gi leserne et oppdatert og variert nyhetsbilde, sier medieutvikler Anders Brenna.

Medieutvikleren har laget iPhone-programmet Siste Nytt med utgangspunkt i den nye norske søkemotoren Gravemaskinen, som foreløpig er i lukket beta. Dermed kan leserne raskt holde seg oppdatert på nisjenyheter fra et bredt utvalg av norske nettaviser.

- Søker man på f.eks: datalagringsdirektivet, RBK, “Jens Stoltenberg”, iPad eller oljesand viser Siste Nytt de 50 siste artiklene fra et variert utvalg av redaksjoner, sier Brenna.

Med Gravemaskinen som søkemotor er det også mulig å søke på ord og uttrykk i artiklenes tekst, i tittelen og i sitater, samt søke på tekstlengde og hvilken journalist som har skrevet saken.

- Et søk på f.eks. artikler som har brukt ordet “sex” i tittelen gir et interessant innblikk i medie-Norges nyhetsprioriteringer. Mange får seg en overraskelse når de ser hvilke nettaviser som er mest sex-fikserte i sine artikler, sier Brenna.

I Siste Nytt gjøres et slikt søk ved å skrive title:sex i søkefeltet. Andre interessante eksempler er title:askefast og title:krise. Tilsvarende vil avanserte søk som journalist:”anders brenna”, quotes:sjokkert eller sources:”erna solberg” vise de siste 50 artiklene fra medieutvikleren som har laget Siste Nytt, artikler der noen er sitert på ordet sjokkert eller bare artikler der Høyre-leder Erna Solberg er sitert.

- Siste Nytt ble tilgjengelig lørdag i pinsen, og det ble solgt 54 programmer den første dagen. Det holdt til en 28. plass på topplisten til Apple, sier Brenna.

På sin andre dag solgte Siste Nytt 57 programmer i det norske markedet, samt 1 i det amerikanske. Det holdt til en 24. plass i Norge.

- Salgstallene viser at det norske iPhone-markedet fortsatt er umodent for salg av norsk innhold, men at det kommer seg, sier Brenna.

Medieutvikleren skrev tidligere i år en analyse i medienettavisen Kampanje om hva man kan forvente å tjene som norsk iPhone-utvikler etter lanseringen av Sitatsjekk, og vil bruke nye tall fra Siste Nytt til å skrive en oppfølger.

Siste Nytt er en relativt enkel applikasjon, selv om søkemotoren bak er svært avansert. Den er utviklet av Anders Brenna i samarbeid med Trondheimsselskapet Atbrox AS, der bl.a. tidligere Google-utvikler Amund Tveit bruker sin erfaring fra arbeidet med de nordiske utgavene av Google News. I motsetning til andre søkemotorer, er Gravemaskinen en tjeneste som er laget for journalister og mediebransjen.

- Gravemaskinen gjør det mulig for nettaviser og andre å raskt utvikle nye kommersiell programmer og tjenester, enten det er på web, til intranett eller i dedikerte applikasjoner på mobiler, PC-er og andre digitale enheter, sier Brenna.

Siste Nytt er den andre applikasjonen som bruker Gravemaskinen. Den første er Sitatsjekk, et program som lar brukerne sjekke hva politikere, næringslivstopper og andre tidligere har sagt, for å sjekk om de snur kappen etter vinden. Sitatsjekk har forøvrig blitt skrevet om fra bunnen av, og vil snart bli lansert i ny versjon. Oppgraderingen vil bli gratis for alle som har kjøpt tidligere utgaver, og den vil fortsatt koste 55 kr.

Selv om Siste Nytt nettopp er lansert, er arbeidet med å oppgradere den allerede i gang. Ivrige brukere meldte inn ønsker og behov bare noen få timer etter lanseringen. Øverst på listen står ønsket om å filtrere bort nyheter fra fremtiden.

- Flere norske nettaviser kan ikke klokka, og det skaper litt hodebry for Siste Nytt. Vi kommer til å filtrere nyheter som tilsynelatende er publisert i fremtiden, men det beste hadde vært om de aktuelle lokalavisene selv rettet feilen, sier Brenna.

Per i dag er det 57 norske nettaviser som får sine nyheter presentert i Siste Nytt, men det blir mange flere i løpet av kort tid. Brenna håper å slippe å måtte fjerne lokalaviser som ikke setter riktig dato og klokkeslett på sine artikler.

- Ett av målene med Siste Nytt er å fremheve nyheter og artikler fra lokalaviser og andre nisjeaviser slik at vi får et mer variert mediebilde i Norge, sier Brenna.

Les mer om Siste Nytt på bloggen til Anders Brenna. Der er det også bilder av programmet som fritt kan benyttes. Programmet koster 6 kroner, og prisen inkluderer fremtidige oppgraderinger. Siste Nytt kan kjøpes i App Store via PC/Mac eller direkte fra mobilen.

Ta gjerne direkte kontakt med Anders Brenna på 900 77 860 ved spørsmål om Siste Nytt, Sitatsjekk eller Gravemaskinen.

Anders Brenna er tidligere nettsjef i Teknisk Ukeblad og redaksjonssjef i digi.no. Nå skriver han en fast spalte om medieteknologier og forretningsutvikling i fagtidsskriftet Kampanje, samtidig som han utvikler medieløsninger for iPhone, iPad og web sammen med Trondheimsselskapet Atbrox.

Mvh
Anders Brenna
Medieutvikler
http://twitter.com/abrenna
http://blogg.abrenna.com
http://sitatsjekk.no
http://gravemaskinen.no

Som et eksempel på hvor raskt det går å utvikle nye medieapplikasjoner med utgangspunkt i Gravemaskinens API, kan jeg nevne at Terje Pedersen, som har laget Sitatsjekk for Android, klarte å lage en betautgave av Siste Nytt for Android i løpet av søndag kveld.

Nå må det poengteres at det ikke er programmeringen som tar lang tid når man utvikler slike programmer. Det mest tidkrevende er å finne frem til hvordan designet fungerer optimalt for brukeren. Det er et tilnærmet evigvarende prosjekt, og arbeidet med oppgradering av Siste Nytt er allerede i gang, men det er viktig at man er på rett spor og har et system som fungerer før man slipper den første utgaven. Det tror jeg vi har med Siste Nytt, men jeg er samtidig den som gleder meg mest til å få noen av de første oppdaterte funksjonenen på plass. :-)

Til slutt på vi bare si takk til de som allerede har kjøpt Siste Nytt. I skrivende stund er det to anmeldelser på App Store. Det er for få til at de vises til alle. Kanskje dere kan bidra med deres ærlige mening om Siste Nytt?

Nationen har 48 artikler om Datalagringsdirektivet

…og det er bare hittil i år.

Her er artiklene lagt ut i et oversiktlig regneark på Google Spreadsheets.

Nummer 2 på listen er digi.no, som forøvrig har flest artikler totalt.

Graf med mest siterte personer

Vi har lagt inn vår første graf i Gravemaskinen, og det er en graf som viser hvem som er de mest siterte personene. Den vises når man logger på Gravemaskinen, før man gjør et eget søk.

Hva synes dere?

Blogger i Sitatsjekk og Gravemaskinen

Vi har begynt arbeidet med å legge blogger inn i vårt system, og har begynt med norske blogger på *.blogspot.com.

Disse er allerede tilgjengelig for de som har kjøpt Sitatsjekk for iPhone eller Android, samt for de som deltar i den lukkede betatestingen av Gravemaskinen på web.

Vi skal legge inn støtte for flere bloggeplattformer. Kom gjerne med tips om hvilke norskspråklige blogger dere mener bør prioriteres.

Gravemaskinen indekserer blogger

Fra før av ligger mange nettaviser inne i systemet, samt pressemeldingene fra regjeringen.no. Nå har vi også begynt å legge til blogger, og først ute er Vampus.

Flere blogger vil bli lagt inn etterhvert, men vi kommer ikke til å indeksere alt og alle. Gravemaskinen er et redaksjonelt verktøy, og en god stund fremover kommer vi til å legge til blogger som på en eller annen måte relaterer seg til media.

Dette er ikke en manuell prosess i seg selv, og ettersom det er et ganske oversiktlig utvalg blogger, er det ingenting i veien for at vi på et senere tidspunkt kan gjøre et massivt løft og legge inn store antall blogger av gangen. Vi velger imidlertid å holde litt igjen, ettersom det er mange nye funksjoner som skal på plass i tiden fremover.

I skrivende stund er det også bare to av Vampus’ mange innlegg som er indeksert. Akkurat som med nettavisene har vi ikke prioritert å indeksere alt på alle med en gang. Noen er komplette, andre har kortere historikk. Dette blir fortløpende oppdatert, og så fort en kilde blir indeksert blir den automatisk fulgt opp fremover.

Gravemaskinen skal indeksere, analysere og strukturere innhold i mange forskjellige kildetyper, og åpne medierelatert innhold er bare begynnelsen. Teknikkene, systemene og algoritmene vi bruker for å indeksere og strukturere dette innholdet vil bli gjenbrukt og videreutviklet i arbeidet med andre kildedokumenter. Det inkluderer blant annet årsrapporter, domsavsigelser og offentlige utredninger.

Vi er fortsatt i en begrenset lukket beta, men denne helgen åpner vi opp for alle som har lyst til å prøve. Vi legger også opp til å utvide den lukkede betaen, og i første omgang tilbyr vi netthodene i NONA å registrere seg.

Gå hit for å teste Gravemaskinen.no.