Monthly Archives: April 2010

Prøv Gravemaskinen nå

Denne helgen åpner vi opp for en midlertidig preview av Gravemaskinen.

Klikk her for å prøve Gravemaskinen

Tilgangen vil bli stengt søndag kveld, og vi har ikke åpnet for alt ennå. Dette er rett og slett vår første utvidede test.

CSV eksport

Vi har lagt inn støtte for å eksportere resultatene fra Gravemaskinen til .csv-filer.

Det vil si kommaseparerte tekstfiler som kan åpnes med hvilket som helst regneark, slik at dataene kan sorteres med Excel, Google Spreadsheets, OpenOffice.org eller Numbers.

Vi har valgt å begrense oss til dette i første omgang, istedenfor å støtte et spesifikt regnearkprogram.

De fleste vil ikke trenge å gjøre en slik eksport, ettersom de mest brukte funksjonene vil støttes direkte i webgrensesnittet. Samtidig er vi veldig oppmerksomme på at de som liker å fikle med slike tall og oversikter, gjerne har blitt erfarne Excel-brukere. Det blir for dumt hvis de må vente på at funksjonaliteten blir tilgjengelig, hvis de like gjerne kan importere resultatene fra Gravemaskinen.

Vårt webgrensesnitt nærmer seg en forøvrig en begrenset lansering som en abonnementstjeneste. Vi har foreløpig testet autentisering med Twitter, og flere alternativer kommer etterhvert.

Datalagringsdirektivet eksportert til Google Docs

Vi har ikke laget en egen funksjon for eksport av resultater fra Gravemaskinen og Sitatsjekk til regneark ennå, men det kommer.

I mellomtiden har vi nettopp gjort en test av klipp og lim fra et søkeresultat i Gravemaskinen over i Google Spreadsheets og delt det med alle som er interessert.

Her er de siste 100 artiklene om Datalagringsdirektivet. Merk at det er duplikater i tabellen. Dette skyldes at noen artikler har flere URL, noe som blir tydeligere i Gravemaskinens webgrensesnitt der titlene er lenker.

Dette regnearket kan redigeres av hvem som helst, og det er derfor mulig å bruke regnearkets innebygde funksjonalitet til å sortere og organisere dataene. Google Spreadsheets er foreløpig ganske primitivt, så de som ønsker å gjøre litt mer spennende ting er nok fortsatt best tjent med å kopiere dataene over i Excel, eventuelt OpenOffice.org eller Numbers.

Vi skal få på plass bedre eksportfunksjonalitet etterhvert, men vi må gjøre oss noen erfaringer først.

iPad-rapport til Eirik Newth

Astrofysikeren har skrevet et kritisk blogginnlegg om pressens opphausing av Apple’s iPad. Vi tenkte at det kunne være en passende test av vår nye rapport å hente ut en liste over hvilke artikler som har hatt ordet iPad i tittelen de siste dagene.

Det gjør vi ved å søke på title:ipad, et søk som også kan gjøres med Sitatsjekk for iPhone:

295 resultater…

Det var ikke så rent få, og det var mange nok til at vi raskt innså at det blir for snevert å bare vise 25 av gangen.

Det er forøvrig noen duplikater på listen, og det skyldes at noen publiseringssystemer (bl.a. Escenic) publiserer artikler på flere URL hvis man har artikler som går over flere kategorier. Det er enkelt å filtrere bort, men vi har ikke gjort det i denne generiske visningen.

Her er (litt av) listen som viser de siste 100 artiklene med ipad i tittelen:

Man kan være enig eller uenig med Eirik Newth, men det er umulig å si at han ikke har et poeng…

Twitter-autentisering og ny artikkelrapport

Vi jobber nå med å legge inn en ny rapport i det som foreløpig er vårt interne webgrensesnittet.

Her ramser vi opp diverse parametere for hver enkelt artikkel, og det inkluderer blant annet artiklenes lengde målt i antall tegn, ord og setninger.

Det er ikke så lett å se det på dette skjermbildet, men øverst til høyre står det et navn. Det er brukeren som er autentisert til Gravemaskinen gjennom Twitter. Dette er vårt lille hint om at webgrensesnittet (forhåpentligvis) ikke er så langt unna offentlig tilgjengelighet…

Vi ser forøvrig allerede nå at vi må ta med publikasjonsnavn for å gjøre rapporten oversiktlig nok. Det kommer snart.

Ved å sammenligne temaer som f.eks. “datalagringsdirektivet” på denne måten, håper vi å gi en rask og god oversikt over utviklingen av diverse saker. Klokkeslettet sier mye om hvilke medier som er først på ballen i store saker som utvikler og sprer seg raskt.

Askefast

VG leder med 18 artikler der ordet “askefast” er brukt, foran Stavanger Aftenblad med 7.

Kultur vs Sport vs Utenriks

Vi har som nevnt i forrige blogginnlegg lagt til et nytt søkeparameter for å søke på URL-strengen til artiklene.

Dette parameteret ble lagt inn etter et inspirerende møte med en potensiell kunde. De syntes det var interessant å se på hva Gravemaskinens “journalyse”-funksjonalitet kan brukes til, men påpekte at de helst ville ha en mulighet til å sammenligne forskjellige redaksjoner.

Ettersom det er veldig mange forskjellige publiseringssystemer som er i bruk rundt omkring, og selv de som bruker samme CMS velger ofte forskjellige kategorier og URL-syntakser, er det vanskelig å lage en generisk løsning som fungerer for absolutt alle.

Ved hjelp av vårt API kan hver enkelt nettavis lage egne løsninger for dette, men vi kom heldigvis frem til en generisk metode som vil virke for en svært stor andel av nettavisene.

Her har vi tre eksempler på URL-søk og hvilke nettaviser som bruker henholdsvis kategoriene kultur, sport og utenriks:

Kultur

Sport

Utenriks

Ettersom forskjellige nettaviser har forskjellige kategoriseringer, blir det feil å bruke slike rapporter til å avgjøre hvem som skriver mest om de forskjellige feltene, men de som ønsker å gjøre en sammenligning mellom 2 nettaviser får i hvertfall en mulighet til å gjøre det både raskt og enkelt.

URL-søk

Vi har lagt inn et nytt søkeparameter som gjør det mulig å søke på tekst i URL-strengen.

Ved f.eks å søke på “kultur” vil man i de nettavisene som kategoriserer sine redaksjoner med katalognavn i URL, kunne filtrere så man bare får opp resultater for kulturjournalistiske artikler.

Parameteret er helt ferskt, og ytelsen er ikke helt god ennå, men parameteret virker for de som bruker Sitatsjekk for iPhone eller Android.

Syntaksen er noe kronglete, men vi jobber med saken. Slik må du søke: “url:http*kultur*”

#sitatsjekkspotting

Mobilen.no har en gjennomgang av iPhone OS 4, og der fant vi en skjermdump som viser at Sitatsjekk er installert. :-)

Hvem siterer Dagens Næringsliv?

Jeg er ingen stor fan av papiraviser, men jeg er en stor fan av god journalistikk. Nettaviser som bare driver «klipp og lim»-journalistikk har ikke livets rett, og det har heller ikke papiraviser.

“Står det ikke på nett så har det ikke skjedd”, har vært undertegnedes slagord på bloggen i mange år, og som en følge av det har vi foreløpig kun lagt inn nettaviser i Sitatsjekk og Gravemaskinen.

Det betyr at papiravisene foreløpig slipper billig unna, men de som tror nettavisene får en free ride tar feil. Vi skal etterhvert få på plass rapporter som viser hvem som gjør hva av journalistikk, og det vil bli offentliggjort.

Her er vårt første primitive forsøk på å hente ut en oversikt over hvem som har sitert (eller omtalt) “DN” eller “Dagens Næringsliv” fordelt på de siste ukene:

Tallene er ikke kvalitetssikret ennå, og jeg er blant de som mener flere siteringer er greit så lenge man ikke overdriver, krediterer skikkelig og sørger for at det fortsatt er mer verdi igjen i artiklene som siteres.

Samtidig er det ikke til å komme bort fra at det er ganske drøyt å sitere 10-30 artikler om dagen…