En blogg från Högskolan i Borås

måndag 25 oktober 2010

Mark Twains omdiskuterade självbiografi

Tidningar och andra medier har i år skrivit mycket om den uppseendeväckande och länge emotsedda publiceringen av Mark Twains självbiografi. Denna fick inte publiceras förrän ett helt sekel passerat efter den amerikanske författarens död i april 1910. Materialet publiceras i bokform, men parallellt tillgängliggörs det också gratis, elektroniskt och vetenskapligt-kritiskt redigerat av Mark Twain Project Online (MTPO).

torsdag 14 oktober 2010

Livet på nätet


En ny undersökning, Digital Life, har tillfrågat över 50 000 respondenter världen över om deras användning av och beteenden på nätet. Resultatet har sammanställs i dynamiska diagram som tecknar bl.a. människors nätbeteende och social nätaktivitet i olika länder. Vilka kulturer ägnar mer webbtid åt studier, medan andra ägnar mer tid åt onlinespel? Hur stor vänkrets i de sociala nätverken har man i genomsnitt i olika länder? Dessa och liknande frågor behandlas i undersökningen. Tag gärna sajtens interaktiva demovisning.

tisdag 12 oktober 2010

Gephi

Ett intressant verktyg i öppen källkod (fritt nedladdningsbart för såväl PC, Mac som Linux) för att hantera grafer (såsom visualisering, grafisk representation och utforskande av data) är "Gephi". Like Photoshop but for data, säger utvecklarna själva.

Gephi har bl.a. använts för omfattande länkanalyser, undersökningar av sociala nätverk och för att åskådliggöra biologiska datamönster. Är du intresserad kan du också läsa ett litet paper som förklarar upplägget. Ansvaret för Gephi ligger på The Gephi Consortium, som officiellt startade alldeles nyss, den 1 oktober 2010.

måndag 4 oktober 2010

ordfrekvensverktyg


Ett sätt att skaffa sig en uppfattning om innehållet i ett elektroniskt dokument man överväger att läsa, t.ex. en längre webbartikel, är att låta ett program undersöka vilka ord som förekommer mest i dokumentet. Samma verktyg kan också användas för att skaffa sig (ibland överraskande!) information om det ord- och termbruk man själv har i sina skrivna texter.

Ett av de mer kända verktygen är Wordle, vars attraktionskraft bl.a. ligger i att frekvensresultatet presenteras i grafisk form, med en bokstavsstorlek som motsvarar frekvensgraden. Se exemplet här intill från en analys av Monty Pythons sketch om "silly walks".

Men det finns betydligt mer kraftfulla verktyg om man vill gå på djupet, analysera trender, återanvända resultatet i andra sammanhang, använda olika stoppordslistor (eliminera redovisning av "intetsägande" ord som och, men, det etc) osv - ett sådant har nyligen utvecklats av Geoffrey Rockwell och Stéfan Sinclair och heter Voyeur - ta gärna en smygtitt på det ;-)