En blogg från Högskolan i Borås

tisdagen den 28:e februari 2012

Textfångst och OCR


I programmets valbara kurs Textkodning av kulturarvet behandlas bl.a. frågan om hur man med hjälp av OCR (teckenigenkänning) omvandlar en inscannad sida ur en tryckt bok till maskinläsbar text som sedan kan t.ex. XML-kodas. Det finns också metoder för att låta en mjukvara känna igen hela segment i en inskannad och OCR:ad text och själv tilldela segmenten lämplig kod. Om detta och mycket annat föreläste David Hansson (Karolinska institutet, se bilden) och Gunilla Wiberg (Kungliga biblioteket) för en internationell kurs i februari, och de spelar in en särskild dubbelföreläsning om dessa ämnen som ljudfil för kursen Textkodning av kulturarvet.

Digitaliseringsstudio i februarimörkret


Under träffen för kursen Bilddigitalisering av kulturarvet anordnades en mindre workshop med en provisorisk digitaliseringsstudio, där mer eller mindre "svåra" objekt digitaliserades med digital kamera och olika parametrar. Hela processen strömmades samtidigt via dator och dukprojektor så hela gruppen kunde iaktta resultat och diskutera. På bilden syns Andrea Davis-Kronlund, fotograf, och Torsten Johansson, konservator (båda från Kungliga Biblioteket), fixa de sista justeringarna innan workshopen startade.

onsdagen den 22:e februari 2012

Gästföreläsare i digitalisering


En av gästföreläsarna på kursen Bilddigitalisering av kulturarvet var Liga Krumina, assistant professor i biblioteks- och informationsvetenskap vid Lettlands universitet i Riga. Hon undervisar och forskar där om bl.a. digital humanities, elektronisk publicering och digitala bibliotek. Hon deltar i utvecklingen av såväl Erasmusprogrammet och NORSLIS.

Under kursen gav Liga en fyllig och inspirerande föreläsning om pågående digitalisering i Baltikum i allmänhet och i Lettland i synnerhet. Bland annat pågår ett stort projekt att digitalisera lettisk dagspress. Hon kunde också peka på skillnader mellan de baltiska länderna i detta avseende, t.ex. att Estland redan från början satsat på större långsiktiga verksamheter medan Lettland och Litauen mer valt kortare projektformer.

Läs mer om digitalisering i Lettland här.

tisdagen den 21:e februari 2012

Lars Björk om digitalisering som process


Kursträffen fortsatte under tisdagen med Lars Björk, Kungliga Biblioteket/Högskolan i Borås, som fördjupade vår uppfattning av digitalisering som en transmissionsprocess mellan medier. Exemplen utgjordes av bl.a. Alice i underlandet, SJ:s ebiljetter för utskrift samt Djävulsbibeln.

Kursträff i bilddigitalisering


Just nu pågår i Borås kursträffen i programmets kurs Bilddigitalisering av kulturarvet.

Idag talade bl.a. Bengt Neiss från Kungliga biblioteket i Stockholm om bevarandefrågor, filformat och emulering av filformat och äldre mjukvaror. Bland annat visade han hur mjukvaror kan emulera gamla konsollen Nintendo 64 och dess spel.

fredagen den 27:e januari 2012

Presentation: Gunilla Wiberg och David Hansson


För några år sedan jobbade vi på Lunds universitet och tittade på arbetet kring digitalisering ihop med andra svenska universitetsbibliotek. 2008 gick vi kursen “Digitalisering av kulturarvet” på Högskolan i Borås, där vårt projektarbete utgjordes av en 1800-talsbok: http://digitalisering.info.se/

Efter några år i olika delar av landet, jobbar vi återigen i samma stad: David jobbar som systemerare på universitetsbiblioteket på Karolinska Institutet och Gunilla som systembibliotekarie på Libris-enheten på Kungliga biblioteket.

David tycker om att spela gitarr och sjunga, samt dansa argentinsk tango. Studietiden ägde rum vid Högskolan i Växjö (ekonomi/marknadsföring) även om IT-intresset gett mer tyngd åt yrkesvalet.

Gunilla är bland annat intresserad av hundar och fotografering. Hon är också intresserad av multimedia och har en multimediautbildning vid Lunds tekniska högskola. 3D-animationer och multimedia har dock fått stå tillbaka för mer handfast projektledning, programmering etc.

Vi tycker båda om att lösa problem och att komma framåt, vilket gör att vi har kul när vi jobbar tillsammans. Vi tar gärna motsatta positioner när vi diskuterar något för att se problemet från olika håll och tvingas tänka igenom argumenten.

Vi har bitvis fördjupat våra kunskaper i programmering. 2006 gick vi en kurs i Adobe ColdFusion (programmeringsspråk för webben) i London. Hösten 2011 gick vi en distanskurs i C# på KTH.

Vi undervisar i programmets kurs "Textkodning av kulturarvet" samt inom den internationella kursen "Digitizing cultural heritage material". Vi berättar om OCR, vilket innebär att datorn läser text från bildfiler som kommer från en skanner eller kamera. David använder OCR i sitt jobb på Karolinska Institutet för att kunna distribuera skannade dokument från Statens biblioteksdepå i Bålsta via KTH, Göteborgs UB, Karolinska Institutet och Uppsala universitet. Gunilla har bland annat utvärderat OCR-motorer för att läsa frakturstil och olika typer av material.

Foto: Lars OA Hedlund

tisdagen den 24:e januari 2012

Följ kurs via app



Programmets kurs "Bilddigitalisering av kulturarvet" utgör testkurs för Bibliotekshögskolans satsning på att utveckla nya former för mobilt lärandestöd. Detta innebär i praktiken att de kursstudenter som har en smartphone kan utnyttja applikationen AppAndGo (kräver login) för snabb kursinformation, skicka meddelande till lärare och kurskamrater samt få tillgång till en del av kursmaterialet direkt via mobilen, t.ex. föreläsningsinspelningar, presentationsbilder, uppgiftsinstruktioner och viss kurslitteratur.

onsdagen den 11:e januari 2012

34 fallstudier av digitaliseringsprojekt

En ny bra bekantskap är Digitization in the Real World, en samling av 34 fallstudier om digitaliseringsprojekt vid amerikanska minnesinstitutioner. Resultatet är dels en tryckt bok, dels en e-bok, dels en blogg där var och en av fallstudierna presenteras, och där hela det aktuella bokkapitlet går att ladda ner samt där du också får en länk till den studerade digitala samlingens webbplats. Läs mer i fallstudiernas blogg.

onsdagen den 26:e oktober 2011

Kulturinstitutioner och användargenererad information


Flera svenska (och utländska) kulturinstitutioner tillgängliggör delar av sina digitaliserade samlingar via sociala medietjänster som t.ex. Flickr. I ett paper på Mötesplatskonferensen förra veckan som väckte intresse presenterade Kari Ansnes en studie om hur kulturinstitutionerna använder den information de får in via fritextkommentarer till bilderna. Hur tänker man på institutionerna kring hur informationen kan användas, vilken trovärdighet den har och vem som äger texterna? Studien baseras på en undersökning av tre institutioner och visar att en del av informationen används genom att t.ex. berika uppgifterna i institutionernas egna databaser.

Kari är student på Digitala tjänster-mastern och tillika verksam vid Riksarkivet i Oslo. Papret initierades under kursen Användare och informationspraktiker i digitala miljöer som går under programmets andra termin.

Mötesplatskonferensen går av stapeln varje år i Borås i samarbete mellan Högskolan, Borås stadsbibliotek och i år också Kultur i Väst och Kungl. biblioteket.

tisdagen den 11:e oktober 2011

DOCAM 2011


Första helgen i oktober tillbringade Mats och jag i Växjö för det nionde The Annual Meeting of the Document Academy (DOCAM) som för första gången gick av stapeln i Sverige. Konferensen tog både upp frågor om vad ett dokument kan vara och vilken funktion dokument har i vårt samhälle och gav ett antal exempel på hur det kan vara givande att använda just dokument som studieobjekt. Bland de exempel som diskuterades var både böcker, museiföremål och arkiv.

Bland intressanta presentationer med arkivpespektiv fanns Roswitha Skares, där hon diskuterade författararkiv utifrån debatten kring Christa Wolfs bok Was bleibt/What Remains och bland annat ställde sig frågan om vi kan lita på vad vi hittar i författararkiv, vad finns inkluderat och vad är utelämnat? Vilken historia är det som arkivet berättar?

Carol Choksy utgick ifrån det aktuella exemplet med Barack Obamas födelseattest för att diskutera pappersdokument i förhållande till digitala dokument och vad det är som gör att ett dokument uppfattas som autentiskt i olika sammanhang och av olika grupper. Processen, inte objektet i sig, gör ett dokument autentiskt, var hennes tes i korthet.

Jag pratade tillsammans med Sara Kjellberg om hur dokumentegenskaper används i olika genrer för att signalera trovärdighet och hur bloggare förhåller sig till dessa olika genrepraktiker. Mats presenterade en studie av ett konstverk som samlade marginalanteckningar och understrykningar från ett stort antal biblioteksexemplar av Virginia Wolfs A Room of One's Own. Tillsammans med Joacim Hansson bollade han också idéer kring ett kommande projekt som utgår ifrån Maria Küchens verk Rosariet.
//Helena