Texterna är OCR-ade på maskinell väg och behöver därför korrigeras manuellt innan de sedan kan kodas (likaledes manuellt) med TEI. För böcker tryckta i t.ex. frakturstil kan sådant korrekturarbete vara omfattande, eftersom OCR-tolkning ännu inte är särskilt vass på fraktur.
Uppgiften är ett exempel på hur mycket förädlings- och återanvändningsarbete som är möjligt att göra ovanpå de stora bankerna av digitaliserade böcker som f.n. byggs upp världen över.
0 kommentarer:
Skicka en kommentar