This text is also available in English.
Här beskrivs hur du kan hjälpa Projekt Runeberg med korrekturläsning av intressanta texter, för att förhöja deras användbarhet. Först en bakgrund.
Projekt Runeberg publicerar nordisk litteratur på Internet sedan 1992. Det enklaste men också det jobbigaste sättet att lägga ut en bok på nätet är att skriva in texten på tangentbord. I stället kan man använda en scanner tillsammans med ett program för teckentolkning, så kallad OCR (optical character recognition). I båda fallet får man en textfil, som man sparar i HTML-format för att det ska bli en websida av den. När sidan visas för läsaren har bokens vackra typografi försvunnit. En annan nackdel är att man saknar garantier mot skrivfel. Det hjälper inte att man är aldrig så noga när man skriver in texten. För att veta om texten är rätt avskriven, måste man gå till biblioteket och titta i den riktiga boken.
Under hösten 1998 började Projekt Runeberg arbeta med elektroniska faksimilutgåvor. Det betyder man sparar en bild av den inscannade boksidan. På det sättet återges bokens typografi exakt och dessutom försvinner risken för fel.
Visst kan fel uppstå även vid inläsning av bilden. Det kan bero på dåligt tryck, fläckar i papperet eller "fluglortar". Men det är ytterst osannolikt att sådana fel skulle leda till att en bokstav skulle förvandlas till en annan, att två bokstäver skulle byta plats, eller att en hel rad i texten skulle utelämnas. Det är sådana fel man vill skydda sig emot. Och faksimiltekniken är det bästa skyddet.
Samtidigt innebär faksimiltekniken också nackdelar: Bilden tar längre tid att ladda ner över modem. Det går inte att klippa-och-klistra text mellan bilden och ett ordbehandlingsprogram. Det går inte att söka efter ord eller fraser i bilderna. Och blinda eller synskadade kan inte läsa bilden i blindskrift. Det beror på att bilden, ur datorns synvinkel, består av en massa svarta och vita bildpunkter och inte av enskilda bokstäver och ord.
För att få fram bokstäverna och orden ur bilden, används ett OCR-program. Dessa är väldigt bra på sitt arbete, men ändå blir det ett och annat fel kvar, siffran 1 kan förväxlas med bokstaven l och bokstäverna e och c förväxlas ibland. Dessutom är programmen sällan bra på att känna igen rubriker, kursiveringar och styckebrytningar. Resultatet från OCR-programmet brukar vi kalla för råtext, eftersom den inte är speciellt användbar utan bearbetning, ungefär som råolja.
När Projekt Runeberg producerar en elektronisk faksimilutgåva, läggs varje boksida upp som en websida. Överst kommer sidhuvudet med logotypen och bokens titel. Sedan följer den inscannade bilden av boksidan. Därunder läggs råtexten, och sist en sidfot.
För vanliga textutgåvor, görs i stället en websida för varje kapitel i boken. Kapitel kan vara olika stora. Romaner har kapitel som omfattar flera tiotal boksidor. Diktsamlingar har dikter som ryms på en eller två boksidor. Uppslagsverk har kanske flera artiklar på varje sida.
För att skapa och korrekturläsa en textutgåva utifrån en faksimilutgåva, gör man så här:
Sedan är det bara att vänta på besked från Projekt Runebergs redaktörer att texten blivit mottagen.
Om du undrar över något, är det bara att skriva ett brev.
Redaktörerna har som målsättning att svara personligt på varje brev.
Du kan skriva på svenska, danska, norska eller engelska.