Stikkordarkiv: Internet Archive

På jakt etter etymologiske ordbøker

Jakten etter etymologiske ordbøker startet med at jeg har hatt lyst til å kjøpe den nye Norsk etymologisk ordbok, og så fant jeg ut at den finnes som e-bok, i vannmerket epub-utgave  (feks hos haugenbok.no).  Nå koster den nokså mye, så jeg ville gjerne høre om noen erfaringer før jeg kjøper. Hvordan er det feks å søke opp ord i epub-utgaven?

Altså setter jeg i gang med å se om Google har noen relevante erfaringer, men finner ikke umiddelbart noen vurderinger av den typen jeg er på jakt etter. (Hvis du har noen erfaringer å bidra med, så kom gjerne med dem i kommentarfeltet!) Men derimot finner jeg andre interessante ting (denne serendipiteten er en av nettets store velsignelser etter mitt syn).

Avsporing 1: Piratutgaver

Det dukker nokså snart opp piratutgaver, i dette tilfellet fra to utenlandske nettsteder. Jeg får tilbud om å laste ned boka gratis – i epub eller pdf – mot at jeg besøker en eller annen annonsørnettside. Nei ellers takk. Lenkene skal jeg unnlate å oppgi.

Avsporing 2: Nynorsk etymologisk ordbok

Jeg skal til å bla meg forbi Nynorsk etymologisk ordbok : Torp, Alf, 1853-1916 : Free Download, men oppdager i siste liten at det står «Nynorsk». Dette er altså en helt annen bok. Den kom ut i 1919, og forfatteren Alf Torp døde i 1916, dermed er boka fritatt for opphavsrettbeskyttelsen, slik at en «free download» ikke er noe skummelt. Og når jeg klikker på lenka, kommer jeg til Internet Archives utgave av boka, digitalisert ved U of Toronto:

etym

Dette er en pen og ryddig måte å vise fram ei scannet bok på. Den er absolutt på høyden med samme bok på bokhylla til Nasjonalbiblioteket, for den finnes jo der også: http://urn.nb.no/URN:NBN:no-nb_digibok_2010060706062. Jeg legger merke til en mangel: Søkefunksjonen (Search inside) ser ut til ikke å virke. Og det er jo en nokså nødvendig funksjon i ei ordbok!

Men på den andre siden finnes en mulighet her som savnes hos NB, nemlig å laste ned boka i forskjellige ebok-formater, f.eks. disse (prøv sjøl):

PDF
EPUB
Kindle
Full Text

blue

Jeg var nokså spent på kvaliteten på disse tekstbaserte formatene. Er den bra nok så kan jeg laste boka over på et brett eller en telefon, og ha den med meg overalt uten å ha nettilgang. Hvis du prøver, vil du se at teksten inneholder mange «trykkfeil» (dvs ord som tekstgjenkjenningsprogrammet ikke har tolket riktig). Hvor mye feil som tåles er ikke så lett å enes om. De fleste vil nok mene at her er feilandelen for stor. Spesielt her hvor det dreier seg om en ordbok så er vel toleransen nokså lav.

Jeg sjekket kindle-versjonen (både på Kindle lesebrett og Kindle-app for iPhone) og epub-versjonen (Bluefire for iPhone og Adobe Digital Editions for PC). Feilraten er den samme for alle, fordi det er den samme råteksten som er brukt. Funksjonaliteten mht blaing, vising og søking varierer litt. Personlig synes jeg Bluefire på iPhone ser ok ut. (Se bildet til venstre).

Spørsmål 1: Hvem har den beste versjonen? Internet Archive eller nb.no?

Nettleserversjonen til Internet Archive er litt «penere», men fordi søkefunksjonen ikke virker, så er det tross alt bare nb.no som duger, spesielt fordi det dreier seg om et oppslagsverk.

Nedlasting av tekstversjon mangler hos nb.no, men versjonen til Internet Archive har for mange feil til at den kan godkjennes. Hvis det ikke hadde vært et oppslagsverk, ville kanskje feilmengden vært tolererbar!

Spørsmål 2: Hvor mye bedre er dagens ebøker enn digitaliserte versjoner av de som ble trykt for 100 år siden?

Dette vet jeg ikke, fordi jeg ikke har slått kloa i den nye Norsk etymologisk ordbok, som i motsetning til denne fra 1919 er «Born digital» – og derfor forventes være funksjonelt overlegen. Jeg har fått kommentarer som tyder på at denne nye eboka ikke har skikkelig søkefunksjon, dvs den mangler hypertekstindeks til oppslagsordene, og fritekstsøking er for tregt. Det siste er nok avhengig av hvilket brett og evt hvilken app du bruker.

Så det gjenstår mer utforsking. Men jeg har ikke lyst til å bruke 480 kroner for å skaffe meg den nye eboka 😉

Advertisements

Om tidsreiser på nettet

Vi er etter hvert blitt vant til å reise på nettet, fra sted til sted (fra side til side) ved å følge lenker. Følelsen av å flytte seg er noe vagere når vi reiser i cyberspace enn når vi reiser i «virkeligheten» Men på en måte er vi bevisst at vi flytter oss i rommet, fra den ene nettadressen til den andre.

Å reise i tida

Nettet forandrer seg hele tida, nye ting kommer til, mens gamle sider forsvinner. Noen ganger har vi bruk for å se på nettsider som er forsvunnet eller endret. Som nevnt før på denne bloggen finnes det tjenester som har arkivering av nettsider som hovedoppgave, mest kjent er sikkert Internet Archive (The Wayback Machine). Det finnes også andre arkiver.

Altså kan vi til en viss grad reise bakover i tida på nettet. Ikke overalt, det er mange nettsider som er borte for alltid, dvs ikke arkivert på en måte som vi kan ha nytte av. Men hvis du vil se hvilke nyheter som sto i dagbladet.no for 10 år sida, så finnes det håp. Eller hvis du har mistanke om at noen har gjort endringer i et viktig nettdokument. Eller hvis du skulle hatt informasjon fra noen av de offentlige nettsidene i USA som nettopp har vært stengt.  Men for å finne fram i arkivene trenger vi trenger gode verktøy, og her kommer memento til hjelp.

Memento

Herbert van de Sompel er godt kjent innenfor bibliotekenes verden, som opphavsmann til teknologier som sfx, openurl, oai-pmh etc. Det spiller ingen rolle om dette er ukjent for deg. Her handler det om memento, som Herbert står bak, og som er et rammeverk for å navigere nettet langs tidsaksen. (På emtacl12 var Herbert keynote speaker, og her kom han inn på memento).

Memento Logo (Public domain)

Memento er som nevnt et rammeverk som innholder både standarder, retningslinjer og verktøy. I verktøykassen finner vi Memento Time Travel, som er et tillegg for nettleseren Chrome.

Etter at du har installert Memento Time Travel, så kan du ved å høyreklikke på ei nettside få fram tidsreisemuligheten. For eksempel lurer jeg på hva som sto på forsida av New York Times den 11. september i 2001. (Ja, jeg har jo en mistanke).

NYT

Her har jeg på forhånd sagt fra til Memento (ved å klikke på Memento-ikonet i verktøylinja i nettleseren) hvilket tidspunkt jeg vil reise til. Resultatet er her ttp://web.archive.org/web/20010911211250/http://www.nyt.com/ .

Som sagt, ikke alle nettsider er arkivert, så ofte er du uten muligheter til å gå tilbake. Et av målene med Memento-prosjektet har vært en bevisstgjøringskampanje for behovet for arkiveringstiltak. Hvis nettsidearkivering blir tatt alvorlig nok av mange nok, vil reisemulighetene etter hvert bli bedre. Men allerede i dag er nytteverdien stor.

PS: Jeg hadde sjøl bruk for ei arkivert nettside for et par dager siden, da jeg ønsket å sjekke MARC 21-formatet. Dette administreres av Library of Congress i USA, og deres nettside var akkurat da offer for den såkalte shutdown-affæren. Men vha Internet Archive fant jeg en tidligerre kopi, som var god nok for mitt behov.

Altså:

Du bør installere denne utvidelsen for Chrome og ta den i bruk!