Et åpnere bibliotek

1 svar

Mitt første møte med et åpnere bibliotek var på slutten av åttitallet, da NTUB jekket ned skranken i hovedbiblioteket. Like etterpå kom internettet, og begrepet åpenhet har tatt en ny vending etter det.

Den gamle skranken ved NTUB, her med Bjørg og Per. Foto Nils Bjørnelv

Åpenhet er bra. Det kan bety at biblioteket er lett tilgjengelig, at det finnes overalt, at åpningstidene er ok, at det er innbydende osv osv. Her vil jeg imidlertid se spesielt på åpenhet i et IT-perspektiv, og det blir vel som vanlig i denne bloggen med spesiell fokus på fagbibliotekene.

Åpen kildekode

Dette er en egenskap ved datasystemer som ikke nødvendigvis betinger at de er gratis, men at kildekoden er tilgjengelig slik at vi (bibliotekene) kan utnytte dette til å sjøl gjøre endringer. Her er det også en vanlig forutsetning at slike endringer som blir gjort av andre enn den opprinnelige opphavsinstansen kan bli «pløyd tilbake», og dermed komme andre brukere til gode. Dette er slett ikke vanlige betingelser for våre datasystemer.

Åpen publisering

På engelsk heter det Open Access, og her er det nok en forutsetning at publikasjonene er fritt og gratis tilgjengelige. Det er sjølsagt et mysterium for de fleste at forskningsresultater som har framkommet med offentlige midler, feks her i universitetene, blir publisert på en slik måte at til og med de samme institusjonene (ja i verste fall til og med forfatterne) må kjøpe dem tilbake.

Det kan diskuteres hvem som er pådrivere og hvem som er bremser i prosessen for et åpnere publiseringssystem. Bibliotekene bør gå fremst i dette toget.

Åpne IT-systemer

Åpenhet angår mye mer enn selve kildekoden. Vi ønsker gjerne å ha IT-systemer som er: Bransjeuavhengige, leverandøruavhengige, utskiftbare, flyttbare, skalerbare, dokumenterte osv. Alt dette er egenskaper som etter mitt syn har med åpenhet å gjøre.

Dette kan gjerne sammenfattes i utsagnet «Det er bedre med 10 skruer løs enn en som har rustet fast». Det er nok en kjensgjerning at en del av våre kjernesystemer ifølge disse kriteriene er langt fra åpne.

Å vise vei i stedet for å stå i veien.

Nei dette er ikke et sitat fra Kjartan Fløgstad :-). Det er grunn til å legge merke til at brukere av og til betrakter biblioteket som en omvei, som driver med sin mer eller mindre esoteriske virksomhet vha interne systemer og et hemmelig språk og en stadig masing om å lære opp brukerne i det faget som heter informasjonskompetanse. Urettferdig? Tja, ikke sikkert det. I alle fall har dette etter mitt syn noe med åpenhet å gjøre. Og – i alle fall – vi må etterstrebe å snakke et vanlig språk. Av og til synes jeg at vi (bibliotekene) oppfører oss som om vi er litt skamfulle for at det ikke var vi som fant opp nettet, og derfor må vi kompensere ved i det minste beholde vårt eget snevre fagspråk. Det er ikke særlig lurt!

Standarder

Når systemene skal samarbeide, er det gjerne mye snakk om hvilke standarder man skal bruke for å lage grenseenitt. Å komme fram til den ene «sanne standarden» har vært en målsetting som ikke nødvendigvis har vært gunstig. Det kan kanskje heller være lurt å forholde seg til en virkelighet hvor informasjon, data, systemer og tjenester ikke følger vår foretrukne ISO-standard, fordi den (altså standarden) framstår som uferdig, uforståelig og utilgjengelig. Å la de hundre blomster blomstre er en strategi som bør få mer oppmerksomhet, kanskje kan den sammen med darwinistiske mekanismer oppnå mer enn smalsporet standard-tenking.

En helt spesiell egenskap ved standarder er at de ofte inneholder detaljerte semantiske beskrivelser av data. Slik at den som skal bruke dataene har bruk for å kunne standarden. En alternativ og trolig mer robust måte er å gjøre semantikken eksplisitt, en del av dataene, slik som feks er et grunnleggende prinsipp i RDF og linked data.

Rådata

En form for åpenhet består i å gi brukerne tilgang til rådata, ikke bare til ferdigkokte dokumenter. Dette tillater å tilberede (behandle) dataene med andre hypoteser og andre verktøy, eller kanskje overprøve resultater som presenteres i dokumentene.

Innenfra og ut

En form for lukkethet er når institusjonene bruker sine «bokbudsjetter» på å skaffe «sine brukere» (studenter og ansatte) tilgang til forskningsdata produsert ved andre institusjoner gjennom rådyre mellomledd (betalingsmurer). Enn om alle sammen i stedet fokuserte på å gjøre sine egne data så tilgjengelig som mulig for andre? Altså «innenfra og ut» i stedet for «utenfra og inn».

Idet jeg i skrivende stund er i ferd med å forlate NTNU, så mister jeg samtidig tilgang til alle de dataene og alle den informasjon som NTNU kjøper. Det gjelder ikke bare pensjonisten, men enhver som forlater NTNU, f.eks. en ferdiguteksaminert student. Det er kanskje rettferdig. Eller kanskje ikke?

OK

dette bildet passer ikke ditt bibliotek? Nei, kanskje ikke hvis det er et folkebibliotek. Men kanskje likevel til en viss grad? I alle fall. Jeg tror at parolen «Et åpnere bibliotek» alltid har sin misjon.

Hva er i veien med MARC-posten?

Legg igjen en kommentar

(Dette er svar på et spørsmål til mitt forrige innlegg Hva er MARC, og er nok ikke særlig lettlest for deg som ikke har kjennskap til MARC-katalogisering).

Altså: Hva er i veien med MARC-posten?

I en MARC-post er det som regel blandet sammen en beskrivelse av mange «slags ting» (mange entitetstyper, klasser). I FRBR-språkbruk kunne vi si at vi finner verk, uttrykk, manifestasjon, eksemplar, person og emne. I andre datamodeller kunne man finne på å bruke andre navn på tingene, men i alle fall er det mange ting som er beskrevet, ved å bruke forskjellige MARC-felter. (100 for person, 082 og 241 for verk, 020 og 260 for manifestasjon, 852 for eksemplar, 245 for uttrykk etc). Alle disse feltene blir pakket sammen i en MARC-post. For å tolke denne dataklumpen, dvs ekstrahere informasjon om de enkelte tingene og deres innbyrdes forhold, så kreves det en svært detaljert kunnskap om formatet og konvensjonene som er brukt. Denne kunnskapen finnes bare hos noen svært spesialiserte personer innen biblioteksverdenen, og i tillegg kodet inn i like spesialiserte dataverktøy, såkalte biblioteksystemer. For resten av verden er dette ugjennomtrengelig.

Dette er OK så lenge MARC-postene skal brukes til det de var laget for på 1960-tallet: som grunnlag for å trykke katalogkort. Men det er ikke OK i alle andre sammenhenger, der vi har bruk for å finne og behandle og formidle informasjon om de forskjellige tingene en bibliografisk post kan bestå av. Det som da mangler i MARC, er en eksplisitt semantikk, dvs at posten sjøl forteller hva den uttaler seg om, slik at den kan brukes av personer eller applikasjoner som ikke innehar den komplekse ekstrinsiske MARC-kunnskapen. Vi har sett at nye tiltak som FRBR-modellen har hjulpet oss til å forstå at en «bibliographic record» ikke er så flat som vi trodde. Men dette (FRBR) har bare vært en tankemodell, og har ikke kunne hjelpe oss veldig mye i praksis.

Noen av oss mener å øyne en lysning (eller løsning) innenfor den semantiske webben, nettopp fordi man der er opptatt av å gjøre semantiske ting eksplisitt (typer, egenskaper, relasjoner, verdier etc). Linked data er en plattform som det satses på (for eksempel i BIBFRAME), hvor man i tillegg til en eksplisitt databeskrivelse er fokusert på et liv på nettet (gjennom bruk av URIer for identifisering og adressering). Men vi er ikke i mål, det er fort gjort å gå seg bort i religionskonflikter når vi kommer i nærheten av ontologiske saker eller dataformater og programmeringsspråk.

MARC must die? Nei det tror jeg er feil angrepsmåte. Heller dette: Å bruke MARC der hvor det er lurt, men ikke ellers.

Photo: Till Krech http://www.flickr.com/photos/10508943@N00/125171884/

Hva er MARC?

5 svar

Det er svært mange i norske bibliotek som bruker MARC til daglig. Da mener jeg ikke det franske brennevinet Marc som er laget av pressrester av druer, men et eller annet metadataformat som heter MARC. Mange bruker BIBSYS-MARC, andre NORMARC eller BSMARC. Kanskje også andre. De fleste bruker «sitt» format til katalogisering, og tenker kanskje lite på at det finnes mange MARC-formater med forskjellige egenskaper, mange bruksområder og mange problemstillinger knyttet til disse formatene. For eksempel: Har MARC-formatene etter snart 50 års levetid omsider overlevd seg sjøl?

For to dager siden holdt jeg en presentasjon for metadatagruppen ved NTNU UB med tittelen Alt du trenger å vite om MARC – men ikke har tenkt å spørre om. Her er presentasjonen i Slideshare-utgave: Les videre →

På jakt etter etymologiske ordbøker

1 svar

Jakten etter etymologiske ordbøker startet med at jeg har hatt lyst til å kjøpe den nye Norsk etymologisk ordbok, og så fant jeg ut at den finnes som e-bok, i vannmerket epub-utgave (feks hos haugenbok.no). Nå koster den nokså mye, så jeg ville gjerne høre om noen erfaringer før jeg kjøper. Hvordan er det feks å søke opp ord i epub-utgaven?

Altså setter jeg i gang med å se om Google har noen relevante erfaringer, men finner ikke umiddelbart noen vurderinger av den typen jeg er på jakt etter. (Hvis du har noen erfaringer å bidra med, så kom gjerne med dem i kommentarfeltet!) Men derimot finner jeg andre interessante ting (denne serendipiteten er en av nettets store velsignelser etter mitt syn).

Avsporing 1: Piratutgaver

Det dukker nokså snart opp piratutgaver, i dette tilfellet fra to utenlandske nettsteder. Jeg får tilbud om å laste ned boka gratis – i epub eller pdf – mot at jeg besøker en eller annen annonsørnettside. Nei ellers takk. Lenkene skal jeg unnlate å oppgi.

Avsporing 2: Nynorsk etymologisk ordbok

Jeg skal til å bla meg forbi Nynorsk etymologisk ordbok : Torp, Alf, 1853-1916 : Free Download, men oppdager i siste liten at det står «Nynorsk». Dette er altså en helt annen bok. Den kom ut i 1919, og forfatteren Alf Torp døde i 1916, dermed er boka fritatt for opphavsrettbeskyttelsen, slik at en «free download» ikke er noe skummelt. Og når jeg klikker på lenka, kommer jeg til Internet Archives utgave av boka, digitalisert ved U of Toronto:

Dette er en pen og ryddig måte å vise fram ei scannet bok på. Den er absolutt på høyden med samme bok på bokhylla til Nasjonalbiblioteket, for den finnes jo der også: http://urn.nb.no/URN:NBN:no-nb_digibok_2010060706062. Jeg legger merke til en mangel: Søkefunksjonen (Search inside) ser ut til ikke å virke. Og det er jo en nokså nødvendig funksjon i ei ordbok!

Men på den andre siden finnes en mulighet her som savnes hos NB, nemlig å laste ned boka i forskjellige ebok-formater, f.eks. disse (prøv sjøl):

PDF
EPUB
Kindle
Full Text

blue

Jeg var nokså spent på kvaliteten på disse tekstbaserte formatene. Er den bra nok så kan jeg laste boka over på et brett eller en telefon, og ha den med meg overalt uten å ha nettilgang. Hvis du prøver, vil du se at teksten inneholder mange «trykkfeil» (dvs ord som tekstgjenkjenningsprogrammet ikke har tolket riktig). Hvor mye feil som tåles er ikke så lett å enes om. De fleste vil nok mene at her er feilandelen for stor. Spesielt her hvor det dreier seg om en ordbok så er vel toleransen nokså lav.

Jeg sjekket kindle-versjonen (både på Kindle lesebrett og Kindle-app for iPhone) og epub-versjonen (Bluefire for iPhone og Adobe Digital Editions for PC). Feilraten er den samme for alle, fordi det er den samme råteksten som er brukt. Funksjonaliteten mht blaing, vising og søking varierer litt. Personlig synes jeg Bluefire på iPhone ser ok ut. (Se bildet til venstre).

Spørsmål 1: Hvem har den beste versjonen? Internet Archive eller nb.no?

Nettleserversjonen til Internet Archive er litt «penere», men fordi søkefunksjonen ikke virker, så er det tross alt bare nb.no som duger, spesielt fordi det dreier seg om et oppslagsverk.

Nedlasting av tekstversjon mangler hos nb.no, men versjonen til Internet Archive har for mange feil til at den kan godkjennes. Hvis det ikke hadde vært et oppslagsverk, ville kanskje feilmengden vært tolererbar!

Spørsmål 2: Hvor mye bedre er dagens ebøker enn digitaliserte versjoner av de som ble trykt for 100 år siden?

Dette vet jeg ikke, fordi jeg ikke har slått kloa i den nye Norsk etymologisk ordbok, som i motsetning til denne fra 1919 er «Born digital» – og derfor forventes være funksjonelt overlegen. Jeg har fått kommentarer som tyder på at denne nye eboka ikke har skikkelig søkefunksjon, dvs den mangler hypertekstindeks til oppslagsordene, og fritekstsøking er for tregt. Det siste er nok avhengig av hvilket brett og evt hvilken app du bruker.

Så det gjenstår mer utforsking. Men jeg har ikke lyst til å bruke 480 kroner for å skaffe meg den nye eboka 😉

Discovery ved NTNU i 2014

1 svar

[Dette er et kort sammendrag av gårsdagens kunngjøring på vårt intranett Innsida].

Ved NTNU UB har vi i 2013 prøvd ut discoveryverktøyet EDS fra EBSCO. Samtidig har BIBSYS lansert Oria, som er bygd på verktøyet Primo fra Ex Libris. Foreløpig mener vi at ingen av disse to er gode nok til at de fullt ut kan erstatte dagens systemer og markedsføres overfor våre brukere som det eneste søkeverktøy mot våre informasjonsressurser. Begge verktøyene har svakheter og mangler med driftsstabilitet, dekning, funksjonalitet mm.

Derfor vil vi inntil videre markedsføre BIBSYS Ask som søkeverktøy både for sluttbrukere og til internt bruk. Dagens nettsider beholdes, mens vi vil erstatte dagens Primo med Oria. Vi ser på dette som en betatjeneste, og som et supplement til BIBSYS Ask og til fagdatabasene.

Etter vår vurdering er EDS ennå ikke godt nok til å settes i produksjon. Brukerundersøkelse har vist at det har god nok dekning og god nok støtte for fulltekstlenking på artikler, men ikke for ebøker. EDS har mangelfull duplikatkontroll, og en uryddig behandling av søkekilder og dokumenttyper. Det er mangler i brukergrensesnitt.

Vi har avtale med EBSCO som agent ut 2014. EDS-prosjektet vårt vil fortsette, med hovedvekt på å få aksept for våre krav til EBSCO om bedret datakvalitet, funksjonalitet og integrasjon med andre produkter. Vi har fremdeles en visjon om å ha en tett integrasjon mellom søkeverktøy, kunnskapsbase og administrative tjenester, og ønsker derfor å fortsatt utfordre EBSCO til å levere oss det integrerte totaltilbudet. I og med at BIBSYS nå anskaffer nytt biblioteksystem, er det sjølsagt også interessant å se om dette kan føre til bedre integrasjon med agentsystemene.

I tillegg vil vi starte opp et prosjekt som går litt mer grunnleggende til verks når det gjelder grunnprinsippene for gjenfinning. Det er ikke alminnelig enighet om at dagens discoveryverktøy er noe særlig mer egnet for dagens forskere og studenter enn de systemene vi hadde før. Vi må også utforske muligheter og utfordringer med åpne data og åpne systemer.

Noe med data

2 svar

Ifølge termodynamikkens 2. hovedsetning så er det vanskeligere å lage ei ku av en hamburger enn omvendt. (Nicholad Georgescu-Roegen har sagt noe lignende)

Det har hendt, når noen spurte meg om hva jeg jobbet med, at jeg for spøk svarte «noe med data». Nå etter en mannsalder i biblioteket så skulle jeg vel heller si «noe med informasjon» – eller kanskje «noe med kunnskap». Men hvis noen ber meg om å forklare forskjellen mellom data og informasjon, er jeg ikke sikker på at jeg klarer det noe særlig.

pyra Jeg kan jo prøve, med utgangspunkt i denne trekanten som vel de fleste har sett, å si at Informasjon er kodet i form av data, og kan brukes for å gi kunnskap – eller noe sånt. Og så har jeg hatt følelsen av at innen biblioteket så arbeider vi mest i midtsjiktet, dvs med informasjon. Det som er «varen» hos oss er bøker, artikler, rapporter, bilder, manuskripter, lyd, levende bilder, noter, kart &c &c. Vi er vant til å kalle alt dette for dokumenter (sjøl om vi for ca 15 år siden prøvde vi oss fram med mer moderne termer som dokumentlignende objekter (grøss) og informasjonsobjekter).

Etter hvert så har vi også blitt vant til at en stadig større del av dokumentene våre manifesterer seg som nettsider, i den forstand at de kan aksesseres vha en nettleser. Men vi betrakter gjerne alt sammen som informasjonsobjekter, og ser for oss at disse objektene er bearbeidet av noen, og så overlates det til oss å formidle dem til våre brukere.

Så det dreier seg altså om informasjon, og vi jobber også mye med informasjonssøking og informasjonsformidling (men pussig nok lite med informasjonsteori og informatikk). Når vi finner og formidler informasjon, er det nesten alltid i form av dokumenter, som på en måte er ferdig innpakket informasjon.

Taktskifte: Data

Vi (altså fremdeles i bibliotekene) har vel på en måte vært forskånet for – eller hevet oss over – det nederste datalaget. Men sannelig har det kommet sigende innover oss, i form av

Metadata, Rådata, Big data, Paradata (ja jøss), Linked data, Åpne data &c&c

Metadata var greit nok, det var jo bare et nytt navn på katalogkortet. Men det har skjedd mer, delvis på grunn av at nettet har gitt oss mulighet for å publisere halvfabrikata, rådata, fragmenter, dynamiske dokumenter og lignende. Nettet har vært den tekniske plattformen, og har også etter hvert gitt arena for en delingskultur. Det var kanskje ikke forskerne som var først ute med å gripe tak i nye teknologier og nye kulturer, men de er på full fart!

Forskningspublikasjonen blir noe mye mer enn et dokument, den kan være dynamisk, distribuert og fragmentert, og vi øyner en ny paradigme for bruk og gjenbruk av forskningsresultater, nemlig tilgang til disse fragmentene («assets»), blant annet selve datasettene (rådata).

Rådata er data som ikke er bearbeidet, dvs de kan bearbeides på forskjellige måter, i henhold til forskjellige problemstillinger, forskjellige metoder og forskjellige verktøy. Når rådata bearbeides så mister de som regel denne egenskapen: å kunne brukes til forskjellige ting. (Dette gjelder jo ikke bare data, men alle former for råvarer). Vi kan bruke en ny trekant for å illustrere dette:

http://www.dlib.org/dlib/january11/smit/smit1.png

Ett motiv for å ha bruk for rådata beskriver Pål Hermod Lykkja som «reproduksjonskrisa», nemlig mangelfull verifikasjon av forskningsresultater, et problem som kanskje er alvorligere enn vi aner. Reproduksjon vil ofte bety å gå løs på samme hypotese og samme datasett med andre metoder. Et annet bruksområde kan være å angripe nye problemstillinger og hypoteser ut fra et eksisterende datasett, kanskje innen et annet fagområde.

Har biblioteket en rolle?

Vi har til en viss grad fått verktøy (feks dataskyer og nettverk), kulturer (ref web 2.0) og lisenser (feks Open Data Commons) for å publisere data.

Men vi har kanskje ikke nødvendige forretningsmodeller og paradigmer på plass hos forskere og institusjoner, sjøl om det finnes entusiaster og foregangsinstitusjoner.

Og – det som er hovedpoenget med dette innlegget: Bibliotekene er bare så vidt i ferd med å oppdage hva som foregår. Hvis vi ikke er forutseende, kan det hende at vi blir mindre relevante for formidling av forskningsresultater.

For øvrig gjelder mesteparten av det som er sagt over for mye annen informasjonsformidling enn det som angår forskning. Ta for eksempel Wikipedia, som vi tradisjonelt var istand til å nyttiggjøre oss i form av tradisjonelle leksikonartikler, men hvor vi nå kan gripe tak i «råere assets» vha linked data, Wikimedia Commons, Wikidata etc. Men mer om det en annen gang kanskje.

Bibliotekene må finne ut hva dette datastyret egentlig dreier seg om. Vi må skifte fokus mer over på datalaget, vi må sette oss inn i datamodellering, og kanskje kommer vi i nærkontakt med informasjonsteorien også? Kanskje har vi en rolle når det gjelder forvaltning (f.eks. lagring og katalogisering) av data? Kanskje har vi en rolle innenfor formidling som ikke er isolert til midtsjiktet i pyramiden? Jeg tror ikke vi skal stole på at de andre vil tale vår sak når rollelista skal settes opp.

Kua og hamburgeren

Du har sikkert skjønt poenget med innledningen: At kua er rådata, og at når vi først har laget hamburgere av den, så kan den ikke brukes til andre ting.

Lenker

Abelard and Héloise: Why Data and Publications Belong Together.
Eefke Smit, D-Lib Magazine, January/February 2011, Volume 17, Number 1/2 http://dx.doi.org/10.1045/january2011-smit

The Entropy Law and the Economic Process in Retrospect.
Nicholas Georgescu-Roegen, Eastern Economic Journal, 1986, vol. 12, issue 1, pages 3-25

Termodynamikkens 2. hovedsetning. http://en.wikipedia.org/wiki/Second_law_of_thermodynamics

The Information.
James Gleick. 2011.
http://en.wikipedia.org/wiki/The_Information:_A_History,_a_Theory,_a_Flood

Open Data Commons
http://opendatacommons.org/

[Reproduksjonskrisa].
Pål Magnus Lykkja
http://www.nb.no/cgi-bin/wa?A2=ind1309&L=BIBLIOTEKNORGE&P=106765

Discovery quo vadis

3 svar

[ Siden dette innlegget ble skrevet så har vi fått beskjed om at Thomson Reuters har ombestemt seg, slik at Web of Science fortsatt vil være tilgjengelig i de aktuelle discovery-systemene ]

o o o

Dette tenkte jeg å skrive på vårt intranett, i anledning våre diskusjoner om hva vi skal gjøre med discovery her i huset (NTNU UB). Men kanskje flere har interesse eller synspunkter? I alle fall går jeg rett på sak, uten å prøve å forklare hva discovery betyr i denne sammenhengen. Hvis du kommer «utenfra» og er forvirret, så kan du feks søke i denne bloggen på «discovery».

o o o

En felles egenskap ved alle discoverysystemer er: De gir ikke tilgang til alt. Det betyr at de kan ikke være vårt eneste tilbud. Dette tror jeg alle er enig om.

Et naturlig spørsmål er da om hvilken vei utviklingen går, blir det bedre eller dårligere dekning etter hvert? Neppe noe enkelt svar på det spørsmålet. Men i det minste interessant å se at Thomson Reuter trekker sin tjeneste WoS (Web of Science) tilbake fra discoverysystemene. Det gjelder spesielt Primo (dvs Oria) og EDS. Denne opplysningen spredte seg i går, men det er vanskelig å finne offisielle kunngjøringer. (Dette sitatet tilskrives Jeroen Prinsen fra WoS: «we believe [not allowing WoS in any discovery service] is in the best interest of our customers and end users». Javel nei???)

Erfaringer som vi har gjort i interne prosjekter tyder på at hvis vi ønsker å øke discoverysystemets dekning ved å gi det tilgang til våre egne samlinger (som er et av systemenes salgsargumenter), så går dette ikke av seg sjøl. Det koster kanskje mer arbeid enn vi er forberedt på.

Ovenstående kan brukes som et argument mot å investere i et discoverysystem. Det kan også brukes som et innspill til spørsmålet om hvordan vi ønsker å framstille systemet for våre brukere. Kanskje er formuleringen «Start å søke her» brukbar. Kanskje er det lurt å satse kraftigere (enn det så langt er gjort i Oria og EDS) på å bringe de andre tjenestene inn i discoveryverktøyet. F.eks. gjennom en systematisk satsing på en høyrespalte som hele tiden gir informasjon om andre ting, f.eks. lenker til enkeltdatabaser, viktig info fra «bibliotekets nettsider».

Når jeg skriver dette så er jeg litt inspirert av Lorcan Dempseys blogginnlegg Full library discovery. Han har god oversikt over hvordan mange bibliotek tenker om disse tingene. Kanskje er vi litt for flinke til å stupe ned i superdetaljerte egenskaper vedr systemenes funksjonalitet, på bekostning av mer overordnete, ja kanskje til og med strategiske vurderinger.

PS: Det skjer også ting med Google Scholar (f.eks. her og her) . . .

Om tidsreiser på nettet

Legg igjen en kommentar

Vi er etter hvert blitt vant til å reise på nettet, fra sted til sted (fra side til side) ved å følge lenker. Følelsen av å flytte seg er noe vagere når vi reiser i cyberspace enn når vi reiser i «virkeligheten» Men på en måte er vi bevisst at vi flytter oss i rommet, fra den ene nettadressen til den andre.

Å reise i tida

Nettet forandrer seg hele tida, nye ting kommer til, mens gamle sider forsvinner. Noen ganger har vi bruk for å se på nettsider som er forsvunnet eller endret. Som nevnt før på denne bloggen finnes det tjenester som har arkivering av nettsider som hovedoppgave, mest kjent er sikkert Internet Archive (The Wayback Machine). Det finnes også andre arkiver.

Altså kan vi til en viss grad reise bakover i tida på nettet. Ikke overalt, det er mange nettsider som er borte for alltid, dvs ikke arkivert på en måte som vi kan ha nytte av. Men hvis du vil se hvilke nyheter som sto i dagbladet.no for 10 år sida, så finnes det håp. Eller hvis du har mistanke om at noen har gjort endringer i et viktig nettdokument. Eller hvis du skulle hatt informasjon fra noen av de offentlige nettsidene i USA som nettopp har vært stengt. Men for å finne fram i arkivene trenger vi trenger gode verktøy, og her kommer memento til hjelp.

Memento

Herbert van de Sompel er godt kjent innenfor bibliotekenes verden, som opphavsmann til teknologier som sfx, openurl, oai-pmh etc. Det spiller ingen rolle om dette er ukjent for deg. Her handler det om memento, som Herbert står bak, og som er et rammeverk for å navigere nettet langs tidsaksen. (På emtacl12 var Herbert keynote speaker, og her kom han inn på memento).

Memento er som nevnt et rammeverk som innholder både standarder, retningslinjer og verktøy. I verktøykassen finner vi Memento Time Travel, som er et tillegg for nettleseren Chrome.

Etter at du har installert Memento Time Travel, så kan du ved å høyreklikke på ei nettside få fram tidsreisemuligheten. For eksempel lurer jeg på hva som sto på forsida av New York Times den 11. september i 2001. (Ja, jeg har jo en mistanke).

Her har jeg på forhånd sagt fra til Memento (ved å klikke på Memento-ikonet i verktøylinja i nettleseren) hvilket tidspunkt jeg vil reise til. Resultatet er her ttp://web.archive.org/web/20010911211250/http://www.nyt.com/ .

Som sagt, ikke alle nettsider er arkivert, så ofte er du uten muligheter til å gå tilbake. Et av målene med Memento-prosjektet har vært en bevisstgjøringskampanje for behovet for arkiveringstiltak. Hvis nettsidearkivering blir tatt alvorlig nok av mange nok, vil reisemulighetene etter hvert bli bedre. Men allerede i dag er nytteverdien stor.

PS: Jeg hadde sjøl bruk for ei arkivert nettside for et par dager siden, da jeg ønsket å sjekke MARC 21-formatet. Dette administreres av Library of Congress i USA, og deres nettside var akkurat da offer for den såkalte shutdown-affæren. Men vha Internet Archive fant jeg en tidligerre kopi, som var god nok for mitt behov.

Altså:

Du bør installere denne utvidelsen for Chrome og ta den i bruk!

Innenfra og ut

Legg igjen en kommentar

Jeg kan ikke dy meg for å komme tilbake til dette temaet. Foranledningen er den store oppmerksomheten på discovery-tjenester fra «alle» store fagbibliotek. Når bibliotekene verden over bruker så forferdelig mye energi og folk og penger på å finne saker og ting, så skyldes vel det at tingene egentlig er nokså vanskelig å finne. De er enten skjult bak en betalingsmur, eller forlagt i et rotete datasystem med uinteressante metadata. Og her passer metaforen om innenfra-ut istedet for utenfra-inn synes jeg.

Enn om vi alle bruker all energi på å gjøre våre ting lett å få tak i? Ved å bruke åpne systemer og åpen publisering.

Denne utopien kan ikke bibliotekene alene oppnå. Det må sjølsagt skje sammen med de som foretar den vitenskapelige publiseringen. Hvis jeg skulle være litt slem, kunne jeg insinuere at bibliotekene ikke alltid synes det er greit å bidra til åpenhet, fordi vi dermed svekker vår posisjon som uunnværlige forvaltere av esoteriske saker.

o o o

Som sagt, det som trigget meg var ressursbruken innenfor discoverysystemer. Rent konkret skrev Rurik Greenall et lite innlegg på UB’s intranett hvor han anbefalte artikkelen Giving up on discovery av Dale Askey fra McMaster University, som bl.a. spør hva vi kan bruke ressursene til i stedet for å opprettholde discovery-verktøy. Funderingene hans her fører meg direkte til begrepene inside-out eller outside-in, som jeg har lært om av Lorcan Dempsey og tidligere blogget om her: Innenfra og ut eller utenfra og inn

Jeg lot meg dermed friste til å skrive en kommentar til Ruriks innlegg. Det som står over her er en omtrent ordrett gjentakelse av denne kommentaren, for om mulig å nå noen flere lesere.

o o o

Har du lest så langt, men er ikke sikker på hva jeg mener med discovery? Den korteste definisjonen jeg har sett er fra Daniel Forsman: Discovery: A single search box providing a Google-like searchexperience (as well as advanced searching capabilities). Mange store bibliotek og biblioteksammenslutninger har anskaffet eller planlegger å anskaffe et slikt verktøy, for å gi brukerne sine en enhetlig inngang til «alt» det materialet som bibliotekene forvalter.

Ordet fulltekst finnes ikke på norsk

1 svar

men likevel bruker vi det daglig i bibliotekene.

Hva mener jeg med at det ikke finnes når det brukes hele tida? Jo, det står ikke i noen norsk ordbok såvidt jeg kan se. Det finnes ikke som oppslagsord hverken i Store norske leksikon eller Wikipedia.

Okei. Vi kan vel bruke det likevel? Ja sjølsagt. Men hva betyr det egentlig?

Spørsmålet var litt retorisk. Jeg leste et sted at «Fulltekst betyr at hele artikkelen eller boka er tilgjengelig på nettet». Og det er en forklaring som vi i bibliotekene nok synes er ok. Hvis vi da ikke skal begynne med flisespikking av termen «tilgjengelig» 😉

Såvidt jeg husker dukket fulltekstbetegnelsen opp for titalls år siden i bibliotekene, og da i sammenhengen «fulltekstsøkbar», på et tidspunkt da selve «fullteksten» slett ikke var «tilgjengelig». Så har vi altså etter hvert latt det få en annen betydning.

For å være litt vrien: Sjøl synes jeg ordet «fulltekst» passer like så godt på ei trykt bok som på noe som finnes på nettet. Og dessuten: Det dreier seg vel ikke bare om tekst, men også om dokumenter som inneholder bilder?

Hvis du ikke jobber i et bibliotek eller med biblioteksaker, så har jeg to spørsmål:

hva synes du ordet fulltekst høres ut som det betyr? (ikke tenk på hva jeg skrev over)
er det noen annen benevnelse vi heller burde bruke for å angi «artikkelen eller boka som er på nettet»

Svar gjerne med en kommentar! (Okei, svar gjerne sjøl om du er biblioteksmenneske)

Jeg tror ikke vi bruker språket vårt for bevisst å distansere oss fra brukerne, slik som mange andre profesjoner beskyldes for. Men jeg tror heller ikke vi er flinke nok til å sjekke hvordan ordene våre blir oppfattet, Det finnes nok andre eksempler enn fulltekst. Hva er feks en e-ressurs?

Her er et fiktivt eksempel på ei treffliste fra en søketjeneste på nettet, kanskje et såkalt «discovery»-system. For meg ser dette perfekt ut, fordi jeg forstår både Fulltekst og Bestill 😉

1. Comment on «How cats lap: water uptake by Felis catus»
Nauenberg, Michael. Science (New York, N.Y.), 2011, Vol.334(6054), pp.311; author reply 311
Fulltekst Bestill

2. Crystal structure of the DNA-bound VapBC2 antitoxin/toxin pair from Rickettsia felis
Maté, María J ; Vincentelli, Renaud ; Foos, Nicolas ; Raoult, Didier ; Cambillau, Christian ; Ortiz-lombardía, Miguel. Nucleic acids research, 2012, Vol.40(7), pp.3245-58
Fulltekst Bestill

3. Felis Bernandesii, Panthera Onca
Rodríguez, Will. Punta Umbría : Essan, 2008. ISBN: 9788493607050
Fulltekst Bestill

4. How cats lap: water uptake by Felis catus.(REPORTS)(Author abstract)(Report)
Reis, Pedro M. ; Jung, Sunghwan ; Aristoff, Jeffrey M. ; Stocker, Roman. Science, Nov 26, 2010, Vol.330(6008), p.1231(4)
Fulltekst Bestill

5. Crystal structure and functional insight of HP0420-homolog from Helicobacter felis
Piao, Shunfu ; Jin, Xiao Ling ; Yun, Bo-young ; Kim, Nahee ; Cho, Hyun-soo ; Fukuda, Minoru ; Lee, Heeseob ; Ha, Nam-chul. Biochemical and biophysical research communications, 2010, Vol.394(4), pp.940-6
Fulltekst Bestill

6. Horizontal transmission of Rickettsia felis between cat fleas, Ctenocephalides felis
Hirunkanokpun, S ; Thepparit, C ; Foil, LD ; Macaluso, KR. Molecular Ecology, 2011, Vol.20(21), pp.4577-4586
Fulltekst Bestill

betaUB

Nettjenester og nye teknologier ved NTNU Universitetsbiblioteket (Bloggen er avsluttet juni 2014)

Et åpnere bibliotek

Åpen kildekode

Åpen publisering

Åpne IT-systemer

Å vise vei i stedet for å stå i veien.

Standarder

Rådata

Innenfra og ut

OK

Hva er i veien med MARC-posten?

Hva er MARC?

På jakt etter etymologiske ordbøker

Avsporing 1: Piratutgaver

Avsporing 2: Nynorsk etymologisk ordbok

Spørsmål 1: Hvem har den beste versjonen? Internet Archive eller nb.no?

Spørsmål 2: Hvor mye bedre er dagens ebøker enn digitaliserte versjoner av de som ble trykt for 100 år siden?

Discovery ved NTNU i 2014

Noe med data

Taktskifte: Data

Har biblioteket en rolle?

Kua og hamburgeren

Lenker

Discovery quo vadis

Om tidsreiser på nettet

Å reise i tida

Memento

Altså:

Innenfra og ut

Ordet fulltekst finnes ikke på norsk

Åpen kildekode

Åpen publisering

Åpne IT-systemer

Å vise vei i stedet for å stå i veien.

Standarder

Rådata

Innenfra og ut

OK

Del på

Del på

Del på

Avsporing 1: Piratutgaver

Avsporing 2: Nynorsk etymologisk ordbok

Spørsmål 1: Hvem har den beste versjonen? Internet Archive eller nb.no?

Spørsmål 2: Hvor mye bedre er dagens ebøker enn digitaliserte versjoner av de som ble trykt for 100 år siden?

Del på

Del på

Taktskifte: Data

Har biblioteket en rolle?

Kua og hamburgeren

Lenker

Del på

Del på

Å reise i tida

Memento

Altså:

Del på

Del på

Del på