Om tidsreiser på nettet

Vi er etter hvert blitt vant til å reise på nettet, fra sted til sted (fra side til side) ved å følge lenker. Følelsen av å flytte seg er noe vagere når vi reiser i cyberspace enn når vi reiser i «virkeligheten» Men på en måte er vi bevisst at vi flytter oss i rommet, fra den ene nettadressen til den andre.

Å reise i tida

Nettet forandrer seg hele tida, nye ting kommer til, mens gamle sider forsvinner. Noen ganger har vi bruk for å se på nettsider som er forsvunnet eller endret. Som nevnt før på denne bloggen finnes det tjenester som har arkivering av nettsider som hovedoppgave, mest kjent er sikkert Internet Archive (The Wayback Machine). Det finnes også andre arkiver.

Altså kan vi til en viss grad reise bakover i tida på nettet. Ikke overalt, det er mange nettsider som er borte for alltid, dvs ikke arkivert på en måte som vi kan ha nytte av. Men hvis du vil se hvilke nyheter som sto i dagbladet.no for 10 år sida, så finnes det håp. Eller hvis du har mistanke om at noen har gjort endringer i et viktig nettdokument. Eller hvis du skulle hatt informasjon fra noen av de offentlige nettsidene i USA som nettopp har vært stengt.  Men for å finne fram i arkivene trenger vi trenger gode verktøy, og her kommer memento til hjelp.

Memento

Herbert van de Sompel er godt kjent innenfor bibliotekenes verden, som opphavsmann til teknologier som sfx, openurl, oai-pmh etc. Det spiller ingen rolle om dette er ukjent for deg. Her handler det om memento, som Herbert står bak, og som er et rammeverk for å navigere nettet langs tidsaksen. (På emtacl12 var Herbert keynote speaker, og her kom han inn på memento).

Memento Logo (Public domain)

Memento er som nevnt et rammeverk som innholder både standarder, retningslinjer og verktøy. I verktøykassen finner vi Memento Time Travel, som er et tillegg for nettleseren Chrome.

Etter at du har installert Memento Time Travel, så kan du ved å høyreklikke på ei nettside få fram tidsreisemuligheten. For eksempel lurer jeg på hva som sto på forsida av New York Times den 11. september i 2001. (Ja, jeg har jo en mistanke).

NYT

Her har jeg på forhånd sagt fra til Memento (ved å klikke på Memento-ikonet i verktøylinja i nettleseren) hvilket tidspunkt jeg vil reise til. Resultatet er her ttp://web.archive.org/web/20010911211250/http://www.nyt.com/ .

Som sagt, ikke alle nettsider er arkivert, så ofte er du uten muligheter til å gå tilbake. Et av målene med Memento-prosjektet har vært en bevisstgjøringskampanje for behovet for arkiveringstiltak. Hvis nettsidearkivering blir tatt alvorlig nok av mange nok, vil reisemulighetene etter hvert bli bedre. Men allerede i dag er nytteverdien stor.

PS: Jeg hadde sjøl bruk for ei arkivert nettside for et par dager siden, da jeg ønsket å sjekke MARC 21-formatet. Dette administreres av Library of Congress i USA, og deres nettside var akkurat da offer for den såkalte shutdown-affæren. Men vha Internet Archive fant jeg en tidligerre kopi, som var god nok for mitt behov.

Altså:

Du bør installere denne utvidelsen for Chrome og ta den i bruk!

Advertisements

Innenfra og ut

Jeg kan ikke dy meg for å komme tilbake til dette temaet. Foranledningen er den store oppmerksomheten på discovery-tjenester fra «alle» store fagbibliotek. Når bibliotekene verden over bruker så forferdelig mye energi og folk og penger på å finne saker og ting, så skyldes vel det at tingene egentlig er nokså vanskelig å finne. De er enten skjult bak en betalingsmur, eller forlagt i et rotete datasystem med uinteressante metadata. Og her passer metaforen om innenfra-ut istedet for utenfra-inn synes jeg.

Enn om vi alle bruker all energi på å gjøre våre ting lett å få tak i? Ved å bruke åpne  systemer og åpen publisering.

Denne utopien kan ikke bibliotekene alene oppnå. Det må sjølsagt skje sammen med de som foretar den vitenskapelige publiseringen. Hvis jeg skulle være litt slem, kunne jeg insinuere at bibliotekene ikke alltid synes det er greit å bidra til åpenhet, fordi vi dermed svekker vår posisjon som uunnværlige forvaltere av esoteriske saker.

o o o

Som sagt, det som trigget meg var ressursbruken innenfor discoverysystemer. Rent konkret skrev Rurik Greenall et lite innlegg på UB’s intranett hvor han anbefalte artikkelen Giving up on discovery av Dale Askey fra McMaster University, som bl.a. spør hva vi kan bruke ressursene til i stedet for å opprettholde discovery-verktøy. Funderingene hans her fører meg direkte til begrepene inside-out eller outside-in, som jeg har lært om av Lorcan Dempsey og tidligere blogget om her: Innenfra og ut eller utenfra og inn

Jeg lot meg dermed friste til å skrive en kommentar til Ruriks innlegg. Det som står over her er en omtrent ordrett gjentakelse av denne kommentaren, for om mulig å nå noen flere lesere.

o o o

Har du lest så langt, men er ikke sikker på hva jeg mener med discovery? Den korteste definisjonen jeg har sett er fra Daniel Forsman: Discovery: A single search box providing a Google-like searchexperience (as well as advanced searching capabilities). Mange store bibliotek og biblioteksammenslutninger har anskaffet eller planlegger å anskaffe et slikt verktøy, for å gi brukerne sine en enhetlig inngang til «alt» det materialet som bibliotekene forvalter.

Ordet fulltekst finnes ikke på norsk

men likevel bruker vi det daglig i bibliotekene.

Hva mener jeg med at det ikke finnes når det brukes hele tida? Jo, det står ikke i noen norsk ordbok såvidt jeg kan se. Det finnes ikke som oppslagsord hverken i Store norske leksikon eller Wikipedia.

Okei. Vi kan vel bruke det likevel? Ja sjølsagt. Men hva betyr det egentlig?

Spørsmålet var litt retorisk. Jeg leste et sted at «Fulltekst betyr at hele artikkelen eller boka er tilgjengelig på nettet». Og det er en forklaring som vi i bibliotekene nok synes er ok. Hvis vi da ikke skal begynne med flisespikking av termen «tilgjengelig» 😉

Såvidt jeg husker dukket fulltekstbetegnelsen opp for titalls år siden i bibliotekene, og da i sammenhengen «fulltekstsøkbar», på et tidspunkt da selve «fullteksten» slett ikke var «tilgjengelig». Så har vi altså etter hvert latt det få en annen betydning.

For å være litt vrien: Sjøl synes jeg ordet «fulltekst» passer like så godt på ei trykt bok som på noe som finnes på nettet. Og dessuten: Det dreier seg vel ikke bare om tekst, men også om dokumenter som inneholder bilder?

Hvis du ikke jobber i et bibliotek eller med biblioteksaker, så har jeg to spørsmål:

  1. hva synes du ordet fulltekst høres ut som det betyr? (ikke tenk på hva jeg skrev over)
  2. er det noen annen benevnelse vi heller burde bruke for å angi «artikkelen eller boka som er på nettet»

Svar gjerne med en kommentar! (Okei, svar gjerne sjøl om du er biblioteksmenneske)

Jeg tror ikke vi bruker språket vårt for bevisst å distansere oss fra brukerne, slik som mange andre profesjoner beskyldes for. Men jeg tror heller ikke vi er flinke nok til å sjekke hvordan ordene våre blir oppfattet, Det finnes nok andre eksempler enn fulltekst. Hva er feks en e-ressurs?

Her er et fiktivt eksempel på ei treffliste fra en søketjeneste på nettet, kanskje et såkalt «discovery»-system.  For meg ser dette perfekt ut, fordi jeg forstår både Fulltekst og Bestill 😉

1. Comment on «How cats lap: water uptake by Felis catus»
Nauenberg, Michael. Science (New York, N.Y.), 2011, Vol.334(6054), pp.311; author reply 311
Fulltekst   Bestill

2. Crystal structure of the DNA-bound VapBC2 antitoxin/toxin pair from Rickettsia felis
Maté, María J ; Vincentelli, Renaud ; Foos, Nicolas ; Raoult, Didier ; Cambillau, Christian ; Ortiz-lombardía, Miguel.  Nucleic acids research, 2012, Vol.40(7), pp.3245-58
Fulltekst   Bestill

3. Felis Bernandesii, Panthera Onca
Rodríguez, Will. Punta Umbría : Essan, 2008. ISBN: 9788493607050
Fulltekst   Bestill

4. How cats lap: water uptake by Felis catus.(REPORTS)(Author abstract)(Report)
Reis, Pedro M. ; Jung, Sunghwan ; Aristoff, Jeffrey M. ; Stocker, Roman. Science, Nov 26, 2010, Vol.330(6008), p.1231(4)
Fulltekst   Bestill

5. Crystal structure and functional insight of HP0420-homolog from Helicobacter felis
Piao, Shunfu ; Jin, Xiao Ling ; Yun, Bo-young ; Kim, Nahee ; Cho, Hyun-soo ; Fukuda, Minoru ; Lee, Heeseob ; Ha, Nam-chul. Biochemical and biophysical research communications, 2010, Vol.394(4), pp.940-6
Fulltekst   Bestill

6. Horizontal transmission of Rickettsia felis between cat fleas, Ctenocephalides felis
Hirunkanokpun, S ; Thepparit, C ; Foil, LD ; Macaluso, KR. Molecular Ecology, 2011, Vol.20(21), pp.4577-4586
Fulltekst   Bestill

Sommerlektyre

Nei, dette er ikke typisk lettbeint lesestoff. Men kanskje det ikke er det du er på jakt etter heller? Det blir litt fag og litt annet.

Names and identities: looking at Flann O’Brien av Lorcan Dempsey

Her er Lorcan Dempsey med et litt omfattende blogginnlegg. Det berører autoritetsdata (for de som har interesse for det begrepet) og det omhandler linked data (for de som tenner mer på dette). I det hele tatt dreier det seg om personer og navn, og bl.a. forskjellige initiativer både i og utenfor OCLC (hvor Lorcan er Vice President and Chief Strategist) for å drive med kontrollerte navneregistre. Lorcan er ire, og bruker Flann O’Brian (irsk forfatter) som case.

Infinite Jest av David Foster Wallace

Denne romanen av David Foster Wallace (1996) er en murstein og har et visst rykte som uleselig. Jeg er kommet 9 % inn i den (på lesebrettet opereres det ikke med sidetall, men den trykte utgaven har 1079 sider). Wikipedia sier flg: «The lengthy and complex work takes place in a semi-parodic future version of North America, and touches on tennis, substance addiction recovery programs, depression, child abuse, family relationships, advertising, popular entertainment, film theory, and Quebec separatism, among other topics.»  Sånn rent faglig interessant er måten Wallace bruker noter (388 stk) til å bryte opp teksten. Det er også i sakens natur (pga størrelse og kompleksitet) at det har dukket opp en egen wiki for interesserte lesere av Infinite Jest. David Foster Wallace Wiki: Infinite Jest  Dette med bokwiki er ikke enestående, men i dette tilfellet er wikien særdeles omfattende. Det kan faktisk være fristende å forlate boka for å fordype seg i wikien i stedet. Dette er vel i Wallace sin ånd, i og med hans bruk av noter for å bryte linearitet.

Hvis dette høres lettbeint ut, får du finne deg noe av Joyce eller Pynchon kanskje.

The Windup Girl av Paolo Bacigalupi

Mht Infinite Jest fant jeg et faglig alibi (om enn tynt). Her er det ikke noe slikt. Boka er etter mitt skjønn en veldig aktuell kommentar til Monsantos omdiskuterte (for å si det forsiktig) virksomhet med å patentere liv. Monsanto er kalt «The World’s Most Evil Corporation». The Windup Girl er en historie om den biologiske katastrofen, og omfatter både genmanipulering og genpatentering og onde korporasjoner. Den har et plot som gjør at den også kan presses inn i sommerlektyrekategorien. Eller kanskje lar du deg fenge av kategoriseringen «biopunk»? Boka finnes i ebok-utgave.

Catalogue 2.0 : The future of the library catalogue redigert av Sally Chambers

Denne nyutgitte boka har bidrag av Marshall Breeding, Sally Chambers, Anne Christensen, Till Kinstler, Marshall Breeding, Lukas Koster, Driek Heesakkers, Rosemie Callewaert, Emmanuelle Bermes, Karen Calhoun og Lorcan Dempsey. Derfor anbefaler jeg den uten å ha lest den. Altså utelukkende grunnlag av navnene. De fleste har jeg møtt, og kjenner dem som fagfolk med interessante perspektiver. Temaene omfatter sjølsagt slikt som FRBR, linked data og discovery, men har også andre vinkler. Boka finnes visst ikke som ebok.

Frå Ragnar til alle av Ragnar Hovland

Okeida, dette er kanskje lettbeint. Hvis du kjenner Ragnar, trenger du vel ikke vite mer enn at dette er hans nyeste bok. Som er et utvalg fra «mange års bombardement med kortare og lengre e-postar til dei tilsette [i Det Norske Samlaget]». Og på samme måte som med den forrige, her anbefaler jeg før jeg leser. Heller ikke her er det noen ebok-utgave.

Fortsatt god sommer!

ELAG 2013 er i gang

ELAG 2013 er i gang. I år er det Gent som er stedet.

Denne konferansen har tema INSIDE OUT LIBRARY. Dette betyr bl.a. at biblioteket ikke bare skal bringe informasjon utenfra og inn, men kanskje i større grad enn vi har tenkt på formidle informasjon innenfra og ut! For eksempel gjelder jo dette vitenskapelig publisering. (Dette var min tolking av temaet).

Om noen få minutter starter Herbert Van de Sompel med presentasjonen «A Blank Slate». Den skal jeg følge med på, fordi Herbert er alltid interessant. Han er en nøkkelperson i utviklingen av mange avanserte verktøy, bl.a. SFX, OAI-PMH, Memento og mer.

Og jeg trenger ikke være tilstede i Gent. Konferansen direkteoverføres («streames») her: http://lib.ugent.be/elag2013/streaming/

Og programmet er her: http://elag2013.org/programme/

I morgen kl 11:30 skal vår Rurik Greenall snakke om «Making Future-proof Library Content for the Web: Metadata-driven Workflows and Doing Things the “Right” Way».

Det er også mange andre interessante presentasjoner!

Om Google og Neil Gaiman

Med jevne mellomrom dukker dette sitatet av Neil Gaiman opp på Facebook: «Google can bring you back 100,000 answers, a librarian can bring you back the right one».  Som regel er det formidlet på den omseggripende måten å spre visdomsord på, nemlig å klistre opp teksten på en plakat, for eksempel slik:

Neil

Nå må jeg innrømme at jeg har litt vanskelig for å svelge dette sitatet. Jeg skjønner godt poenget og hensikten. Men samtidig vil jeg minne om at Google faktisk er et av de aller viktigste hjelpemidlene vi har til å finne svar. Det er mange meninger om Google, for eksempel om hvordan det burde virket annerledes enn det gjør. Men at det har revolusjonert søking etter svar tviler jeg ikke på.

Jada, Google kan finne tusener og millioner treff på en søking. Men det kan også sortere treffene på en slik måte at disse enorme treffmengdene ikke blir særlig i veien for oss. Og det har også begynt å gi oss svar i tillegg til treffene. Mer om det om et øyeblikk.

Gaiman setter Google opp mot bibliotekarene. Men jeg tror nok at Google også er et svært viktig hjelpemiddel for nettopp denne gruppen. At de er over gjennomsnittet flinke til å finne lure måter å bruke Google på er sikkert sant. Og at de vet at det fins andre ting enn Google som kan hjelpe når det trengs kraftigere saker eller bombesikre fakta. Nå er jeg ikke bibliotekar og slett ikke referansebibliotekar, men innrømmer glatt at mitt mest brukte verktøy for å finne informasjon er nettopp Google. Jeg vet at det ikke er perfekt, men bruker det likevel.

OK, sitatet er et ledd i en omfattende støtteaksjon for bibliotek som institusjon og bibliotekarer som gruppe. Gaiman ytret det først i egenskap av Honorary Chair of National Library Week i USA i april 2010, og sendte det etterpå ut på Twitter, der det har spredd seg godt. Gaiman ( @neilhimself ) er som mange vet en supertrendy tvitrer. Sitatet havnet til og med på golvet i the Gungahlin Library, ACT, Australia. (Bildet er derfra).

Men det kan være litt fristende å konfrontere Gaiman med hva han selv skriver på nettsida si, i hensikt å gi fansen beskjed om ikke å kontakte han direkte med spørsmål: «the answer to your question is probably on the site somewhere already (which is the most common reason for my not answering your question). Use the neilgaiman.com search function. Use Google. Use your school or local library. And good luck». (Min utheving).

Det kan også være interessant å se hva Google svarer på spørsmålet: «Who is Neil Gaiman?». Prøv sjøl: https://www.google.com/search?q=who+is+neil+gaiman%3F

Du vil nok være enig i at sjøl om du får 18.000.000 treff, så er denne første sida nokså hjelpsom. Blant annet fordi Google har begynt å gi svar (i høyrespalten) i tillegg til søketreffene i venstrespalten.

Så Neil: Det var veldig godt sagt, men nokså urettferdig egentlig.

Hva gjør vi når Google går konkurs

– eller for eksempel når de bestemmer seg for å hive Scholar på skraphaugen fordi Scholar-teamet skal over på Google Glass-prosjektet –

Dette skrekkscenariet brukes ofte i biblioteket som et argument for å bruke penger på å kjøpe kommersielle søkeverktøy. Og sjølsagt er det mange som ville merke på kroppen hvis noe slikt skjedde, fordi Scholar faktisk er så mye brukt av våre brukere, ja det er ofte vi ser målinger hvor det er dét mest brukte verktøyet.

Jeg har ikke tenkt å vurdere sannsynligheten for at dette skjer i det hele tatt, men tar som utgangspunkt at det kan skje.

Og da mener jeg at konsekvensen av en slik hendelse er overkommelig forutsatt at vi har orden på beholdningene våre. Eller sagt med andre ord: Det er mye viktigere for biblioteket å ha en bra kunnskapsbase enn et bra søkeverktøy. Kunnskapsbasen er oversikten over hvilke ressurser vi har og hvordan brukerne får tilgang til dem. Det er kunnskapsbasen som gjør det mulig for lenketjeneren å sette opp ei lenke som virker for våre brukere.

I praksis er det SFX som er vår kunnskapsbase og lenketjener. Så lenge den virker bra nok er det relativt enkelt å skifte ut (eller supplere) Google Scholar med Primo – eller skifte ut Primo med EDS – eller noe annet. Hvis vi skal skifte ut SFX med en annen kunnskapsbase, så må denne ha like god dekning av vår beholdning.

Sagt med andre ord: UB har i mange år greid seg uten eget søkeverktøy. Dette skyldes bl.a. Google Scholar. Hvis Scholar forsvinner, vil det være en nokså rask oppgave å anskaffe et slikt verktøy som kan søke på tvers av forskjellige søkekilder. Og resultatet vil bli ok så lenge vi har orden på kunnskapsbasen vår. Og det har vi.

PS: Jo, vi har jo forsåvidt hatt søkeverktøy – det er bare ingen som har brukt dem. Og akkurat nå driver vi og vurderer både det ene og det andre nye verktøyet – sjøl om Scholar ikke viser noen tegn på å vakle. Men det er en annen sak.

o o o

PS: Hvis du leser dette som privatperson (ikke bibliotekperson), så bør du forberede deg ved å (1) finne ut hvordan du tar backup av eposten din (hvis du bruker gmail), (2) finne ut hvilke andre epostleverandører som kan være aktuelle og (3) forbererede deg på å skifte fra søk i Google til andre tjenester, som f.eks. Bing, Yandex eller DuckDuckGo