Månedlige arkiver: juni 2011

Nytt fra Google+

Det er vel rett å si at Google har prøvd seg med tjenester for sosiale nettverk uten å lykkes. Vi sto i kø på våre knær og tryglet om invitasjoner til Wave og Buzz, men fant ingen grunn til å være med på leken lenge. Nå (dvs i forgårs) er de på banen igjen med Google+, som i likhet med mye annet derfra i første omgang forbeholdes de inviterte.

Vi som ikke er inviterte kan se at Google har fått seg ei ny menylinje. Det har vært relativt mye diskusjoner om den tilsynelatende bagatellen at de innfører ei ny svart linje. Men det er visst et lite signal om at det er forandringer på gang. Når Google+ er tilgjengelig, vil denne linja få nytt innhold.

Sjøl sier Google:

«Starting today, you might begin noticing that things look a little different across Google products. We’re working on a project to bring you a new and improved Google experience, and over the next few months, you’ll continue to see more updates to our look and feel.»

Denne «new experience» brukes flere steder. Og den hentyder på en nokså omfattende revisjon av Googles tjenester. Kanskje mye på overflata, kanskje noe på innsida. Og kanskje nokså mye i retning av et Google som er mer innrettet mot deling, i en retning som ligner på Facebook og Twitter. Jeg vil sikkert hoppe ombord så snart jeg får anledning (dvs en invitasjon). Det skal bli interessant å se om de nye tjenestene som Sparks, Circles etc også i noen grad er rettet inn mot profesjonell bruk – ikke bare tidtrøyte. Kanskje kan dette også få konsekvenser for vårt virke i bibliotekene?

Se Google’s egen kunngjøring på bloggen The Official Google Blog

Her er en omfattende omtale i Wired: Inside Google+ — How the Search Giant Plans to Go Social

Så får vi vente og se. Her er bildet som etter sigende er inspirasjon for Google i prosjektet (The Emerald Sea):

Emerald sea / Albert Bierstadt

Reklamer

Les: Forskningsbibliotekene strever og strever

En ny rapport fra OCLC Research studerer forskningsvirksomhet og forskerholdninger ved 8 store universiteter (4 i USA og 4 i UK) og kommer med konklusjoner som nok bør bekymre oss, f.eks.

«institutionally-provided research support services are not appreciated by researchers in universities, who consider them marginal at best and burdensome at worst»

«[the researchers] begrudge any time spent on activity which seems to them to serve an administrative need, seeing their job as to perform research, not administration. And the bad—if not unexpected—news for libraries is that institutional repositories fall squarely into the latter category, as far as researchers are concerned, since they lack any essential motivation to deposit their research outputs in them. The fact that this results in a disorganised mess of uncategorised and unsecured research outputs worries librarians, but is not a major concern for researchers.»

Vi har tidligere ( i blogginnlegget Innenfra og ut eller utenfra og inn ) kommentert et tilsynelatende åpenbart behov for at forskningsbibliotekene skifter over til å få informasjon ut i stedet for inn. Det er denne virksomheten som forskerne ifølge denne rapporten ikke synes at vi driver på noen meningsfylt måte.

Det blir kanskje regn i helga. Hvis du er opptatt av forskningsbibliotekenes rolle, så bør du pløye gjennom denne rapporten! Her er den:

MacColl, John and Michael Jubb. 2011. Supporting Research: Environments, Administration and Libraries. Dublin, OH: OCLC Research. http://www.oclc.org/research/publications/library/2011/2011-10.pdf (.pdf: 443K/11 pp.).

Endelig bildesøking i Google

Dette er en stor nyhet. Før måtte du beskrive bilder med ord for å kunne søke etter dem, nå kan du søke vha bilder. Det må riktignok innrømmes at det er langt fram til den virkelige store nytteverdien. Men det går an å se for seg noen muligheter.

Når du får kameraikonet til høyre i søkefeltet (ved Google bildesøking), kan du søke enten ved å laste opp et bilde fra disken din eller ved å angi et bilde fra ei nettside. Du vil kanskje kunne trekke bildet rett inn i søkefeltet. For å gjøre et kontrollert eksperiment, prøvde jeg et par av mine egne bilder.

Først prøvde jeg et vaffelbilde. Her ble resultatet: Ingen treff på identiske bilder, og noen forslag til Visually similar images som var interessante: Alle var av mat, men det var ingen vafler! Altså null nytteverdi.

(Prøv sjøl ved å trekke vaffelbildet inn i søkefeltet for Google bildesøk)

Så søkte jeg etter et bilde jeg har på flickr: av en porsbusk. Her ble resultatet (litt overraskende) at nøyaktig dette bildet finnes på et for meg ukjent nettsted. Noen har kopiert det fra min flickr-konto. De har ikke gjort noe galt, da jeg har lagt ut bildet med en passende CC-lisens. I dette tilfellet var forslagene til Visually similar images alle fra planteriket, men det var ingen riktige plantearter.

Etter en del mer testing både med egne og andres bilder konkluderer jeg med at søk vha bilder i stedet for ord gir gode resultater når det gjelder å finne identiske bilder (f.eks. sjekke hvor et bilde kommer fra, eller om det er noen som har stjålet et bilde) – mens denne metoden er nokså ubrukbar når det gjelder å finne bilder som ligner. Den er f.eks. ubrukbar til å identifisere ukjente planter. Ansiktsgjenkjenning mangler visst også.

Ennå er dette mer kuriøst enn nyttig. Men det er lett å se for seg hvordan det kan bli når matchingsalgoritmene blir mer avanserte. Kanskje får vi også muligheten til å tegne søkebegrepet i stedet for å laste opp ferdige bilder – slik som i eksperimentelle retrievr.

God helg!

PDA: Brukerinitiert akkvisisjon

Det var Eric Hellman som sporet meg inn på temaet akkvisisjon i blogginnlegget A Corollary to Raganathan’s Third Law :

«Publishers are aware that many of the books they sell to libraries are seldom used.[…] They worry that they’ll no longer be able to sell 10 copies of a seldom-used book to 10 libraries, because 1 electronic copy will meet the demand from 10 libraries in a consortium. They feel that they deserve the benefit of inefficient library purchasing decisions. «

Derfra gikk turen via forskjellige omveier (i bloggen Go to Hellman) til begrepet Patron Driven Acquisition. For å forklare dette enkelt, så dreier denne metoden seg om å overlate utvalgsprosessen til brukerne, ved å la dem foreta anskaffelse av ei bok uten å spørre biblioteket. «Etter bruk» kan så biblioteket koples inn i avgjørelsesprossen, og boka kan f.eks. overtas av biblioteket med sikte på bruk av andre. Eller den kan rett og slett «returneres». Det finnes mange finurlige forretningsmodeller som nå er under utprøving av leverandørene. Det er sikkert noen i bibliotekene som rynker kraftig på nesen over dette. Men faktum er at (1) veldig mange av bøkene i samlingene våre ikke blir brukt og (2) vi har ikke nok penger til å kjøpe inn «på forhånd» alt som brukerne våre etterspør. Og det er vel ikke en gang sikkert det er ønskelig at vi hadde hatt så mye penger?

Forkortelsen PDA brukes mye, og vi hører også varianter som Patron Driven Access – eller Patron Initiated Purchase of E-Books – eller Demand-Driven Acquisition. Og konteksten er som regel e-bøker, sjøl om det er flere andre dokumenttyper hvor metoden kan aktualiseres. Den minner jo f.eks. om stykkpriskjøp (Pay-per-view) av e-artikler. Vi kan se disse metodene som uttrykk for en just-in-time-tenkning i stedet for just-in-case. Og det er vel ikke så mye feil å si at vi er inne på noe som er en direkte motsetning til de pakkeløsningene (big deals) som leverandørene har så stor suksess med – og som vi kanskje kunne kalle Publisher Driven Acquisition 😉

(Hva heter forresten PDA på norsk? Brukerinitiert akkvisisjon?)

Jeg har nevnt Hellman. Han har bl.a. skrevet dette innlegget: Patron Driven eBook Acquisition: Crab Legs vs. Spinach

Rick Anderson, University of Utah har også skrevet om PDA, blant annet What Patron-Driven Acquisition (PDA) Does and Doesn’t Mean: An FAQ

Et iniativ fra CERN

Sjøl om mye av oppmerksomheten om PDA er fra de siste par årene, er det grunn til å nevne artikkelen

E-books and interlibrary loan. An academic centric model for lending av Jens Vigen, CERN og Kari Paulson, eBooks Corporation

Til å være skrevet for 8 år siden er dette nokså forutseende. Et lite sitat:

«CERN Library is participating in a project with eBooks Corporation to develop an eBook Library (EBL), a lending platform intended for release in 2004.

Developments in recent years have made many librarians feel a loss of control as journal publishers reconfigured the supply model to their extreme advantage. With the introduction of electronic journals, journal publishers enforced their concept of packaging bundled products. Acquisitions librarians are left with a minimum of choice and perceive more and more often their
role simply as ‘paying librarians’.

Cataloguing Resources Not Currently Owned

With the introduction of electronic books in libraries, someone will still have to pay the bill. However, the philosophy of selling collections, or bundled subject packages, could be developed into something far more dynamic, actually resulting in a local user driven acquisition policy, carefully guided by librarians.

So far, most library catalogues only include the description of documents that belong to a certain collection or a set of collections. This is probably due to the widespread concept of seeing a library catalogue more as a logistics tool than a portal to information in general.»

Leverandørene

Det er flere leverandører på banen med PDA-inspirerte forretningsmodeller for salg til bibliotekene, se f.eks.

ebrary Title Preview: Patron Driven Acquisition

NetLibrary On Demand

EBL (EbookLibrary)

EBL kan oppfattes som et direkte resultat av initiativet fra CERN. Vi kan som et eksempel nevne deres tilgangsmodell Non-Linear Lending:

«Multiple concurrent access Non-Linear LendingTM is a system which surpasses the traditional print model of limiting access to one patron at a time. Non-Linear LendingTM limits the total number of lending days per year per title but enables multiple-concurrent access.»

Hva skjer hos oss?

Rune Brandshaug er leder av Seksjon for fellestjenester ved UB.  Han sier:

«Biblioteket søker nå om prosjektmidler til å utprøve slike forretnings- og tilgangsmodeller. Vi er nå i sluttfasen i valg av leverandør for trykte bøker. Mange av tilbyderne har beskrevet nye løsninger for tilgang til e-bøker. De tilbyr også avanserte systemer for overvåking og utvelgelse av trykte bøker. Uansett om vi får prosjektmidler eller ikke, disse mulighetene må prøves ut. I den nye seksjonen for fellestjenester vil dette bli en viktig oppgave.»

Rune har også tall for hvor mye bibliotekets boksamlinger brukes:

kake

«Dette er tall over bruk (dvs utlån) av trykte bøker (monografier) innen 4 år (2007 – 2010) etter at de er kjøpt. Det er over en tredjedel (35 %)  som ikke er brukt i det hele tatt, og noe mindre (28 %) som er brukt mer enn to ganger. Vi kan ikke satse på at bokbudsjettet vårt i stor grad går med til å anskaffe materiale som ikke brukes. PDA er en alternativ måte å skaffe dokumenter på, som vi må utforske»,

sier Rune.

Hvordan er din nettboble?

«Lut lei prinsebryllup? Installer en prinsebryllupnyhetsfjerner for dagbla og vg.»

Dette er omtrent ordrett hva som ble tilbudt på nettsida Lut lei prinsebryllup? for litt over en måned siden. Den gang var jo fristelsen til å installere noe slikt ganske stor. Og det er ikke vanskelig å tenke seg andre varianter for filtrering. Personlig kunne jeg tenke meg Adresseavisen uten RBK og Dagbladet uten flåttalarm og Trønderbladet uten Marit Bjørgen og Dagens Næringsliv uten børs og …. Nei forresten, etter å ha tenkt meg nøye om: Egentlig vil jeg vel heller ha det slik det er. Sjølsagt foretar jeg allerede valg som filtrerer stoffet. Måten jeg gjør det på i dag er godt nok, jeg får med meg mye som interesserer meg, men også et lite vindu til den verdenen som ikke er så interessant. Den måten jeg gjør det er forskjellig fra måten du gjør det på, men begge to får vi med oss (i større eller mindre detalj) mye som er felles. Jeg tror ikke jeg vil ta i bruk mer detaljerte filtre for å skreddersy min horisont til å bli så snever at den er bare min.

(Som alltid: noen kanaler velger jeg å følge med på, andre ikke. Men noe har forandret seg,  f.eks. bruker jeg RSS i nokså stor utstrekning for å følge med i kilder jeg synes er viktige. Det gjelder ikke bare blogger o.l., men også epostlister, faste google-søk og andre kilder. Og forøvrig: i mye større grad enn før følger jeg med på hva andre anbefaler, f.eks. gjennom twitter).

I det hele tatt føler jeg at jeg stort sett har kontroll med min nettboble.  Bortsett fra:

  • når Facebook på egen hånd bestemmer at de godt kan filtrere bort nyheter fra en del av vennene mine
  • når Google på egen hånd bestemmer seg for å filtrere lenker fra søkeresultatene som de tror er av mindre interesse for meg

Denne økende grad av filtrering er sjølsagt i stor grad motivert av reklamehensyn. Når Facebook , Google og alle de andre ønsker å finstille våre personprofiler i langt større grad enn vi sjøl har bedt om, så er det fordi de lever av å selge reklame, og vet at den virker best når den er målrettet (targeted).

Spørsmålet er: Vet vi nok om hvordan dette virker? Vet vi nok om hvordan vi kan motvirke det? Sikkert ikke. Sjøl om Google, Facebook &co ikke akkurat lyver for oss, er de heller ikke særlig flinke til å fortelle hva de driver med.

En som interesserer seg for dette er Eli Pariser, som nettopp har utgitt boka The Filter Bubble: What The Internet Is Hiding From You .

Han har også holdt et TED-foredrag om samme emne: Eli Pariser: Beware online «filter bubbles»:

Og her er et intervju Ethan Zuckerman gjorde med Eli Pariser for nettstedet The BOSTON Phoenix 26. mai:

Eli Pariser talks about The Filter Bubble

Så: Hvordan er din boble? Har du god kontroll?

Ord for dagen: Informasjonsressurs

Dette ordet bruker jeg nokså ofte. Det er det også mange andre som gjør, og av og til viser det seg at vi ikke legger den samme betydningen i det. Dette er et litt uformelt forsøk på å kartlegge noen betydninger. Og ja, jeg har jaktet på en autoritativ definisjon uten å lykkes med det.

Én betydning

Først vil jeg slå et slag for den betydningen jeg sjøl har vent meg til:

(1) Informasjonsressurser er en fellesbetegnelse for alt det som biblioteket har å tilby av materiale  til sine brukere. En informasjonsressurs kan være en tidsskriftartikkel, ei bok, et bilde, et lydopptak, et kart, et oppslagsverk, ei nettside osv. Disse ressursene kan være digitale eller trykte eller finnes på andre medier.

Samlingene i biblioteket består av slike informasjonsressurser, men dette utgjør en stadig minkende andel av de totale informasjonsressursene vi tilbyr. Tjenester som biblioteket tilbyr (veiledning, referansetjenester, undervisning o.l.) oppfatter jeg ikke som informasjonsressurser. Et bibliotek kan typisk tilby sine brukere millionvis av informasjonsressurser.

Denne betydningen er nokså utbredt i bibliotekverdenen, og er vel den vedtatte betydningen her ved NTNU UB.

I Wikipedia brukes f.eks. denne betydningen i artikkelen om Nettside:

“En nettside, også kalt hjemmeside eller webside, er et dokument eller en informasjonsressurs som egner seg for World Wide Web, kan aksesseres gjennom en nettleser og vises på en dataskjerm”

Aalberg og Hegna bruker også denne betydningen i rapporten Arkitektur for digitale bibliotek – uten at de tar seg bryderiet med å foreta noen formell definisjon.

(Det er ikke så lett å finne synonymer, men jeg mener at “dokument” egentlig er noe av det nærmeste man kan komme. For noen år siden var jeg også vant til betegnelsen “informasjonsobjekt”, men dette har ikke egentlig slått gjennom.)

En annen betydning

Men i verden utenfor bibliotekene er det ikke uvanlig å se en annen oppfatning:

(2) Informasjonsressurser er samlinger, aggregater, tjenesteytere eller tjenester, som gjerne er oppbygd av enkeltressurser slik som i den første betydningen.

Wikipedia nevnes ofte som eksempel på en informasjonsresurs. Det er forsåvidt greit nok – også ifølge (1).  Biblioteket omtales også som en informasjonsressurs!

I Wikipedia brukes f.eks. denne betydningen i artikkelen om Universitetsbiblioteket i Agder:

“Universitetsbiblioteket i Agder (UBA) er en del av Universitetet i Agder, og er primært en informasjonsressurs for tilhørende studenter og forskere”

I NOU 1994: 17 Til informasjonens pris brukes også denne betydningen:

“Store, offentlige informasjonsressurser finner vi f.eks. i Statistisk sentralbyrå, Arbeidsmarkedsetaten, Trygdeetaten, Skatteetaten (det sentrale personregisteret), Vegdirektoratet (bilregisteret), Brønnøysundregistrene, Postverket, Televerket, Kartverket, Tinglysingsdata, Nasjonalbiblioteket, Patentstyret, Riksarkivet, Statsarkivene o.fl.”

Over til engelsk

Her er jeg kanskje på litt tynn is, men jeg har en følelse av at Information resource brukes på en litt annen måte enn hva den norske “oversettelsen” gjør. Begge betydningene (1) og (2) er i bruk – kanskje er (2) litt mer vanlig her enn på norsk. Jeg finner også bl.a. denne definisjonen i PC Magazine som innebærer enda en variant:

“(1) The data and information assets of an organization, department or unit. See data administration.
(2) Another name for the Information Systems (IS) or Information Technology (IT) department. See IT.”

Over til webben

Når vi befinner oss på webben – som litt forenklet sagt er den del av internettet vi kontakter vha en nettleser – så legges det gjerne helt spesielle betydninger i termene Resource og Information resource. Det er her snakk om klart definerte tekniske termer som ikke samsvarer helt med de betydningene vi har sett på når det gjelder Informasjonsressurs. Men jeg synes ikke det er noe problem at en term kan ha flere betydninger, og spesielt ikke at den i en klart avgrenset teknisk kontekst kan ha en betydning som er forskjellig fra (litt smalere enn)  i “dagligtale”.

[Resten av dette kapitlet er litt webteknisk, og du kan godt hoppe over det ;-)]

I starten av webbens historie, var Resource synonymt med det som var responsen på en HTTP request, altså det innholdet som ble returnert fra webserveren til nettleseren: ei nettside, ei fil, et dokument etc. Siden, og spesielt gjennom RDF og den semantiske webben, har begrepet Resource blitt utvidet til å kunne omfatte omtrent hva som helst, eller slik det omtales i Wikipedia-artikkelen om Resource (Web)

“every thing or entity that can be identified, named, addressed or handled, in any way whatsoever, in the Web at large, or in any networked information system.”

For å betegne det opprinnelige resource-begrepet har man så tatt i bruk termen Information resource, slik Tim Berners-Lee sjøl så enkelt sier det:

The AWWW decided to use the term “Information Resource” for a thing like a web page which contains information, and  “Resource” for any old thing at all.

Ordet Information resource brukes her på en måte som ikke står i motstrid til definisjonen (1), bare på en litt smalere måte.

Oppsummering

Jeg mener at det norske ordet Informasjonsressurs har en grei betydning i definisjon (1) og foreslår at vi samarbeider om å bruke den på bekostning av (2).

Og jeg antar at det på engelsk er greit å oversette dette til Information resource – i alle fall så lenge vi befinner oss i bibliotekskontekst.

Unntaket er når vi snakker i en teknisk web-kontekst. Da er det tryggest å bruke det engelske Information resource i den veldefinerte betydningen nevnt i forrige kapittel. Jeg er litt usikker på om det er vanlig å bruke norske Informasjonsressurs i denne konteksten.