Stikkordarkiv: Statistikk

Hvor finner vi ebøkene?

eller rettere sagt: hvor finner brukerne ebøkene?

Springer er en av UB’s viktigste leverandører av e-bøker. Vi vet at dette er bøker som blir brukt mye, og de er nokså lett tilgjengelige. Blant annet kan de lastes ned kapittelvis uten kopisperre, og leses på en hvilken som helst plattform som støtter pdf, uavhengig av om du er på nett eller ikke.

Vi har spurt Springer om hvordan brukerne våre kommer seg til ebøkene, og vi har fått nøyaktige data. I perioden oktober 2011 – april 2012 kom litt over halvparten fra Google og Google Scholar, mens 12 % kom fra UB’s katalog BIBSYS Ask:
Google                         24821 26,5%
Google Scholar                 23107 24,6%
BIBSYS Ask                     11303 12,0%
Andre                          34400 36,7%
SUM                            93631

chart

Det som er talt opp her er antall «downloads», som i leverandørterminologi betyr at en bruker har fått tak i boka og åpnet den i nettleseren.

Hvis vi ser lenger ned på lista ser vi at 8,3 % kommer via SFX. Vi må anta at også en del av disse kommer fra Google Scholar.

Det kan også være grunn til å legge merke til Mendeley og Facebook. Sjøl om de ikke har store prosenttall ennå, så er i alle fall de sosiale mediene på banen. Her kommer de 17 første kildene (til og med Wikipedia):
Google                          24821 26,5%
Google Scholar                  23107 24,6%
BIBSYS Ask                      11303 12,0%
Pubmed                           8756  9,3%
SFX                              7828  8,3%
Springer Link                    7509  8,0%
NTNUs websider                   1912  2,0%
CRISTIN                          1134  1,2%
Scopus                            710  0,7%
ScienceDirect                     483  0,5%
AMS                               417  0,4%
Mendeley                          402  0,4%
Psycnet                           359  0,3%
Facebook                          327  0,3%
http://www.informatik.uni-tuebingen.de   303  0,3%
Wikipedia                         250  0,2%
Andre                            4010  4,2%
SUM 93631

Om deling av SFX-kaka

Det er sikkert mange av våre brukere som ikke vet at de avhenger av SFX for å få tak i de dokumentene de finner fram til i en eller annen leteprosess. I det minste vet de ikke om navnet, noe som kanskje kan være likså greit. (Om disambiguering av SFX, se Wikipedia)

Metalib og SFX er to verktøy som vi kjøpte fra Ex Libris tidlig i dette tiåret for å tilby brukerne et enhetlig apparat for informasjonssøking. Vi er i dag enige om at Metalib som søkeportal betraktet har vært nokså mislykket – av forskjellige grunner som vi ikke skal bruke tid på nå. Men samtidig er vi av den mening at bruk av SFX har vært en suksess.

SFX virker på den måten at hvis du gir den en dokumentreferanse (i form av en OpenURL), så vil den gjøre sitt beste for å lokalisere dokumentet og gjøre det tilgjengelig for deg. Alt dette hokuspokus bør sjølsagt skje på en minst mulig påtrengende måte, fordi du er jo interessert i en ting: dokumentet levert på skjermen din med en gang.

Men SFX kan også brukes til å fortelle oss i biblioteket om hvordan våre brukere oppfører seg. Her er f.eks. en oversikt over hvilke søkekilder som ble brukt for å finne dokumentene før SFX fikk jobben med å skaffe dem:

Dataene er fra 1. kvartal i år. Kakestykkene viser bare det grove bildet, mens detaljene (dvs tallene og fordelingen innen restgruppen Andre)  finner du her: NTNU: SFX‐bruk 1. kvartal 2011 fordelt på søkekilder .

Dette bildet er vel ikke noe spesielt overraskende. Vi visste jo fra før at Metalib brukes svært lite (bare omtrent en fjerdedel av «konkurrenten» Google Scholar). Det er grunn til å legge merke at det kommer flere forespørsler fra anbefalingstjenesten bx fra ExLibris enn det gjør direkte fra Metalib.

Merk: Dette viser jo ikke hvor mye søking som har foregått i de forskjellige søkekildene – bare hvor mange ganger brukeren har funnet dokumenter som det har vært verdt å gå videre med. Det er sannsynligvis en nesten ugjennomførbar oppgave å få tak i totalbildet, spesielt fordi forskjellige søketjenester har en tendens til å bruke ikkesammenlignbare statistikkmekanismer.

Hvis du studerer detaljtallene, så ser du at vi har utelatt «interne» SFX-oppslag, dvs hvor det ikke har vært foretatt noe forutgående søking. Merk at det i det aktuelle tidsrommet var utført flere SFX-oppslag fra A-Z-lista (120.909) enn det totale antall oppslag fra søkekildene (93.533). Dette kan kanskje forklares ut fra den sentrale plassen A-Z-lista har på UB’s startside – eller er det også andre årsaker (les: feilkilder)?

Og hvilke andre felter søker man på i BIBSYS Ask?

For noen dager sida hadde vi et kakediagram som viste hvilke søkefelter som er mest brukt i BIBSYS Ask. Og dette var som ventet: I den grad man søker på noen felter i det hele tatt, så dreier det seg om forfatter, tittel og emne.

Det totale antall søk som er talt opp er 1195097, som altså er antall søk utført ved NTNU mot BIBSYS Bibliotekbase via BIBSYS Ask i 2010. For å repetere de mest brukte søkefeltene, idet vi slår sammen ord i tittel med tittel for enkelhets skyld, og minner om at Fritekst betyr at brukeren ikke har brukt noen feltangivelse:

top

Hva så med resten? Her kommer de feltene som er «nest mest brukt»:

top16

Vi må huske på at BIBSYS Ask brukes på mange måter, og ikke alltid via det brukergrensesnittet som vi kjenner som Ask, men vha spesiallagede grensesnitt. F.eks. utgjøres en betydelig del av søking på dewey av ferdiglagede lenker som skal produsere nyhetslister innen forskjellige fagområder. Jeg antar at det relativt store antallet søk på ISSN (sammenlignet med ISBN) skyldes noe tilsvarende ferdiglaget opplegg.

Vi ser også av tallene at for noen av søkefeltene er andelen av søk utført av bibliotekansatte større enn for andre. Tallmaterialet er ikke sikkert nok på dette punktet, men det er f.eks. klart at minst 746 av 1835 søk på UDK er utført av ansatte ved UBiT. Antallet er i virkeligheten større, men vi har ikke detaljert nok skille mellom ansatte og brukere til å finne den nøyaktige andelen intern bruk.

Enda lenger ned på lista finner vi de som er brukt mindre enn en gang om dagen i gjennomsnitt. Der finner vi f.eks. alle de kontrollerte emneordsystemene, som f.eks. humord (294), tekord (260) og mesh (132). Det er f.eks. interessant at vårt eget system TEKORD brukes så lite. Her er også all bruk fra ansatte regnet med!

PS: Hvordan har jeg laget de fine stolpediagrammene? Jo, vha Google chart API.