Stikkordarkiv: James Gleick

Ord for dagen: Redundans

Før trodde jeg at redundans var et stygt ord. Men nå er jeg i ferd med å snu.

Wikipedia sier:

Redundans kalles informasjon som gjentar allerede etablert kunnskap uten å tilføre noe nytt. Redundant informasjon kan derfor også kalles overskuddsinformasjon. Slik informasjon kan ofte være med å tydeliggjøre en mening, men kan også sees på som noe som tar unødvendig plass og som bør fjernes.

Jeg har vel som et resultat av mitt yrke blitt opphengt i at redundans er en uting som må bekjempes, gjennom å tilstrebe normaliserte datamodeller og gjenbruk (referering) av data til det ytterste. Ikke fordi redundans tar ekstra lagringsplass (for det gjør det jo), men fordi det koster arbeid å vedlikeholde ekstra kopier av data som allerede finnes – og fordi det skaper muligheter for inkonsistens. Det er sjølsagt internettet som har gitt denne tenkinga et ekstra puff, fordi det nå i mange tilfeller er mulig å bruke andres data (fjernbruk).

Det er James Gleick (The Information) som har fått meg til å innse at jeg har vært svært urettferdig, ved at jeg ikke har vært klar over (eller ikke har forstått) de positive egenskapene ved redundans. Gleick nevner bl.a. tre forskjellige eksempler:

  • Redundans er et viktig virkemiddel når det gjelder å formidle informasjon, og brukes svært bevisst på et grunnleggende nivå i vår kommunikasjonsteknologi for å sikre feilfri (støyfri) dataoverføring
  • Det er redundansen som fikk afrikanernes trommespråk til å funke. Sjøl om språket egentlig ikke er entydig nok, så pøste de på med nok «unødvendige» ord slik at meningen kom fram
  • Det er redundansen som gjør at det trykte ordet er så stabilt og uforfalskelig som det er, nemlig at det trykkes og spres i mange identiske kopier. Du kan ikke miste dem alle eller ødelegge dem alle.

I en «ideell» verden uten redundans skjønner du alt eller ingenting, høyst sannsynligvis ingenting. I den virkelige verden skjønner du som oftest det meste godt nok.

Jeg ser for meg flere interessante aspekter ved redundansbegrepet når vi beveger oss inn på den semantiske webben, spesielt i forbindelse med linked data. På den ene sida er linked data en oppfordring til å normalisere data gjennom å lage datamodeller som utnytter (refererer) eksisterende data i stedet for å gjenta dem. Men på den andre sida innbyr linked data til nettopp redundans ved å tillate å bruke egenskaper som i det minste ligner på hverandre, og ikke minst ved en mangel på overordnet og sentralisert styring. Det siste kan sikkert betraktes som en svakhet, men jeg tror at det er denne mangelen på stivbeint global kontroll som kanskje er den største styrken til linked data. Slik at også her blir redundansen (rett brukt) snudd fra minus til pluss.

Synes du dette høres spekulativt ut?

Advertisements

Det er informasjon alt handler om

Det er bare å innrømme det: Etter et yrkesliv der jeg omtrent hver eneste dag har hatt informasjon som arbeidsområde, så har jeg ennå ikke fattet dette begrepet til bunns. Det har dreid seg om informasjonsformidling eller informasjonssøking eller informasjonsteknologi eller lignende. Fordi jeg er realist så kjenner jeg til informasjonsteori (Shannon). Men det har liksom ikke vært nødvendig å bry seg så mye om dette i det daglige. Om jeg har håndtert informasjon som en vare (i biblioteket) eller en teknologi (i BIBSYS) så har informasjonsteorien aldri vært et tema. Pussig nok.

Jeg har aldri før slått opp på «Informasjon» i norsk Wikipedia. Gjør det nå, og blir ikke noe klokere. Tvert imot står det at «Denne artikkelens faglige presisjon er omstridt, eller den kan inneholde faktafeil». Hvorfor det montro? Det tyder vel på at forfatterne ikke har blitt enige, fordi begrepet brukes med forskjellige betydninger.

Men nå vil jeg til bunns i dette. Ved hjelp av boka The Information av James Gleick, som jeg har nevnt i forbifarten i et tidligere innlegg her. Den kjøpte jeg med store forventninger, og er så langt helt oppslukt. Akkurat nå har jeg kommet til at Charles Babbage møter Ada Lovelace. (Nei, dette er ikke noen kjærlighetsroman :-)) Og jeg ser fram til å møte Kurt Gödel, Alan Turing og Claude Shannon med flere.

Sjøl om jeg bare har lest 14% av boka, så tar jeg herved sjansen på å anbefale den som innhold i påskeryggsekken. Du får den som tidligere nevnt billig fra amazon.com. (Også i papirutgave). Det er nok en forutsetning at du er litt interessert i realfag.

Det er tegn som tyder på at informasjonsteorien er i vinden, f.eks. som en modell for å forklare hvordan vår verden er skrudd sammen og hvorfor den virker som den gjør, blant annet gjennom en samkjøring med kvantefysikken. Nå når bibliotekene er kastet inn i den digitale verden, så har jeg en ide om at også vi bør orientere oss i informasjonens verden med nye øyne. Kanskje kan denne boka være et bidrag til det. Jeg mener, jeg leser den også som ei fagbok med forventet relevans til yrket mitt 😉

God påsketur! Pass deg for osonlaget, og husk at Nivea duger ikke lenger.