Ord for dagen: Redundans

Før trodde jeg at redundans var et stygt ord. Men nå er jeg i ferd med å snu.

Wikipedia sier:

Redundans kalles informasjon som gjentar allerede etablert kunnskap uten å tilføre noe nytt. Redundant informasjon kan derfor også kalles overskuddsinformasjon. Slik informasjon kan ofte være med å tydeliggjøre en mening, men kan også sees på som noe som tar unødvendig plass og som bør fjernes.

Jeg har vel som et resultat av mitt yrke blitt opphengt i at redundans er en uting som må bekjempes, gjennom å tilstrebe normaliserte datamodeller og gjenbruk (referering) av data til det ytterste. Ikke fordi redundans tar ekstra lagringsplass (for det gjør det jo), men fordi det koster arbeid å vedlikeholde ekstra kopier av data som allerede finnes – og fordi det skaper muligheter for inkonsistens. Det er sjølsagt internettet som har gitt denne tenkinga et ekstra puff, fordi det nå i mange tilfeller er mulig å bruke andres data (fjernbruk).

Det er James Gleick (The Information) som har fått meg til å innse at jeg har vært svært urettferdig, ved at jeg ikke har vært klar over (eller ikke har forstått) de positive egenskapene ved redundans. Gleick nevner bl.a. tre forskjellige eksempler:

  • Redundans er et viktig virkemiddel når det gjelder å formidle informasjon, og brukes svært bevisst på et grunnleggende nivå i vår kommunikasjonsteknologi for å sikre feilfri (støyfri) dataoverføring
  • Det er redundansen som fikk afrikanernes trommespråk til å funke. Sjøl om språket egentlig ikke er entydig nok, så pøste de på med nok «unødvendige» ord slik at meningen kom fram
  • Det er redundansen som gjør at det trykte ordet er så stabilt og uforfalskelig som det er, nemlig at det trykkes og spres i mange identiske kopier. Du kan ikke miste dem alle eller ødelegge dem alle.

I en «ideell» verden uten redundans skjønner du alt eller ingenting, høyst sannsynligvis ingenting. I den virkelige verden skjønner du som oftest det meste godt nok.

Jeg ser for meg flere interessante aspekter ved redundansbegrepet når vi beveger oss inn på den semantiske webben, spesielt i forbindelse med linked data. På den ene sida er linked data en oppfordring til å normalisere data gjennom å lage datamodeller som utnytter (refererer) eksisterende data i stedet for å gjenta dem. Men på den andre sida innbyr linked data til nettopp redundans ved å tillate å bruke egenskaper som i det minste ligner på hverandre, og ikke minst ved en mangel på overordnet og sentralisert styring. Det siste kan sikkert betraktes som en svakhet, men jeg tror at det er denne mangelen på stivbeint global kontroll som kanskje er den største styrken til linked data. Slik at også her blir redundansen (rett brukt) snudd fra minus til pluss.

Synes du dette høres spekulativt ut?

Legg igjen en kommentar

Fyll inn i feltene under, eller klikk på et ikon for å logge inn:

WordPress.com-logo

Du kommenterer med bruk av din WordPress.com konto. Logg ut / Endre )

Twitter picture

Du kommenterer med bruk av din Twitter konto. Logg ut / Endre )

Facebookbilde

Du kommenterer med bruk av din Facebook konto. Logg ut / Endre )

Google+ photo

Du kommenterer med bruk av din Google+ konto. Logg ut / Endre )

Kobler til %s