Digitalt bibliotek - Digital library

Et digitalt bibliotek , også kalt et nettbibliotek , et internettbibliotek , et digitalt arkiv eller en digital samling er en online database med digitale objekter som kan inkludere tekst, stillbilder, lyd, video, digitale dokumenter eller andre digitale medieformater eller et bibliotek tilgjengelig via internett . Objekter kan bestå av digitalisert innhold som trykk eller fotografier , samt opprinnelig produsert digitalt innhold som tekstbehandlingsfiler eller innlegg på sosiale medier . I tillegg til å lagre innhold, tilbyr digitale biblioteker midler for å organisere, søke og hente innholdet i samlingen.

Digitale biblioteker kan variere enormt i størrelse og omfang, og kan vedlikeholdes av enkeltpersoner eller organisasjoner. Det digitale innholdet kan lagres lokalt eller fjernadgang via datanettverk. Disse systemene for informasjonsinnhenting er i stand til å utveksle informasjon med hverandre gjennom interoperabilitet og bærekraft .

Historie

Den tidlige historien til digitale biblioteker er ikke godt dokumentert, men flere sentrale tenkere er knyttet til fremveksten av konseptet. Forgjengere inkluderer Paul Otlet og Henri La Fontaine 's Mundaneum , et forsøk påbegynt i 1895 for å samle og systematisk katalog verdens kunnskap, med håp om å få til fred i verden. Visjonene til det digitale biblioteket ble stort sett realisert et århundre senere under den store utvidelsen av Internett, med tilgang til bøkene og søk i dokumentene av millioner av individer på World Wide Web.

Vannevar Bush og JCR Licklider er to bidragsytere som avanserte denne ideen til den nåværende teknologien. Bush hadde støttet forskning som førte til bomben som ble kastet på Hiroshima . Etter å ha sett katastrofen, ønsket han å lage en maskin som skulle vise hvordan teknologi kan føre til forståelse i stedet for ødeleggelse. Denne maskinen vil inneholde et skrivebord med to skjermer, brytere og knapper og et tastatur. Han kalte dette " Memex ". På denne måten kunne enkeltpersoner få tilgang til lagrede bøker og filer med rask hastighet. I 1956 finansierte Ford Foundation Licklider for å analysere hvordan biblioteker kan forbedres med teknologi. Nesten et tiår senere inkluderte boken hans med tittelen " Fremtidens biblioteker " visjonen hans. Han ønsket å lage et system som ville bruke datamaskiner og nettverk, slik at menneskelig kunnskap ville være tilgjengelig for menneskelige behov og tilbakemeldinger ville være automatiske for maskinformål. Dette systemet inneholdt tre komponenter, kunnskapens korpus, spørsmålet og svaret. Licklider kalte det et prokognitivt system.

Tidlige prosjekter fokuserte på opprettelsen av en elektronisk kortkatalog kjent som Online Public Access Catalog (OPAC). På 1980 -tallet resulterte suksessen med disse forsøkene i at OPAC erstattet den tradisjonelle kortkatalogen i mange akademiske, offentlige og spesialbiblioteker. Dette tillot biblioteker å gjennomføre ytterligere givende samarbeidsinnsats for å støtte ressursdeling og utvide tilgangen til bibliotekmateriale utover et enkelt bibliotek.

Et tidlig eksempel på et digitalt bibliotek er Education Resources Information Center (ERIC), en database med utdanningssiteringer, sammendrag og tekster som ble opprettet i 1964 og gjort tilgjengelig online via DIALOG i 1969.

I 1994 ble digitale biblioteker allment synlige i forskningsmiljøet på grunn av et NSF -administrert program på 24,4 millioner dollar som støttes i fellesskap av DARPAs Intelligent Integration of Information (I3) -program, NASA og NSF selv. Vellykkede forskningsforslag kom fra seks amerikanske universiteter. Universitetene inkluderte Carnegie Mellon University , University of California-Berkeley , University of Michigan , University of Illinois , University of California-Santa Barbara og Stanford University . Artikler fra prosjektene oppsummerte fremdriften på halvveis i mai 1996. Stanford -forskning, av Sergey Brin og Larry Page , førte til grunnleggelsen av Google .

Tidlige forsøk på å lage en modell for digitale biblioteker inkluderte DELOS Digital Library Reference Model og 5S Framework.

Terminologi

Begrepet digitalt bibliotek ble først populært av NSF / DARPA / NASA Digital Libraries Initiative i 1994. Med tilgjengeligheten av datanettverk forventes det at informasjonsressursene forblir distribuert og tilgjengelig etter behov, mens i Vannevar Bushs essay As We May Tenk (1945) at de skulle samles og oppbevares innenfor forskerens Memex .

Begrepet virtuelt bibliotek ble opprinnelig brukt om hverandre med digitalt bibliotek, men brukes nå først og fremst om biblioteker som er virtuelle i andre sanser (for eksempel biblioteker som samler distribuert innhold). I de tidlige dagene med digitale biblioteker var det diskusjon om likhetene og forskjellene mellom begrepene digital , virtuell og elektronisk .

Det skilles ofte mellom innhold som ble opprettet i et digitalt format, kjent som born-digital , og informasjon som er konvertert fra et fysisk medium, f.eks. Papir, gjennom digitalisering . Ikke alt elektronisk innhold er i digitalt dataformat. Begrepet hybridbibliotek brukes noen ganger om biblioteker som har både fysiske samlinger og elektroniske samlinger. For eksempel er American Memory et digitalt bibliotek i Library of Congress .

Noen viktige digitale biblioteker fungerer også som langsiktige arkiver, for eksempel arXiv og Internett -arkivet . Andre, for eksempel Digital Public Library of America , søker å gjøre digital informasjon fra forskjellige institusjoner lett tilgjengelig på nettet.

Typer digitale biblioteker

Institusjonelle depoter

Mange akademiske biblioteker er aktivt involvert i å bygge oppbevaringssteder for institusjonens bøker, artikler, avhandlinger og andre verk som kan digitaliseres eller er "født digitale". Mange av disse depotene blir gjort tilgjengelige for allmennheten med få begrensninger, i samsvar med målene om åpen tilgang , i motsetning til publisering av forskning i kommersielle tidsskrifter, hvor utgiverne ofte begrenser tilgangsrettigheter. Institusjonelle, virkelig gratis og selskapslager blir noen ganger referert til som digitale biblioteker. Institusjonell programvare for depot er designet for å arkivere, organisere og søke i et biblioteks innhold. Populære open source -løsninger inkluderer DSpace , EPrints , Digital Commons og Fedora Commons -baserte systemer Islandora og Samvera .

Nasjonale biblioteksamlinger

Juridisk innskudd er ofte dekket av opphavsrettslovgivning og noen ganger av lover som er spesifikke for lovlig innskudd, og krever at en eller flere kopier av alt materiale som er publisert i et land, skal sendes for bevaring i en institusjon, vanligvis nasjonalbiblioteket . Siden ankomsten av elektroniske dokumenter har lovgivningen må endres for å dekke de nye formatene, for eksempel 2016 -endringen av Copyright Act 1968 i Australia.

Siden har det blitt bygget forskjellige typer elektroniske depot. The British Library 's Publisher Submission Portal og den tyske modellen ved Deutsche Nationalbibliothek har en innskuddspunkt for et nettverk av biblioteker, men offentlig tilgang er bare tilgjengelig i lesesaler i bibliotekene. Australian National edeposit -systemet har de samme funksjonene, men gir også mulighet for ekstern tilgang for det meste av innholdet.

Digitale arkiver

Fysiske arkiver skiller seg fra fysiske biblioteker på flere måter. Tradisjonelt er arkiver definert som:

  1. Inneholder primære informasjonskilder (vanligvis brev og papirer direkte produsert av en person eller organisasjon) i stedet for de sekundære kildene som finnes i et bibliotek (bøker, tidsskrifter, etc.).
  2. Å ha innholdet organisert i grupper i stedet for individuelle elementer.
  3. Har unikt innhold.

Teknologien som brukes til å lage digitale biblioteker er enda mer revolusjonerende for arkiver siden den bryter ned den andre og tredje av disse generelle reglene. Med andre ord vil "digitale arkiver" eller "nettarkiver" fremdeles generelt inneholde hovedkilder, men de vil sannsynligvis bli beskrevet individuelt i stedet for (eller i tillegg til) i grupper eller samlinger. Fordi de er digitale, er innholdet lett reproduserbart og kan faktisk ha blitt gjengitt andre steder. The Oxford Text Archive er generelt ansett for å være den eldste digitale arkiv over akademiske fysiske primære kildemateriale.

Arkiver skiller seg fra biblioteker med hensyn til materialet som er inneholdt. Biblioteker samler individuelle utgitte bøker og serier, eller begrensede sett med individuelle gjenstander. Bøkene og tidsskriftene som finnes på biblioteker er ikke unike, siden det finnes flere eksemplarer og en gitt kopi generelt vil vise seg å være like tilfredsstillende som alle andre eksemplarer. Materialet i arkiver og manuskriptbiblioteker er "de unike opptegnelsene over bedriftsorganer og avisene til enkeltpersoner og familier".

Et grunnleggende kjennetegn ved arkiver er at de må beholde konteksten deres poster er opprettet i og nettverket av relasjoner mellom dem for å bevare sitt informative innhold og gi forståelig og nyttig informasjon over tid. Den grunnleggende trekk ved arkiver ligger i deres hierarkiske organisasjon som uttrykker sammenhengen ved hjelp av arkiv bindingen .

Arkivbeskrivelser er de grunnleggende virkemidlene for å beskrive, forstå, hente og få tilgang til arkivmateriale. På digitalt nivå blir arkivbeskrivelser vanligvis kodet ved hjelp av XML -formatet Encoded Archival Description . EAD er en standardisert elektronisk representasjon av arkivbeskrivelse som gjør det mulig å gi fagforeningen tilgang til detaljerte arkivbeskrivelser og ressurser i depoter distribuert over hele verden.

Gitt viktigheten av arkiver, er det definert en dedikert formell modell, kalt NEsted SeTs for Object Hierarchies (NESTOR), bygget rundt deres særegne bestanddeler. NESTOR er basert på ideen om å uttrykke de hierarkiske forholdene mellom objekter gjennom inkluderingsegenskapen mellom sett, i motsetning til det binære forholdet mellom noder som utnyttes av treet. NESTOR har blitt brukt til å formelt utvide 5S -modellen til å definere et digitalt arkiv som et spesifikt tilfelle av digitalt bibliotek som kan ta hensyn til de særegne egenskapene til arkiver.

Funksjoner i digitale biblioteker

Fordelene med digitale biblioteker som et middel for lett og raskt tilgang til bøker, arkiver og bilder av forskjellige typer er nå allment anerkjent av kommersielle interesser og offentlige organer.

Tradisjonelle biblioteker er begrenset av lagringsplass; digitale biblioteker har potensial til å lagre mye mer informasjon, rett og slett fordi digital informasjon krever svært lite fysisk plass for å inneholde den. Som sådan kan kostnaden for å vedlikeholde et digitalt bibliotek være mye lavere enn for et tradisjonelt bibliotek. Et fysisk bibliotek må bruke store summer på å betale for personale, bokvedlikehold, husleie og flere bøker. Digitale biblioteker kan redusere eller i noen tilfeller gjøre opp med disse gebyrene. Begge typer bibliotek krever katalogiseringsinngang for at brukerne skal kunne finne og hente materiale. Digitale biblioteker kan være mer villige til å ta i bruk innovasjoner innen teknologi som gir brukerne forbedringer innen elektronisk og lydbokteknologi, i tillegg til å presentere nye kommunikasjonsformer som wikier og blogger; konvensjonelle biblioteker kan vurdere at det er tilstrekkelig å tilby online tilgang til OP AC -katalogen. En viktig fordel for digital konvertering er økt tilgjengelighet for brukerne. De øker også tilgjengeligheten for personer som kanskje ikke er tradisjonelle lånere på et bibliotek, på grunn av geografisk beliggenhet eller organisatorisk tilknytning.

  • Ingen fysisk grense: Brukeren av et digitalt bibliotek trenger ikke å gå til biblioteket fysisk; mennesker fra hele verden kan få tilgang til den samme informasjonen, så lenge en Internett -tilkobling er tilgjengelig.
  • Døgnet rundt tilgjengelighet: En stor fordel med digitale biblioteker er at folk kan få tilgang til informasjonen døgnet rundt.
  • Flere tilgang: De samme ressursene kan brukes samtidig av en rekke institusjoner og lånetakere. Dette er kanskje ikke tilfelle for opphavsrettsbeskyttet materiale: et bibliotek kan ha lisens for å "låne ut" bare én kopi om gangen; dette oppnås med et system for digital rettighetsforvaltning der en ressurs kan bli utilgjengelig etter utlånsperioden eller etter at utlåner velger å gjøre den utilgjengelig (tilsvarer å returnere ressursen).
  • Informasjonsinnhenting: Brukeren kan bruke et hvilket som helst søkeord (ord, frase, tittel, navn, emne) for å søke i hele samlingen. Digitale biblioteker kan tilby svært brukervennlige grensesnitt, og gir klikkbar tilgang til ressursene.
  • Bevaring og bevaring: Digitalisering er ikke en langsiktig konserveringsløsning for fysiske samlinger, men lykkes med å gi tilgangskopier for materialer som ellers ville forringes fra gjentatt bruk. Digitaliserte samlinger og født-digitale gjenstander gir mange bevarings- og bevaringsproblemer som analoge materialer ikke gjør. Se den følgende delen "Problemer" på denne siden for eksempler.
  • Plass: Mens tradisjonelle biblioteker er begrenset av lagringsplass, har digitale biblioteker potensial til å lagre mye mer informasjon, rett og slett fordi digital informasjon krever svært lite fysisk plass for å inneholde dem og medielagringsteknologier er rimeligere enn noen gang før.
  • Merverdi: Visse egenskaper til objekter, først og fremst kvaliteten på bildene, kan forbedres. Digitalisering kan forbedre lesbarheten og fjerne synlige feil som flekker og misfarging.

Programvare

Det finnes en rekke programvarepakker for bruk i generelle digitale biblioteker (for bemerkelsesverdige, se kategori: Programvare for digitalt bibliotek ). Institusjonell programvare for depot, som hovedsakelig fokuserer på inntak, bevaring og tilgang til lokalt produserte dokumenter, spesielt lokalt produserte akademiske utdata, finnes i programvare for institusjonelle arkiver . Denne programvaren kan være proprietær, slik det er med Library of Congress som bruker Digiboard og CTS til å administrere digitalt innhold.

Designet og implementeringen i digitale biblioteker er konstruert slik at datasystemer og programvare kan bruke informasjonen når den utveksles. Disse omtales som semantiske digitale biblioteker. Semantiske biblioteker brukes også til å sosialisere med forskjellige samfunn fra en masse sosiale nettverk. DjDL er en type semantisk digitalt bibliotek. Søkeordbaserte og semantiske søk er de to hovedtypene søk. Et verktøy er gitt i det semantiske søket som oppretter en gruppe for forstørrelse og forfining for søkeordbaserte søk. Konseptuell kunnskap som brukes i DjDL er sentrert rundt to former; faget ontologi og sett konseptsøkemønstre basert på ontologi. De tre typer ontologier som er knyttet til dette søket er bibliografiske ontologier , samfunnsbevisste ontologier og fagontologier.

Metadata

I tradisjonelle biblioteker er muligheten til å finne interessante verk direkte knyttet til hvor godt de ble katalogisert. Selv om katalogisering av elektroniske verk digitalisert fra et biblioteks eksisterende beholdning kan være like enkelt som å kopiere eller flytte en post fra trykket til det elektroniske skjemaet, krever komplekse og fødd-digitale arbeider betydelig mer innsats. For å håndtere det økende volumet av elektroniske publikasjoner må nye verktøy og teknologier utformes for å tillate effektiv automatisert semantisk klassifisering og søk. Selv om fulltekstsøk kan brukes for noen elementer, er det mange vanlige katalogsøk som ikke kan utføres ved hjelp av fulltekst, inkludert:

  • finne tekster som er oversettelser av andre tekster
  • skille mellom utgaver/bind av en tekst/tidsskrift
  • inkonsekvente deskriptorer (spesielt emneoverskrifter)
  • mangler, mangelfull eller dårlig kvalitet taksonomi praksis
  • å knytte tekster publisert under pseudonymer til de virkelige forfatterne ( Samuel Clemens og Mark Twain , for eksempel)
  • skille sakprosa fra parodi ( The Onion from The New York Times )

Søker

De fleste digitale biblioteker har et søkegrensesnitt som gjør det mulig å finne ressurser. Disse ressursene er vanligvis dypnettet (eller usynlige web) ressurser, siden de ofte ikke kan lokaliseres ved søkemotor crawlere . Noen digitale biblioteker oppretter spesielle sider eller nettstedskart slik at søkemotorer kan finne alle ressursene sine. Digitale biblioteker bruker ofte Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH) for å avsløre metadataene sine for andre digitale biblioteker og søkemotorer som Google Scholar , Yahoo! og Scirus kan også bruke OAI-PMH til å finne disse dype webressursene.

Det er to generelle strategier for å søke i en sammenslutning av digitale biblioteker: distribuert søk og søk på tidligere innhøstede metadata .

Distribuert søk innebærer vanligvis at en klient sender flere søkeforespørsler parallelt til et antall servere i føderasjonen. Resultatene samles, duplikater elimineres eller grupperes, og de resterende elementene sorteres og presenteres tilbake til klienten. Protokoller som Z39.50 brukes ofte i distribuert søk. En fordel med denne tilnærmingen er at de ressurskrevende oppgavene med indeksering og lagring overlates til de respektive serverne i føderasjonen. En ulempe med denne tilnærmingen er at søkemekanismen er begrenset av de forskjellige indekserings- og rangeringsfunksjonene til hver database; Derfor blir det vanskelig å sette sammen et kombinert resultat bestående av de mest relevante gjenstandene.

Søke over tidligere innhøstede metadata innebærer å søke i en lokalt lagret indeks for informasjon som tidligere er samlet fra bibliotekene i forbundet. Når et søk utføres, trenger ikke søkemekanismen å opprette forbindelser med de digitale bibliotekene det søker - den har allerede en lokal representasjon av informasjonen. Denne tilnærmingen krever at det opprettes en indekserings- og høstingsmekanisme som fungerer regelmessig, kobler seg til alle de digitale bibliotekene og spør hele samlingen for å oppdage nye og oppdaterte ressurser. OAI-PMH brukes ofte av digitale biblioteker for å tillate metadata å bli høstet. En fordel med denne tilnærmingen er at søkemekanismen har full kontroll over indeksering og rangering av algoritmer, muligens for å gi mer konsistente resultater. En ulempe er at høstings- og indekseringssystemer er mer ressurskrevende og derfor dyre.

Digital bevaring

Digital bevaring tar sikte på å sikre at digitale medier og informasjonssystemer fortsatt kan tolkes inn i en ubestemt fremtid. Hver nødvendig komponent i dette må migreres, bevares eller emuleres . Vanligvis emuleres lavere systemnivåer ( diskett for eksempel), bitstrømmer (de faktiske filene som er lagret på diskene) bevares og operativsystemene emuleres som en virtuell maskin . Bare der betydningen og innholdet i digitale medier og informasjonssystemer er godt forstått, er migrering mulig, slik tilfellet er for kontordokumenter. Imidlertid har minst en organisasjon, Wider Net Project , opprettet et offline digitalt bibliotek, eGranary , ved å reprodusere materialer på en 6 TB harddisk . I stedet for et bit-stream-miljø inneholder det digitale biblioteket en innebygd proxy-server og søkemotor, slik at det digitale materialet kan nås ved hjelp av en nettleser . Materialene er heller ikke bevart for fremtiden. EGranary er beregnet for bruk på steder eller situasjoner der Internett-tilkobling er veldig treg, ikke-eksisterende, upålitelig, upassende eller for dyr.

I løpet av de siste årene har prosedyrer for digitalisering av bøker i høy hastighet og relativt lave kostnader blitt betraktelig forbedret med det resultat at det nå er mulig å digitalisere millioner av bøker per år. Googles bokskanningsprosjekt jobber også med biblioteker for å tilby digitalisering av bøker som driver fremover på digitaliseringsboken.

Opphavsrett og lisensiering

Digitale biblioteker er hemmet av opphavsrettslovgivningen fordi, i motsetning til tradisjonelle trykte verk, fortsatt er lovene om digital opphavsrett. Publisering av materiale på nettet av biblioteker kan kreve tillatelse fra rettighetshavere, og det er en interessekonflikt mellom biblioteker og forlagene som ønsker å lage online -versjoner av innhentet innhold til kommersielle formål. I 2010 ble det anslått at tjuetre prosent av bøkene som eksisterte ble opprettet før 1923 og dermed var opphavsrettslige. Av dem som ble skrevet ut etter denne datoen, var bare fem prosent fremdeles på trykk fra og med 2010. Således var omtrent syttito prosent av bøkene ikke tilgjengelige for publikum.

Det er en fortynning av ansvar som skjer som følge av den digitale ressursens distribuerte natur. Komplekse saker om immaterielle rettigheter kan bli involvert siden digitalt materiale ikke alltid eies av et bibliotek. Innholdet er i mange tilfeller bare offentlig domene eller selvgenerert innhold. Noen digitale biblioteker, for eksempel Project Gutenberg , jobber med å digitalisere verk som ikke er opphavsrettslig og gjøre dem fritt tilgjengelige for allmennheten. Et estimat av antall forskjellige bøker som fremdeles finnes i bibliotekskataloger fra 2000 f.Kr. til 1960, er gjort.

De Fair Bruk Avsetninger (17 USC § 107) under åndsverkloven av 1976 gi konkrete retningslinjer under hvilke omstendigheter bibliotekene har lov til å kopiere digitale ressurser. Fire faktorer som utgjør rettferdig bruk er "Formål med bruken, arbeidets art, beløp eller vesentlighet som brukes og markedspåvirkning."

Noen digitale biblioteker skaffer lisens til å låne ut ressursene sine. Dette kan innebære begrensning av utlån av bare én kopi av gangen for hver lisens, og bruk av et system for digital rettighetsforvaltning for dette formålet (se også ovenfor).

The Digital Millennium Copyright Act av 1998 var en handling skapt i USA for å forsøke å forholde seg til innføringen av digitale verk. Denne loven inneholder to traktater fra 1996. Den kriminaliserer forsøket på å omgå tiltak som begrenser tilgangen til opphavsrettslig beskyttet materiale. Det kriminaliserer også handlingen om å forsøke å omgå tilgangskontroll. Denne loven gir unntak for ideelle biblioteker og arkiver som tillater opptil tre kopier, hvorav en kan være digital. Dette kan imidlertid ikke offentliggjøres eller distribueres på nettet. Videre lar det biblioteker og arkiver kopiere et verk hvis formatet blir foreldet.

Opphavsrettsproblemer vedvarer. Som sådan har det blitt fremmet forslag som antyder at digitale biblioteker er unntatt fra lov om opphavsrett. Selv om dette ville være svært gunstig for publikum, kan det ha en negativ økonomisk effekt, og forfattere kan være mindre tilbøyelige til å lage nye verk.

Et annet problem som kompliserer saker er ønsket om noen forlag om å begrense bruken av siffermateriale, for eksempel e-bøker kjøpt av biblioteker. Mens med trykte bøker eier biblioteket boken til den ikke lenger kan sirkuleres, ønsker utgivere å begrense antall ganger en e-bok kan sjekkes ut før biblioteket må kjøpe den igjen. "[HarperCollins] begynte å lisensiere bruken av hver e-bokkopi for maksimalt 26 lån. Dette påvirker bare de mest populære titlene og har ingen praktisk effekt på andre. Etter at grensen er nådd, kan biblioteket kjøpe tilbake tilgangsrettigheter til et lavere kostnad enn den opprinnelige prisen. " Fra et publiseringsperspektiv høres dette ut som en god balanse mellom bibliotekets utlån og beskytter seg mot en fryktet nedgang i boksalget, men biblioteker er ikke satt opp for å overvåke samlingene som sådan. De erkjenner den økte etterspørselen etter digitalt materiale tilgjengelig for lånetakerne og ønsket om et digitalt bibliotek om å bli utvidet til å omfatte bestselgere, men utgivelseslisensiering kan hindre prosessen.

Anbefalingssystemer

Mange digitale biblioteker tilbyr anbefalingssystemer for å redusere informasjonsoverbelastning og hjelpe brukerne med å finne relevant litteratur. Noen eksempler på digitale biblioteker som tilbyr anbefalingssystemer er IEEE Xplore , Europeana og GESIS Sowiport . Anbefalersystemene fungerer hovedsakelig basert på innholdsbasert filtrering, men også andre tilnærminger brukes som samarbeidende filtrering og henvisningsbaserte anbefalinger. Beel et al. rapporter at det er mer enn 90 forskjellige anbefalingsmetoder for digitale biblioteker, presentert i mer enn 200 forskningsartikler .

Vanligvis utvikler og vedlikeholder digitale biblioteker sine egne anbefalingssystemer basert på eksisterende søke- og anbefalingsrammer som Apache Lucene eller Apache Mahout . Imidlertid er det også en anbefaling-som-en-tjenesteleverandør som spesialiserer seg på å tilby et anbefalingssystem for digitale biblioteker som en tjeneste .

Ulemper ved digitale biblioteker

Digitale biblioteker, eller i det minste deres digitale samlinger, har dessverre også brakt sine egne problemer og utfordringer på områder som:

Det er mange store digitaliseringsprosjekter som vedvarer disse problemene.

Fremtidig utvikling

Store digitaliseringsprosjekter pågår hos Google , Million Book Project og Internet Archive . Med fortsatte forbedringer i bokhåndtering og presentasjonsteknologi som optisk tegngjenkjenning og utvikling av alternative arkiver og forretningsmodeller, vokser digitale biblioteker raskt i popularitet. På samme måte som biblioteker har våget seg til lyd- og videosamlinger, har digitale biblioteker som Internett -arkivet. Google Books- prosjektet mottok nylig en domstolsseier ved å fortsette med bokskanningsprosjektet som ble stoppet av Forfatterens laug. Dette bidro til å åpne veien for biblioteker for å jobbe med Google for bedre å nå kunder som er vant til datastyrt informasjon.

I følge Larry Lannom, direktør for informasjonsstyringsteknologi ved den ideelle organisasjonen for nasjonale forskningsinitiativer (CNRI), "er alle problemene knyttet til digitale biblioteker pakket inn i arkivering." Han fortsetter: "Hvis folk om 100 år fortsatt kan lese artikkelen din, har vi løst problemet." Daniel Akst, forfatter av The Webster Chronicle, foreslår at "fremtiden til biblioteker - og til informasjon - er digital." Peter Lyman og Hal Variant, informasjonsforskere ved University of California, Berkeley , anslår at "verdens totale årlige produksjon av trykk, film, optisk og magnetisk innhold vil kreve omtrent 1,5 milliarder gigabyte lagringsplass." Derfor tror de at "snart vil det være teknologisk mulig for en gjennomsnittlig person å få tilgang til praktisk talt all registrert informasjon."

Digitale arkiver er et medium i utvikling og de utvikler seg under forskjellige omstendigheter. Ved siden av store lagre har andre digitale arkiveringsprosjekter også utviklet seg som svar på behov innen forskning og forskningskommunikasjon på forskjellige institusjonelle nivåer. For eksempel, under COVID-19-pandemien , har biblioteker og høyere utdanningsinstitusjoner lansert digitale arkiveringsprosjekter for å dokumentere livet under pandemien, og dermed skapt en digital, kulturell oversikt over kollektive minner fra perioden. Forskere har også benyttet digital arkivering for å lage spesialiserte forskningsdatabaser . Disse databasene kompilerer digitale poster for bruk på internasjonalt og tverrfaglig nivå. COVID CORPUS, lansert i oktober 2020, er et eksempel på en slik database, bygget som svar på vitenskapelige kommunikasjonsbehov i lys av pandemien. Utover akademia har digitale samlinger også nylig blitt utviklet for å appellere til et mer generelt publikum, slik det er med Selected General Audience Content fra Internet-First University Press utviklet av Cornell University. Denne generelle publikumsdatabasen inneholder spesialisert forskningsinformasjon, men er digitalt organisert for tilgjengelighet. Etableringen av disse arkivene har lagt til rette for spesialiserte former for digital journalføring for å oppfylle ulike nisjer innen online, forskningsbasert kommunikasjon.

Se også

Referanser

Videre lesning

Eksterne linker