Metadata standard - Metadata standard

En metadatastandard er et krav som har til hensikt å etablere en felles forståelse av betydningen eller semantikken til dataene , for å sikre korrekt og riktig bruk og tolkning av dataene fra sine eiere og brukere. For å oppnå denne felles forståelsen må en rekke egenskaper eller attributter for dataene defineres, også kjent som metadata .

Metadata

Metadata er ofte definert som data om data . Det er "strukturert informasjon som beskriver, forklarer, lokaliserer eller på annen måte gjør det lettere å hente, bruke eller administrere en informasjonsressurs", spesielt i et distribuert nettverksmiljø som for eksempel internett eller en organisasjon. Et godt eksempel på metadata er katalogiseringssystemet som finnes i biblioteker , som for eksempel registrerer forfatter, tittel, emne og plassering på hyllen til en ressurs. En annen er utvinning av programvaresystemkunnskap for programvareobjekter som datastrømmer, kontrollstrømmer, samtalekart, arkitekturer, forretningsregler, forretningsvilkår og databaseskjemaer.

Metadata er vanligvis kategorisert i tre typer:

  • Beskrivende metadata beskriver en informasjonsressurs for identifisering og gjenfinning gjennom elementer som tittel, forfatter og abstrakt.
  • Strukturelle metadata dokumenterer relasjoner innenfor og mellom objekter gjennom elementer som lenker til andre komponenter (f.eks. Hvordan sider settes sammen for å danne kapitler).
  • Administrative metadata hjelper til med å administrere informasjonsressurser gjennom elementer som versjonsnummer, arkiveringsdato og annen teknisk informasjon for filhåndtering, rettighetsbehandling og bevaring.

Tilgjengelige metadatastandarder

Metadataelementer gruppert i sett designet for et bestemt formål, f.eks. For et bestemt domene eller en bestemt type informasjonsressurs, kalles metadataskjemaer. For hvert element er navnet og semantikken (elementets betydning) spesifisert. Innholdsregler (hvordan innhold må formuleres), representasjonsregler (f.eks. Store bokstaver) og tillatte elementverdier (f.eks. Fra et kontrollert ordforråd) kan spesifiseres valgfritt. Noen skjemaer angir også i hvilken syntaks elementene må kodes, i motsetning til syntaksuavhengige skjemaer. Mange nåværende skjemaer bruker Standard Generalized Markup Language (SGML) eller XML for å spesifisere syntaksen. Metadataskjemaer som er utviklet og vedlikeholdt av standardorganisasjoner (for eksempel ISO ) eller organisasjoner som har påtatt seg et slikt ansvar (for eksempel Dublin Core Metadata Initiative) kalles metadatastandarder.

Mange forskjellige metadataskjemaer utvikles som standarder på tvers av fagområder, for eksempel biblioteksvitenskap, utdanning, arkivering, netthandel og kunst. I tabellen nedenfor er en oversikt over tilgjengelige metadatastandarder gitt.

Navn Fokus Beskrivelse
DDI Arkivering og samfunnsvitenskap Den Dokumentasjon Initiative er en internasjonal innsats for å etablere en standard for teknisk dokumentasjon som beskriver samfunnsvitenskapelige data. En medlemsbasert allianse utvikler DDI-spesifikasjonen, som er skrevet i XML.
EBUCore EBUCore -metadata satt for audiovisuelt innhold EBUCore er et sett med beskrivende og tekniske metadata basert på Dublin Core og tilpasset media. EBUCore er flaggskipets metadata -spesifikasjon for EBU, den største profesjonelle sammenslutningen av kringkastere rundt om i verden. Det er utviklet og vedlikeholdt av EBUs tekniske avdeling. EBU har en lang historie innen definisjonen av metadataløsninger for kringkastere. EBUCore brukes i stor grad som vist i denne rapporten. EBUCore er registrert i SMPTE. Den er også tilgjengelig i RDF.
EBU CCDM EBU Class Conceptual Data Model - CCDM EBU Class Conceptual Data Model (CCDM) er en ontologi som definerer et grunnleggende sett med klasser og egenskaper som et vanlig ordforråd for å beskrive programmer i deres forskjellige faser av opprettelsen fra igangkjøring til levering. CCDM er et felles rammeverk, og brukerne inviteres til å berike modellen ytterligere med klasser og eiendommer som passer mer spesifikt til deres behov.
FOAF Friend of a Friend (FOAF) The Friend of a Friend (FOAF) -prosjektet handler om å lage et web med maskinlesbare hjemmesider som beskriver mennesker, koblingene mellom dem og tingene de lager og gjør.
EAD Arkivering Kodet arkivbeskrivelse er en standard for koding av arkivfunnhjelpemidler ved hjelp av XML i arkiv- og manuskriptlagre.
CDWA Kunst Kategorier for beskrivelse av kunstverk er et konseptuelt rammeverk for å beskrive og få tilgang til informasjon om kunstverk, arkitektur og annen materiell kultur.
VRA Core Kunst Visual Resources Association tilbyr en kategorisk organisasjon for beskrivelse av verk av visuell kultur, så vel som bildene som dokumenterer dem.
Darwin Core Biologi Den Darwin kjernen er en metadata spesifikasjon for informasjon om den geografiske forekomst av arter og eksistensen av prøver i samlinger.
ONIX Bokindustrien Online Informasjonsutveksling er en internasjonal standard for å representere og kommunisere produktinformasjon fra bokindustrien i elektronisk form.
CWM Datavarehus Hovedformålet med Common Warehouse Metamodel er å muliggjøre enkel utveksling av lager- og business intelligence -metadata i distribuerte heterogene miljøer.
EML Økologi Ecological Metadata Language er en spesifikasjon utviklet for den økologiske disiplinen.
IEEE LOM utdanning Metadata for læringsobjekter spesifiserer syntaksen og semantikken til læringsobjektmetadata.
CSDGM Geografiske data Innholdsstandard for digitale geospatiale metadata opprettholdes av Federal Geographic Data Committee (FGDC).
ISO 19115 Geografiske data Den ISO 19115: 2003 Geografisk informasjon - Metadata standarden definerer hvordan å beskrive geografisk informasjon og tilhørende tjenester, herunder innhold, romlig-temporale kjøp, datakvalitet, tilgang og bruksrett. Den vedlikeholdes av ISO/TC 211 -komiteen.
e-GMS Myndighetene Den IKT Metadata Standard (E-GMS) definerer metadataelementer for informasjonsressurser for å sikre maksimal konsistens på metadata på tvers av offentlige organisasjoner i Storbritannia.
GILS Regjeringen/organisasjoner Global Information Locator Service definerer en åpen, rimelig og skalerbar standard slik at myndigheter, selskaper eller andre organisasjoner kan hjelpe søkere med å finne informasjon.
TEI Humaniora, samfunnsvitenskap og språkvitenskap Text Encoding Initiative er en standard for representasjon av tekster i digital form, hovedsakelig innen humaniora, samfunnsvitenskap og lingvistikk.
NISO MIX Bilder Z39.87 Dataordbok er tekniske metadata for digitale stillbilder (MIX) - NISO Metadata for Images in XML er et XML -skjema for et sett med tekniske dataelementer som kreves for å administrere digitale bildesamlinger.
<indecs> Åndsverk Indecs Content Model -Interoperabilitet av data i e-handelssystemer adresserer behovet for å sette forskjellige opprettelsesidentifikatorer og metadata inn i et rammeverk for å støtte forvaltningen av immaterielle rettigheter.
MARC Bibliotekarskap MARC - Maskinlesbar katalogisering - standarder for representasjon og kommunikasjon av bibliografisk og relatert informasjon i maskinlesbar form.
METS Bibliotekarskap Metadata Encoding and Transmission Standard er et XML -skjema for koding av beskrivende, administrative og strukturelle metadata angående objekter i et digitalt bibliotek.
MODS Bibliotekarskap Metadata Object Description Schema er et skjema for et bibliografisk elementsett som kan brukes til en rekke formål, og spesielt for bibliotekapplikasjoner.
XOBIS Bibliotekarskap XML Organic Bibliographic Information Schema er et XML -skjema for modellering av MARC -data.
PBCore Media PBCore er en metadata og katalogiseringsressurs for offentlige kringkastere og tilknyttede samfunn.
MPEG-7 Multimedia Multimedia Content Description Interface MPEG-7 er en ISO/IEC-standard og spesifiserer et sett med deskriptorer for å beskrive ulike typer multimediainformasjon; den er utviklet av Moving Picture Experts Group.
MEI Musikknotasjon Music Encoding Initiative er et samfunnsdrevet forsøk på å lage en allment akseptert, digital, symbolsk fremstilling av musikknotasjonsdokumenter.
Dublin Core Nettverksressurser Dublin Core - interoperable online metadata standard fokusert på nettverksressurser.
GJØR JEG Nettverksressurser Digital Object Identifier gir et system for identifisering og dermed håndtering av informasjon ("innhold") på digitale nettverk, og gir utholdenhet og semantisk interoperabilitet.
ISO/IEC 11179 Organisasjoner ISO/IEC 11179 Standard beskriver metadata og aktiviteter som trengs for å administrere dataelementer i et register for å skape en felles forståelse av data på tvers av organisatoriske elementer og mellom organisasjoner.
ISO/IEC 19506 Programvaresystemer ISO/IEC 19506 Standard kalt Knowledge Discovery Metamodel er en ontologi for å beskrive programvaresystemer. Standarden gir både en detaljert ontologi og felles dataformat for å representere granulære programvareobjekter og deres relasjoner, slik at ekstraksjoner som datastrømmer, kontrollstrømmer, anropskart, arkitektur, databaseskjemaer, forretningsregler/vilkår og derivasjon av forretningsprosesser. Brukes først og fremst til eldre og eksisterende systemsikkerhet, samsvar og modernisering.
ISO 23081 Registeradministrasjon ISO 23081 er en tredelt teknisk spesifikasjon som definerer metadata som trengs for å administrere poster. Del 1 tar for seg prinsipper, del 2 tar for seg konseptuelle og gjennomføringsspørsmål, og del 3 skisserer en metode for egenvurdering.
MoReq2010 Registeradministrasjon MoReq2010 er en spesifikasjon som beskriver MOdel REKravene for håndtering av elektroniske poster.
DIF Vitenskapelige datasett Directory Interchange Format er et beskrivende og standardisert format for utveksling av informasjon om vitenskapelige datasett.
RAD Bibliotekarskap og arkivering De Regler for arkivbeskrivelse (RAD) er den kanadiske arkiv beskrivende standard. Det er overvåket av Canadian Committee on Archival Description of the Canadian Council of Archives. Lignende i struktur til AACR2 , ble den sist revidert i 2008.
RDF Nettressurser Ressursbeskrivelsesramme (RDF) er en generell metode for konseptuell beskrivelse eller modellering av informasjon som er implementert i webressurser, ved bruk av en rekke syntaksformater.
MDDL Finansmarkedet (Financial) Market Data Definition Language (MDDL) er utviklet av Financial Information Services Division (FISD) i Software and Information Industry Association (SIIA). MDDL er en utvidbar Markup Language (XML) -spesifisert spesifikasjon, som letter utveksling av informasjon om finansielle instrumenter som brukes over hele verdens finansmarkeder. MDDL hjelper til med å kartlegge alle markedsdata til et felles språk og en struktur for å lette utveksling og behandling av flere komplekse datasett.
NIEM Lovhåndhevelse ; Sosiale tjenester ; Planlegging av bedriftens ressurser NIEM-den nasjonale informasjonsutvekslingsmodellen- er en samfunnsdrevet, amerikansk regjeringsdekkende, standardbasert tilnærming til utveksling av informasjon. NIEMs datadomener vokser standarder som er utviklet og vedlikeholdt av domenesamfunn. Noen prøvedomener som er inkludert eller utvikles i NIEM er: kjemi/biologi/stråling/kjernefysisk; Rettferdighet; intelligens; innvandring; Internasjonal handel; biometri; nødstyring; screening; Menneskelige tjenester; tjenester for barn, ungdom og familie; Helse; infrastruktur beskyttelse; militære operasjoner; maritimt; og overflatetransport.
SAML Shibboleth har blitt utviklet av Internet2/MACE. Den gir en metode for distribuert autentisering og autorisasjon for deltakende HTTP (S) -baserte applikasjoner. Security Assertion Markup Language er et XML-basert åpent standard dataformat for utveksling av autentiserings- og autorisasjonsdata mellom parter. Et skjemaeksempel finnes på OASIS (Advancing open standards for the information society)

Kilder:

Se også

Referanser