EIDR - EIDR

Entertainment ID Registry Association
EIDR-logo 1.png
Dannelse 2010
Type 501 (c) (6) non-profit-medlemskapsselskap
Hovedkvarter Redwood City, CA
Daglig leder
Kip Welch
Nettsted www .eid .org

The Entertainment Identifier Registry , eller EIDR , er et globalt unik identifikator system for et bredt spekter av audiovisuelle objekter, inkludert filmer , TV og radio programmer. Identifikasjonssystemet løser en identifikator til en metadatapost som er tilknyttet titler, redigeringer, DVDer , kodinger, klipp og mash-ups på toppnivå . EIDR gir også identifikatorer for leverandører av videotjenester, for eksempel kringkastings- og kabelnettverk.

Per juni 2020 inneholder EIDR over 2 millioner plater, inkludert nesten 400 tusen filmer, og nesten en million episoder fra over 40 000 TV-serier.

EIDR er en implementering av en digital objektidentifikator (DOI).

Historie

Identifikasjonssystemer for medieaktiva har eksistert i flere tiår. Den vanlige motivasjonen for deres opprettelse er å muliggjøre styring av medieaktiva gjennom tildeling av en unik id til et sett metadata som representerer fremtredende egenskaper for hver eiendel. Over tid har slike systemer en tendens til å spre seg, og hver oppstår for å håndtere et bestemt sett med problemer. Som et resultat er det betydelig variasjon mellom systemer når det gjelder hvilke eiendeler som er kategorisert, hvilke metadata som er knyttet til hver eiendel, og selve definisjonen av en eiendel. For å nevne noen eksempler, burde et " regissørkutt " av en film være forskjellig fra den opprinnelige teatralsk utgivelsen? Hvordan skal regionale variasjoner (f.eks. Oversettelse av tittelen eller dialogen til fremmedspråk) redegjøres for? Ytterligere komplikasjoner inkluderer prosedyrene (og nødvendige legitimasjonsbeskrivelser) for å legge til nye eiendeler, redigere eksisterende eiendeler og opprette derivater.

EIDR ble opprettet for å løse disse problemene, så vel som andre som oppstod i arbeidsflyter for videoaktiva , både i en virksomhet-til-virksomhet- kontekst og de intramurale aktivitetene etter innholdsproduksjonen til innholdsprodusenter. EIDR har følgende egenskaper:

  • Et sentralt register tilgjengelig for alle deltakere
  • Evne til å enkelt registrere nye eiendeler
  • En eiendel-ID som er uforanderlig (og spesielt med hensyn til endringer i eiendoms eierskap eller plassering av metadataene eller selve eiendelen)
  • Oppdagelse / forebygging av duplikater av samme eiendel som opprettes
  • Evne til å lage et sett med videoaktiver hentet fra et abstrakt verk (f.eks. Original teaterutgivelse, regissørklipp, språkvarianter)
  • Evne til å gruppere videoaktiva etter mer generelle forhold (f.eks. Episoder av en sesong av en TV-serie)
  • Et kjernesett av metadata for å skille mellom eiendeler, selv når de er nært beslektede
  • Skalerbar, uforanderlig, vedvarende

EIDR er ment å supplere, ikke erstatte, eksisterende aktivaidentifikasjonssystemer. Tvert imot er en nøkkelfunksjon å tillate at en EIDR-post inkluderer referanser til eiendelens ID under andre systemer. Denne funksjonen er spesielt nyttig i film- og tv-arkiver, noe som gjør det enkelt for dem å kryssreferanse sine beholdninger med andre kilder for arbeidet og metadata om det. Etter design replikerer ikke EIDR funksjoner i andre eiendel-ID-systemer, for eksempel kommersielle systemer som søker å tilføre verdi gjennom forbedrede metadata (f.eks. Sammendrag av plott, produksjonsdetaljer). Det er også et ikke-mål å spore eierskap og rettighetsinformasjon, som imidlertid kan implementeres som applikasjoner som bruker EIDR ID.

Innholdsmodell

EIDR er bygget på en samling poster (som videre er delt inn i felt) som er lagret i et sentralt register. Disse postene er referert eksternt av DOI, som tildeles når en post blir opprettet, og hver identifikator er uforanderlig deretter. Identifikatoren oppløsning system underliggende Dois er håndtere system og så hver innfødte EIDR Content ID er et håndtak formatert, i økende spesifisitet, for å håndtere, DOI og EIDR standarder.

Content ID-format

Den kanoniske formen for en EIDR Content ID er en forekomst av et håndtak og har formatet:

10.5240 / XXXX-XXXX-XXXX-XXXX-XXXX-C

hvor

  • 10.5240 er DOI-prefikset for et EIDR-aktivum. "10" indikerer at håndtaket er en DOI; andre prefikser er tilordnet andre aktivatyper (f.eks. akademiske publikasjoner ). Sifrene mellom "." og "/" danner underprefikset, som indikerer hvilket registreringsbyrå innen International DOI Foundation (IDF) som har rett til å administrere disse håndtakene. "5240" er tildelt EIDR Association.
  • XXXX-XXXX-XXXX-XXXX-XXXX-C er DOI-suffikset. Hver "X" betegner et heksadesimalt siffer (AF), og "C" er et ISO 7064 Mod 37,36 kontrollsiffer .

Det er også en 96-biters kompakt binær form som er beregnet på innbygging i små nyttelaster som vannmerker . Dette skjemaet genereres fra det kanoniske formatet som følger:

  • 16-biters underprefiks: generert ved å tolke underprefikset som en binær verdi, f.eks. B'0001010001111000 '
  • 80-bits suffiks: delen som ikke er kontrollsum av suffikset, representert som 10 byte

Den Uniform Resource Name skjema for en EIDR ID er spesifisert i RFC   7302 .

For bruk på nettet kan en EIDR-innholds-ID vises som en URI i en av disse skjemaene:

  • https://doi.org/10.5240/XXXX-XXXX-XXXX-XXXX-XXXX-C : dette er en EIDR ID representert som en DOI proxy referanse (den vil bli omdirigert fra DOI til EIDR-registeret)
  • info: doi: 10.5240 / XXXX-XXXX-XXXX-XXXX-XXXX-C [avviklet] : dette er en EIDR-ID representert som en RFC 4452- kompatibel "info" URI (husk at alle EIDR-IDene også er DOI-ID-er, men ikke samtale).

Opptakstyper

Det er fire typer innholdsposter, som hver er knyttet til et reservert prefiks:

  • Content ID (10.5240 / XXXX-XXXX-XXXX-XXXX-XXXX-C): er tilknyttet et underholdningselement som en film eller TV-serie. Innholdsposter er hierarkiske, slik at forhold kan uttrykkes, for eksempel en serie, hvis barn vil være årstider, hvis barn i sin tur vil være individuelle episoder. Mange andre forhold støttes, som beskrevet nedenfor. Innholdsposter utgjør mesteparten av dataene i EIDR-registeret.
  • Party-ID (10.5237 / XXXX-XXXX): identifiserer enheter som registranter, innholdsprodusenter og distributører.
  • Video Service ID (10.5239 / XXXX-XXXX): Identifiserer en videotjeneste, kjent som en "kanal" eller "nettverk": en (vanligvis) lineær innholdssekvens som er planlagt å bli sendt på bestemte tidspunkter (f.eks. Service-ID for Cartoon Network er 10.5239 / 8BE5-E3F6). Videotjenester er hierarkiske: for eksempel kan en forelder ha flere barn for å gjøre rede for regionale eller språklige variasjoner).
  • Bruker-ID (10.5238 / [0-9a-zA-Z _. # ()] {2-32}): Identifiserer en bruker ved hjelp av en streng på 2–32 alfanumeriske og valgte spesialtegn (illustrert her med Perl- syntaks). En bruker er først og fremst et administrativt begrep som er underordnet partene (som de arver tilgangsrettigheter til). I motsetning til de andre EIDR DOI-ene, kan bruker-ID bare brukes i EIDR (f.eks. Programmering av API-er).

Underprefikset 5237, 5238, 5239 og 5240 er alle tildelt EIDR Association.

Innholdsregistreringer

Innholdsposter er objekter kategorisert etter typer og forhold. Hver har tre forskjellige (ortogonale) typer:

  • Objekttype : det er totalt 10 av disse. Først er Basic Type, som har minimale felt som er nødvendige for å beskrive en innholdspost. De andre 9 er avledet fra basistypen, og inneholder ekstra felt for å beskrive mer komplekse objekter.
  • Strukturell type : Disse skiller fremstillinger av et verk og er oppført i økende rekkefølge av spesifisitet:
  • Referenttype : typen innholdselement, uavhengig av en bestemt manifestasjon (f.eks. Er en film vist på TV fortsatt en film):
    • Serie : En abstraksjon som inneholder bestilte eller ikke-ordnede enkeltvarer.
    • Sesong : Et andre nivå av gruppering under en serie, som vanligvis dekker et tidsintervall
    • TV : Innhold som først dukket opp via kringkasting.
    • Film : Langformet innhold som først dukket opp i kino eller teater.
    • Kort : Løst definert for å dekke et verk som er 40 minutter eller mindre, for eksempel musikkvideoer , teatraliske nyhetshjul eller teater- eller DTV-tegneserie shorts.
    • Internett : Innhold som først ble vist på nettet. Dette er forskjellig fra innhold fra andre steder som er gjort tilgjengelig på nettet.
    • Interaktivt materiale : Innhold som ikke er strengt audiovisuelt. Den dekker DVD-menyer, interaktive TV-overlegg, tilpassede spillere osv.
    • Kompilering : Innhold sammensatt av flere andre eiendeler som ikke kan beskrives mer presist, for eksempel et boksesett av en filmfranchise.
    • Supplerende : Denne typen er for sekundært innhold hvis primære formål er å støtte, øke eller markedsføre annet innhold. Eksempler inkluderer trailere, uttak og reklamedokumentarer ("å lage" stykker).

Grunnleggende metadata

Følgende felt (hentet fra et større sett) omfatter basisobjektdataene til en innholdspost:

  • Strukturell type : f.eks. Abstraksjon
  • Mode : f.eks. AudioVisual (for en film eller et TV-program); "Audio" for et radioprogram; "Visual" for et stille verk.
  • Referenttype : f.eks. Film
  • Tittel : den primære tittelen. Titler og alternative titler kjennetegnes videre av:
    • Lang : tittelspråket uttrykt som ISO 639-1- kode
    • Klasse : utgivelse eller regional
  • Alternativ tittel 1..N : en eller flere alternative titler (ofte regionale eller språkvarianter)
  • Originalspråk : språket til den originale utgivelsen uttrykt som ISO 639-1-kode
  • Associated Org 1..N : Party ID (er) for produsent, studio, etc.
  • Utgivelsesdato : dato tittel ble opprinnelig gitt ut
  • Opprinnelsesland : ISO 3166-1 alfa 2- kode, med utvidelser for nedlagte land
  • Omtrentlig lengde : uttrykt som XML-skjema xs: varighet datatype
  • Alternativ ID 1..N : en eller flere ekvivalente IDer uttrykt i et annet aktiva ID-system (se diskusjon nedenfor).
  • Kreditt : kun skjelettkreditter blir gitt, vanligvis begrenset til regissøren og opptil fire av hovedaktørene. Som nevnt er det et ikke-mål for EIDR å konkurrere med proprietære systemer med rike metadata (f.eks. Plottoppsummeringer). Hovedmålet er å assistere med å entydige tittelen, og hjelpe til med validering og av duplisering.
  • Registrant : parten som opprettet denne innholdsposten (f.eks. "10.5237 / superparty")
  • Opprettelsesdato : dato denne innholdsposten ble opprettet
  • Status : normalt "gyldig" (det er spesielle tilfeller for slettede poster)
  • Siste modifikasjonsdato : siste gang denne innholdsposten ble endret

Slettede innholdsposter

En EIDR-ID må alltid kunne løses, og under normale omstendigheter vil den tilsvarende innholdsposten være permanent. Det er to mekanismer tilgjengelig for å håndtere feil eller andre uvanlige omstendigheter. Den foretrukne er aliasing, hvorved en EIDR-ID blir omdirigert transparent til en annen innholdspost. Aliasing brukes ofte for å håndtere en eiendel som blir registrert to ganger.

Den andre mekanismen er bruken av gravsteinsplater. Dette brukes når innholdsposten er ødelagt, eller et annet ugyldig aktiv ble registrert ved et uhell. I dette tilfellet vil ID være alias for en spesiell gravsteinsoppføring. Gravsteinen kan gjenkjennes av applikasjoner fordi EIDR ID-feltet blir satt til den utmerkede verdien " 10.5240 / 0000-0000-0000-0000-0000-X ". Merk at "X" betyr den 24. bokstaven i det latinske alfabetet ( ASCII 0x58 eller Unicode U + 0058).

Alternativ ID

Å ha et rikt sett med alternative ID-er for innhold er et av hovedmålene for EIDR. Dette gjør at EIDR-IDer kan brukes overalt i arbeidsflyter for innhold; Hvis det er behov for en alternativ ID, kan den finnes i metadataene for EIDR-ID-en. EIDR støtter inkluderingen av både proprietære og andre standard (f.eks. ISAN) ID-referanser. Ytterligere alternative ID-er kan legges til når det er nødvendig (f.eks. Av parter som ønsker å støtte nye arbeidsflyter). Nedenfor er et eksempel på alternative ID-er for EIDR-aktiva 10.5240 / EA73-79D7-1B2B-B378-3A73-M (filmen Blade Runner ). Hvis en alternativ ID kan løses algoritmisk, for eksempel ved å plassere den riktig i en mal-URL, gjør EIDR den lenken tilgjengelig.

Alternative ID-er for 10.5240 / EA73-79D7-1B2B-B378-3A73-M
Alternativ ID 0000-0000-14A9-0000-K-0000-0000-E
Type: ISAN
Alternativ ID 2 89
Type: IVA
Alternativ ID nr. 3 B000SW4DLM
Type: Proprietært domene: amazon.com
Alternativ ID # 4 12886
Type: Proprietært domene: flixster.com
Alternativ ID nr. 5 15042
Type: Proprietært domene: thecinemasource.com
Alternativ ID # 6 tt0083658
Type: IMDB Forhold: IsSameAs
Alternativ ID nr. 7 E0087486000
Type: Proprietært domene: spe.sony.com/MPM
Alternativ ID # 8 3929
Type: Proprietært domene: spe.sony.com/ProductID
Alternativ ID nr. 9 2002029
Type: Proprietært domene: warnerbros.com/MPM
Alternativ ID # 10 389785
Type: Proprietært domene veronicamagazine.nl
Alternativ ID # 11 B001EC2J1G
Type: Proprietært domene: amazon.com
Alternativ ID # 12 150002645
Type: Proprietært domene: bfi.org.uk

Alternative ID-er er delt inn i ikke-proprietær og proprietær. Førstnevnte har særegne, forhåndsdefinerte typer (for eksempel de som er utstedt av ISAN, IMDb og IVA), mens proprietære ID-er alle er av typen "Proprietær", og er ytterligere preget av et tilknyttet DNS-domene. Fra juli 2017 er det over 2 millioner alternative ID-er direkte tilgjengelige via EIDR.

Forholdet mellom objekter

Innholdsobjekter kan relateres til hverandre i henhold til følgende tabell. Disse relasjonene uttrykkes som tilleggsfelt i innholdsposten og er dermed relative til det objektet. Legg merke til at emneobjektet er barnet og målet er overordnet (f.eks. Emnet er <forholdstype> Forelder). Ytterligere begrensninger er angitt i tabellen.

Arvelighetsrelasjoner : Objektet som forholdet eksisterer på, kan arve grunnleggende metadatafelt fra objektet som forholdet refererer til. Bare et arveforhold kan eksistere på et objekt. Disse forholdene produserer en trestruktur som er forankret i EIDR-ID-en for en abstraksjon.
erSesongFra En gruppe serieepisoder gitt ut over et sammenhengende tidsrom (f.eks. Kringkastingsår) f.eks. 10.5240 / AB95-8734-5D98-A282-2DF0-C ("Sesong 9") er en sesong på 10.5240 / C272-DA64-E2B5-0A78 -2AC3-Z ("X-Files")
erEpisodeOf f.eks. 10.5240 / E008-224D-0397-0560-6300-8 ("Sunshine Days") er en episode av 10.5240 / AB95-8734-5D98-A282-2DF0-C ("Sesong 9").
erEditOf En forekomst av en tittel med unike egenskaper som skiller den fra alle andre versjoner. For eksempel er 10.5240 / 7290-C8AD-12BA-4F93-3B07-7 ("Blade Runner: The Director's Cut") en redigering av 10.5240 / EA73-79D7-1B2B-B378-3A73-M.
isManifestationOf En manifestasjon er en mer spesifikk forekomst av et verk som kan selges, overføres, overføres eller spilles. Overordnet til en manifestasjon skal være en redigering. For eksempel er 10.5240 / 9CE1-DE39-5F3E-073D-4307-7 Ultrafiolett standard CFF (standarddefinisjon, engelsk lyd og undertekster) for "Blade Runner: The Director's Cut". Det er en manifestasjon av det abstrakte arbeidet 10.5240 / EA73-79D7-1B2B-B378-3A73-M .
isClipOf Ett (og bare ett) sammenhengende fragment av en eiendel.
Avhengighetsrelasjoner : Objektene som forholdet refererer til, har sterk betydning for den grunnleggende naturen til objektet som forholdet eksisterer på. Dette betyr at objektene det er referert til i forholdet, må tas i betraktning når du ser etter duplikater når et objekt blir opprettet eller endret. Disse forholdene produserer rettet grafer i og over trær.
isCompositeOf Et enkelt verk sammensatt av deler av flere andre plater.
erCompilationOf En samling av flere hele verk som ikke er mer presist beskrevet.
Lette forhold : Det er ingen arv; objektene de henviser til påvirker ikke den underliggende naturen til objektet som forholdet eksisterer på. Disse forholdene brukes hovedsakelig når vi beveger oss rundt i objekttreet og kobler objekttrær til hverandre, og produserer en rettet graf over elementer av disse trærne.
isPackagingOf For å lage en samling eiendeler som frigjøres sammen, f.eks. 10.5240 / F219-975E-5990-4570-BA75-2 ("Hannah Montana og Miley ...") er en emballasje på 10.5240 / 9ABE-2BF1-ACE7-EBA2-8E57 -N .
erPromotionOf Salgsfremmende gjenstander som en trailer.
er SupplementTo Hjelpemateriale som kan bli funnet på en DVD, for eksempel en outtake eller bak kulissene.
isAlternateContentFor Innhold som er synkronisert med hovedfordelen, for eksempel lyd eller en alternativ kameravinkel.

Bruk i standarder og applikasjoner

EIDR har blitt innlemmet i mange standarder. Noen av de mer betydningsfulle er oppført her:

  • SMPTE / AMWA : SMPTE anbefalt praksis RP 2079 standardiserer bruk av EIDR i MXF- mediebeholdere, i hjertet av profesjonelle arbeidsflyter, inkludert AMWA AS-03 og AS-11-spesifikasjoner. SMTPE anbefalt praksis 2021-5 tillater at en EIDR-identifikator bæres hvor som helst BXF brukes til utveksling av data mellom kringkastingssystemer.
  • European Broadcasting Union (EBU) : EBUCore er et vanlig kjernesett med beskrivende og tekniske metadata som beskriver mediaressurser (lyd, video, stillbilder, teksting, etc.). EBU- og EIDR-ansatte har produsert en kartlegging av EBUCore for basisposter til EIDR-rotobjekter: .. EIDR og EBU jobber sammen i SMPTE Core-arbeidsgruppen for å definere beskrivende metadata for SMPTE-baserte spesifikasjoner og arbeidsflyter. EIDR er en av standardene som støttes av EBU Core.
  • DVB : EIDR er referert i utkast til DVB-spesifikasjoner for følgeskjermer (tm-sm-css-0017r14).
  • MPEG : EIDR har blitt foreslått som en innholdsidentifikator i Multimedia Preservation Application Format som defineres for arkivbruk.
  • CableLabs (US) : EIDR er en del av CableLabs Metadata-standarden for distribusjon av video on demand-eiendeler. EIDR er en programidentifikator som kan være til stede i en SCTE-35 2013 segmenteringsbeskrivelse, en standard som brukes i IP-distribusjon over kabel. EIDR brukes også i Dynamic Ad Insertion (DAI) -produkter som bruker standardarkitekturen SCTE 130.
  • EIDR og alternative ID-er : For å fremme interoperabilitet av EIDR med et bredt utvalg av systemer, inkluderer EIDR et "AlternateID" -felt for å kryssreferanse eksisterende ID-systemer. Alternative ID-er kan for eksempel omfatte CRID ( RFC 4078 ), ISAN, ISRC, UPC eller URI , samt kommersielle ID-systemer som Ad-ID , Baseline, IMDb, etc. For tiden har omtrent halvparten av EIDR-poster en ID fra minst ett annet system.
  • Kartlegging fra andre standardmetadata og identifikatorer til EIDR : Andre metadata- og identifikatorsystemer kan tilordnes direkte til EIDR:
    • EN 15907 og EN 15744 : Disse standardene er i regi av Den europeiske standardiseringskomiteen CEN / TC 372 og filmstandards.org. Beste fremgangsmåter og kartlegginger er tilgjengelige for rotobjekter EN 15907 og EN 15744. EIDR jobber også med filmarkiver for å utvide interoperabiliteten med disse standardene til et mer detaljert detaljnivå, inkludert et prosjekt med British Film Institute (BFI) for å registrere sine EN 15907-baserte poster med EIDR.
    • International Standard Audiovisual Number (ISAN) : ISAN er mye brukt i rettighetsadministrasjons- og innsamlingssystemer. En fullstendig kartlegging av en ISAN-registrering til en EIDR-registrering er tilgjengelig. Det britiske audiovisuelle registreringsbyrået, et joint venture mellom EIDR og ISAN-UK, tilbyr felles registreringstjenester for begge identifikatorene. Forløpere til denne tjenesten har blitt brukt til å skaffe EIDR-ID-er og ISAN-er for kringkastingsinnhold fra ITV (et kommersielt TV-nettverk i Storbritannia).

EIDR-identifikatorer har funnet veien inn i et økende antall kommersielle applikasjoner. Følgende illustrerer noen av fordelene ved å bruke EIDR:

  • Warner Brothers-Xbox-integrasjon : EIDR ble brukt til å forbedre implementeringen av et EST-system ( Electronic Sell Through ) for å levere Warner Theatral-titler til Microsoft Xbox Live- kunder. Driften av en elektronisk butikkfront krever at flere grupper innen Warner Brothers koordinerer sine aktiviteter med Xbox-teamet. Den utgående siden av distribusjonskjeden inkluderte publisering av "Avails" (titler tilgjengelig for salg) og sporing av ordreoppfyllelse; den inngående siden inkluderte bestillinger. Andre funksjoner som rapporter spenner over begge sider av distribusjonskjeden. Det opprinnelige systemet krevde manuell inngrep og tilsyn, spesielt ved grenser mellom organisasjoner. Et eksempel på behovet for manuell behandling ville være å verifisere at riktig versjon av et aktivum (som kan variere avhengig av undertekster eller innhold) ble levert. I det nye systemet opprettet Warner Brothers en ny EIDR-ID for hver innholdsvariant, og disse ble brukt i alle påfølgende behandlingsstadier. Dette eliminerte tvetydighet og lette automatiseringen av de innkommende, utgående trinnene. En annen fordel var evnen til å lage rapporter i farta.
  • Swisscom EPG-integrasjon : Swisscom driver en betal-TV-tjeneste i Sveits. I 2014 fullførte den lanseringen av en elektronisk programmeringsguide (EPG) for sine kunder basert på EIDR. Dette er et ende-til-ende-system der EIDR-ID-er brukes til å representere eiendelene som vises i EPG. Et sentralt element i systemet var at EIDR ID-er også ble brukt i guide metadata levert til Swisscom av media-press.tv. Dette inkluderte å sette opp et system for tildeling av EIDR-ID til eiendeler som ikke allerede var i registret. En viktig fordel ved å bruke EIDR er ikke å måtte oversette mellom forskjellige identifikasjonssystemer.

Drift og administrasjon

EIDR administreres av den ideelle organisasjonen EIDR Association, som ble grunnlagt i oktober 2010 av MovieLabs , CableLabs , Comcast og Rovi . Medlemskapet har vokst jevnlig siden den gang: fra slutten av 2014 har det 79 medlemmer fordelt mellom bransjeansvarlige og bransjens bidragsytere. Den raskest voksende kategorien er ikke-amerikanske selskaper, som nå står for rundt 20% av medlemskapet. EIDR-foreningen driver to EIDR-registre: Produksjon og Sandkasse. Førstnevnte er det offisielle nettstedet, og det siste er reservert for test og utvikling. Begge systemene er tilgjengelige offentlig online, men innholdet i sandkassen er garantert ikke riktig, komplett eller til og med å referere til eiendeler som eksisterer. Bare medlemmer av EIDR-foreningen kan endre registeret.

Registrering

Registrering av nye eiendeler kan gjøres enkeltvis eller i bulk (opptil 100.000 eiendeler om gangen). I begge tilfeller omfatter arbeidsflyten en kombinasjon av automatiserte (for å utføre veldefinerte, men kjedelige oppgaver) og manuelle (der det er nødvendig med menneskelig skjønn) prosesser. Det er også iterativt, da den første matchingsprosessen kan identifisere en rekke hull og feil som må håndteres.

Registrering av nye eiendeler er en kompleks prosess som krever litt forberedelse, spesielt når det gjelder bulkinnlevering. De automatiserte prosessene vil sjekke syntaksen, sørge for at de grunnleggende metadataene blir levert, og at eventuelle avhengigheter (f.eks. Serieposter opprettet før konstituerende episoder) blir respektert. Manuelle trinn inkluderer å sørge for at de riktige partene er tilknyttet eiendelen. Et av de viktigste trinnene er å sikre at en ny eiendel ikke allerede eksisterer i registeret: dette blir dekket i neste avsnitt.

For å registrere et nytt aktivum, må en bruker være tilknyttet en part som har fått rollen "Registrant" av EIDR-operatøren. En registrant kan være en hovedagent, for eksempel et studio eller et kodingshus, men det kan også være en part som gjør bulkregistrering av bakkatalogartikler, eller en part som handler på vegne av noen andre. Det er også et krav at en registrant skal være EIDR-medlem. Generelt er eierskap til innhold, autorisasjon av metadata og registreringsegenskaper separate og ikke-relaterte begreper.

Deduplisering

Dette refererer til flagging av eiendeler som sendes til registeret som faller inn i en av følgende tre kategorier:

  • Kandidatelementet er unikt (med hensyn til eksisterende registermidler).
  • Kandidatelement er et duplikat av en eksisterende post.
  • Kandidataktiva har stor sannsynlighet for å være duplikat.

Denne vurderingen er basert på å anvende et (stort) sett med regler på kandidatens aktivum, noe som gir en numerisk score. Bucketing skjer som et resultat av å sammenligne poengsummen med to terskler:

  • Lav terskel : ethvert aktivum med en poengsum under denne verdien anses ikke å være et duplikat. Dette er det eneste tilfellet når et foreslått rekordtillegg eller -endring vil lykkes.
  • Høy terskel : ethvert aktivum med en score over denne verdien anses (nesten helt sikkert) å være et duplikat. Den foreslåtte posttillegget / endringen vil ikke fortsette, og en feilstatus vil bli returnert. Registranter vil vanligvis bruke den eksisterende ID-en for varen de prøvde å registrere, og kan legge til manglende informasjon og alternative ID-er til den eksisterende posten.

Eiendeler som faller mellom lav og høy terskel anses å ha stor mulighet for å være duplikat: den foreslåtte rekordtillegget / endringen vil ikke fortsette før manuelt gjennomgås av EIDR-operatørene.

Arkitektur

Komponentene i EIDR-systemet er vist nedenfor.

EIDR Registerarkitektur

De viktigste funksjonelle blokkene er som følger:

  • Core Registry : Denne modulen er en tilpasning og konfigurasjon av CNRI Digital Object Repository. Den utfører forskjellige funksjoner, inkludert registrering, generering av unike identifikatorer, indeksering, styring av objektlagring og tilgangskontroll.
  • Repository : Dette lagrer og gir tilgang til registrerte objekter; for EIDR er disse objektene samlinger av metadata, ikke selve medieverdiene. Metadataene inkluderer standard objektinformasjon, forhold og tilgangskontrollinnstillinger.
  • REST AP I: Et REST- grensesnitt som gir tilgang til hele settet med ikke-administrative registerfunksjoner. Tjenester kan ringe individuelle eller gruppesamtaler, som kan sendes synkront eller asynkront. En generell spørresyntaks muliggjør henting (og i noen tilfeller endring) av registerposter som tilfredsstiller et sett med kriterier spesifisert av innringeren.
    • EIDR SDK : Dette blir gitt til utviklere for å lette opprettelsen av tredjepartsapplikasjoner (vanligvis til støtte for en B2B eller intramural arbeidsflyt). Den består av en Java SDK, en .NET SDK og eksempler på programmer bygget på de to SDK-ene. Det anbefales å bruke SDK over direkte samtaler til REST API.
    • Kommandolinjeverktøy : Dette er enkle Java- og .NET-applikasjoner, bygget på SDK, som hver gir en enkelt funksjon, for eksempel løse, spørre, matche og registrere.
    • Web UI : et nettbasert brukergrensesnitt primært for søk, oppslag og surfing av objekthierarkiet. Den støtter også enkle registreringer.
  • DOI Proxy : Ved å bruke håndtaksprefikset videresender dette EIDR DOI-oppløsningsforespørsler til EIDR-registeret.
  • Håndteringssystem : Tilbyr distribuerte oppslagstjenester og oppløsningstjenester

Forhold til DOI og håndtakssystem

En EIDR ID er et spesialisert eksempel på en Digital Object Identifier (DOI), som igjen er bygget på toppen av Håndteringssystemet utviklet av Corporation for National Research Initiatives (CNRI). De EIDR-spesifikke aspektene ved de nedre lagene er beskrevet mer detaljert nedenfor.

Digital Object Identifier (EIDR Aspects)

En digital objektidentifikator, standardisert som ISO 26324, søker å identifisere et bredt spekter av digitale gjenstander, inkludert bøker, opptak, forskningsdata og annet digitalt innhold. Målet er ikke bare at IDene skal være unike, men vedvarende og uforanderlige. I motsetning til URL-er, forblir DOI-identifikatorer de samme selv om objektene flytter til et annet sted, eller blir eid av en annen organisasjon. Her er noen av egenskapene til DOI:

  • Den internasjonale DOI-stiftelsen (IDF) håndhever tidligere avtalte regler for de konstituerende registreringsbyråene (f.eks. EIDR) for å sikre kontinuitet. Spesielt hvis en RA avbryter driften, vil navnene den er vert overtatt av en annen RA.
  • IDF definerer regler som alle DOI-navn må følge (hvilke typer gjenstander som kan navngis av en bestemt RA)
  • DOI-systemet gir en datamodell, basert på en dataordbok, for å muliggjøre et strukturert middel for å uttrykke metadata (og inter-objekt-relasjoner).
  • DOI-systemet har sitt eget svært overflødige og distribuerte sett med håndtak og proxy-servere.
  • Alle DOI-prefikser er av skjemaet "10.NNNN" der 10 er en katalogindikator og "NNNN" er en registrantkode i området 1-65535 (f.eks. Er EIDR-innholdsposter 10.5240)

DOI-datamodellen gir midler til å knytte metadata til hvert objekt, samt policyer som styrer bruken av det. Med ordene i DOI-håndboken kan metadata omfatte "navn, identifikatorer, beskrivelser, typer, klassifiseringer, steder, tider, målinger, forhold og annen form for informasjon relatert til [et objekt]." Metadata flyter mellom følgende enheter:

  • Ressursleverandør : vanligvis eieren av medieandelen, som er ansvarlig for å legge inn metadata til systemet.
  • Registreringsbyrå : enhetene som fungerer som depot for eiendelene (og tilhørende metadata). Som nevnt støtter DOI en føderasjon av uavhengige RA, som hver er ansvarlig for et sett med eiendeler. EIDR er en slik RA. Andre inkluderer CrossRef for vitenskapelige artikler, DataCite for forskningsdata og OPOCE for offisielle publikasjoner fra EU.
  • Tjenestebruker : enhetene som gjør spørsmål til RAs, henter metadata knyttet til eiendeler. DOI-oppløsningsrammeverket er ansvarlig for å sende et spørsmål til riktig RA (tjenestebrukeren trenger ikke å vite dette).

For å fremme interoperabilitet mellom RA-er, har DOI konseptet metadata Kernel. Dette er et kjernesett av metadata som alle objekter som er lagret innenfor DOI-rammeverket, bør ha. Hele settet finner du i DOI-håndboken. Interoperabilitet er et stort tema som strekker seg utenfor EIDRs omfang, men følgende delmengde er spesielt relevant for EIDR-eiendeler:

  • referent : et objekt vedlikeholdt i DOI-systemet.
  • referentName : navnet på referenten (f.eks. tittelen på en film)
  • primaryReferentType : For EIDR inkluderer dette opprettelse (f.eks. underholdningsaktiva) og fest (f.eks. skaperen av dem).
  • StructuralType : Dette er gjensidig utelukkende kategorier som identifiserer formen på en eiendel. To spesielt relevante for EIDR-eiendeler er en abstraksjon (et objekt som en film som kan eksistere i flere former) og ytelse (en spesifikk forekomst av et objekt som Director's Cut).
  • principalAgent : for kreasjoner, enheten som er hovedansvarlig for dens eksistens.
  • registreringAuthorityCode : betegner byrået som utstedte DOI. Dette vil være EIDR RA for EIDR-eiendeler.

EIDR-metadata er tilgjengelig i standard DOI-kjernemetadataformat så vel som EIDR-spesifikke formater. DOI for DOI-metadataskjemaet er doi: 10.1000 / 276 .

Håndtakssystem (EIDR-aspekter)

DOI er i sin tur implementert på toppen av Handle System, en distribuert, svært skalerbar, navnoppløsnings tjeneste. Et håndtak er definert som:

<Handle> :: = <Handle Naming Authority> "/" <Handle Local Name>

Naming Authority er globalt unik og definerer både et administrativt rom og syntaksen til Handle Local Name. For EIDR i definisjonen ovenfor er "10.5240" EIDR Naming Authority, og er ansvarlig for å løse suffikset (inkludert at det samsvarer med den forventede syntaksen for et EIDR-aktivum). Utvalget av tillatte navngivningsmyndigheter er mer generelt enn det som brukes av DOI (eller EIDR).

Håndteringssystemets distribuerte natur gjør at hvert lokale navneområde kan være vert på flere geografisk distribuerte tjenestesider. Dette er en sammensatt modell der hvert lokale navneområde har full kontroll over plasseringen og driften av tjenestesidene. Videre kan hvert tjenesteside inneholde servere med flere oppløsninger: forespørsler rettet til et bestemt tjenesteside vil bli sendt jevnt over dets bestående servere.

Datamodellen til Håndtakssystemet er enkel, men fleksibel. Et vilkårlig antall verdier kan være knyttet til hvert håndtak. Over tid kan disse verdiene opprettes, endres og ødelegges. Hvert slikt datum har følgende attributter:

  • indeks : et usignert heltall som identifiserer en dataverdi fra de andre som kan eksistere for dette håndtaket.
  • type : en UTF-8 streng som identifiserer typen. Typesystemet er utvidbart og vanlige typer vedlikeholdes som håndtak i "0.TYPE" navngivningsmyndighet. Det er ingen begrensninger på opprettelsen av nye typer, selv om bruk av oppløsbare håndtak som typenavn anbefales. Vanlige typer inkluderer URL for en enkelt indireksjon, "10320 / loc" for et sett med kontekstbaserte oppløsningsalternativer, og forskjellige administrative typer for håndtering av systemadministrasjon, som alle er basert på håndtaksoppløsning.
  • data : selve verdien, representert som en sekvens av oktetter som tolkes i sammenheng med tilhørende type
  • tillatelse : tilgangsrettigheter til denne spesielle verdien. Merk at forskjellige dataverdier for et håndtak kan ha forskjellige tillatelser
  • TTL : et heltall som spesifiserer hvor lenge en verdi kan bufres
  • tidsstempel : et helt tall (uttrykt som millisekunder fra Unix-epoken) som registrerer sist gang verdien ble oppdatert
  • referanse : en liste over referanser til andre håndteringsverdier. Disse brukes vanligvis til å legge til legitimasjon (f.eks. En digital signatur).

Å få tilgang til håndteringssystemet skjer via en trådprotokoll definert i RFC 3652 ; EIDR-applikasjoner trenger ikke å være opptatt av dette på grunn av lagdeling av protokoller.

Se også

Videre lesning

  1. R. Kroon, R. Drewry, A. Leigh, S. McConnachie. "Innholdsidentifikasjon for audiovisuelle arkiver". International Association of Sound and Audiovisual Archives Journal, Summer 2015 (No. 45).
  2. R. Kroon. "Bringe orden til digitale identifikatorer". Media and Entertainment Journal Winter 2014-2015: 148–150.
  3. R. Drewry, D. Dulchinos. "Transforming Entertainment Through Technology". Media and Entertainment Journal Winter 2013-2014: 81–88.
  4. D. Agranoff, W. Michel, T. Wakai. "Strømlinjeformet integrering og administrasjon av metadata ved bruk av EIDR (Entertainment ID Registry)". SCTE Cable-Tec Expo 2012.

Eksterne linker

Referanser

  1. ^ ISO / IEC 7064: 2003 : Informasjonsteknologi - Sikkerhetsteknikker - Kontroller tegnsystemer. 2002
  2. ^ W3C XML-skjema del 2: Datatyper andre utgave
  3. ^ SMPTE RP 2079 . DOI-navn og EIDR-identifikasjonsrepresentasjon.
  4. ^ Advanced Media Workflow Association AS-03 MXF Program Delivery Specification .
  5. ^ Advanced Media Workflow Association AS-11 MFX for Contribution Specification .
  6. ^ SMPTE RP 2021-5: 2013 . Bruke Ad-ID og EIDR som alternative identifikatorer i SMPTE BXF og ATSC PMCP.
  7. ^ EBU TECH 3293 . EBU CORE METADATA SET Versjon 1.5.
  8. ^ DVB Document A167-2. Digital Video Broadcasting (DVB); Companion Screens og Streams; Del 2: Innholdsidentifisering og mediesynkronisering, juli 2014. s. 52.
  9. ^ ISO / IEC CD 23000-15 . Informasjonsteknologi - Multimedia applikasjonsformat (MPEG-A) - Del 15: Applikasjonsformat for multimedia bevaring.
  10. ^ MD-SP-AMIv3.0-I02-121210 Arkivert 2015-04-02 på Wayback Machine . CableLabs Asset Management Interface 3.0 Spesifikasjon.
  11. ^ ANSI / SCTE 35 2013 . Digital programinnsigelsesmelding for kabel.
  12. ^ SCTE 130-10 2013 . Digital programinnsetting - annonseringssystemgrensesnitt, del 10.
  13. ^ TC 372 Workshop Compendium . Hvordan EN 15744 og EN 15907 ble til.
  14. ^ Pressemelding . Swisscom fullfører den første europeiske distribusjonen av Entertainment ID Registry med media-press.tv.
  15. ^ ISO 26324: 2012 : Informasjon og dokumentasjon - Digital objektidentifikatorsystem, 2012.