Henting av musikkinformasjon - Music information retrieval

Musikkinformasjonsinnhenting ( MIR ) er den tverrfaglige vitenskapen om å hente informasjon fra musikk . MIR er et lite, men voksende forskningsfelt med mange virkelige applikasjoner. De som er involvert i MIR kan ha bakgrunn fra musikkvitenskap , psykoakustikk , psykologi , akademisk musikkstudie, signalbehandling , informatikk , maskinlæring , optisk musikkgjenkjenning, beregningsintelligens eller en kombinasjon av disse.

applikasjoner

MIR brukes av bedrifter og akademikere til å kategorisere, manipulere og til og med lage musikk.

Klassifisering av musikk

Et av de klassiske MIR-forskningstemaene er sjangerklassifisering, som kategoriserer musikkartikler i en av forhåndsdefinerte sjangere som klassisk, jazz, rock, etc. Humørklassifisering, artistklassifisering og musikkmerking er også populære temaer.

Anbefalersystemer

Flere anbefalingssystemer for musikk eksisterer allerede, men overraskende få er basert på MIR -teknikker, i stedet bruker de likhet mellom brukere eller møysommelig datasamling. Pandora bruker for eksempel eksperter til å merke musikken med spesielle kvaliteter som "kvinnelig sanger" eller "sterk basslinje". Mange andre systemer finner brukere hvis lyttehistorie er lik og foreslår uhørt musikk til brukerne fra sine respektive samlinger. MIR -teknikker for likhet i musikk begynner nå å inngå i slike systemer.

Musikkildeseparasjon og instrumentgjenkjenning

Musikkildeseparasjon handler om å skille originale signaler fra et blandet lydsignal. Instrumentgjenkjenning handler om å identifisere instrumentene som er involvert i musikk. Ulike MIR -systemer er utviklet som kan skille musikk til komponentsporene uten tilgang til hovedkopien. På denne måten kan f.eks. Karaoke -spor opprettes fra vanlige musikkspor, selv om prosessen ennå ikke er perfekt på grunn av at vokal opptar noe av det samme frekvensområdet som de andre instrumentene.

Automatisk musikkutskrift

Automatisk musikkutskrift er prosessen med å konvertere et lydopptak til symbolsk notasjon, for eksempel en partitur eller en MIDI -fil . Denne prosessen involverer flere lydanalyseoppgaver, som kan omfatte multi-pitch-deteksjon, startdeteksjon , varighetsestimering, instrumentidentifikasjon og ekstraksjon av harmonisk, rytmisk eller melodisk informasjon. Denne oppgaven blir vanskeligere med et større antall instrumenter og et større polyfonivå .

Musikkgenerasjon

Den automatiske generasjonen av musikk er et mål som mange MIR -forskere har. Det har blitt gjort forsøk med begrenset suksess når det gjelder menneskelig forståelse av resultatene.

Metoder som brukes

Datakilde

Poeng gir en klar og logisk beskrivelse av musikk du kan jobbe fra, men tilgang til noter, enten digitale eller på annen måte, er ofte upraktisk. MIDI -musikk har også blitt brukt av lignende årsaker, men noen data går tapt ved konvertering til MIDI fra et annet format, med mindre musikken ble skrevet med MIDI -standardene i tankene, noe som er sjelden. Digitale lydformater som WAV , mp3 og ogg brukes når selve lyden er en del av analysen. Tapende formater som mp3 og ogg fungerer godt med det menneskelige øret, men mangler kanskje viktige data for studier. I tillegg lager noen kodinger artefakter som kan være villedende for enhver automatisk analysator. Til tross for dette har allestedsnærværende mp3 betydd at mye forskning på feltet involverer disse som kildemateriale. Metadata som er utvunnet fra nettet blir i økende grad inkorporert i MIR for en mer avrundet forståelse av musikken innenfor dens kulturelle kontekst, og denne består nylig av analyse av sosiale tagger for musikk.

Funksjonsrepresentasjon

Analyse kan ofte kreve noen oppsummeringer, og for musikk (som med mange andre former for data) oppnås dette ved å trekke ut funksjoner , spesielt når selve lydinnholdet analyseres og maskinlæring skal brukes. Formålet er å redusere mengden data ned til et håndterbart sett med verdier, slik at læring kan utføres innen en rimelig tidsramme. Et vanlig trekk som er trukket ut er Mel-Frequency Cepstral Coefficient (MFCC) som er et mål på timbre av et musikkstykke. Andre funksjoner kan brukes for å representere nøkkelen , akkorder, harmonier, melodi , hovedtone , slag per minutt eller rytme i stykket. Det finnes en rekke tilgjengelige verktøy for ekstraksjon av lydfunksjoner tilgjengelig her

Statistikk og maskinlæring

  • Beregningsmetoder for klassifisering, gruppering og modellering- ekstraksjon av musikalske funksjoner for mono- og polyfonisk musikk, likhet og mønstermatching , gjenfinning
  • Formelle metoder og databaser-applikasjoner for automatisert musikkidentifisering og gjenkjenning, for eksempel partiturfølge , automatisk akkompagnement, ruting og filtrering for musikk- og musikkforespørsler, spørrespråk, standarder og andre metadata eller protokoller for musikkinformasjonshåndtering og -henting , multi-agent-systemer , distribuert søk)
  • Programvare for henting av musikkinformasjon- Semantisk web og musikalske digitale objekter, intelligente agenter, samarbeidsprogramvare, nettbasert søk og semantisk henting , søk ved nynning / Søk etter lyd , akustisk fingeravtrykk
  • Musikkanalyse og kunnskapsrepresentasjon - automatisk oppsummering, sitat, utdrag, nedgradering, transformasjon, formelle musikkmodeller, digitale partiturer og representasjoner, indeksering av musikk og metadata .

Andre problemer

  • Interaksjon mellom mennesker og datamaskiner og grensesnitt-multimodale grensesnitt, brukergrensesnitt og brukervennlighet , mobilapplikasjoner, brukeratferd
  • Musikk persepsjon, kognisjon, følelser, og følelser - musikk likhet beregninger , syntaktiske parametre, semantiske parametere, musikalske former, strukturer, stiler og musikk merknads metoder
  • Musikkarkiver, biblioteker og digitale samlinger - digitale musikkbiblioteker , offentlig tilgang til musikalske arkiver, referanser og forskningsdatabaser
  • Immaterielle rettigheter og musikk - nasjonale og internasjonale opphavsrettsspørsmål , digital rettighetsforvaltning , identifisering og sporbarhet
  • Sosiologi og økonomi i musikk - musikkindustri og bruk av MIR i produksjon, distribusjon, forbrukskjede, brukerprofilering, validering, brukerbehov og forventninger, evaluering av musikk -IR -systemer, byggesamlinger, eksperimentell design og beregninger

Akademisk aktivitet

Se også

Referanser

Eksterne linker

Eksempel på MIR -applikasjoner