AV1 - AV1

AOMedia Video 1
AV1 -logo 2018.svg
Internett -medietype video/AV1
Utviklet av Alliansen for åpne medier
Første utgivelse 28. mars 2018 ; 3 år siden ( 2018-03-28 )
Siste utgivelse
1.0.0 Errata 1
(8. januar 2019 ; for 2 år siden ) ( 2019-01-08 )
Type format Videokodingsformat
Inneholdt av
Forlenget fra
Utvidet til AVIF
Standard AOM AV1
Åpent format ? Ja
Nettsted aomedia .org /av1-features / Rediger dette på Wikidata

AOMedia Video 1 ( AV1 ) er et åpent , royaltyfritt videokodingsformat som opprinnelig er designet for videooverføringer over Internett. Det ble utviklet som en etterfølger til VP9 av Alliance for Open Media (AOMedia), et konsortium grunnlagt i 2015 som inkluderer halvlederfirmaer, video on demand -leverandører, produsenter av videoinnhold, programvareutviklingsselskaper og leverandører av nettlesere. AV1 bitstrøm spesifikasjonen inkluderer en referanse videokodek . I 2018 utførte Facebook testing av tilnærmede virkelige forhold, og AV1 referansekoder oppnådde henholdsvis 34%, 46,2% og 50,3% høyere datakomprimering enn libvpx-vp9, x264 høy profil og x264 hovedprofil.

Som VP9, ​​men i motsetning til H.264/AVC og HEVC , har AV1 en royalty-fri lisensjonsmodell som ikke hindrer adopsjon i åpen kildekode-prosjekter .

AV1 Image File Format ( AVIF ) er et bildefilformat som bruker AV1 -komprimeringsalgoritmer.

Historie

Alliansens motiver for å lage AV1 inkluderte de høye kostnadene og usikkerheten knyttet til patentlisensiering av HEVC , den MPEG -designede kodeken som forventes å lykkes med AVC . I tillegg kunngjorde Alliansens sju grunnleggende medlemmer-Amazon, Cisco, Google, Intel, Microsoft, Mozilla og Netflix-at det første fokuset for videoformatet ville være levering av webvideo av høy kvalitet. Den offisielle kunngjøringen om AV1 kom med pressemeldingen om dannelsen av Alliance for Open Media 1. september 2015. Bare 42 dager før, 21. juli 2015, ble HEVC Advances første lisensieringstilbud kunngjort som en økning i forhold til royaltyavgiftene til forgjengeren, AVC. I tillegg til de økte kostnadene, økte kompleksiteten i lisensieringsprosessen med HEVC. I motsetning til tidligere MPEG-standarder der teknologien i standarden kunne lisensieres fra en enkelt enhet, MPEG-LA , da HEVC-standarden var ferdig, hadde det blitt dannet to patentpuljer med et tredje basseng i horisonten. I tillegg nektet forskjellige patentinnehavere å lisensiere patenter via begge bassengene, noe som økte usikkerheten om HEVCs lisensiering. I følge Microsofts Ian LeGrow ble en åpen kildekode, royalty-fri teknologi sett på som den enkleste måten å eliminere denne usikkerheten rundt lisensiering.

Den negative effekten av patentlisensiering på gratis og åpen kildekode-programvare har også blitt nevnt som en årsak til opprettelsen av AV1. For eksempel vil det å bygge en H.264-implementering i Firefox forhindre at den distribueres gratis siden lisensavgifter må betales til MPEG-LA. Free Software Foundation Europe har hevdet at FRAND -patentlisensiering gjør at implementering av gratis programvare av standarder er umulig på grunn av ulike inkompatibiliteter med gratis programvarelisenser .

Mange av komponentene i AV1 -prosjektet ble hentet fra tidligere forskningsinnsats fra Alliance -medlemmer. Individuelle bidragsytere startet eksperimentelle teknologiplattformer flere år tidligere: Xiph's/Mozilla's Daala publiserte allerede kode i 2010, Googles eksperimentelle VP9 -utviklingsprosjekt VP10 ble kunngjort 12. september 2014, og Ciscos Thor ble publisert 11. august 2015. Bygger på kodebasen til VP9, AV1 inneholder flere teknikker, hvorav flere ble utviklet i disse eksperimentelle formatene. Den første versjonen 0.1.0 av AV1 referansekodek ble publisert 7. april 2016.

Selv om en frysing av myke funksjoner trådte i kraft i slutten av oktober 2017, fortsatte utviklingen av flere viktige funksjoner. En av disse pågående funksjonene, bitstrømformatet , ble anslått å bli frosset i januar 2018, men ble forsinket på grunn av uløste kritiske feil samt ytterligere endringer i transformasjoner, syntaks, forutsigelse av bevegelsesvektorer og fullføring av juridisk analyse . Alliansen kunngjorde utgivelsen av AV1 bitstream-spesifikasjonen 28. mars 2018, sammen med en referanse, programvarebasert enkoder og dekoder. 25. juni 2018 ble en validert versjon 1.0.0 av spesifikasjonen utgitt. 8. januar 2019 ble en validert versjon 1.0.0 med Errata 1 av spesifikasjonen utgitt.

Martin Smole fra AOM -medlem Bitmovin sa at beregningseffektiviteten til referansekoderen var den største gjenværende utfordringen etter at frysingen av bitstrømformatet var fullført. Mens det fortsatt arbeides med formatet, var ikke encoderen målrettet for produksjonsbruk og hastighetsoptimaliseringer ble ikke prioritert. Følgelig var den tidlige versjonen av AV1 størrelsesordener langsommere enn eksisterende HEVC -kodere. Mye av utviklingsarbeidet ble følgelig forskjøvet mot modning av referansekoder. I mars 2019 ble det rapportert at hastigheten til referansekoderen hadde forbedret seg sterkt og innenfor samme størrelsesorden som kodere for andre vanlige formater.

21. januar 2021 ble MIME -typen AV1 definert som video/AV1. Bruken av AV1 som bruker denne MIME-typen er begrenset til sanntids transportprotokollformål .

Hensikt

AV1 har som mål å være et videoformat for nettet som er både topp moderne og royaltyfritt . I følge Matt Frost, leder for strategi og partnerskap i Googles Chrome Media -team, er «oppdraget til Alliance for Open Media det samme som WebM -prosjektet».

En tilbakevendende bekymring for standardutvikling, ikke minst for royaltyfrie multimediaformater, er faren for et uhell å krenke patenter som skaperne og brukerne ikke visste om. Bekymringen har blitt reist angående AV1, og tidligere VP8 , VP9, ​​Theora og IVC . Problemet er ikke unikt for royalty-frie formater, men det truer unikt deres status som royalty-fri.

Patentlisensiering AV1, VP9 , Theora HEVC , AVC GIF , MP3 , MPEG-1 , MPEG-2 , MPEG-4 Del 2
Av kjente patentinnehavere Avgiftsfri Royalty bærer Patenter utløp
Av ukjente patentinnehavere Umulig å fastslå før formatet er gammelt
nok til at alle patenter ville ha utløpt
(minst 20 år i WTO -land )

For å oppfylle målet om å være royalty -fri, krever utviklingsprosessen at ingen funksjon kan adopteres før den har blitt bekreftet uavhengig av to separate parter for ikke å krenke patenter fra konkurrerende selskaper. I tilfeller der et alternativ til en patentbeskyttet teknikk ikke er tilgjengelig, har eiere av relevante patenter blitt invitert til å bli med i Alliansen (selv om de allerede var medlemmer av en annen patentpulje). For eksempel er Alliance-medlemmene Apple, Cisco, Google og Microsoft også lisensgivere i MPEG-LAs patentmasse for H.264. Som en ekstra beskyttelse for den royaltyfrie statusen til AV1, har Alliansen et lovlig forsvarskasse for å hjelpe mindre alliansemedlemmer eller AV1-rettighetshavere i tilfelle de blir saksøkt for påstått patentbrudd.

I henhold til patentregler vedtatt fra World Wide Web Consortium (W3C), lisensierer teknologibidragsytere sine AV1-tilkoblede patenter til hvem som helst, hvor som helst og når som helst basert på gjensidighet (dvs. så lenge brukeren ikke driver med patentforhandlinger). Som en defensiv betingelse mister alle som driver patentforhandlinger retten til patenter til alle patentinnehavere.

Denne behandlingen av immaterielle rettigheter ( IPR ), og dens absolutte prioritet under utvikling, er i strid med eksisterende MPEG -formater som AVC og HEVC. Disse ble utviklet under en IPR-engasjementspolicy av deres standardiseringsorganisasjoner, slik det er fastsatt i ITU-Ts definisjon av en åpen standard . Imidlertid har MPEGs styreleder hevdet at denne praksisen må endres, slik den er: EVC er også satt til å ha et royaltyfritt undersett, og vil ha byttbare funksjoner i bitstrømmen for å forsvare seg mot fremtidige IPR-trusler.

Opprettelsen av royalty-frie webstandarder har vært en lang uttalt jakt for industrien. I 2007 spesifiserte forslaget for HTML5 -video Theora som obligatorisk å implementere. Årsaken var at offentlig innhold skulle være kodet i fritt implementerbare formater, om det bare var som et "grunnlinjeformat", og at det ville være vanskelig å endre et slikt grunnformat senere på grunn av nettverkseffekter. Alliance for Open Media er en videreføring av Googles innsats med WebM-prosjektet, som fornyet den royaltyfrie konkurransen etter at Theora hadde blitt overgått av AVC. For selskaper som Mozilla som distribuerer gratis programvare, kan AVC være vanskelig å støtte, ettersom royalty per kopi lett er uholdbart gitt mangel på inntektsstrøm for å støtte disse betalingene i gratis programvare (se FRAND § Ekskludert kostnadsløs distribusjon ). Tilsvarende har HEVC ikke lykkes med å overbevise alle lisensgivere om å tillate et unntak for fritt distribuert programvare (se HEVC § Provision for costless software ).

Ytelsesmålene inkluderer "et steg opp fra VP9 og HEVC" i effektivitet for en lav økning i kompleksitet . NETVCs effektivitetsmål er 25% forbedring i forhold til HEVC. Den primære kompleksiteten er for programvaredekoding, siden maskinvarestøtte vil ta tid å nå brukere. Imidlertid er live encoding -ytelse også relevant for WebRTC , som er Ciscos agenda: Cisco er en produsent av videokonferanseutstyr , og Thor -bidragene deres tar sikte på "rimelig komprimering med bare moderat kompleksitet".

Funksjonsmessig er AV1 spesielt utviklet for sanntidsapplikasjoner (spesielt WebRTC) og høyere oppløsninger (bredere fargeSkalaer , høyere bildefrekvens , UHD ) enn typiske bruksscenarier av dagens generasjon (H.264) videoformater, der det forventes å oppnå sine største effektivitetsgevinster. Det er derfor planlagt å støtte fargeområdet fra ITU-R anbefaling BT.2020 og opptil 12 bits presisjon per fargekomponent. AV1 er først og fremst beregnet på tapskoding , selv om tapsfri komprimering også støttes.

Teknologi

AV1 er et tradisjonelt blokkbasert frekvensomformingsformat med nye teknikker. Basert på Googles VP9, ​​inneholder AV1 flere teknikker som hovedsakelig gir kodere flere kodingsalternativer for å muliggjøre bedre tilpasning til forskjellige typer inngang.

Behandler stadier av en AV1 -encoder med relevant teknologi knyttet til hvert trinn.
libaom
Aomenc-skjermbilde-2020-01-23.png
Utvikler (er) Alliansen for åpne medier
Stabil utgivelse
3.1.3 / 5. oktober 2021 ; 13 dager siden ( 2021-10-05 )
Skrevet inn C , montering
Tillatelse BSD 2-klausullisens ( gratis programvare )
Nettsted aomedia.googlesource.com/aom

Alliansen publiserte en referanseimplementering skrevet på C og monteringsspråk ( aomenc, aomdec) som gratis programvare under vilkårene i BSD 2-Clause License . Utvikling skjer offentlig og er åpen for bidrag, uavhengig av AOM -medlemskap.

Utviklingsprosessen var slik at kodingsverktøy ble lagt til referansekodebasen som eksperimenter , kontrollert av flagg som aktiverer eller deaktiverer dem på byggetid, for gjennomgang av andre gruppemedlemmer, så vel som spesialiserte team som hjalp til og sikret maskinvarevennlighet og samsvar med immaterielle rettigheter (TAPAS). Når funksjonen fikk litt støtte i fellesskapet, var eksperimentet aktivert som standard, og til slutt ble flagget fjernet når alle vurderingene ble bestått. Eksperimentnavn ble nedskrevet i konfigurasjonsskriptet og store bokstaver i betingede kompilasjonsflagg .

For bedre og mer pålitelig å støtte HDR og fargerom, kan tilsvarende metadata nå integreres i videobitstrømmen i stedet for å bli signalisert i beholderen.

Oppdeling

10 måter å dele opp kodende enheter på-i firkanter (rekursivt), rektangler eller blandinger derav ("T-formet").

Rammeinnhold skilles i tilstøtende blokker av samme størrelse, referert til som superblokker. I likhet med begrepet makroblokk er superblokker firkantede og kan enten være i størrelsen 128 × 128 eller 64 × 64 piksler. Superblokker kan deles i mindre blokker i henhold til forskjellige partisjoneringsmønstre. Fireveis delt mønster er det eneste mønsteret hvis partisjoner kan deles opp rekursivt. Dette gjør at superblokker kan deles inn i partisjoner så små som 4 × 4 piksler.

Diagram over AV1 -superblokkpartisjoneringen. Den viser hvordan 128 × 128 superblokker kan deles helt ned til 4 × 4 blokker. Som spesialtilfeller kan 128 × 128 og 8 × 8 blokker ikke bruke splittene 1: 4 og 4: 1, og 8 × 8 blokker kan ikke bruke "T" -formede splitt.

"T-formede" partisjoneringsmønstre introduseres, en funksjon utviklet for VP10, samt horisontale eller vertikale inndelinger i fire striper med 4: 1 og 1: 4 sideforhold. De tilgjengelige partisjoneringsmønstrene varierer i henhold til blokkstørrelsen, både 128 × 128 og 8 × 8 blokker kan ikke bruke 4: 1 og 1: 4 splitt. Videre kan 8 × 8 blokker ikke bruke "T" -formede splitter.

To separate spådommer kan nå brukes på romlig forskjellige deler av en blokk ved hjelp av en jevn, skrå overgangslinje ( kilepartisjonert prediksjon ). Dette muliggjør mer nøyaktig separering av objekter uten de tradisjonelle trappelinjene langs grensene til firkantede blokker.

Mer encoder -parallellitet er mulig takket være konfigurerbar prediksjonsavhengighet mellom fliserader ( ext_tile).

Prediksjon

AV1 utfører intern behandling med høyere presisjon (10 eller 12 bits per prøve), noe som fører til komprimeringsforbedring på grunn av mindre avrundingsfeil i referansebilder.

Spådommer kan kombineres på mer avanserte måter (enn et ensartet gjennomsnitt) i en blokk ( sammensatt prediksjon ), inkludert jevne og skarpe overgangsgradienter i forskjellige retninger ( kilepartisjonert prediksjon ) samt implisitte masker som er basert på forskjellen mellom to prediktorer. Dette gjør at kombinasjonen av enten to interspådommer eller en inter og en intra prediksjon kan brukes i samme blokk.

En ramme kan referere til 6 i stedet for 3 av de 8 tilgjengelige rammebufferne for tidsmessig (inter) prediksjon, samtidig som den gir mer fleksibilitet for bi-prediksjon ( ext_refs).

Forvrengt bevegelse sett fra forsiden av et tog.

Verktøyene Warped Motion ( warped_motion) og Global Motion ( global_motion) i AV1 tar sikte på å redusere overflødig informasjon i bevegelsesvektorer ved å gjenkjenne mønstre som stammer fra kamerabevegelse. De implementerer ideer som ble prøvd å bli utnyttet i foregående formater som f.eks. MPEG-4 ASP, om enn med en ny tilnærming som fungerer i tre dimensjoner. Det kan være et sett med vridningsparametere for en hel ramme som tilbys i bitstrømmen, eller blokker kan bruke et sett med implisitte lokale parametere som blir beregnet basert på omkringliggende blokker.

Bryterrammer (S-frame) er en ny type mellomrammer som kan forutses ved å bruke allerede dekodede referanserammer fra en høyere oppløsning av den samme videoen for å bytte til en lavere oppløsning uten at det er nødvendig med full nøkkelramme i begynnelsen av et videosegment i brukstilfellet for adaptiv bitrate -streaming .

Intra prediksjon

Intra prediksjon består i å forutsi pikslene til gitte blokker bare ved å bruke informasjon tilgjengelig i den gjeldende rammen. Oftest er intreprediksjoner bygget fra nabopikslene over og til venstre for den forutsagte blokken. DC -prediktoren bygger en prediksjon ved å gjennomsnitte pikslene over og til venstre for blokken.

Retningsprediktorer ekstrapolerer disse nabopikslene i henhold til en spesifisert vinkel. I AV1 kan 8 hovedretningsmoduser velges. Disse modusene starter i en vinkel på 45 grader og øker med en trinnstørrelse på 22,5 grader opp til 203 grader. Videre, for hver retningsmodus, kan seks forskyvninger på 3 grader signaliseres for større blokker, tre over hovedvinkelen og tre under den, noe som resulterer i totalt 56 vinkler ( ext_intra).

"TrueMotion" -prediktoren ble erstattet med en Paeth- prediktor som ser på forskjellen fra den kjente piksel i hjørnet over til venstre til pikslen rett over og direkte til venstre for den nye og deretter velger den som ligger i retning av den mindre gradient som prediktor. En palettforutsigelse er tilgjengelig for blokker med svært få (opptil 8, dominerende) farger som i noe dataskjerminnhold. Korrelasjoner mellom lysstyrken og fargeinformasjonen kan nå utnyttes med en prediktor for chromablokker som er basert på prøver fra luma -planet ( cfl). For å redusere synlige grenser langs grenser til mellom forutsagte blokker, kan en teknikk som kalles overlappet blokkbevegelseskompensasjon (OBMC) brukes. Dette innebærer å utvide en blokkstørrelse slik at den overlapper med tilstøtende blokker med 2 til 32 piksler, og blander de overlappende delene sammen.

Datatransformasjon

For å transformere feilen som gjenstår etter prediksjon til frekvensdomenet, kan AV1 -kodere bruke firkantede, 2: 1/1: 2 og 4: 1/1: 4 rektangulære DCTer ( rect_tx), samt en asymmetrisk sommertid for blokker der toppen og/eller venstre kant forventes å ha lavere feil takket være prediksjon fra piksler i nærheten, eller velge å ikke gjøre noen transformasjon (identitetstransform).

Den kan kombinere to endimensjonale transformasjoner for å bruke forskjellige transformasjoner for den horisontale og vertikale dimensjonen ( ext_tx).

Kvantisering

AV1 har nye optimaliserte kvantiseringsmatriser ( aom_qm). De åtte settene med kvantiseringsparametere som kan velges og signaliseres for hver ramme, har nå individuelle parametere for de to kromplanene og kan bruke romlig prediksjon. På hver ny superblokk kan kvantiseringsparametrene justeres ved å signalisere en forskyvning.

Filtre

For in-loop-filtreringstrinnet har integrasjonen av Thors begrensede lavpassfilter og Daalas retningsbestemte deringing-filter vært fruktbart: Det kombinerte Constrained Directional Enhancement Filter ( cdef) overgår resultatene av å bruke de originale filtrene separat eller sammen.

Det er et kantrettet, betinget erstatningsfilter som jevner ut blokker med konfigurerbar (signalisert) styrke omtrent i retning av den dominerende kanten for å eliminere ringeartefakter .

Det er også sløyfe-restaureringsfilter ( loop_restoration) basert på Wiener-filteret og selvstyrte restaureringsfiltre for å fjerne uskarpe artefakter på grunn av blokkbehandling.

Filmkornsyntese ( film_grain) forbedrer koding av bråkete signaler ved hjelp av en parametrisk videokodingstilnærming. På grunn av tilfeldigheten som er forbundet med filmkornstøy, er denne signalkomponenten tradisjonelt enten veldig dyr å kode eller utsatt for å bli skadet eller gå tapt, og muligens etterlate alvorlige kodende artefakter som rester. Dette verktøyet omgår disse problemene ved bruk av analyse og syntese, og erstatter deler av signalet med en visuelt lignende syntetisk tekstur som utelukkende er basert på subjektivt visuelt inntrykk i stedet for objektiv likhet. Den fjerner kornkomponenten fra signalet, analyserer dens ikke-tilfeldige egenskaper og overfører i stedet bare beskrivende parametere til dekoderen, som legger tilbake et syntetisk, pseudoslutt støysignal som er formet etter den originale komponenten. Det er den visuelle ekvivalenten til teknikken Perceptual Noise Substitution som brukes i lydkodekene AC3, AAC, Vorbis og Opus.

Entropi -koding

Daalas entropykoder ( daala_ec), en ikke-binær aritmetisk koder , ble valgt for å erstatte VP9s binære entropikoder. Bruken av ikke-binær aritmetisk koding hjelper til med å unngå patenter, men legger også til parallellitet på bitnivå til en ellers seriell prosess, noe som reduserer kravene til klokkefrekvens på maskinvareimplementeringer. Dette er å si at effektiviteten til moderne binær aritmetisk koding som CABAC nærmer seg ved hjelp av et større alfabet enn binært, derav større hastighet, som i Huffman -koden (men ikke så enkel og rask som Huffman -koden). AV1 fikk også muligheten til å tilpasse symbolsannsynlighetene i den aritmetiske koderen per kodet symbol i stedet for per ramme ( ec_adapt).

Skalerbar videokoding

Av stor betydning for videokonferanser er skalerbar videokoding en generell teknikk, ikke unik for AV1, for å begrense og strukturere videorammeavhengigheter slik at en eller flere lavere bithastighetsvideostrømmer kan trekkes ut fra en høyere bithastighetsstrøm med bedre kvalitet. Dette skiller seg fra adaptiv bithastighetsstrømming ved at en viss komprimeringseffektivitet i hver høyere bithastighetstilpasning blir gitt opp til fordel for den generelle strømmen. Kodingsprosessen er også mindre overflødig og krevende.

AV1 har bestemmelser for tidsmessig og romlig skalerbarhet. Dette er å si at både framerate og oppløsning er brukbare måter å definere en lavere bitrate -understrøm på.

Kvalitet og effektivitet

En første sammenligning fra begynnelsen av juni 2016 fant AV1 omtrent på nivå med HEVC, det samme gjorde en som brukte kode fra slutten av januar 2017.

I april 2017, ved hjelp av de 8 aktiverte eksperimentelle funksjonene den gangen (på 77 totalt), var Bitmovin i stand til å demonstrere gunstige objektive beregninger , så vel som visuelle resultater, sammenlignet med HEVC på Sintel og Tears of Steel kortfilmer. En oppfølgingssammenligning av Jan Ozer fra Streaming Media Magazine bekreftet dette, og konkluderte med at "AV1 er minst like bra som HEVC nå". Ozer bemerket at hans og Bitmovins resultater motsier en sammenligning fra Fraunhofer Institute for Telecommunications fra slutten av 2016 som hadde funnet AV1 65,7% mindre effektiv enn HEVC, og underpresterte selv H.264/AVC som de konkluderte med å være 10,5% mer effektive. Ozer begrunnet denne uoverensstemmelsen med å ha brukt kodingsparametere godkjent av hver enkelt giverleverandør, i tillegg til å ha flere funksjoner i den nyere AV1 -koderen. Dekodingsytelsen var på omtrent halvparten av hastigheten til VP9 i henhold til interne målinger fra 2017.

Tester fra Netflix i 2017, basert på målinger med PSNR og VMAF ved 720p, viste at AV1 var omtrent 25% mer effektiv enn VP9 (libvpx). Tester fra Facebook utført i 2018, basert på PSNR , viste at AV1 referansekoder var i stand til å oppnå henholdsvis 34%, 46,2% og 50,3% høyere datakomprimering enn libvpx-vp9, x264 høy profil og x264 hovedprofil.

Tester fra Moscow State University i 2017 fant at VP9 krevde 31% og HEVC 22% mer bithastighet enn AV1 for å oppnå lignende kvalitetsnivåer. AV1 -koderen opererte med hastigheten "2500–3500 ganger lavere enn konkurrentene" på grunn av mangel på optimalisering (som ikke var tilgjengelig på det tidspunktet).

Tester fra University of Waterloo i 2020 fant at ved bruk av en gjennomsnittlig opinion score (MOS) for 2160p (4K) video hadde AV1 bithastighetsbesparelse på 9,5% sammenlignet med HEVC og 16,4% sammenlignet med VP9. De konkluderte også med at på tidspunktet for studien ved 2160p tok AV1 -videokodene i gjennomsnitt 590 × lengre tid sammenlignet med koding med AVC; mens HEVC tok gjennomsnittlig 4,2 × lengre tid og VP9 i gjennomsnitt 5,2 × lengre tid enn AVC.

Den siste enkodersammenligningen av Streaming Media Magazine fra september 2020, som brukte moderate kodingshastigheter, VMAF og et mangfoldig sett med korte klipp, indikerte at libaom- og SVT-AV1-koderne tok omtrent dobbelt så lang tid å kode som x265 i sin "veryslow" forhåndsinnstilte mens den bruker 15-20% mindre bithastighet, eller omtrent 45% mindre bithastighet enn x264 veryslow . Den best-in-test AV1-encoderen, Visionular's Aurora1, i sin "tregere" forhåndsinnstilling, var så rask som x265 veryslow samtidig som den sparte 50% bitrate over x264 veryslow .

Profiler og nivåer

Profiler

AV1 definerer tre profiler for dekodere som er Main , High og Professional . Hovedprofilen gir mulighet for en bitdybde på 8- eller 10-bits per prøve med 4: 0: 0 (gråtoner) og 4: 2: 0 (kvartal) kromprøvetaking . High profile legger videre til støtte for 4: 4: 4 chroma sampling (ingen undersampling). Profesjonell profil utvider mulighetene til full støtte for 4: 0: 0, 4: 2: 0, 4: 2: 2 (halv) og 4: 4: 4 chroma undersampling med 8, 10 og 12 biters fargedybder.

Funksjonssammenligning mellom AV1 -profiler
Hoved (0) Høy (1) Profesjonell (2)
Litt dybde 8 eller 10-bit 8 eller 10-bit 8, 10 og 12 bit
Chroma undersampling 4: 0: 0 Ja Ja Ja
4: 2: 0 Ja Ja Ja
4: 2: 2 Nei Nei Ja
4: 4: 4 Nei Ja Ja

Nivåer

AV1 definerer nivåer for dekodere med maksimale variabler for nivåer fra 2,0 til 6,3. Nivåene som kan implementeres avhenger av maskinvarekapasiteten.

Eksempeloppløsninger vil være 426 × 240@30  fps for nivå 2.0, 854 × 480@30  fps for nivå 3.0, 1920 × 1080@30  fps for nivå 4.0, 3840 × 2160@60  fps for nivå 5.1, 3840 × 2160@120  fps for nivå 5.2 og 7680 × 4320@120  fps for nivå 6.2. Nivå 7 er ikke definert ennå.

seq_level_idx Nivå MaxPicSize
(prøver)
MaxHSize
(prøver)
MaxVSize
(prøver)
MaxDisplayRate
(Hz)
MaxDecodeRate
(Hz)
MaxHeader
Rate (Hz)
MainMbps
(Mbit/s)
HøyMbps
(Mbit/s)
Min komp. Grunnlag Max Fliser Max Tile Cols Eksempel
0 2.0 147456 2048 1152 4.423.680 5.529.600 150 1.5 - 2 8 4 426 × 240@30 b / s
1 2.1 278784 2816 1584 8 363 520 10 454 400 150 3.0 - 2 8 4 640 × 360@30 b / s
4 3.0 665856 4352 2448 19 975 680 24.969.600 150 6.0 - 2 16 6 854 × 480@30 b / s
5 3.1 1065024 5504 3096 31.950.720 39 938 400 150 10,0 - 2 16 6 1280 × 720@30fps
8 4.0 2359296 6144 3456 70.778.880 77 856 768 300 12.0 30.0 4 32 8 1920 × 1080@30fps
9 4.1 2359296 6144 3456 141 557 760 155.713.536 300 20,0 50,0 4 32 8 1920 × 1080@60fps
12 5.0 8912896 8192 4352 267 386 880 273.715.200 300 30.0 100,0 6 64 8 3840 × 2160@30fps
1. 3 5.1 8912896 8192 4352 534.773.760 547.430.400 300 40,0 160,0 8 64 8 3840 × 2160@60fps
14 5.2 8912896 8192 4352 1.069.547.520 1.094.860.800 300 60,0 240,0 8 64 8 3840 × 2160@120fps
15 5.3 8912896 8192 4352 1.069.547.520 1.176.502.272 300 60,0 240,0 8 64 8 3840 × 2160@120fps
16 6.0 35651584 16384 8704 1.069.547.520 1.176.502.272 300 60,0 240,0 8 128 16 7680 × 4320@30fps
17 6.1 35651584 16384 8704 2.139.095.040 2.189.721.600 300 100,0 480,0 8 128 16 7680 × 4320@60fps
18 6.2 35651584 16384 8704 4.278.190.080 4.379.443.200 300 160,0 800,0 8 128 16 7680 × 4320@120fps
19 6.3 35651584 16384 8704 4.278.190.080 4.706.009.088 300 160,0 800,0 8 128 16 7680 × 4320@120fps

Containerformater som støttes

Standardisert

  • ISO Base Media File Format : ISOBMFF containerization spec av AOMedia var den første som ble fullført og den første som fikk adopsjon. Dette er formatet som brukes av YouTube.
  • Matroska : versjon 1 av Matroska containerization spec ble publisert i slutten av 2018.

Uferdige standarder

  • MPEG Transport Stream (MPEG TS)
  • Transportprotokoll i sanntid : en foreløpig spesifikasjon for RTP-pakking av AOMedia definerer overføring av AV1 OBUer direkte som RTP-nyttelast. Den definerer en RTP -headerutvidelse som inneholder informasjon om videorammer og deres avhengigheter, noe som er generelt nyttig for § skalerbar videokoding . Transport av rå videodata skiller seg også fra for eksempel MPEG TS over RTP ved at andre strømmer, for eksempel lyd, må transporteres eksternt.

Ikke standardisert

  • WebM: Som et spørsmål om formalitet har AV1 ikke blitt sanksjonert i undergruppen til Matroska kjent som WebM i slutten av 2019.
  • On2 IVF : dette formatet ble arvet fra den første offentlige utgivelsen av VP8, hvor det fungerte som en enkel utviklingsbeholder. rav1e støtter også dette formatet.
  • Pre-standard WebM: Libaom inneholdt tidlig støtte for WebM før Matroska containerisering ble spesifisert; dette har siden blitt endret for å være i samsvar med Matroska -spesifikasjonen.

Adopsjon

Innholdsleverandører

I oktober 2016 uttalte Netflix at de forventet å bli en tidlig adopterer av AV1. Februar 2020 begynte Netflix å bruke AV1 for å streame utvalgte titler på Android, noe som ga 20% forbedret komprimeringseffektivitet over sine VP9 -strømmer.

I 2018 begynte YouTube å rulle ut AV1, og begynte med spillelisten AV1 Beta Launch . I følge beskrivelsen er videoene (til å begynne med) kodet med høy bithastighet for å teste dekodingsytelse, og YouTube har "ambisiøse mål" for å rulle ut AV1. YouTube for Android TV støtter avspilling av videoer kodet i AV1 på kompatible plattformer fra versjon 2.10.13, utgitt tidlig i 2020.

I februar 2019 sa Facebook, etter sine egne positive testresultater, at de gradvis ville lansere AV1 så snart nettleserstøtte dukker opp, med sine mest populære videoer.

I juni 2019 var Vimeos videoer i kanalen "Personal plukker" tilgjengelige i AV1. Vimeo bruker og bidrar til Mozillas Rav1e -encoder og forventer, med ytterligere encoder -forbedringer, til slutt å gi AV1 -støtte for alle videoer lastet opp til Vimeo, samt selskapets "Live" -tilbud.

April 2020 kunngjorde iQIYI støtte for AV1 for brukere på PC -nettlesere og Android -enheter, ifølge kunngjøringen, som det første kinesiske videostreamingsnettstedet som tok i bruk AV1 -formatet.

Twitch planlegger å lansere AV1 for sitt mest populære innhold i 2022 eller 2023, med universell støtte som forventes å komme i 2024 eller 2025.

Programvareimplementeringer

  • Libaom er referanseimplementering . Den inkluderer en encoder (aomenc) og en dekoder (aomdec). Som den tidligere forskningskodeken har den fordelen av å bli gjort for å med rette demonstrere effektiv bruk av hver funksjon, men til den generelle kostnaden for kodingshastighet. Ved frysing av funksjoner hadde encoderen blitt problematisk sakte, men hastighetsoptimaliseringer med ubetydelig effekteffekt har fortsatt å bli utført også etter det.
  • rav1e er en encoder skrevet i Rust og montering. rav1e tar den motsatte utviklingsmessige tilnærmingen til Aomenc: start som den enkleste (derfor raskeste) tilpassede encoderen, og forbedr deretter effektiviteten over tid mens du forblir rask.
  • SVT-AV1 inkluderer en åpen kildekoder og dekoder som først ble utgitt av Intel i februar 2019 og som er spesielt designet for bruk på datasenter-servere basert på Intel Xeon- prosessorer. Netflix samarbeider med Intel om SVT-AV1.
  • dav1d er en dekoder skrevet i C99 og montering fokusert på hastighet og bærbarhet. Den første offisielle versjonen (0.1) ble utgitt i desember 2018. Versjon 0.2 ble utgitt i mars 2019, med brukere som kunne "trygt bruke dekoderen på alle plattformer, med utmerket ytelse", ifølge utviklerne. Versjon 0.3 ble kunngjort i mai 2019 med ytterligere optimaliseringer som demonstrerte ytelse 2 til 5 ganger raskere enn aomdec .; versjon 0.5 ble utgitt i oktober 2019. Firefox 67 byttet fra Libaom til dav1d som standard dekoder i mai 2019. I 2019 ble dav1d v0.5 vurdert som den beste dekoderen sammenlignet med libgav1 og libaom. dav1d 0.9.0 ble utgitt 17. mai 2021. dav1d 0.9.2 ble utgitt 3. september 2021.
  • Cisco AV1 er en proprietær levende giver som Cisco utviklet for sine WebEx telekonferanse produkter. Koderen er optimalisert for latens og begrensningen for å ha et "brukbart CPU -fotavtrykk", som med en "varebærbar datamaskin". Cisco understreket at ved sitt driftspunkt - høy hastighet, lav latens - utelukker det store verktøysettet til AV1 ikke en lav kodingskompleksitet. Tilgjengeligheten av verktøy for skjerminnhold og skalerbarhet i alle profiler gjorde dem i stand til å finne gode kompromisser til hastighet, enda bedre enn med HEVC. Sammenlignet med deres tidligere distribuerte H.264 -koder, var et spesielt forbedringsområde innen skjermdeling med høy oppløsning.
  • libgav1 er en dekoder skrevet i C ++ 11 utgitt av Google.

Flere andre parter har kunngjort å jobbe med kodere, inkludert EVE for AV1 (i betatesting), NGCodec, Socionext, Aurora og MilliCast.

Programvarestøtte

Nettlesere

Videospillere

Kodere

  • FFmpeg (siden versjon 4.0, 20. april 2018)
  • HandBrake (siden versjon 1.3.0, 9. november 2019; støtte for dekoding)
  • Bitmovin Encoding (siden versjon 1.50.0, 4. juli 2018)

Videoredigerere

Andre

  • GStreamer (siden versjon 1.14)
  • MKVToolNix (adopsjon av siste av1-in-mkv-spesifikasjon siden versjon 28)
  • MediaInfo (siden versjon 18.03)
  • Elecard StreamEye Studio (verktøy for analyse av videokvalitet)
  • Google Duo (siden april 2020)
  • Adobe Audition (støtte for dekoding, forhåndsvisningsvideo)
  • Avidemux (siden versjon 2.76, 7. juli 2020; dekodingsstøtte)

Støtte for operativsystem

AV1 -støtte fra forskjellige operativsystemer
Microsoft Windows Mac os BSD / Linux Chrome OS Android iOS
Codec -støtte Ikke aktivert som standard, krever tillegg Nei Ja Ja Ja Nei
Beholderstøtte ISO
-base mediefilformat (.mp4) WebM (.webm)
Matroska (.mkv)
Nei ISO
-base mediefilformat (.mp4) WebM (.webm)
Matroska (.mkv)
ISO
-base mediefilformat (.mp4) WebM (.webm)
Matroska (.mkv)
Nei
Merknader - Støtte introdusert i Windows 10 oktober 2018 oppdatering (1809) med AV1 Video Extension -tillegg

- Støtte for maskinvareakselerasjon lagt til i Windows 10 November 2019 Update (1909)

- Støttes i Universal Windows Platform -apper som Microsoft Edge og Films & TV

Ikke støttet fra macOS Catalina Støtter dekoding, fra Chrome OS 70 og fremover Støttes siden Android 10 Ikke støttet fra iOS 14

Maskinvare

Sammenligning av AV1 -maskinvare
Produkt Funksjon
(D = Dekode, E = Kode)
Profil Gjennomstrømning
(enkelt kjerne)
Gjennomstrømning
(maks)
Ref
Allegro AL-E195 E Hoved (0) og
profesjonell (1)
AL-E210 E Hoved (0) 4K 30fps 10-bit ?
AMD RDNA 2 D Hoved (0) 8K
Amlogic S905X4 D 4K 120 fps
S908X D 8K 60fps
S805X2 D 1080p
Amphion CS8142 D 4K 60fps
Broadcom BCM7218X D 4K
Chips & Media WAVE510A
WAVE627
D
E
Hoved (0) 4K 60fps 4K 120 fps
Dwango E 720p 30 bps
Intel Tiger Lake
Rocket Lake
Alder Lake
D Hoved (0) 8K 10-bit
MediaTek Dimensitet 900
Dimensjon 1000
Dimensjon 1100
Dimensitet 1200
D 4K 60fps 4K 60fps
MT9638 D 4K 60fps 10-bit 4K 60fps 10-bit
Nvidia GeForce 30 D Hoved (0) 8K 60fps 10-bit
Realtek RTD1311 D 4K
RTD2893 D 8K
Rockchip RK3588 D 4K 60fps 10-bit
Samsung Exynos 2100 D

Flere Alliance -medlemmer demonstrerte AV1 -aktiverte produkter på IBC 2018, inkludert Socionext maskinvareakselerert encoder. Ifølge Socionext er kodingsakseleratoren FPGA -basert og kan kjøres på en Amazon EC2 F1 -skyforekomst, hvor den kjører 10 ganger raskere enn eksisterende programvarekodere.

I følge Mukund Srinivasan, forretningsdirektør for AOM-medlem Ittiam , vil tidlig maskinvarestøtte bli dominert av programvare som kjører på ikke-CPU-maskinvare (for eksempel GPGPU , DSP eller shader- programmer, som tilfellet er med noen VP9 maskinvareimplementeringer ), som løst -funksjonell maskinvare vil ta 12–18 måneder etter bitstream -fryse til chips er tilgjengelige, pluss 6 måneder før produkter basert på disse chipsene kommer på markedet. Bitstrømmen ble endelig frosset 28. mars 2018, noe som betyr at chips kan være tilgjengelige en gang mellom mars og august 2019. I følge prognosen ovenfor kan produkter basert på chips deretter være på markedet i slutten av 2019 eller begynnelsen av 2020.

  • Januar 2019 kunngjorde NGCodec AV1 -støtte for NGCodec akselerert med Xilinx FPGAer .
  • April 2019 kunngjorde Allegro DVT sin AL-E210 multi-format video encoder hardware IP, den første offentlig annonserte hardware AV1 encoder.
  • April 2019 kunngjorde Rockchip sin RK3588 SoC som har AV1-maskinvare som dekoder opptil 4K 60fps ved 10-biters fargedybde.
  • Mai 2019 kunngjorde Amphion en videodekoder med AV1 -støtte opp til 4K 60fps 28. mai 2019 kunngjorde Realtek RTD2893, sin første integrerte krets med AV1 -dekoding, opptil 8K.
  • Juni 2019 kunngjorde Realtek RTD1311 SoC for set-top-bokser med en integrert AV1-dekoder.
  • 20. oktober 2019 viste et veikart fra Amlogic tre set-top-boks SoCer som er i stand til å dekode AV1-innhold, S805X2, S905X4 og S908X. S905X4 ble brukt i SDMC DV8919 innen desember.
  • Oktober 2019 kunngjorde Chips & Media WAVE510A VPU som støtter dekoding AV1 på opptil 4Kp120.
  • November 2019 kunngjorde MediaTek verdens første smarttelefon SoC med en integrert AV1 -dekoder. Dimensity 1000 er i stand til å dekode AV1 -innhold opptil 4K 60fps.
  • Januar 2020 kunngjorde LG Electronics at 8K -TV -ene fra 2020, som er basert på α9 Gen 3 -prosessoren, støtter AV1.
  • På CES 2020 kunngjorde Samsung at 8K QLED -TV -er fra 2020, med Samsungs "Quantum Processor 8K SoC", er i stand til å dekode AV1.
  • August 2020 kunngjorde Intel at deres Intel Xe-LP GPU i Tiger Lake vil være deres første produkt som inkluderer AV1 maskinvaredekoding med fast funksjon.
  • September 2020 kunngjorde Nvidia at deres Nvidia GeForce RTX 30-serie GPUer vil støtte AV1 maskinvaredekoding med fast funksjon.
  • September 2020 lanserte Intel offisielt Tiger Lake 11. generasjons CPUer med AV1 fastfunksjonell maskinvaredekoding.
  • September 2020 fusjonerte AMD oppdateringer til amdgpu -driverne for Linux, noe som gir støtte for AV1 -dekodingsstøtte på RDNA2 GPUer.
  • 28. september 2020 Roku uthvilt Roku Ultra inkludert AV1 støtte.
  • 30. september 2020 ga Intel ut versjon 20.3.0 for Intel Media Driver som la til støtte for AV1 -dekoding på Linux.
  • Oktober 2020 bekreftet Microsoft støtte for AV1-maskinvaredekoding på Xe-LP (Gen12), Ampere og RDNA2 med et blogginnlegg.
  • 16. mars 2021 lanserte Intel offisielt Rocket Lake 11. generasjons CPUer med AV1 fastfunksjonell maskinvaredekoding.

Patentkrav

Sisvel, et selskap i Luxembourg, har dannet et patentmasse og selger en patentlisens for AV1. Bassenget ble kunngjort tidlig i 2019, men en liste over påståtte patenter ble først publisert 10. mars 2020. Denne listen inneholder over 1050 patenter. Innholdet i patentkravene gjenstår å utfordre.

Sisvels priser er 0,32 euro for displayenheter og 0,11 euro for enheter uten visning som bruker AV1. Sisvel har uttalt at de ikke vil søke innholdsavgifter, men lisensen gir ingen unntak for programvare.

Fra mars 2020 har Alliance for Open Media ikke svart på listen over patentkrav. Uttalelsen deres etter Sisvels første kunngjøring gjentok forpliktelsen til deres royaltyfrie patentlisens og nevnte "AOMedia patentforsvarsprogram for å beskytte AV1-økosystemdeltakere i tilfelle patentkrav", men nevnte ikke Sisvel-kravet ved navn.

Google er klar over patentmassen, men planlegger ikke å endre sine nåværende eller kommende bruksplaner for AV1.

AV1 Bildefilformat (AVIF)

AV1 Image File Format ( AVIF ) ( / ə v jeg f / ) er en bildefil spesifikasjon for lagring av bilder eller bildesekvenser komprimert med AV1 i HEIF filformat. Den konkurrerer med HEIC som bruker det samme beholderformatet, bygget på ISOBMFF , men HEVC for komprimering. Versjon 1.0.0 av AVIF -spesifikasjonen ble ferdigstilt i februar 2019.

AVIF støtter funksjoner som:

libavif
AV1Fenc eksempel screenshot.png
Utvikler (er) Alliansen for åpne medier
Stabil utgivelse
0.9.2 / 23. juni 2021 ; 3 måneder siden ( 2021-06-23 )
Skrevet inn C , montering
Tillatelse BSD 2-klausullisens ( gratis programvare )
Nettsted github.com/AOMediaCodec/libavif

AVIF -støtte

14. desember 2018 publiserte Netflix de første .avif -prøvebildene. I november 2020 ble HDR -prøvebilder med PQ -overføringsfunksjon og BT.2020 fargeprimær publisert.

Programvare

  • Nettlesere
    • AVIF -støtte i nettlesere er under utvikling. Spesielt:
    • I august 2020 ble Google Chrome versjon 85 utgitt med full støtte for AVIF. Google Chrome 89 for Android legger til AVIF -støtte.
    • I oktober 2021 ble Mozilla Firefox 93 utgitt med standard AVIF -støtte. Den hadde planlagt å aktivere AVIF -støtte som standard i Firefox 86, men trakk endringen en dag før utgivelsen.
    • Webkit la til AVIF -støtte 5. mars 2021.
  • Bildevisere
    • AVIF -lesestøtte er tilstede i qView image viewer som starter med v4.0.
    • XnView
    • gTommel
    • ImageMagick
    • ImageGlass
    • AVIF -lesestøtte er tilstede i IrfanView
  • Mediaspiller
    • VLC leser AVIF -filer som starter med versjon 4, som fortsatt er under utvikling
  • Bilde redaktører
    • Paint.net la til støtte for åpning av AVIF -filer i september 2019, og muligheten til å lagre bilder i AVIF -format i en oppdatering fra august 2020.
    • Colorist -formatkonvertering og Darktable RAW -bildedata har hver utgitt støtte for og gir referanseimplementeringer av libavif.
    • Det er utviklet en GIMP -plugin -implementering som støtter både 3.x og 2.10.x plugin APIer. Innfødt AVIF import og eksport ble lagt til GIMP i oktober 2020.
  • Bildebibliotek
    • libavif - Bærbart bibliotek for koding og dekoding av AVIF -filer.
    • libheif - ISO/IEC 23008-12: 2017 HEIF og AVIF dekoder og encoder.
    • SAIL - Format -agnostisk bibliotek med støtte for AVIF implementert på toppen av libavif.

OS

  • Microsoft kunngjorde støtte med forhåndsversjonen av Windows 10 " 19H1 ", inkludert støtte i File Explorer, Paint og flere APIer, sammen med eksempelbilder.
  • Android 12 utgitt 4. oktober 2021, la til innebygd støtte for AVIF, selv om det ikke vil være standard bildeformat for kameraappen.

Nettsteder

  • 14. februar 2020 publiserte Netflix en bloggartikkel med objektive målinger om AVIFs bildekvalitet og komprimeringseffektivitet i forhold til JPEG .
  • Cloudflare kunngjorde AVIF -støtte i et blogginnlegg 3. oktober 2020.
  • Vimeo kunngjorde AVIF -støtte i et blogginnlegg 3. juni 2021.

Programmerings språk

  • PHP versjon 8.1 vil inkludere AVIF -støtte i GD -utvidelsen.

Andre

  • Exiftool støtter AVIF -format for lese og skrive EXIF ​​siden v11.79.

Referanser

Eksterne linker