Konveks funksjon - Convex function

Konveks funksjon på et intervall.
En funksjon (i svart) er konveks hvis og bare hvis regionen over grafen (i grønt) er et konveks sett .
En graf over den bivariate konvekse funksjonen x 2 + xy + y 2 .

I matematikk kalles en virkelig verdi funksjon konveks hvis linjesegmentet mellom to punkter på grafen til funksjonen ikke ligger under grafen mellom de to punktene. Tilsvarende er en funksjon konveks hvis epigrafen (settet med punkter på eller over grafen til funksjonen) er et konveks sett . En to-differensierbar funksjon av en enkelt variabel er konveks hvis og bare hvis den andre derivaten er ikke-negativ på hele domenet. Velkjente eksempler på konvekse funksjoner til en enkelt variabel inkluderer den kvadratiske funksjonen og den eksponensielle funksjonen . Enkelt sagt refererer en konveks funksjon til en funksjon som er i form av en kopp , og en konkav funksjon er i form av en hette .

Konvekse funksjoner spiller en viktig rolle på mange matematiske områder. De er spesielt viktige i studiet av optimaliseringsproblemer der de kjennetegnes med en rekke praktiske egenskaper. For eksempel har en strengt konveks funksjon på et åpent sett ikke mer enn ett minimum. Selv i uendelige dimensjonale rom, under passende ytterligere hypoteser, fortsetter konvekse funksjoner å tilfredsstille slike egenskaper, og som et resultat er de de mest velforståtte funksjonene i beregningen av variasjoner . I sannsynlighetsteorien er en konveks funksjon som brukes på den forventede verdien av en tilfeldig variabel alltid begrenset over av den forventede verdien av den konvekse funksjonen til den tilfeldige variabelen. Dette resultatet, kjent som Jensens ulikhet , kan brukes til å utlede ulikheter som den aritmetisk -geometriske gjennomsnittlige ulikheten og Hölders ulikhet .

Definisjon

Visualisering av en konveks funksjon og Jensens ulikhet

La være en konveks delmengde av et ekte vektorrom og la det være en funksjon.

Da kalles det konveks hvis og bare hvis noen av følgende tilsvarende betingelser holder:

  1. For alle og alle :
    Høyre side representerer den rette linjen mellom og i grafen over som en funksjon av å øke fra til eller minske fra for å feie denne linjen. På samme måte representerer argumentet for funksjonen på venstre side den rette linjen mellom og i eller -aksen på grafen til Så krever denne tilstanden at den rette linjen mellom et par punkter på kurven for å være over eller bare møter grafen.
  2. For alle og alle slik at :
    Forskjellen på denne andre tilstanden med hensyn til den første tilstanden ovenfor er at denne tilstanden ikke inkluderer skjæringspunktene (f.eks. Og ) mellom den rette linjen som går gjennom et par punkter på kurven til (den rette linjen er representert av på høyre side av denne tilstanden) og kurven for den første tilstanden inkluderer skjæringspunktene når det blir eller ved eller eller Faktisk trenger skjæringspunktene ikke å bli vurdert i en tilstand av konveks bruk
    fordi og er alltid sanne (så ikke nyttig å være en del av en tilstand).

Den andre setningen som karakteriserer konvekse funksjoner som er verdsatt i den virkelige linjen, er også setningen som brukes til å definere konvekse funksjoner som er verdsatt i den utvidede reelle talllinjen der en slik funksjon er tillatt (men ikke nødvendig) å ta som en verdi. Den første setningen brukes ikke fordi den tillater å ta eller som en verdi, i så fall hvis eller henholdsvis, ville være udefinert (fordi multiplikasjonene og er udefinerte). Summen er også udefinert, så en konveks utvidet real-verdi funksjon er vanligvis bare tillatt å ta nøyaktig en av og som en verdi.

Den andre uttalelsen kan også modifiseres for å få definisjonen på streng konveksitet , der sistnevnte oppnås ved å erstatte den med den strenge ulikheten Eksplisitt kalles kartet strengt konveks hvis og bare hvis for alle virkelige og alt slik at :

En strengt konveks funksjon er en funksjon som den rette linjen mellom et par punkter på kurven er over kurven bortsett fra skjæringspunktene mellom den rette linjen og kurven.

Funksjonen sies å være konkav (resp. Strengt konkav ) hvis ( multiplisert med -1) er konveks (resp. Strengt konveks).

Alternativ navn

Begrepet konveks blir ofte referert til som konveks ned eller konkav oppover , og begrepet konkav blir ofte referert til som konkav ned eller konveks oppover . Hvis begrepet "konveks" brukes uten et "opp" eller "ned" søkeord, refererer det strengt til en koppformet graf . Som et eksempel refererer Jensens ulikhet til en ulikhet som involverer en konveks eller konveks (opp) funksjon.

Egenskaper

Mange egenskaper til konvekse funksjoner har samme enkle formulering for funksjoner med mange variabler som for funksjoner til en variabel. Se egenskapene nedenfor for mange variabler, siden noen av dem ikke er oppført for funksjoner til en variabel.

Funksjoner av en variabel

  • Anta er en funksjon av en reell variabel definert på et intervall, og la
    (Merk at er helningen av den lilla linje i den ovennevnte tegning, det funksjons
    R er symmetrisk i betyr at R ikke er endret ved å bytte og ). er konveks hvis og bare hvis er monotonisk ikke-avtagende i for hver fast (eller vice versa). Denne karakteriseringen av konveksitet er ganske nyttig for å bevise følgende resultater.
  • En konveks funksjon av en reell variabel definert på et åpent intervall C er kontinuerlig på tillater venstre og høyre derivater , og disse er monotont ikke-reduserende . Som en konsekvens er den differensierbar i det hele tatt, men høyst mange punkter, men settet som ikke er differensierbart kan imidlertid fortsatt være tett. Hvis er lukket, kan det hende at den ikke er kontinuerlig ved endepunktene til (et eksempel er vist i eksempler -delen ).
  • En differensierbar funksjon av en variabel er konveks på et intervall hvis og bare hvis derivatet er monotont ikke-reduserende i det intervallet. Hvis en funksjon er differensierbar og konveks, er den også kontinuerlig differensierbar .
  • En differensierbar funksjon av en variabel er konveks på et intervall hvis og bare hvis grafen ligger over alle tangentene :
    for alle x og y i intervallet.
  • En to ganger differensierbar funksjon av en variabel er konveks på et intervall hvis og bare hvis den andre derivaten er ikke-negativ der; Dette gir en praktisk test for konveksitet. Visuelt "buer en to ganger differensierbar konveks funksjon opp" uten bøyninger den andre veien ( bøyningspunkter ). Hvis dets andre derivat er positivt på alle punkter, er funksjonen strengt konveks, men det motsatte holder ikke. For eksempel er det andre derivatet av is , som er null for, men er strengt konveks.
    • Denne egenskapen og egenskapen ovenfor når det gjelder "... dens derivat er monotont ikke-reduserende ..." er ikke like siden hvis det er ikke-negativt på et intervall , er det monotont ikke-avtagende mens det motsatte ikke er sant, for eksempel, er monotont ikke-avtagende mens dets derivat ikke er definert på noen punkter på .
  • Dersom er en konveks funksjon av en reell variabel, og , så er superadditivpositiv virkelig , det vil si for positive reelle tall og .
Bevis

Siden er konveks, ved å bruke en av de konvekse funksjonsdefinisjonene ovenfor og la det følge det for alle virkelige

Av dette følger det
  • En funksjon er midtpunkt konveks på et intervall hvis for alle
    Denne tilstanden er bare litt svakere enn konveksitet. For eksempel er en virkelig verdsatt Lebesgue-målbar funksjon som er midtpunktskonveks konveks: dette er et teorem om Sierpinski . Spesielt vil en kontinuerlig funksjon som er midtpunktskonveks være konveks.

Funksjoner av flere variabler

  • En funksjon verdsatt i de utvidede reelle tallene er konveks hvis og bare hvis den er epigraf
    er et konveks sett.
  • En differensierbar funksjon definert på et konvekst domene er konveks hvis og bare hvis det gjelder for alle i domenet.
  • En to ganger differensierbar funksjon av flere variabler er konveks på et konveks sett hvis og bare hvis dens hessiske matrise av andre partielle derivater er positiv semidefinitt på innsiden av det konvekse settet.
  • For en konveks funksjon er undernivåsettene og med konvekse sett. En funksjon som tilfredsstiller denne egenskapen kalles en kvasikonveks funksjon og kan ikke være en konveks funksjon.
  • Følgelig er settet med globale minimiserere av en konveks funksjon et konveks sett: - konveks.
  • Et hvilket som helst lokalt minimum for en konveks funksjon er også et globalt minimum . En strengt konveks funksjon vil ha høyst ett globalt minimum.
  • Jensens ulikhet gjelder for hver konveks funksjon . Dersom er en tilfeldig variabel tar verdier i domenet for deretter hvor E betegner den matematiske forventning . Faktisk er konvekse funksjoner akkurat de som tilfredsstiller hypotesen om Jensens ulikhet .
  • En førsteordens homogen funksjon av to positive variabler og (det vil si en funksjon som tilfredsstiller alle positive reelle ) som er konveks i en variabel, må være konveks i den andre variabelen.

Operasjoner som bevarer konveksitet

  • er konkav hvis og bare hvis den er konveks.
  • Ikke -negative vektede summer:
    • hvis og er alle konvekse, så er det også . Spesielt er summen av to konvekse funksjoner konveks.
    • Denne egenskapen strekker seg også til uendelige summer, integraler og forventede verdier (forutsatt at de eksisterer).
  • Elementvis maksimal: la være en samling av konvekse funksjoner. Da er den konveks. Domenet til er samlingen av punkter der uttrykket er begrenset. Viktige spesialtilfeller:
    • Hvis det er konvekse funksjoner, så er det det også
    • Danskins teorem : Hvis er konveks i så er konveks i selv om C ikke er et konveks sett.
  • Sammensetning:
    • Hvis f og g er konvekse funksjoner og g er ikke-reduserende over et univariat domene, er det konveks. Som et eksempel, hvis det er konveks, så er det det også . fordi er konveks og monotonisk økende.
    • Hvis f er konkav og g er konveks og ikke-økende over et univariat domene, er den konveks.
    • Konveksitet er invariant under affine kart: det vil si at hvis f er konveks med domene , så er det , hvor med domene .
  • Minimering: Hvis er konveks i så er konveks i x , forutsatt at C er et konveks sett og at
  • Hvis den er konveks, er perspektivet med domenet konveks.

Sterkt konvekse funksjoner

Begrepet sterk konveksitet strekker seg og parametrerer begrepet streng konveksitet. En sterkt konveks funksjon er også strengt konveks, men ikke omvendt.

En differensierbar funksjon kalles sterkt konveks med parameter m > 0 hvis følgende ulikhet gjelder for alle punktene x , y i sitt domene:

eller, mer generelt,
hvor er noen norm . Noen forfattere, for eksempel refererer til funksjoner som tilfredsstiller denne ulikheten som elliptiske funksjoner.

En tilsvarende betingelse er følgende:

Det er ikke nødvendig for en funksjon å være differensierbar for å være sterkt konveks. En tredje definisjon for en sterkt konveks funksjon, med parameter m , er at for alle x , y i domenet og

Legg merke til at denne definisjonen nærmer seg definisjonen for streng konveksitet som m → 0, og er identisk med definisjonen av en konveks funksjon når m = 0. Til tross for dette finnes det funksjoner som er strengt konvekse, men som ikke er sterkt konvekse for noen m > 0 ( se eksempel nedenfor).

Hvis funksjonen er to ganger kontinuerlig differensierbar, så er den sterkt konveks med parameter

m hvis og bare hvis for alle x i domenet, hvor I er identiteten og er den hessiske matrisen , og ulikheten betyr at det er positivt semi-bestemt . Dette er ekvivalent med å kreve at den minste egenverdien av være minst m for alle x . Hvis domenet bare er den virkelige linjen, er det bare det andre derivatet, slik at tilstanden blir . Hvis m = 0, betyr dette at hessianeren er positiv semidefinitt (eller hvis domenet er den virkelige linjen, betyr det at ), noe som betyr at funksjonen er konveks, og kanskje strengt konveks, men ikke sterkt konveks.

Forutsatt at funksjonen er to ganger kontinuerlig differensierbar, kan man vise at den nedre grensen for innebærer at den er sterkt konveks. Ved å bruke

Taylors teorem eksisterer det
slik at
Deretter
ved antagelsen om egenverdiene, og derfor gjenoppretter vi den andre sterke konveksitetsligningen ovenfor.

En funksjon er sterkt konveks med parameter

m hvis og bare hvis funksjonen
er konveks.

Skillet mellom konveks, strengt konveks og sterkt konveks kan være subtil ved første øyekast. Hvis er to ganger kontinuerlig differensierbar og domenet er den virkelige linjen, kan vi karakterisere det som følger:

  • konveks hvis og bare hvis for alle
x .
  • strengt konveks hvis for alle
  • x (merk: dette er tilstrekkelig, men ikke nødvendig).
  • sterkt konveks hvis og bare hvis for alle
  • x .

    La oss for eksempel være strengt konvekse, og anta at det er en rekke punkter slik at . Selv om funksjonen ikke er sterkt konveks fordi den vil bli vilkårlig liten.

    En to ganger kontinuerlig differensierbar funksjon på et kompakt domene som tilfredsstiller for alle, er sterkt konveks. Beviset for denne påstanden følger av

    ekstreme verdisetningen , som sier at en kontinuerlig funksjon på et kompakt sett har et maksimum og minimum.

    Sterkt konvekse funksjoner er generelt lettere å arbeide med enn konvekse eller strengt konvekse funksjoner, siden de er en mindre klasse. Som strengt konvekse funksjoner, har sterkt konvekse funksjoner unike minima på kompakte sett.

    Uniformt konvekse funksjoner

    En jevnt konveks funksjon, med modul , er en funksjon som for alle

    x , y i domenet og t ∈ [0, 1] tilfredsstiller
    hvor er en funksjon som er ikke-negativ og forsvinner bare ved 0. Dette er en generalisering av begrepet sterkt konveks funksjon; ved å ta gjenoppretter vi definisjonen av sterk konveksitet.

    Eksempler

    Funksjoner av en variabel

    • Funksjonen har , så
    f er en konveks funksjon. Den er også sterkt konveks (og dermed strengt konveks også), med sterk konveksitetskonstant 2.
  • Funksjonen har , så
  • f er en konveks funksjon. Det er strengt konveks, selv om det andre derivatet ikke er strengt positivt på alle punkter. Den er ikke sterkt konveks.
  • Den absolutte verdi funksjon er konveks (som gjenspeiles i den
  • trekant ulikhet ), selv om den ikke har en derivert i punktet  x  = 0. Det er ikke strengt konveks.
  • Funksjonen for er konveks.
  • Den eksponensielle funksjonen er konveks. Det er også strengt konveks siden , men det er ikke sterkt konveks siden det andre derivatet kan være vilkårlig nær null. Mer generelt funksjonen er
  • logaritmisk konveks hvis f er en konveks funksjon. Begrepet "superkonveks" brukes noen ganger i stedet.
  • Funksjonen med domenet [0,1] definert av for er konveks; den er kontinuerlig på det åpne intervallet (0, 1), men ikke kontinuerlig ved 0 og 1.
  • Funksjonen x 3 har andre derivat 6 x ; dermed er den konveks på settet der x ≥ 0 og konkav på settet der  x  ≤ 0.
  • Eksempler på funksjoner som er monotont økende, men ikke konvekse, inkluderer og .
  • Eksempler på funksjoner som er konvekse, men ikke monotont økende, inkluderer og .
  • Funksjonen har større enn 0 hvis
  • x > 0, så er konveks på intervallet . Den er konkav på intervallet .
  • Funksjonen med , er konveks på intervallet og konveks på intervallet , men ikke konveks på intervallet , på grunn av singulariteten ved 
  • x  = 0.

    Funksjoner av n variabler

    • LogSumExp -funksjonen, også kalt softmax -funksjon, er en konveks funksjon.
    • Funksjonen på domenet til
    positive-bestemte matriser er konveks.
  • Hver virkelig verdsatt lineær transformasjon er konveks, men ikke strengt konveks, siden hvis f er lineær, da . Denne uttalelsen gjelder også hvis vi erstatter "konveks" med "konkav".
  • Hver virkelig verdsatte affinefunksjon , dvs. hver funksjon i formen , er samtidig konveks og konkav.
  • Hver norm er en konveks funksjon, av trekants ulikhet og positiv homogenitet .
  • Den spektrale radius av et ikke-negativt matrise er en konveks funksjon av dens diagonale elementer.
  • Se også

    Merknader

    Referanser

    • Bertsekas, Dimitri (2003). Konveks analyse og optimalisering . Athena Scientific.
    • Borwein, Jonathan og Lewis, Adrian. (2000). Konveks analyse og ikke -lineær optimalisering. Springer.
    • Donoghue, William F. (1969). Distribusjoner og Fourier -transformasjoner . Academic Press.
    • Hiriart-Urruty, Jean-Baptiste og Lemaréchal, Claude . (2004). Grunnleggende om konveks analyse. Berlin: Springer.
    • Krasnosel'skii MA , Rutickii Ya.B. (1961). Konvekse funksjoner og Orlicz -mellomrom . Groningen: P.Noordhoff Ltd.
    • Lauritzen, Niels (2013). Bachelor konveksitet . World Scientific Publishing.
    • Luenberger, David (1984). Lineær og ikke -lineær programmering . Addison-Wesley.
    • Luenberger, David (1969). Optimalisering med Vector Space Methods . Wiley & Sons.
    • Rockafellar, RT (1970). Konveks analyse . Princeton: Princeton University Press.
    • Thomson, Brian (1994). Symmetriske egenskaper for virkelige funksjoner . CRC Press.
    • Zălinescu, C. (2002). Konveks analyse i generelle vektorrom . River Edge, NJ: World Scientific Publishing Co., Inc. s. Xx+367. ISBN 981-238-067-1. MR  1921556 .

    Eksterne linker