Fonetiske symboler i Unicode - Phonetic symbols in Unicode

Unicode støtter flere fonetiske skript og notasjoner gjennom de eksisterende skrivesystemene og tillegg av ekstra blokker med fonetiske tegn. Disse fonetiske tilleggene er avledet av et eksisterende skript, vanligvis latin, gresk eller kyrillisk. I Unicode er det ikke noe "IPA -skript". Bortsett fra IPA, utvidelser til IPA og foreldede og ikke -standardiserte IPA -symboler , inneholder disse blokkene også tegn fra det uralske fonetiske alfabetet og det amerikanistiske fonetiske alfabetet .

Fonetiske skript

Det internasjonale fonetiske alfabetet (IPA) bruker bokstaver fra andre skrivesystemer slik de fleste fonetiske skript gjør. IPA bruker spesielt latinske, greske og kyrilliske tegn. Å kombinere diakritikk gir også mening til den fonetiske teksten. Til slutt bruker disse fonetiske alfabeter modifikasjonsbokstaver, som er spesielt konstruert for den fonetiske betydningen. En "modifikasjonsbokstav" er strengt ment ikke som et uavhengig grafem, men som en modifikasjon av den foregående karakteren som resulterer i et tydelig grafem, særlig i sammenheng med det internasjonale fonetiske alfabetet. For eksempel bør ʰ ikke forekomme alene, men endre det foregående eller følgende symbolet. Således er et enkelt IPA -symbol, forskjellig fra t . I praksis brukes imidlertid flere av disse "modifikasjonsbokstavene" også som fulle grafemerker, f.eks. ʿ som translitterering av semittisk ayin eller hawaiisk ʻokina , eller ˚ translitterering av Abkhaz ә .

Fra IPA til Unicode

Konsonanter

Tabellene nedenfor angir Unicode -kodepunktsekvensene for fonemer slik de brukes i det internasjonale fonetiske alfabetet . En fet kodeverdien angir at Unicodes Figuren gir et program, for eksempel Kan "stemte retroflex tverr-retningen" for U + 026D ɭ Latin liten bokstav L MED Retroflex HOOK (HTML  ɭ). En oppføring med fet kursiv indikerer at selve tegnnavnet refererer til et fonem som U+0298 ʘ LATIN LETTER BILABIAL CLICK (HTML  ʘ)

Bilabial Labiodental Tann Alveolar Postalveolar Retroflex Labialisert palatal Postalveolar-velar
Plosiv s
U+0070
b
U+0062
s
U+0070 U+032A

U+0062 U+032A

U+0074 U+032A

U+0064 U+032A
t
U+0074
d
U+0064
ʈ
U+0288
ɖ
U+0256
Implosiv ɓ̥
U+0253 U+0325
ɓ
U+0253
ɗ̪
U+0257 U+032A
ɗ
U+0257
*
Ejektiv
U+0070 U+02BC
t̪ʼ
U+0074 U+032A U+02BC

U+0074 U+02BC
ʈʼ
U+0288 U+02BC
Nasal
U+006D U+0325
m
U+006D
ɱ̊
U+0271 U+030A
ɱ
U+0271
n̪̊
U+006E U+032A U+030A

U+006E U+032A

U+006E U+0325
n
U+006E
ɳ̊
U+0273 U+030A
ɳ
U+0273
Trill ʙ
U+0299

U+0072 U+0325
r
U+0072
*
Trykk eller klaff ⱱ̟
U+2C71 U+031F

U+2C71
ɾ
U+027E
ɽ
U+027D
Sideklaff ɺ
U+027A
*
Frikativ ɸ
U+0278
β
U+03B2
f
U+0066
v
U+0076
θ
U+03B8
ð
U+00F0
s
U+0073
z
U+007A
ʃ
U+0283
ʒ
U+0292
ʂ
U+0282
ʐ
U+0290
ɧ
U+0267
Lateral frikativ ɬ
U+026C
ɮ
U+026E

U+A78E
Ejektiv frikativ
U+0073 U+02BC
ʃʼ
U+0283 U+02BC
Ejektiv lateral frikativ ɬʼ
U+026C U+02BC
Overbevisende ʬ
U+02AC
ʭ
U+02AD
Tilnærmet β̞̊
U+03B2 U+031E U+030A
β̞
U+03B2 U+031E
ʋ̥
U+028B U+0325
ʋ
U+028B
ð̞
U+00F0 U+031E
ɹ̥
U+0279 U+0325
ɹ
U+0279
ɻ̊
U+027B U+030A
ɻ
U+027B
ɥ̊
U+0265 U+030A
ɥ
U+0265
Tilnærmet lateral
U+006C U+0325
l
U+006C
ɭ
U+026D
Klikk på konsonant ʘ
U+0298
ǀ
U+01C0
ǃ
U+01C3
ǃ / ǂ
U+01C3 / U+01C2
Klikk på siden * ǁ
U+01C1


Alveolo-palatal Palatal Labial-velar Velar Uvular Faryngeal Epiglottal Glottal
Plosiv ȶ
U+0236
ȡ
U+0221
c
U+0063
ɟ
U+025F
k͡p
U+006B U+0361 U+0070
.b
U+0261 U+0361 U+0062
k
U+006B
ɡ
U+0261
q
U+0071
ɢ
U+0262
ʡ
U+02A1
ʔ
U+0294
Implosiv ʄ
U+0284
ɠ
U+0260
ʛ
U+029B
Ejektiv
U+0063 U+02BC

U+006B U+02BC

U+0071 U+02BC
Nasal ȵ
U+0235
ɲ
U+0272
.m
U+014B U+0361 U+006D
ŋ
U+014B
ɴ
U+0274
Trill ʀ
U+0280
*
Trykk eller klaff *
Sideklaff * *
Frikativ ɕ
U+0255
ʑ
U+0291
ç
U+0063 U+0327
ʝ
U+029D
x
U+0078
ɣ
U+0263
χ
U+03C7
ʁ
U+0281
ħ
U+0127
ʕ
U+0295
ʜ
U+029C
ʢ
U+02A2
h
U+0068
ɦ
U+0266
Tilnærmet j
U+006A
ʍ
U+028D
w
U+0077
ɰ
U+0270
Tilnærmet lateral ȴ
U+0234
ʎ
U+028E
ʟ
U+029F

Vokaler

De følgende figurene viser de fonetiske vokalene og deres Unicode / UCS -kodepunkter, arrangert for å representere det fonetiske vokal trapezium . Vokaler som vises i par i figuren til høyre indikerer henholdsvis avrundede og ikke -avrundede variasjoner. Igjen indikeres tegn med Unicode -navn som refererer til fonemer med fet tekst. De med eksplisitte applikasjonsnotater er markert med fet kursiv tekst. De fra lånt uendret fra et annet skrift (latin, gresk eller kyrillisk) er angitt med kursiv. Før og etter en kule er de • avrundede vokalene.

Unicode -kodepunkter for fonetiske vokaler
Front Sentral Tilbake
Lukk i y
U+0069

U+0079
ɨ ʉ
U+0268

U+0289
ɯ u
U+026F

U+0075
Nær-nær ɪ ʏ
U+026A

U+028F
ɪ̈ ʊ̈
U+026A U+0308

U+028A U+0308
ʊ
 

U+028A
Nær midt e ø
U+0065

U+00F8
ɘ ɵ
U+0258

U+0275
ɤ o
U+0264

U+006F
Midt ø̞
U+0065 U+031E

U+00F8 U+031E
ə
 
U+0259
 
ɤ̞
U+0264 U+031E

U+006F U+031E
Åpen-midten ɛ œ
U+025B

U+0153
ɜ ɞ
U+025C

U+025E
ʌ ɔ
U+028C

U+0254
Nesten åpen æ
U+00E6

 
ɐ
 
U+0250
 
Åpen a ɶ
U+0061

U+0276
ä
U+0061 U+0308

 
ɑ ɒ
U+0251

U+0252

Diakritiske

Diakritikk kan kodes enten som modifikator (f.eks. ˳) eller kombinere (f.eks. ◌̥ ) tegn.

Stemmeløs Breathy Voiced Tann Pensum
˳◌̥
U+02F3 • U+0325
◌̤
U+0324
◌͏̪
U+032A
ˌ◌̩
U+02CC • U+0329
Stemt Creaky Voiced Apisk Ikke-pensum
ˬ◌̬
U+02EC • U+032C
˷◌̰
U+02F7 • U+0330
˽◌̺
U+02FD • U+033A
◌͏̯
U+032F
Aspirert Linguolabial Laminal Mer avrundet
ʰ
U+02B0
◌͏̼
U+033C
◌͏̻
U+033B
˒◌̹
U+02D2 • U+0339
Labialisert Nasalisert Palatalisert Mindre avrundet
ʷ
U+02B7
◌̃
U+0303
ʲ
U+02B2
˓◌̜
U+02D3 • U+031C
Avansert Nasal frigjøring Sentralisert Velarisert
˖◌̟
U+02D6 • U+031F

U+207F
¨◌̈
U+00A8 • U+0308
ˠ
U+02E0
Tilbaketrukket Lateral utgivelse Midt-sentralisert Faryngealisert
◌̠
U+02CD • U+0320
ˡ
U+02E1
˟◌̽
U+02DF • U+033D
ˤ
U+02E4
Avansert tungerot Ingen hørbar utgivelse Oppvokst Velarisert eller faryngealisert
◌͏̘
U+0318
˺◌̚
U+02FA • U+031A
˔◌̝
U+02D4 • U+031D
◌̴
U+0334
Tilbaketrukket tungerot Rhoticity Senket Forlenget
◌͏̙
U+0319
˞
U+02DE
˕◌̞
U+02D5 • U+031E
ː
U+02D0
Merknader
1. ^ Kodepunktet refererer til diaeresis , som tar opp plass, men ikke er et mellomromsmodifikasjonsbrev .

Unicode -blokker

Unicode -blokker med mange fonetiske symboler

Seks Unicode -blokker inneholder mange fonetiske symboler:

IPA -utvidelser (U+0250–02AF)

IPA Extensions
Official Unicode Consortium code chart (PDF)
  0 1 2 3 4 5 6 7 8 9 EN B C D E F
U+025x ɐ ɑ ɒ ɓ ɔ ɕ ɖ ɗ ɘ ə ɚ ɛ ɜ ɝ ɞ ɟ
U+026x ɠ ɡ ɢ ɣ ɤ ɥ ɦ ɧ ɨ ɩ ɪ ɫ ɬ ɭ ɮ ɯ
U+027x ɰ ɱ ɲ ɳ ɴ ɵ ɶ ɷ ɸ ɹ ɺ ɻ ɼ ɽ ɾ ɿ
U+028x ʀ ʁ ʂ ʃ ʄ ʅ ʆ ʇ ʈ ʉ ʊ ʋ ʌ ʍ ʎ ʏ
U+029x ʐ ʑ ʒ ʓ ʔ ʕ ʖ ʗ ʘ ʙ ʚ ʛ ʜ ʝ ʞ ʟ
U+02Ax ʠ ʡ ʢ ʣ ʤ ʥ ʦ ʧ ʨ ʩ ʪ ʫ ʬ ʭ ʮ ʯ
Merknader
1. ^ Fra Unicode versjon 14.0

Avstandsmodifikasjonsbokstaver (U+02B0–02FF)

Tegnene i "Spacing Modifier Letters" -blokken er ment å danne en enhet med den foregående bokstaven (som de "modifiserer"). F.eks. Er karakteren U+02B0 ʰ MODIFIER LETTER SMALL H ikke bare ment som en overskrift h ( h ), men som et tegn på aspirasjon plassert etter at bokstaven ble aspirert, som i " aspirated voiceless bilabial plosive ". Blokken inneholder:

  • Latinsk overskriftsmodifikasjonsbokstaver: (U+02B0 – U+02B8): ʰ aspirasjon; ʱ pustende stemme, mumlet; ʲ palatalisering; ʳ, ʴ, ʵ, ʶ r-farging eller r-offglides; ʷ labialisering; ʸ palatalisering, amerikansk bruk for U+02B2
  • Diverse fonetiske modifikatorer: (U+02B9 – U+02D7): ʹ ʺ ʻ 'ʽ ʾ ʿ ˀ ˁ ˂ ˃ ˆ ˇ ˉ ˊ ˋ ˌ ˍ ˎ ː
  • Kloner mellom diakritiske mellomrom: (U+02D8 – U+02DD): ˘ breve ; ˙ prikk over ; ˚ ring over ; ˛ ogonek ; ˜ liten tilde ; ˝ dobbel akutt aksent
  • Tillegg basert på IPA fra 1989: (U+02DE – U+02E4): ˞ ˟ ˠ ˡ ˢ ˣ ˤ
  • Tone bokstaver : (U + 02E5-U + 02E9): ˥ ˦ ˧ ˨ °
  • Utvidede Bopomofo tonetegn: U + 02EA ˪ MODIFIER Brev YIN å avvike TONE MARK ; U+02EB ˫ MODIFIER BREV YANG AVGIR TONEMERK
  • IPA -modifikatorer : U+02EC ˬ MODIFIER LETTER VOICING , uten aspirasjon
  • Andre modifikasjonsbokstaver: U+02EE ˮ MODIFIER LETTER DOUBLE APOSTROPHE for Nenets
  • Uralic Phonetic Alphabet (UPA) modifikatorer: (U+02EF – U+02FF): ˯ ˰ ˱ ˲ ˳ ˴ ˶ ˷ ˸ ˺ ˺ ˻ ˼ ˽ ˾ ˿
Spacing Modifier Letters
Official Unicode Consortium code chart (PDF)
  0 1 2 3 4 5 6 7 8 9 EN B C D E F
U+02Bx ʰ ʱ ʲ ʳ ʴ ʵ ʶ ʷ ʸ ʹ ʺ ʻ ' ʽ ʾ ʿ
U+02Cx ˀ ˁ ˂ ˃ ˄ ˅ ˆ ˇ ˈ ˉ ˊ ˋ ˌ ˍ ˎ ˏ
U+02Dx ː ˑ ˒ ˓ ˔ ˕ ˖ ˗ ˘ ˙ ˚ ˛ ˜ ˝ ˞ ˟
U+02Eks ˠ ˡ ˢ ˣ ˤ ˥ ˦ ˧ ˨ ˩ ˪ ˫ ˬ ˭ ˮ ˯
U+02Fx ˰ ˱ ˲ ˳ ˴ ˵ ˶ ˷ ˸ ˹ ˺ ˻ ˼ ˽ ˾ ˿
Merknader
1. ^ Fra Unicode versjon 14.0

Fonetiske utvidelser (U+1D00–1D7F)

Denne blokken, sammen med Phonetic Extensions Supplement nedenfor, inneholder:

  • Små hovedsteder "ɢ ɪ ɴ ɶ ʀ ʏ ʙ ʜ ʟ"
  • Slå små bokstaver "ɐ ɥ ɯ ɹ ɺ ɻ ʇ ʌ ʍ ʎ ʞ ʮ ʯ"
  • Ekstra små hovedsteder "ʁ ʛ ᴀ ᴁ ᴃ ᴄ ᴅ ᴆ ᴇ ᴊ ᴌ ᴍ ᴎ ᴏ ᴐ ᴘ ᴙ ᴚ ᴜ ᴡ ᴡ ᴢ ᴣ ᴦ ᴧ ᴨ ᴩ ᴪ
  • Bokstaver med palatalkroker "ƫ ᶀ ᶁ ᶂ ᶃ ᶄ ᶅ ᶆ ᶇ ᶈ ᶉ ᶊ ᶋ ᶌ ᶍ ᶎ ᶪ ᶵ"
  • Bokstaver med retroflex kroker "ᶏ ᶐ ᶒ ᶓ ᶔ ᶕ ᶖ ᶗ ᶘ ᶚ ᶩ ᶯ ᶯ ᶼ"
Phonetic Extensions
Official Unicode Consortium code chart (PDF)
  0 1 2 3 4 5 6 7 8 9 EN B C D E F
U+1D0x
U+1D1x
U+1D2x
U+1D3x ᴿ
U+1D4x
U+1D5x
U+1D6x
U+1D7x ᵿ
Merknader
1. ^ Fra Unicode versjon 14.0

Tillegg for fonetiske utvidelser (U+1D80–1DBF)

Phonetic Extensions Supplement
Official Unicode Consortium code chart (PDF)
  0 1 2 3 4 5 6 7 8 9 EN B C D E F
U+1D8x
U+1D9x
U+1DAx
U+1DBx ᶿ
Merknader
1. ^ Fra Unicode versjon 14.0

Modifikator Tone Letters (U+A700 – A71F)

Modifier Tone Letters
Official Unicode Consortium code chart (PDF)
  0 1 2 3 4 5 6 7 8 9 EN B C D E F
U+A70x
U+A71x
Merknader
1. ^ Fra Unicode versjon 14.0

Superscripts and Subscripts (U+2070–209F)

Superscripts and Subscripts
Official Unicode Consortium code chart (PDF)
  0 1 2 3 4 5 6 7 8 9 EN B C D E F
U+207x
U+208x
U+209x
Merknader
1. ^ Fra Unicode versjon 14.0
2. ^ Grå områder indikerer ikke-tildelte kodepunkter
3. ^ Se Latin-1 Supplement Unicode-blokken for tegn ¹ (U+00B9), ² (U+00B2) og ³ (U+00B3)

Skriftstøtte for IPA

Inndata etter valg fra en skjerm

Ytterligere informasjon: Unicode -inngang#Valg fra en skjerm

Applet for valg av tegn

Mange systemer gir en måte å velge Unicode -tegn visuelt. ISO/IEC 14755 omtaler dette som en metode for skjermvalg .

Microsoft Windows har levert en Unicode -versjon av Character Map -programmet (finn det ved å trykke ⊞ Win+ Rog skriv charmapderetter hit ↵ Enter) siden versjon NT 4.0 - som vises i forbrukerutgaven siden XP. Dette er begrenset til tegn i Basic Multilingual Plane (BMP). Tegn kan søkes etter Unicode -tegnnavn, og tabellen kan begrenses til en bestemt kodeblokk. Mer avanserte tredjepartsverktøy av samme type er også tilgjengelig (et kjent freeware- eksempel er BabelMap ).

macOS gir en "tegnpalett" med omtrent samme funksjonalitet, sammen med søk etter beslektede tegn, tegntegn i en font, etc. Den kan aktiveres i inndatamenyen i menylinjen under Systemvalg → Internasjonalt → Inndatameny (eller Systemvalg → Språk og tekst → Inngangskilder) eller kan vises under Rediger → Emoji og symboler i mange programmer.

Tilsvarende verktøy - som gucharmap ( GNOME ) eller kcharselect ( KDE ) - finnes på de fleste Linux -skrivebordsmiljøer.

Se også

Referanser

Eksterne linker