Hindustani ortografi - Hindustani orthography

Hindustani (standardisert hindi og standardisert urdu ) har blitt skrevet i flere forskjellige skript. De fleste hindi -tekster er skrevet i Devanagari -skriptet , som er avledet fra Brāhmī -skriptet i det gamle India . De fleste urdu -tekster er skrevet i urdu -alfabetet , som kommer fra det persiske alfabetet . Hindustani har blitt skrevet i begge manus. De siste årene har det latinske skriften blitt brukt på disse språkene av teknologiske eller internasjonaliseringshensyn. Historisk sett har Kaithi -skript også blitt brukt.

Devanagari -skript

Devanagari -skriptet er en abugida , ettersom skriftlige konsonanter har en iboende vokal, som på standardhindi er en schwa . I visse sammenhenger, for eksempel på slutten av ord, er det ingen vokal, et fenomen som kalles schwa syncope. Andre vokaler er skrevet med en diakritisk på konsonantbrevet. Devanagari er skrevet fra venstre til høyre, med en topplinje som forbinder bokstavene.

Vokaler

ə ɑː ɪ Jeg ʊ ɻɪ ɛː ɔː ɒ

Konsonanter

k ɡ ɡʱ ŋ
t͡ʃ t͡ʃʰ d͡ʒ d͡ʒʱ ɲ
ʈ ʈʰ ɖ ɖʱ ɳ
t̪ʰ d̪ʱ n
s s b m
j ɾ l ʋ
ʃ ʂ s ɦ

Modifiserte konsonanter for ikke-native fonemer

ख़ ग़ ज़ श़ ड़ ढ़ फ़
x ɣ z ʒ ɽ ɽʱ f

Uregelmessige ligaturer:

Sletting av Schwa

Schwa (अ eller 'ə', noen ganger skrevet 'a') implisitt i hver konsonant i Devanagri -skriptet blir "obligatorisk slettet" på hindi på slutten av ord og i visse andre sammenhenger. Dette fenomenet har blitt kalt " schwa syncope rule " eller " schwa deletion rule " på hindi. En formalisering av denne regelen er oppsummert som ə -> ø | VC_CV . Med andre ord, når en konsonant som er forutgått av en vokal blir fulgt av en vokal-etterfulgt konsonant, blir schwaen i den første konsonanten slettet. Imidlertid er denne formaliseringen unøyaktig og ufullstendig (dvs. noen ganger sletter en schwa når den ikke bør, eller andre ganger ikke klarer å slette den når den skal), og kan gi feil. Sletting av Schwa er beregningsmessig viktig fordi det er viktig å bygge tekst-til-tale- programvare for hindi.

Som et resultat av schwa syncope, skiller den korrekte hindi -uttalen av mange ord seg fra det som forventes fra en bokstavelig gjengivelse av Devanagari. For eksempel er राम Rām (feil: Rāma ), रचना er Rachnā (feil: Rachanā ), वेद er Véd (feil: Véda ) og नमकीन er Namkeen (feil Namakeena ).


Persisk skrift

Urdu -alfabetet er basert på det persiske , som er et arabisk alfabet . Urdu er skrevet fra høyre til venstre, og de fleste bokstavene henger sammen. Dette fører til variasjoner i form av en bokstav avhengig av posisjonen i et ord. De fleste vokaler er utelatt i generiske tekster, selv om de kan skrives for disambiguation eller for pedagogiske formål. Urdu er først og fremst skrevet i en kalligrafisk stil med manuset kalt Nasta'liq .

Brev Nasta'liq Navn på bokstav Transkripsjon IPA
ا ا alif - -
ب ب være b /b/
پ پ pe s /p/
ت ت te t /t̪/
ٹ ٹ e /ʈ/
ث ث se s /s/
ج ج jīm j /d͡ʒ/
چ چ che kap /t͡ʃ/
ح ح baṛī han h /h/
خ خ khe kh /x/
د د dāl d /d̪/
ڈ ڈ ḍāl /ɖ/
ذ ذ zāl dh /z/
ر ر re r /r/
ڑ ڑ e /ɽ/
ز ز ze z /z/
ژ ژ zhe zh /ʒ/
س س synd s /s/
ش ش shīn sh /ʃ/
ص ص su'ād /s/
ض ض zu'ād /z/
ط ط t /t/
ظ ظ zo'e /z/
ع ع 'ain ' /ʔ/
غ غ ghain gh /ɣ/
ف ف fe f /f/
ق ق qāf q /q/
ک ک kāf k /k/
گ گ gāf g /ɡ/
ل ل lām l /l/
م م mīm m /m/
ن ن nonne n /n/
Og Og vā'o v, o eller ū /ʋ/ , /oː/ , /ɔ/ eller /uː/
ہ, ﮩ, ﮨ ہ choṭī han h /h/
ھ ھ gjør chashmī han h /ʰ/
ء ء hamza ' /ʔ/
ی ی dere y, jeg /j/ eller /iː/
ے ے bari dere ai eller e /ɛː/ , eller /eː/

Det latinske alfabetet

Det latinske alfabetet har blitt brukt til å skrive hindustani av teknologiske eller internasjonaliseringshensyn. Romersk hindi og romersk urdu bruker det grunnleggende latinske alfabetet . Det er mest brukt av unge morsmål for teknologiske applikasjoner, for eksempel chat , e -post og SMS .

ITRANS , ISCII , IAST (og nesten identiske ISO 15919 ) og Harvard-Kyoto romaniseringsordninger har hovedsakelig blitt brukt til bruk av ikke-morsmål som er mer kjent med det latinske alfabetet.

Translitterasjon

Translitterasjon mellom de tre skriptene kan være komplisert, spesielt ved translitterasjon mellom Devanagari og persiske skript. En hindring for dette er at flere forskjellige bokstaver i ett skript ofte alle tilsvarer den samme bokstaven i det andre skriptet. Så, enkel substitusjon gir ofte ikke riktig stavemåte.

Urdu -bokstaver med lignende lyder

Noen sett med urdu -bokstaver har matchende lyder.

  • 4 bokstaver ز ذ ض ظ er alle ≈ Z
  • 3 bokstaver س ص ث er alle ≈ S
  • 2 bokstaver ت ط er begge ≈ T (en tredje bokstav ٹ vises også ofte som engelsk T, men er forskjellig fra de to andre urdu -bokstavene , se #retroflex -konsonanter nedenfor.)
  • 2 bokstaver ہ ح er begge ≈ H, men blir noen ganger sett på som forskjellige.

Punktskrift

Tre punktskriftalfabeter brukes: Hindi og urdu -blindeskrift i India, basert på Bharati -blindeskriftskonvensjoner , og urdu -punktskrift i Pakistan, basert på persisk punktskriftskonvensjon . Hindi Braille er et alfabet med et ikke skrevet i noen miljøer, mens for Urdu Braille i Pakistan, virker det som vokaler kan være tilleggsutstyr som de er på trykk.

Se også

Referanser