Transliterator

Transliterator convertit une chaîne en écriture latine vers d'autres scripts. Par exemple :

Source Transliteration

kyanpasu

Αλφαβητικός Κατάλογος

биологическом

biologichyeskom

Il est important de noter que translittérer n'est pas traduire. La translittération est plutôt la conversion de lettres d'un script à un autre sans traduire les mots sous-jacents.

Remarque : Souvent, les méthodes de translittération standard ne suivent pas les règles de prononciation d'une langue particulière dans le texte cible.
Le stage Transliterator prend en charge les scripts suivants. En général, le stage Transliterator suit les lignes directrices de translittération en écriture latine du groupe de travail GENUNG (Groupe d'experts des Nations unies pour les noms géographiques). Pour plus d'informations, voir www.eki.ee/wgrs.
Arabe
Script utilisé par plusieurs langues asiatiques et africaines, y compris l'arabe, le persan et l'ourdou.
Cyrillique
Script utilisé par l'Europe orientale et les langues asiatiques, y compris les langues slaves comme le russe. Le stage Transliterator suit généralement la norme ISO 9 pour l'ensemble cyrillique de base.
Devanagari
Le script utilisé par plusieurs langues indiennes, notamment l'hindi et le sanskrit. Ce script est un descendant de l'écriture brahmi qui est l'un des plus anciens systèmes d'écriture utilisés dans l'Inde ancienne et dans l'Asie du sud et centrale actuelle.
Grec
Script utilisé pour la langue grecque. Ce script appartient à la branche hellénique de la famille des langues indo-européennes.
Gujarâtî
Le script utilisé par l'état du Gujarat dans l'ouest de l'Inde. C'est l'un des scripts modernes de l'Inde qui a été adapté de l'écriture devanagari.
Gurmukhi
Le script utilisé par la langue indienne punjabi. Ce script a reçu une influence considérable du script nagari, qui est une forme plus ancienne du script devanagari.
Hangul
Script utilisé pour le coréen. Le stage Transliterator suit les règles de translittération du ministère coréen du Tourisme et de la Culture. Pour plus d'informations, consultez le site Web de L'Institut National de la langue coréenne.
Han
Script utilisé par la langue chinoise. Il s'agit d'une branche de la famille des langues tibéto-birmanes et a été écrite avec des scripts basés sur le thaï et le chinois.
Chinois traditionnel/simplifié

Le stage Transliterator prend en charge à la fois le chinois traditionnel et le chinois simplifié. Voici un exemple de chinois traditionnel : . Voici un exemple de chinois simplifié : .

Kannada
Le script utilisé par plusieurs langues indiennes du sud, telles que le konkani. Ce script est un descendant de l'écriture brahmi de l'Inde ancienne.
Katakana et hiragana
L'un des scripts qui peuvent être utilisés pour écrire le japonais. Le stage Transliterator utilise une légère variante du système Hepburn. Avec le système Hepburn, ZI () et DI () sont représentés par « ji » et ZU () et DU () sont représentés par « zu ». La réversibilité effectue une légère modification en utilisant « dji » pour DI et « Dzou » pour DU. La translittération Katakana est réversible. La translittération Hiragana-Katakana n'est pas complètement réversible puisqu'il y a plusieurs lettres de Katakana qui n'ont pas d'équivalents correspondants en Hiragana. Aussi, la marque de longueur n'est pas utilisée avec Hiragana. La translittération Hiragana-écriture latine n'est pas non plus réversible puisqu'en interne, il s'agit d'une combinaison de Hiragana-Katakana et d'Hiragana-écriture latine.
Demi-chasse/pleine chasse.
Le stage Transliterator peut convertir des scripts demi-chasse étroits et des scripts pleine chasse plus larges. Voici un exemple en demi-chasse : . Voici un exemple en pleine chasse : .
Latin
Script utilisé par la plupart des langues européennes, tel que l'anglais. Il était à l'origine utilisé par les anciens Romains pour écrire en langue latine.
Malayalam
Le script utilisé par la langue malayalam, la langue officielle de l'état indien du Kerala. Ce script a d'abord été écrit avec l'alphabet vatteluttu, qui signifie « écriture ronde », et développé à partir de l'écriture brahmi de l'Inde ancienne.
Oriya
Le script utilisé par la langue oriya, la langue officielle de l'état indien d'Odisha. Le script oriya a été développé à partir de l'écriture kalinga, l'un des nombreux descendants de l'écriture brahmi de l'Inde ancienne.
Tamoul
Le script utilisé par la langue tamoule dans plusieurs états de l'Inde, du Sri Lanka et de la Malaisie. Ce script a été écrit à l'origine avec une version du script brahmi connue sous le nom de tamil brahmi.
Telugu
Le script utilisé par plusieurs langues du sud de l'Inde. Ce script est un descendant de l'écriture brahmi de l'Inde ancienne.
Thaï
Le script utilisé par la langue thaï. Ce script est influencé par l'écriture brahmi de l'Inde ancienne et les alphabets khmers.

Transliterator fait partie du Module Data Normalization. Pour obtenir une liste des autres stages, reportez-vous à la section Module Data Normalization.