Transliterator

Transliterator konvertiert eine Zeichenfolge zwischen lateinischen und anderen Schriften. Beispiel:

Quelle Transkription

kyanpasu

Αλφαβητικός Κατάλογος

биологическом

biologichyeskom

Es ist wichtig, zu verstehen, dass die Transkription keine Übersetzung ist. Die Transkription ist die Konvertierung von Buchstaben einer Schrift ist die einer anderen Schrift, ohne die zugrundeliegenden Wörter zu übersetzen.

Anmerkung: Standardmäßige Transkriptionsmethoden befolgen oft nicht die Ausspracheregeln einer bestimmten Sprache in der Zielschrift.
Der Transliterator-Schritt unterstützt folgende Schriften. Im Allgemeinen folgt der Transliterator-Schritt den Richtlinien der UNGEGN-Arbeitsgruppe für Umschriftsysteme (Working Group on Romanization Systems). Weitere Informationen finden Sie unter www.eki.ee/wgrs.
Arabisch
Diese Schrift wird von mehreren asiatischen und afrikanischen Sprachen verwendet einschließlich Arabisch, Persisch und Urdu.
Kyrillisch
Diese Schrift wird von osteuropäischen und asiatischen Sprachen verwendet einschließlich slawischen Sprachen wie Russisch. Der Transliterator-Schritt folgt im Allgemeinen der ISO 9 für den kyrillischen Basissatz.
Devanagari
Die Schrift, die von verschiedenen indischen Sprachen verwendet wird, einschließlich Hindi und Sanskrit. Diese Schrift ist ein Abkömmling der Brahmi-Schrift, die eines der ältesten Schreibsysteme im alten Indien und in Süd- und Zentralasien ist.
Griechisch
Diese Schrift wird von der griechischen Sprache verwendet. Diese Schrift gehört zum hellenischen Zweig der indoeuropäischen Sprachfamilie.
Gujarati
Das vom Bundesstaat Gujarat im Westen Indiens verwendete Skript. Es ist eine der modernen Schriften Indiens, die von der Devanagari-Schrift übernommen wurde.
Gurmukhi
Die Schrift der indischen Sprache Punjabi. Diese Schrift weist einen beträchtlichen Einfluss durch die Nagari-Schrift auf, die eine frühere Form der Devanagari-Schrift ist.
Hangul
Diese Schrift wird von der koreanischen Sprache verwendet. Der Transliterator-Schritt folgt den Transkriptionsvorschriften des koreanischen Ministeriums für Kultur und Tourismus. Weitere Informationen finden Sie auf der Webseite des Nationalen Instituts für die koreanische Sprache.
Han
Diese Schrift wird von der chinesischen Sprache verwendet. Sie ist ein Zweig der tibetisch-burmesischen Sprachfamilie und wurde mit auf Thailändisch und Chinesisch basierenden Schriften geschrieben.
Traditionelles/vereinfachtes Chinesisch

Der Transliterator-Schritt unterstützt sowohl traditionelles als auch vereinfachtes Chinesisch. Hier ein Beispiel für traditionelles Chinesisch: . Und hier für vereinfachtes Chinesisch:

Kannada
Die Schrift, die von verschiedenen südindischen Sprachen wie Konkani verwendet wird. Diese Schrift ist ein Abkömmling der Brahmi-Schrift des alten Indiens.
Katakana und Hiragana
Dies ist eine der verschiedenen Schriften, in denen Japanisch geschrieben werden kann. Der Transliterator-Schritt verwendet ein leicht abgewandeltes Hepburn-System. Beim Hepburn-System werden sowohl „ZI“ () als auch „DI“ () durch „ji“ und sowohl „ZU“ () als auch „DU“ () durch „zu“ dargestellt. Dies wurde leicht abgeändert zu „dji“ für „DI“ und „dzu“ für „DU“, um Reversibilität zu erreichen. Die Katakana-Transkription ist umkehrbar. Die Hiragana-Katakana-Transkription ist nicht vollständig umkehrbar, da es mehrere Katakana-Buchstaben ohne entsprechende Hiragana-Äquivalente gibt. Außerdem wird die Längenmarkierung bei Hiragana nicht verwendet. Die Hiragana-Lateinisch-Transkription ist ebenfalls nicht umkehrbar, da sie intern eine Kombination aus Katakana-Hiragana und Hiragana-Lateinisch ist.
Halbe Breite/volle Breite
Der Transliterator-Schritt kann zwischen schmalen Halbbreitenschriften und breiteren Vollbreitenschriften konvertieren. Hier ein Beispiel für halbe Breite: . Hier das gleiche Beispiel in voller Breite: .
Latin
Diese Schrift wird von den meisten europäischen Sprachen wie Englisch verwendet. Sie wurde ursprünglich von den alten Römern verwendet, um die lateinische Sprache zu schreiben.
Malayalam
Die Schrift der Malayalam-Sprache, der Amtssprache des indischen Bundesstaates Kerala. Diese Schrift wurde zuerst mit dem Vattelutu-Alphabet geschrieben. „Vattelutu“ bedeutet „rundes Schreiben“. Diese Schrift ist aus der Brahmi-Schrift des alten Indiens hervorgegangen.
Oriya
Die Schrift der Oriya-Sprache, der Amtssprache des indischen Bundesstaates Odisha. Die Oriya-Schrift ist aus der Kalinga-Schrift hervorgegangen, einem der vielen Abkömmlinge der Brahmi-Schrift des alten Indiens.
Tamil
Die von der tamilischen Sprache in mehreren Bundesstaaten Indiens, Sri Lankas und Malaysias verwendete Schrift. Diese Schrift wurde ursprünglich mit einer Version der Brahmi-Schrift geschrieben, die als tamilisches Brahmi bekannt ist.
Telugu
Die Schrift, die von mehreren Sprachen Südindiens verwendet wird. Diese Schrift ist ein Abkömmling der Brahmi-Schrift des alten Indiens.
Thai
Diese Schrift wird von der thailändischen Sprache verwendet. Diese Schrift ist von der Brahmi-Schrift des alten Indien und den Khmer-Alphabeten beeinflusst.

Transliterator ist Bestandteil des Data Normalization-Moduls. Eine Auflistung anderer Schritte finden Sie unter Data Normalization-Modul.