Transliterator

Transliterator は、ラテン文字など、異なるスクリプト (用字系) の間で文字列を変換します。例:

ソース 書き直し

Transliteration-Katakana

kyanpasu

Αλφαβητικός Κατάλογος

биологическом

biologichyeskom

書き直しは翻訳でないことを心に留めておくことが重要です。書き直しは、基盤となる語句を翻訳せずに、異なる用字系の間で文字を変換することを意味します。

注: 標準の書き直し方法は、多くの場合、変換先の用字系における特定言語の発音ルールに従いません。
Transliterator ステージでは、以下の用字系がサポートされています。一般に、Transliterator ステージは、UNGEGN のラテン文字化方式に関する作業部会 (Working Group on Romanization Systems) のガイドラインに従います。詳細については、www.eki.ee/wgrs を参照してください。
アラビア文字
アラビア語、イラン語、ウルドゥー語など、複数のアジアおよびアフリカの言語で使われる用字系。
キリル文字
ロシア語などのスラブ系の言語を含む、東ヨーロッパおよびアジアの言語で使われる用字系。基本キリル文字セットに関しては、Transliterator ステージは一般に ISO 9 に従います。
デーバナーガリー文字
ヒンディー語、サンスクリット語など、インドの複数の言語で使われる用字系。この用字系は、古代インドと現在の南アジアおよび中央アジアで使われている最も古い書記体系であるブラーフミー用字系から派生したものです。
ギリシャ文字
ギリシャ語で使われる用字系。この用字系は、インド ヨーロッパ語族の古代ギリシャ語派に属しています。
グジャラート語
西部インドのグジャラート州で使われる用字系。デーバナーガリー用字系から派生したインドの現代用字系の 1 つ。
グルムキー文字
インドのパンジャブ語で使われる用字系。この用字系は、デーバナーガリー用字系の前身であるナーガリー用字系から大きな影響を受けています。
ハングル
韓国語で使われる用字系です。Transliterator ステージは、韓国文化観光部の書き直し規則に従います。詳細については、The National Institute of the Korean Language (韓国国立国語院) の Web サイトを参照してください。
ハン
中国語で使われる用字系。チベット ビルマ語族の語派であり、タイ語と中国語に基づいた用字系によって書き表されています。
繁体字/簡体字中国語

Transliterator ステージは、繁体字と簡体字の両方の中国語をサポートしています。例えば、これは繁体字中国語ですTraditional Chinese string.これは簡体字中国語ですSimplified Chinese string

カンナダ語
コンカニ語など、南インドの複数の言語で使われる用字系。この用字系は、古代インドのブラーフミー用字系から派生したものです。
片仮名および平仮名
日本語を書くために使うことができる複数の用字系の 1 つ。Transliterator ステージでは、ヘボン式と少しだけ異なる用字系が使われます。ヘボン式では、ZI (ZI character) と DI (DI character) はどちらも "ji" で表記され、ZU (ZU character) と DU (DU character) はどちらも "zu" で表記されます。DI の代わりに "dji"、DU の代わりに "dzu" を使えば、書き直しの可逆性が少し改善されます。片仮名書き直しは可逆です。平仮名-片仮名書き直しは完全には可逆でありません。片仮名のいくつかの文字に平仮名の対応する文字がないからです。また、平仮名では長音記号は使われません。平仮名-ラテン書き直しも可逆でありません。内部的には、片仮名-平仮名と平仮名-ラテン文字を組み合わせたものだからです。
半角/全角
Transliterator ステージは、幅の狭い半角用字系と幅の広い全角用字系の間の変換を行えます。例えば、これは半角です。 half-width string.これは全角です。 full-width string.
ラテン文字
英語など、ヨーロッパの多くの言語で使われる用字系。元々、古代ローマでラテン語を書き表すために使われていました。
マラヤーラム文字
インドのケララ州の公用語であるマラヤーラム語で使われる用字系。この用字系は最初、"丸い文字" を意味するヴァッテルットゥ文字で書き表され、古代インドのブラーフミー用字系から発展しました。
オリヤー文字
インドのオリッサ州の公用語であるオリヤー語で使われる用字系。オリヤー用字系は、古代インドのブラーフミー用字系の多数の派生系の 1 つであるカリンガ用字系から発展しました。
タミル語
インド、スリランカ、マレーシアの複数の州で通用するタミル語で使われる用字系。この用字系は当初、タミル ブラーフミーと呼ばれるブラーフミー用字系の 1 種によって書き表されていました。
テルグ語
南インドの複数の言語で使われる用字系。この用字系は、古代インドのブラーフミー用字系から派生したものです。
タイ語
タイ語で使われる用字系。この用字系は、古代インドのブラーフミー用字系とクメール文字の影響を受けています。

Transliterator は、Data Normalization モジュールのコンポーネントです。他のステージの一覧については、「Data Normalization モジュール」を参照してください。