Transliterator
Transliterator は、ラテン文字など、異なるスクリプト (用字系) の間で文字列を変換します。例:
ソース | 書き直し |
---|---|
kyanpasu |
|
Αλφαβητικός Κατάλογος |
Alphabētikós Katálogos |
биологическом |
biologichyeskom |
書き直しは翻訳でないことを心に留めておくことが重要です。書き直しは、基盤となる語句を翻訳せずに、異なる用字系の間で文字を変換することを意味します。
注: 標準の書き直し方法は、多くの場合、変換先の用字系における特定言語の発音ルールに従いません。
Transliterator ステージでは、以下の用字系がサポートされています。一般に、Transliterator ステージは、UNGEGN のラテン文字化方式に関する作業部会 (Working Group on Romanization Systems) のガイドラインに従います。詳細については、www.eki.ee/wgrs を参照してください。
- アラビア文字
- アラビア語、イラン語、ウルドゥー語など、複数のアジアおよびアフリカの言語で使われる用字系。
- キリル文字
- ロシア語などのスラブ系の言語を含む、東ヨーロッパおよびアジアの言語で使われる用字系。基本キリル文字セットに関しては、Transliterator ステージは一般に ISO 9 に従います。
- ギリシャ文字
- ギリシャ語で使われる用字系。
- 半角/全角
- Transliterator ステージは、幅の狭い半角用字系と幅の広い全角用字系の間の変換を行えます。例えば、これは半角です。。これは全角です。。
- ハングル
- 韓国語で使われる用字系です。Transliterator ステージは、韓国文化観光部の書き直し規則に従います。詳細については、The National Institute of the Korean Language (韓国国立国語院) の Web サイトを参照してください。
- 片仮名
- 日本語を書くために使うことができる複数の用字系の 1 つ。Transliterator ステージでは、ヘボン式と少しだけ異なる用字系が使われます。ヘボン式では、ZI () と DI () は、どちらも "ji" で表記され、ZU () と DU () はどちらも "zu" で表記されます。DI の代わりに "dji"、DU の代わりに "dzu" を使えば、書き直しの可逆性が少し改善されます。片仮名書き直しは可逆です。
- ラテン文字
- 英語など、ヨーロッパの多くの言語で使われる用字系。
Transliterator は、Data Normalization モジュールのコンポーネントです。他のステージの一覧については、「Data Normalization モジュール」を参照してください。