Read from Hive File

Read from Hive File ステージは、ORC、RC、Parquet、Avro のいずれかのフォーマットのファイルからデータを読み取ります。
関連するタスク:

Hadoop への接続: Read from Hive File ステージを使用できるようにするには、Hadoop ファイル サーバーへの接続を作成する必要があります。それが済むと、その接続を保存するための名前がサーバー名として表示されます。

[ファイル プロパティ] タブ

フィールド 説明
サーバー [ファイル名] フィールドで指定したファイルが Hadoop システム上にあることを示します。
注: Hadoop ファイル サーバーにあるファイルを使用する前に、Hadoop ファイル サーバーへの接続を作成する必要があります。接続の作成の詳細については、Hadoop への接続を参照してください。
Hadoop システム上のファイルを選択すると、そのサーバー名が、ファイル サーバーの作成時に指定する名前になります。
ファイル名 ファイルへのパスを指定します。省略記号ボタン (...) をクリックし、必要なファイルを参照して選択します。ただし、必要であればスキーマの列の名前は変更できます。ファイルを選択すると、最初の 50 件のレコードが [プレビュー] グリッドに取得されます。
注: 入力ファイルのスキーマは、正しい場所を参照し、ファイルを選択した時点ですぐにインポートされます。このインポートされるスキーマは編集できません。
ファイル タイプ: 読み込まれるファイルのタイプを選択します。
  • ORC
  • RC
  • Parquet
  • Avro
注: RC ファイルの場合、プレビューを生成するには、[フィールド] タブでスキーマを定義した後に、[ファイル プロパティ] タブの [プレビュー] をクリックします。

[フィールド] タブ

[フィールド] タブでは、フィールドのユーザ定義名のほか、フィールドの名前、データタイプ、および位置を入力ファイルに保存されるとおりに定義します。詳細については、「Hive ファイル読み取りのためのフィールドの定義」を参照してください。