Read from Hive File

Read from Hive File ステージは、次のいずれかのフォーマットのファイルからデータを読み取ります。
  • ORC
  • RC
  • Parquet
  • Avro

[ファイル プロパティ] タブ

フィールド 説明
サーバー [ファイル名] フィールドで指定したファイルが Hadoop システム上にあることを示します。このステージでこれを使用する前に、Management Console で Hadoop ファイル サーバーへの接続を作成しておく必要があります。Hadoop システム上のファイルを選択すると、そのサーバー名が、ファイル サーバーの作成時に Management Console で指定する名前になります。
ファイル名 ファイルへのパスを指定します。省略記号ボタン (...) をクリックし、必要なファイルを参照して選択します。
注: 入力ファイルのスキーマは、正しい場所を参照し、ファイルを選択した時点ですぐにインポートされます。このインポートされるスキーマは編集できません。

ただし、必要であればスキーマの列の名前は変更できます。

ファイルを選択すると、最初の 50 件のレコードが [プレビュー] グリッドに取得されます。
ファイル タイプ: 読み込まれるファイルのタイプを選択します。
  • ORC
  • RC
  • Parquet
  • Avro
注: RC ファイルの場合、プレビューを生成するには、[フィールド] タブでスキーマを定義してから、[ファイル プロパティ] タブの [プレビュー] をクリックします。

[フィールド] タブ

[フィールド] タブでは、フィールドのユーザ定義名のほか、フィールドの名前、データタイプ、および位置を入力ファイルに保存されるとおりに定義します。詳細については、Hive ファイル読み取りのためのフィールドの定義を参照してください。