Apache Knox Gateway を使用すると、Knox セキュリティ レイヤを経由して Hadoop サービスにアクセスできます。Spectrum™ Technology Platformで Knox を介して Hadoop のデータにアクセスするには、Management Console を使って Knox への接続を定義する必要があります。接続を定義した後は、Knox を介して Hadoop に対してデータの読み書きを行うフローを Enterprise Designer で作成できます。
-
Management Console を開きます。
-
に移動します。
- [追加] ボタン をクリックします。
-
[名前] フィールドに、接続の名前を入力します。任意の名前にすることができます。
注: 接続をいったん保存すると、名前の変更は不可能になります。
-
[タイプ] フィールドで、[ゲートウェイ] を選択します。
-
[ゲートウェイ タイプ] フィールドで、[Knox] を選択します。
-
[ホスト] フィールドに、このゲートウェイを実行している HDFS クラスタ内ノードのホスト名または IP アドレスを入力します。
-
[ポート] フィールドに、Knox ゲートウェイのポート番号を入力します。
-
[ユーザ名] フィールドに、Knox ゲートウェイのユーザ名を入力します。
-
[パスワード] フィールドに、Knox ゲートウェイへのアクセスを認証するパスワードを入力します。
-
[ゲートウェイ名] フィールドに、アクセスする Knox ゲートウェイの名前を入力します。
-
[クラスタ名] フィールドに、アクセスする Hadoop クラスタの名前を入力します。
-
[プロトコル] フィールドで、webhdfs を選択します。
-
[サービス名] フィールドに、アクセスする Hadoop サービスの名前を入力します。
-
接続をテストするには、[テスト] をクリックします。
-
[保存] をクリックします。
HDFS クラスタへの Knox 接続を定義した後で、この接続を Enterprise Designer において、Read from File ステージと Write to File ステージで使用できます。ソースまたはシンク ステージでファイルを定義するときに [リモート マシン] をクリックすると、HDFS クラスタを選択できます。