Verbindung zu Knox herstellen

Mit einem Apache Knox Gateway können Sie über den Knox-Sicherheitslayer auf einen Hadoop-Dienst zugreifen. Damit Spectrum™ Technology Platform über Knox auf Daten in Hadoop zugreifen kann, müssen Sie mithilfe der Management Console eine Verbindung zu Knox definieren. Danach können Sie im Enterprise Designer Flüsse erstellen, die Daten über Knox von Hadoop lesen und dorthin schreiben können.

  1. Öffnen Sie die Management Console.
  2. Öffnen Sie Ressourcen > Datenquellen.
  3. Klicken Sie auf die Schaltfläche „Hinzufügen“ .
  4. Geben Sie im Feld Name einen Namen für die Verbindung ein. Sie können den Namen frei wählen.
    Anmerkung: Sobald Sie eine Verbindung gespeichert haben, können Sie den Namen nicht mehr ändern.
  5. Wählen Sie im Feld Typ Gateway aus.
  6. Wählen Sie im Feld Gatewaytyp die Option Knox aus.
  7. Geben Sie im Feld Host den Hostnamen oder die IP-Adresse des Knotens im HDFS-Cluster ein, auf dem das Gateway ausgeführt wird.
  8. Geben Sie in das Feld Port die Portnummer für das Knox-Gateway ein.
  9. Geben Sie in das Feld Benutzername den Benutzernamen für das Knox-Gateway ein.
  10. Geben Sie das Feld Kennwort das Kennwort für Ihren Zugriff auf das Knox-Gateway ein.
  11. Geben Sie in das Feld Gatewayname den Namen des Knox-Gateways ein, auf das Sie zugreifen möchten.
  12. Geben Sie in das Feld Clustername den Namen des Hadoop-Clusters ein, auf das zugegriffen werden soll.
  13. Wählen Sie im Feld Protokoll webhdfs aus.
  14. Geben Sie in das Feld Dienstname den Namen des Hadoop-Dienstes ein, auf den zugegriffen werden soll.
  15. Um die Verbindung zu testen, klicken Sie auf Testen.
  16. Klicken Sie auf Speichern.

Nachdem Sie eine Knox-Verbindung zu einem HDFS-Cluster definiert haben, können Sie die Verbindung im Enterprise Designer in den Schritten Read from File und Write to File verwenden. Sie können das HDFS-Cluster beim Definieren einer Datei in einem Quell- oder Datenladeschritt auswählen, indem Sie auf Remote-Computer klicken.