Conexión a Knox

Una puerta de enlace Apache Knox le permite acceder a un servicio Hadoop a través de una capa de seguridad Knox. A fin de que Spectrum™ Technology Platform acceda a los datos en Hadoop a través de Knox, debe definir una conexión a Knox mediante Management Console. Después de hacerlo, puede crear flujos en Enterprise Designer que pueden leer datos de, y escribir datos en, Hadoop a través de Knox.

  1. Abra Management Console.
  2. Vaya a Recursos > Fuentes de datos.
  3. Haga clic en el botón Agregar .
  4. En el campo Nombre, ingrese un nombre para la conexión. El nombre puede ser cualquiera que elija.
    Nota: Una vez que guardó una conexión, no puede cambiarle el nombre.
  5. En el campo Tipo, seleccione Puerta de enlace.
  6. En el campo Tipo de puerta de enlace, seleccione Knox.
  7. En el campo Host, ingrese el nombre de host o la dirección IP del nodo del clúster HDFS que ejecuta la puerta de enlace.
  8. En el campo Puerto, ingrese el número de puerto para la puerta de enlace Knox.
  9. En el campo Nombre de usuario, ingrese el nombre de usuario para la puerta de enlace Knox.
  10. En el campo Contraseña, ingrese la contraseña para autorizar su acceso a la puerta de enlace Knox.
  11. En el campo Nombre de puerta de enlace, ingrese el nombre de la puerta de enlace Knox a la que desea acceder.
  12. En el campo Nombre de clúster, ingrese el nombre del clúster Hadoop al que se accederá.
  13. En el campo Protocolo, seleccione WEBHDFS.
  14. En el campo Nombre de servicio, ingrese el nombre del servicio Hadoop al que se accederá.
  15. Para probar la conexión, haga clic en Probar.
  16. Haga clic en Guardar.

Después de definir una conexión de Knox en un clúster HDFS, puede usar la conexión en Enterprise Designer, en las etapas Read from File y Write to File. Puede seleccionar el clúster HDFS cuando hace clic en Equipo remoto para definir un archivo en una etapa de origen o recepción.