Calidad de datos y dirección para el SDK de Big Data

Extracción silenciosa de los datos de referencia y configuración del servicio acushare

Ahora puede extraer e instalar datos de referencia para el módulo Universal Addressing mediante una secuencia de comandos silenciosa silentInstalldb_unc.sh. La secuencia de comandos acepta argumentos una vez y extrae bases de datos en el equipo fuera de un proceso interactivo.
Nota: Igual puede usar la utilidad interactiva y la secuencia de comandos sh installdb_unc.sh, si es necesario.

La configuración del servicio acushare tampoco necesita un proceso interactivo. Después de copiar la secuencia de comandos de configuración, debe proporcionar la ruta de instalación de servicio en el archivo installer.properties. El servicio se instala y se inicia automáticamente después de la instalación.

Nota: Las actualizaciones del módulo Big Data Quality (BDQ) se publicarán en octubre de 2017.

Datos de referencia del módulo Universal Addressing en nodos HDFS

Los datos de referencia de los trabajos del módulo Universal Addressing (excepto Validate Address Loqate) ahora también se pueden colocar en HDFS y se puede acceder a ellos en MR, en trabajos Spark y en funciones definidas por el usuario.

Note: Las actualizaciones del módulo Big Data Quality (BDQ) se publicarán en octubre de 2017.

Trabajos Open Parser

Ahora, Spectrum™ Data & Address Quality for Big Data también es compatible con los trabajos Open Parser. Puede utilizar el trabajo para analizar las cadenas de datos de entrada según la gramática de análisis definida.

Para obtener más detalles acerca del uso del trabajo, consulte la sección Open Parser de los Trabajos del módulo Data Normalization.

Nota: Las actualizaciones del módulo Big Data Quality (BDQ) se publicarán en octubre de 2017.

Compatibilidad con S3 native filesystem

Ahora el cliente Amazon S3 native filesystem (s3n) está disponible en los trabajos Spark y MapReduce de Hadoop. Puede almacenar y acceder a sus archivos de entrada y salida en s3n. Deberá proporcionar la ruta en un formato especificado como parámetro en la subclase filepath y utilizarlo en su trabajo.

Nota: Las actualizaciones del módulo Big Data Quality (BDQ) se publicarán por separado.