Data und Address Quality für Big Data SDK

Unbeaufsichtigtes Extrahieren von Referenzdaten und Einrichten des Acushare-Diensts

Sie können Referenzdaten für das Universal Addressing-Modul jetzt auch über ein unbeaufsichtigtes Skript silentInstalldb_unc.sh extrahieren und installieren. Das Skript akzeptiert einmalig Argumente und extrahiert ohne interaktiven Prozess Datenbanken auf Ihrem Rechner.
Anmerkung: Sie können das interaktive Dienstprogramm und Skript sh installdb_unc.sh bei Bedarf weiterhin verwenden.

Auch die Einrichtung des Acushare-Diensts erfordert keinen interaktiven Prozess. Geben Sie in der Datei installer.properties den Dienstinstallationspfad an, nachdem Sie das Einrichtungsskript kopiert haben. Der Dienst wird installiert und startet automatisch nach der Installation.

Anmerkung: Die Aktualisierungen für das Big Data Quality-Modul (BDQ) werden im Oktober 2017 veröffentlicht.

Referenzdaten des Universal Addressing-Moduls auf HDFS-Knoten

Referenzdaten für Aufträge des Universal Addressing-Moduls (außer Validate Address Loqate) können jetzt auch auf HDFS platziert werden und stehen in MR- und Spark-Aufträgen sowie in benutzerdefinierten Funktionen für Zugriffe zur Verfügung.

Note: Die Aktualisierungen für das Big Data Quality-Modul (BDQ) werden im Oktober 2017 veröffentlicht.

Open Parser-Aufträge

Spectrum™ Data und Address Quality für Big Data unterstützt jetzt auch Open Parser-Aufträge. Sie können den Auftrag verwenden, um die Eingabedatenzeichenfolgen anhand der definierten Parsing-Grammatik zu parsen.

Einzelheiten zur Verwendung des Auftrags finden Sie im Abschnitt „Open Parser“ unter „Aufträge des Data Normalization-Moduls“.

Anmerkung: Die Aktualisierungen für das Big Data Quality-Modul (BDQ) werden im Oktober 2017 veröffentlicht.

Unterstützung des nativen S3-Dateisystems

Der Client für das native Amazon S3-Dateisystem (s3n) steht jetzt in Hadoop MapReduce- und Spark-Aufträgen zur Verfügung. Sie können Ihre Eingabe- und Ausgabedateien auf s3n speichern und dort auf sie zugreifen. Sie müssen den Pfad als Parameter der Dateipfad-Unterklasse in einem spezifischen Format angeben und in Ihrem Auftrag verwenden.

Anmerkung: Die Aktualisierungen für das Big Data Quality-Modul (BDQ) werden separat veröffentlicht.