Data and Address Quality for Big Data SDK

リファレンス データの抽出と acushare サービスのセットアップのサイレント実行

Universal Addressing モジュールのリファレンス データの抽出とインストールが、サイレント スクリプト silentInstalldb_unc.sh によって実行できるようになりました。このスクリプトは引数を一度に受け取り、インタラクティブ プロセスを行わずにデータベースをマシン上に展開します。
注: 必要な場合は、インタラクティブ ユーティリティと sh installdb_unc.sh を使用することも可能です。

acushare サービスのセットアップにも、インタラクティブな処理は必要ありません。セットアップ スクリプトをコピーした後に、installer.properties ファイル内でサービス インストール パスを指定します。サービスがインストールされ、インストール後に自動的に起動します。

注: Big Data Quality (BDQ) モジュールのアップデートは 2017 年 10 月にリリースされます。

Universal Addressing モジュールのリファレンス データを HDFS ノード上に配置

Universal Addressing モジュールのジョブ (Validate Address Loqate を除く) の参照データを、HDFS に配置し、MR ジョブ、Spark ジョブ、およびユーザ定義関数でアクセスできるようになりました。

Note: Big Data Quality (BDQ) モジュールのアップデートは 2017 年 10 月にリリースされます。

Open Parser ジョブ

Spectrum™ のビッグデータ向けデータおよび住所品質モジュールで、Open Parser ジョブもサポートされるようになりました。このジョブを使用して、パーシング グラマーの定義に従い入力データ文字列をパースできます。

ジョブの使用については、Data Normalization モジュールのジョブの Open Parser に関するセクションを参照してください。

注: Big Data Quality (BDQ) モジュールのアップデートは 2017 年 10 月にリリースされます。

S3 ネイティブ ファイル システムのサポート

Amazon S3 ネイティブ ファイル システム (s3n) クライアントを Hadoop MapReduce および Spark ジョブで利用できるようになりました。入力および出力ファイルを s3n に保存してアクセスできます。FilePath サブクラスへのパラメータとして指定された形式でパスを指定し、ジョブで使用する必要があります。

注: Big Data Quality (BDQ) モジュールのアップデートは別途リリースされます。