Data and Address Quality for Big Data SDK

リファレンスデータの抽出と acushare サービスのセットアップのサイレント実行

Universal Addressing モジュールのリファレンスデータの抽出とインストールが、サイレントスクリプト silentInstalldb_unc.sh によって実行できるようになりました。このスクリプトは引数を一度に受け取り、インタラクティブプロセスを行わずにデータベースをマシン上に展開します。

注: 必要な場合は、インタラクティブユーティリティと sh installdb_unc.sh を使用することも可能です。

acushare サービスのセットアップにも、インタラクティブな処理は必要ありません。セットアップスクリプトをコピーした後に、installer.properties ファイル内でサービスインストールパスを指定します。サービスがインストールされ、インストール後に自動的に起動します。

注: Big Data Quality (BDQ) モジュールのアップデートは 2017 年 10 月にリリースされます。

Universal Addressing モジュールのリファレンスデータを HDFS ノード上に配置

Universal Addressing モジュールのジョブ (Validate Address Loqate を除く) の参照データを、HDFS に配置し、MR ジョブ、Spark ジョブ、およびユーザ定義関数でアクセスできるようになりました。

Note: Big Data Quality (BDQ) モジュールのアップデートは 2017 年 10 月にリリースされます。

Open Parser ジョブ

Spectrum™ のビッグデータ向けデータおよび住所品質モジュールで、Open Parser ジョブもサポートされるようになりました。このジョブを使用して、パーシンググラマーの定義に従い入力データ文字列をパースできます。

ジョブの使用については、Data Normalization モジュールのジョブの Open Parser に関するセクションを参照してください。

注: Big Data Quality (BDQ) モジュールのアップデートは 2017 年 10 月にリリースされます。

S3 ネイティブファイルシステムのサポート

Amazon S3 ネイティブファイルシステム (s3n) クライアントを Hadoop MapReduce および Spark ジョブで利用できるようになりました。入力および出力ファイルを s3n に保存してアクセスできます。FilePath サブクラスへのパラメータとして指定された形式でパスを指定し、ジョブで使用する必要があります。

注: Big Data Quality (BDQ) モジュールのアップデートは別途リリースされます。

Data and Address Quality for Big Data SDK

リファレンス データの抽出と acushare サービスのセットアップのサイレント実行

Universal Addressing モジュールのリファレンス データを HDFS ノード上に配置

Open Parser ジョブ

S3 ネイティブ ファイル システムのサポート

リファレンスデータの抽出と acushare サービスのセットアップのサイレント実行

Universal Addressing モジュールのリファレンスデータを HDFS ノード上に配置

S3 ネイティブファイルシステムのサポート