データベース リソースのプール サイズの設定

Spectrum データベースには、住所の検証で使用する郵便データや、住所のジオコードで使用するジオコーディング データなど、特定のステージで使用するリファレンス データが含まれます。これらのデータベースは、それを使用するデータフロー ステージやサービスから同時に行われる複数の要求を受け付け、データフローの要求やサービスの要求のパフォーマンスを高めるように設定することが可能です。データベースのプール サイズを変更すると、Spectrum データベースが受け付ける同時要求の数を変更できます。データベースが処理できる同時要求の最大数は、プール サイズによって決まります。デフォルトでは、Spectrum データベースのプール サイズは 4 で、データベースは 4 つの要求を同時に処理できることを意味します。ただし、データベースには別のプール サイズを設定できます。

注: パフォーマンスのチューニング時には、データベースのプール サイズを調整する前にデータフローのプール サイズを最適化します。
  1. Management Console を開きます。
  2. [リソース] > [Spectrum データベース] に移動します。
  3. 最適化するデータベース リソースを選択し、変更ボタン をクリックします。
  4. [プール サイズ] フィールドで、このデータベースで処理する同時要求の最大数を指定します。

    最適なプール サイズはモジュールによって異なります。一般的には、サーバーが搭載する CPU の数の半分から 2 倍のプール サイズを設定すると、最適な結果が得られます。ほとんどのモジュールに最適なプール サイズは CPU 数と同数です。例えば、サーバーが 4 つの CPU を搭載している場合は、プール サイズを 2 (CPU 数の半分) ~ 8 (CPU 数の 2 倍) の間で試すことができ、多くの場合、最適なサイズは 4 (CPU 数と同数) です。

    プール サイズを変更するときは、データベースにアクセスするステージ用としてデータフローに指定されている実行時インスタンスの数を考慮する必要もあります。例えば、1 つの実行時インスタンスを使用するように設定された Geocode US Address ステージを持つデータフローがあるとします。この場合、米国ジオコーディング データベースのプール サイズを 4 に設定しても、パフォーマンスは向上しません。実行時インスタンスが 1 つしかないので、データベースへの要求は一度に 1 つになります。ただし、Geocode US Address の実行時インスタンスの数を 4 つに増やすと、パフォーマンスが向上します。データベースに同時にアクセスする Geocode US Address のインスタンスが 4 つあるので、プール全体を使用できます。

    ヒント: さまざまな設定でパフォーマンス テストを行って、環境にとって最適なプール サイズと実行時インスタンスの設定を特定してください。