パフォーマンス チューニングのチェックリスト
このチェックリストでは、パフォーマンス チューニングのための推奨アプローチ、およびSpectrum™ Technology Platformのパフォーマンスを最適化するためのベスト プラクティスについて説明します。各手法は、パフォーマンスに対する影響が最も高いものから最も低いものの順に記載されています。
パフォーマンス設定 | 説明 | 追加情報 |
---|---|---|
データフロー設計 | パフォーマンスに対する影響が最も高いのは、データフローの設計です。いくつかのベスト プラクティスに従うことによって、データフローのパフォーマンスを確実に高めることができます。 | パフォーマンス最適化のための設計ガイドライン |
データフローのプール サイズ | データフローのプール サイズのデフォルト値は 8 です。8 個を上回るデータフローのインスタンスを同時に実行する予定の場合は、データフローのプール サイズのデフォルト値を同時インスタンス数と同じ数まで増加させることができます。 | データフロー プール サイズの設定 |
データベース リソースのプール サイズと、ステージ実行時インスタンス | データベース リソースのプール サイズと、ステージの実行時インスタンスの設定は、複数の同時要求を処理するシステムの能力を制御します。両者を連動させて調整する必要があります。 | プール サイズと実行時インスタンス設定のチューニング |
ソート パフォーマンス | 大きなデータ セットのソートは、バッチ処理中に実行される操作で最も時間がかかるものの 1 つになることがあります。ソート パフォーマンス オプションによってメモリとディスクの使用率を制御すると、使用可能なメモリとディスクの容量を十分に活用できます。 | デフォルトのソート パフォーマンス オプションの設定 |
リモート コンポーネントのオプション | これらの設定は、住所検証やジオコーディングなどの特定のステージのメモリ使用率を制御します。 | リモート コンポーネントのオプションの設定 |
個々のステージ | 特定の種類の処理を最適化するために採用できる、いくつかのアクションがあります。パフォーマンスのベスト プラクティスを参照して、最適なパフォーマンスが得られるようにデータフローが設定されているかどうかを確認してください。 | 個々のステージの最適化 |
JVM 設定 | 特定のハードウェアにおいてパフォーマンスを向上させることのできる JVM オプションがあります。 | JVM パフォーマンス チューニング |
マイクロバッチ処理 | マイクロバッチ処理は、サーバーに対する 1 回のリクエストに複数のレコードを含める手法です。 | マイクロバッチ処理 |
Elasticsearch のヒープ サイズ設定 | Metadata Insights のプロファイリング ツールや Enterprise Designer のマッチング ステージで、メモリを多用する操作を実行している場合は、Elasticsearch のヒープ サイズを大きくします。 | Elasticsearch のヒープ サイズ設定 |