Uso de una memoria caché global para las consultas

Si tiene una tabla de grandes dimensiones, puede cargar los datos de la tabla de dimensiones en una memoria caché, y utilizarla para buscar claves de reemplazo. Usar una memoria caché mejora el rendimiento, en comparación con la búsqueda directa en la tabla de dimensiones mediante la base de datos de consulta.

Para utilizar una memoria caché debe crear dos flujos de datos: uno para llenar la memoria caché con los datos de la tabla de dimensiones y otro que utilice la memoria caché durante la actualización de la tabla de hechos. El siguiente diagrama ilustra cómo los dos flujos trabajar juntos:

  1. Creación de un flujo de datos que llene la memoria caché con datos de la tabla de dimensiones de la tabla de grandes dimensiones.

    Este flujo de datos debe tener dos etapas:

    • Una etapa Read from DB que lea los datos de la tabla de dimensiones que desea cargar en la memoria caché.
    • Una etapa Write to Cache que llene la memoria caché con los datos de la tabla dimensiones.
  2. Ejecute este flujo de datos para llenar la memoria caché.
  3. En el flujo de datos que llena la tabla de hechos, agregue una memoria caché de consulta.
  4. En la etapa Query Cache, configure la etapa para llenar con consultas la caché creada en la etapa Write to Cache.
  5. Ejecute este flujo de datos para llenar la tabla de hechos.

Si desea asegurarse de que la memoria caché se llena con los datos más recientes de la tabla de dimensiones cada vez que actualiza la tabla de hechos, puede crear un flujo de proceso que primero ejecute el trabajo para llenar la tabla de dimensiones y, a continuación, ejecute el trabajo para actualizar la tabla de hechos. Esto le permite activar el flujo de proceso con el fin de ejecutar los flujos de datos en sucesión. Para obtener más información sobre los flujos de proceso, consulte la Guía del diseñador de flujo de datos.