Detalles de columna en Resultados de generación de perfiles
- Finalización: el porcentaje de finalización de los datos en la columna
- Singularidad: valores únicos, no únicos y distintos detectados en los datos de la columna
- Longitud min. y Longitud máx. de los caracteres en caso de que los datos de la columna sean una cadena de caracteres
- Desviación estándar (Stdev), Máximo (Max), Mínimo (Min), Varianza y valor Promedio en caso de que en la columna se muestren datos numéricos.
- Histograma permite representar la distribución de datos en caso de que la columna tenga datos numéricos
- Percentil en caso de que la columna tenga datos numéricos
- Frecuencia de los datos en la columna
- Longitudes de cadenas en caso de que el tipo de datos de la columna sea una cadena de caracteres
- Distribución de secuencias de comando en caso de que el tipo de datos de la columna sea una cadena de caracteres
- Frecuencia de patrón de texto en caso de que el tipo de datos de la columna sea una cadena de caracteres
- Categorías de caracteres: permite mostrar gráficamente las frecuencias de los tipos de caracteres latinos detectados en la columna de cadena de caracteres seleccionada. Las distintas categorías son:
- Uso de mayúsculas y minúsculas: letras mayúsculas, minúsculas y combinadas
- Tipos de datos de caracteres: alfabético, numérico y alfanumérico
- Contiene espacios: espacios únicos, múltiples y espacios ubicados al principio y al final
- Caracteres especiales: caracteres especiales existentes o no existentes.Nota: En estas categorías solo se considerarán los caracteres especiales definidos durante la configuración de la regla Análisis de caracteres.
Visualización de valores atípicos
Puede hacer clic en la pestaña Valores atípicos para ver los valores atípicos detectados en una columna. Esta pestaña muestra una estructura con tabulación de valores atípicos detectados por categoría en la columna. También se muestran detalles como Patrón, Longitud, Valor o Frecuencia, Rango calculado y Ocurrencia.
Ver la página de sugerencias
Esta página se divide en dos partes:
- Un encabezado en el que aparecen los detalles del perfil. Se muestran los siguientes detalles del perfil analizado:
- Nombre de perfil: nombre del perfil
- Descripción: una breve descripción del perfil
- Iniciado: la fecha (aaaa/mm/dd), hora (hh:mm:ss) y período (a. m. o p. m.) del momento en que se inició el análisis del perfil.
- Origen de datos: el origen de los datos en el perfil que se está analizando. Puede ser un modelo físico o lógico, o bien una conexión de origen de datos.
- Usuario: el usuario que creó el perfil
- Tablas: cantidad de tablas en el modelo seleccionado
- Tipo de fuente de datos: permite indicar si la fuente de datos del perfil es un modelo o una base de datos
- Registros: cantidad total de registros analizados
- Botón Estadísticas: lo guía por la página Resultados de la generación de perfiles de datos. Para obtener más información, consulteVer sugerencias en la página Resultados de la generación de perfiles de datos.
- La segunda sección muestra el nombre de la tabla junto al botón Recomendación. Tras hacer clic en este botón, se muestran Comandos Groovy de sugerencias para su tabla. Cuando expanda la tabla usando el ícono , podrá ver sugerencias relacionadas con las columnas para su tabla.
Puede ver y seleccionar sugerencias para estadísticas independientes en la página Resultados de la generación de perfiles de datos. Analice las estadísticas de sus datos y seleccione cualquier sugerencia según sus requisitos. Para obtener más información, consulteVer sugerencias en la página Resultados de la generación de perfiles de datos.
Ver sugerencias en la página Resultados de la generación de perfiles de datos
Sugerencias para la pestaña Resumen
- Tipo de datos de caracteres: los tipos de datos de caracteres como numéricos, alfanuméricos y alfabéticos que se detectan en sus datos se muestran en un formato tabular con sus frecuencias. En la lista de opciones puede seleccionar Recortar o Eliminar estos valores, o establecer un valor predeterminado. Debe especificar este valor en el cuadro de texto que aparece al seleccionar esta opción.
- Quitar espacios: los espacios redundantes como espacios únicos, espacios múltiples y espacios ubicados al principio y al final que se encuentran en sus datos se muestran en un formato tabular con sus frecuencias. Puede elegir cualquiera de estas opciones según sus necesidades:
- Recortar espacios: esta opción quitará cualquier espacio ubicado al principio o al final que se encuentre en sus datos.
- Minimizar espacio en blanco: esta opción quitará los espacios redundantes entre dos palabras y también los espacios ubicados al principio y al final
- Quitar espacios: esta opción quitará todos los espacios que se encuentren en sus datos.
- Estandarizar uso de mayúsculas y minúsculas: si usa esta opción, puede regularizar sus datos mediante la estandarización del uso de mayúsculas y minúsculas de sus datos, ya sea utilizando letras mayúsculas, minúsculas y combinadas. Puede cambiar el uso de mayúsculas y minúsculas de sus datos a minúsculas o mayúsculas, lo cual depurará sus datos y mejorará su uniformidad y legibilidad.
- Quitar caracteres especiales: mediante esta opción puede elegir quitar cualquier carácter especial que se encuentre en sus datos. Los caracteres especiales detectados se muestran en la sección Opciones en un cuadro de texto. Para depurar sus datos, puede seleccionar los caracteres especiales que desea quitar, y eliminar los caracteres que desea mantener mediante la tecla de retroceso en el cuadro de texto.
- Quitar caracteres de control: mediante esta opción, puede quitar cualquier carácter de control redundante y no imprimible que se encuentre en sus datos. Los caracteres de control detectados en sus datos aparecen en la sección Estadísticas; seleccione la opción Quitar caracteres de control y aplique esta sugerencia para seguir depurando sus datos.
Crear tipo de semántica: puede categorizar sus datos distintos en un tipo de semántica, como Género, Nombre, Apellido, País y Teléfono. Haga clic en el gráfico de estadísticas de los datos distintos para mostrar una vista previa de sus datos. Descargue estos datos y cree tipos de semántica mediante Administración de tablas. Para obtener más información acerca de Administración de tablas, consulte Introducción a las tablas de búsqueda.
Manejo de valores nulos: puede establecer las cadenas de caracteres nulas y vacías que se encuentran en sus datos en un valor predeterminado. Esto aumenta la uniformidad y finalización de sus datos. Las frecuencias de las cadenas de caracteres Finalizadas, Nulas y Vacías aparecen en formato de tabla en la sección Estadísticas. Ingrese el valor predeterminado que desea en el cuadro de texto Opciones y seleccione esta sugerencia.
Sugerencias para la pestaña Resumen de fechas
En el caso de Patrones de datos, verá la siguiente sugerencia:
Estandarizar fecha: puede regular los formatos de las fechas presentes en sus datos para mejorar la uniformidad de sus datos. Las frecuencias de los varios formatos de fecha detectados en sus datos aparecen en formato de tabla. Seleccione el formato deseado en el menú desplegable de formato de fecha que se encuentra en la sección Opciones y seleccione esta sugerencia.
Sugerencias para la pestaña Patrón personalizado
En el caso de Patrones cruzados, verá la siguiente sugerencia:
- Establecerlas en un valor predeterminado. Ingrese el valor predeterminado en el cuadro de texto proporcionado.
- Establecerlas en un valor nulo
Después de seleccionar la opción deseada, seleccione esta sugerencia para depurar sus datos.
Sugerencias para la pestaña Valores atípicos
En el caso de Valores atípicos de tipo semántico, verá la siguiente sugerencia:
Tipos de semántica de segregación: puede trasladar valores atípicos de tipo semántico presentes en una columna a una columna independiente y mejorar la uniformidad y claridad de sus datos. La frecuencia de varios valores atípicos detectados en sus datos se muestra en un formato de tabla, puede mover cualquiera de estos valores atípicos detectados a una columna personalizada independiente y segregar los tipos de semántica.Seleccione los valores atípicos que desea mover a una columna independiente, ingrese el nombre personalizado de la columna en el cuadro de texto y seleccione esta sugerencia.