Upload
others
View
2
Download
0
Embed Size (px)
Citation preview
InformáticaGráficos estadísticos univariantes
Álvaro Romero Jiménez
Departamento de Ciencias de la Computación e Inteligencia ArtificialUniversidad de Sevilla
Próposito de los gráficos estadísticos
La excelencia en los gráficos estadísticos consiste en lacomunicación de ideas complejas con claridad, precisión yeficiencia. Algunos de los objetivos principales de un gráficoestadístico se describen a continuación:
2 / 20
Próposito de los gráficos estadísticos
1. Mostrar los datos.2. Inducir al observador a pensar acerca del contenido en
lugar de la metodología, el diseño gráfico o la tecnologíaque produjo el gráfico.
3. Evitar la distorsión en la comunicación de los datos.4. Presentar muchos números en un pequeño espacio.
3 / 20
Próposito de los gráficos estadísticos
5. Hacer que grandes conjuntos de datos tengan coherencia.6. Inducir a la comparación entre diferentes partes de los
datos.7. Revelar diferentes detalles de los datos, desde la
perspectiva global a los detalles más particulares.8. Tener un propósito razonablemente claro: la descripción,
la exploración, la tabulación o la decoración.9. Estar muy integrado con las descripciones estadísticas y
verbales del conjunto de datos.
4 / 20
Elementos principales
Figura: Descripción del gráfico
5 / 20
Elementos principales
Figura: Comparativa entre el número de solicitudes admitidas y rechazas por cadauno de los departamentos
6 / 20
RecomendacionesI Hacer que los datos sobresalgan. Evitar lo superfluo.I Utilizar elementos prominentes para mostrar los datos.I Hacer la región de datos menor que la región delimitada
por las escalas. Las marcas hacia afuera.I No congestionar la región de datos.I No exagerar el número de marcas (de 3 a 10 marcas).I Utilizar una línea cuando haya un valor que deba verse a
través del gráfico, pero que no interfiera con los datos.I Las etiquetas no deben interferir o congestionar el gráfico.I Evitar colocar claves en el interior. Colocar las notas en el
texto o la explicación.I Los símbolos o conjuntos de datos que se superpongan
deben poder ser reconocidos fácilmente.
7 / 20
Algunos ejemplos de gráficos engañosos
Figura: ¿The Times duplica en número de ventas al Daily Telegraph?
8 / 20
Algunos ejemplos de gráficos engañosos
Figura: ¿Se está produciendo un sobre-calentamiento?
9 / 20
Algunos ejemplos de gráficos engañosos
I Hay 30 millones de usarios de la XBox 360: el 11% son 3.3millones.
I Hay 20 millones de usuarios de la PS3: el 10% son 2 millones.
I Hay 50 millones de usuarios de la Wii: el 6% son 3 millones.
10 / 20
Parte II
Gráficos para variablescuantitativas
11 / 20
Qué buscar en un gráficode una variable cuantitativa
I Forma de los datos (simetría o asimetría, unimodalidad,bimodalidad o multimodalidad, ...).
I Posición de los datos (media, mediana, moda, ...).I Dispersión de los datos (varianza, desviación típica, rango
intercuartílico, ...).I Valores atípicos (outliers) entre los datos.I Conglomerados en los datos.I Granularidad (discretización) en los datos.
12 / 20
Qué buscar en un gráficode una variable cuantitativa
I Forma de los datos (simetría o asimetría, unimodalidad,bimodalidad o multimodalidad, ...).
I Posición de los datos (media, mediana, moda, ...).
I Dispersión de los datos (varianza, desviación típica, rangointercuartílico, ...).
I Valores atípicos (outliers) entre los datos.I Conglomerados en los datos.I Granularidad (discretización) en los datos.
12 / 20
Qué buscar en un gráficode una variable cuantitativa
I Forma de los datos (simetría o asimetría, unimodalidad,bimodalidad o multimodalidad, ...).
I Posición de los datos (media, mediana, moda, ...).I Dispersión de los datos (varianza, desviación típica, rango
intercuartílico, ...).
I Valores atípicos (outliers) entre los datos.I Conglomerados en los datos.I Granularidad (discretización) en los datos.
12 / 20
Qué buscar en un gráficode una variable cuantitativa
I Forma de los datos (simetría o asimetría, unimodalidad,bimodalidad o multimodalidad, ...).
I Posición de los datos (media, mediana, moda, ...).I Dispersión de los datos (varianza, desviación típica, rango
intercuartílico, ...).I Valores atípicos (outliers) entre los datos.
I Conglomerados en los datos.I Granularidad (discretización) en los datos.
12 / 20
Qué buscar en un gráficode una variable cuantitativa
I Forma de los datos (simetría o asimetría, unimodalidad,bimodalidad o multimodalidad, ...).
I Posición de los datos (media, mediana, moda, ...).I Dispersión de los datos (varianza, desviación típica, rango
intercuartílico, ...).I Valores atípicos (outliers) entre los datos.I Conglomerados en los datos.
I Granularidad (discretización) en los datos.
12 / 20
Qué buscar en un gráficode una variable cuantitativa
I Forma de los datos (simetría o asimetría, unimodalidad,bimodalidad o multimodalidad, ...).
I Posición de los datos (media, mediana, moda, ...).I Dispersión de los datos (varianza, desviación típica, rango
intercuartílico, ...).I Valores atípicos (outliers) entre los datos.I Conglomerados en los datos.I Granularidad (discretización) en los datos.
12 / 20
Diagrama de dispersiónDatos: 115 117 120 123 126 129 132 135
139 142 146 150 154 159 164
13 / 20
Diagrama de dispersión
13 / 20
Diagrama de dispersión
13 / 20
Diagrama de dispersión
13 / 20
Diagrama de dispersión
13 / 20
Diagrama de dispersión
13 / 20
Diagrama de caja y bigote
14 / 20
Diagrama de caja y bigote
14 / 20
Diagrama de caja y bigote
14 / 20
Diagrama de caja y bigote
14 / 20
Diagrama de caja y bigote
14 / 20
Diagrama de caja y bigote
14 / 20
Histograma
15 / 20
Histograma
15 / 20
Histograma
15 / 20
Histograma
15 / 20
Histograma
Reglas para el número de intervalos:
I Regla de Sturges: dlog2 n + 1e(n: cantidad total de datos)
I Regla de Scott:3,5s
3√n
(n: cantidad total de datoss: desviación típica de los datos)
I Regla de Friedman-Diaconis: 2IQR
3√n
(n: cantidad total de datosIQR : rango intercuartílico de los datos)
15 / 20
Gráfico de densidad
16 / 20
Parte III
Gráficos para variables cualitativas
17 / 20
Diagrama de barras
18 / 20
Diagrama de puntos
19 / 20
Variable cuantitativa con valores individualizados
20 / 20