Continuamos con las herramientas de análisis y priorización de problemas, y hoy vamos a conocer una de las herramientas más utilizadas: El diagrama de dispersión o gráfico de dispersión. No por nada se considera una de las 7 herramientas básicas de calidad. Es quizá uno de los gráficos que se aprenden de primero en formación estadística, así que ya tienes una idea de su importancia.
Vamos a comprender qué es un diagrama de dispersión, cómo se hace y por supuesto, un ejemplo de aplicación para garantizar el aprendizaje.
Qué es un diagrama de dispersión
Antes de responder este interrogante, es necesario dar respuesta a qué es dispersión. La definición de dispersión tiene múltiples respuestas, como bien nos muestra wikipedia: Dispersión. Nos quedamos con la definición matemática:
Dispersión se define como el grado de distanciamiento de un conjunto de valores respecto a su valor medio.
A partir de esta definición, se derivan las medidas de dispersión que aprendimos en la clase de estadística del colegio: Rango, varianza, desviación, covarianza, coeficiente de correlación, etc.
Ahora bien, el diagrama de dispersión, también conocido como gráfico de dispersión o gráfico de correlación consiste en la representación gráfica de dos variables para un conjunto de datos. En otras palabras, analizamos la relación entre dos variables, conociendo qué tanto se afectan entre sí o qué tan independientes son una de la otra.
En este sentido, ambas variables se representan como un punto en el plano cartesiano y de acuerdo a la relación que exista entre ellas, definimos su tipo de correlación.
Tipos de correlación en un gráfico de dispersión
Con base en el comportamiento que toman las variables de estudio, podemos encontrar 3 tipos de correlación: Positiva, negativa y nula.
-
Correlación positiva
Se presenta cuando una variable aumenta o disminuye y la otra también, respectivamente. Hay una relación proporcional. Por ejemplo para un vendedor de carros, si él vende más carros (variable 1), va a ganar más dinero (variable 2).
-
Correlación negativa
Se presenta cuando una variable se comporta de forma contraria o a la otra, es decir que si una variable aumenta, la otra disminuye. Hay una relación inversa proporcional. Por ejemplo para la construcción de un edificio, entre más trabajadores estén construyendo un edificio (variable 1), menos tiempo se necesitará para tenerlo listo (variable 2)
-
Correlación nula
Si no encuentras un comportamiento entre las variables, existe una correlación nula.
Estos son pues, los tipos de correlación más visibles. Aunque si lo miramos desde una perspectiva que evalua qué tan fuerte o débil es la correlación, encontramos otra clasificación.
El coeficiente de correlación en un diagrama de dispersión
El coeficiente de correlación nos describe cómo es la relación existente entre dos variables, en otras palabras, al conocer este número sabemos si la correlación es positiva o negativa y qué tan fuerte o débil es. Se usa la letra r para expresarla, veamos cómo:
- r=1
La correlación es positiva perfecta. Si una variable crece, la otra también lo hace en una proporción constante. Es una relación directa, por eso si trazamos una linea de ajuste esta va pasar por todos y cada uno de los puntos.
- 0<r<1
Es cuando r esta entre 0 y 1 sin llegar a ser 0 y 1. Es una correlación positiva. El grado de cercanía de 1 define qué tan directa y proporcional es la relación entre ambas variables, por ende entre más cerca esté de 0, más débil será su correlación negativa.
- r=0
La correlación es nula, es decir que no existe una relación lineal entre ambas variables. Qué tal si pruebas buscando otro tipo de relación.
- -1<r<0
Es cuando r esta entre -1 y 0 sin llegar a ser –1 y 0. Es una correlación negativa. El grado de cercanía a -1 define que tan inversa y proporcional es la relación entre ambas variables, por ende entre más cerca esté de 0, más debíl será su correlación negativa.
- r=-1
La correlación es negativa perfecta. Si una variable crece, la otra va a disminuir en proporción constante. Es una relación directa e inversa, por lo tanto una línea de ajuste va a tocar todos los puntos graficados.
Un ejemplo más claro de todo lo mencionado lo muestra wikipedia en una imagen: Tipos de coeficiente de correlación
Cómo hacer un diagrama de dispersión paso a paso
- Paso 1: Determina cuál es la situación. Si no entendemos qué es lo que esta ocurriendo, no podremos establecer las variables a estudiar.
- Paso 2: Determina las variables a estudiar. Si ya determinaste las variables a estudiar, es porque crees que puede existir una relación entre ellas que te permita caracterizar la situación.
- Paso 3: Recolecta los datos de las variables: Si ya los tienes, perfecto. Si no, definimos un período de tiempo para conseguir los datos de las variables antes definidas. Recuerda que los datos de las dos variables deben estar dados en el mismo período de tiempo.
- Paso 4: Ubica los valores en el eje respectivo. Por lo general, la variable independiente es aquella que no está influenciada por la otra y se ubica en el eje x. La variable dependiente que es la que se ve afectada por la otra variable se ubica en el eje y. Así pues, procedemos a ubicar los valores en el plano cartesiano de acuerdo a su variable (x, y)
- Paso 5: Determina el coeficiente de correlación: El coeficiente de correlación debe verse reflejado en la forma que toma el gráfico de dispersión. Es el cociente de la covarianza y la multiplicación de la desviación típica de las dos variables. Con excel logramos calcularlo de manera muy simple.
- Paso 6: Analizamos: Con base en el coeficiente y en el gráfico, definimos cuál es la relación de las dos variables y tomamos las decisiones pertinentes.
Ejemplo de diagrama de dispersión
Vamos a ver desde una problemática empresarial, un ejemplo resuelto de diagrama de dispersión para el área de calidad.
Imagina que una litográfica está abriendo una nueva área de producción para la impresión de posters, y en este momento se encuentra haciendo todos los ensayos y pruebas para determinar la cantidad de tinta de cada color que deberían tener las maquinas.
Como prueba inicial, han decidido establecer la relación de errores de impresión según el grado de llenado de los recipientes de tinta de la máquina.
Bien, definida la situación, iniciamos desde el paso 2:
Las variables a estudiar para este ejemplo de grafico de dispersión en calidad son:
- Cantidad de tinta en litros
- Número de errores de impresión
Para el paso 3, comenzamos a recolectar las variables. En nuestro caso, el departamento de control de calidad hace 50 corridas o pruebas durante 5 días continuos.
Los resultados, a continuación:
Para el paso 4 ubicamos los ejes según las variables que tenemos. Al estar el número de errores influenciado por la cantidad de tinta, lo ubicamos como el eje y. Por consiguiente, el eje x es la cantidad de tinta. Ahora sí, hacemos el gráfico de dispersión.
Paso 5: Determinamos el coeficiente de correlación. En excel lo calculamos con la formula COEF.DE.CORREL. Para nuestro ejemplo resuelto, obtenemos 0,94, ¿se ve esto reflejado en el gráfico? Por supuesto que si, fíjate que los puntos están muy cerca unos de los otros, lo que indica que los valores se correlacionan fuertemente, es decir que la relación entre un aumento en los litros de tinta, impacta directamente en el número de errores en la impresión de posters. De hecho se hace evidente si miramos la tabla, no hay grandes saltos entre datos si miramos el número de errores.
Paso 6: Analizamos. Evidentemente hay una relación positiva fuerte entre la cantidad de tinta con la que se carga el tubo de la máquina y el número de errores generados en la impresión de los posters. Un paso siguiente para un problema de este tipo, sería buscar la forma de aprovechar la capacidad restante de la máquina, por ejemplo usar más tubos y más pequeños.
Plantilla en excel diagrama de dispersión
Derechos de imagen
La imagen destacada del post es: Designed by Freepik
Gracias por ayudarme en esta investigación sobre Diagramas de Dispersión
Que es lo más interesante de este gráfico?
Excelente información. Felicidades
hola. necesito realizar un diagrama de dispersion en base a una encuesta… ayuda porfa
¿quien fue el autor de este diagrama y en que se aplico la primera ves ?
Me gusto mucho la estructura del contenido, y su información tan concisa, todo es bueno, más me gusto que genera automaticamente la bibliografia del sitio en varios formatos. Wow!!
Excelente información, me ha servido de mucho…
muchas gracias es entendible me agrado.
Muchas gracias
me encanto …………………….mas la plantilla
Me alegra mucho Virginia!
me sirvio este progama de busqueda ya que me ayudaron a mi tabajo de clase
Me alegra escuchar eso Winkler!