El diagrama de dispersión como herramienta de la calidad

Cómo hacer un diagrama de dispersión: Ejemplo en calidad

Continuamos con las herramientas de análisis y priorización de problemas, y hoy vamos a conocer una de las herramientas más utilizadas: El diagrama de dispersión o gráfico de dispersión. No por nada se considera una de las 7 herramientas básicas de calidad. Es quizá uno de los gráficos que se aprenden de primero en formación estadística, así que ya tienes una idea de su importancia.

Vamos a comprender qué es un diagrama de dispersión, cómo se hace y por supuesto, un ejemplo de aplicación para garantizar el aprendizaje, es el tema de hoy, para la gestión del negocio.

Qué es un diagrama de dispersión

Antes de responder este interrogante, es necesario dar respuesta a qué es dispersión. La definición de dispersión tiene múltiples respuestas, como bien nos muestra wikipedia: DispersiónNos quedamos con la definición matemática:

Dispersión se define como el grado de distanciamiento de un conjunto de valores respecto a su valor medio.

A partir de esta definición, se derivan las medidas de dispersión que aprendimos en la clase de estadística del colegio: Rango, varianza, desviación, covarianza, coeficiente de correlación, etc.

Ahora bien, el diagrama de dispersión, también conocido como gráfico de dispersión o gráfico de correlación consiste en la representación gráfica de dos variables para un conjunto de datos. En otras palabras, analizamos la relación entre dos variables, conociendo qué tanto se afectan entre sí o qué tan independientes son una de la otra.

En este sentido, ambas variables se representan como un punto en el plano cartesiano y de acuerdo a la relación que exista entre ellas, definimos su tipo de correlación.

Tipos de correlación en un gráfico de dispersión

Con base en el comportamiento que toman las variables de estudio, podemos encontrar 3 tipos de correlación: Positiva, negativa y nula.

  • Correlación positiva

Se presenta cuando una variable aumenta o disminuye y la otra también, respectivamente. Hay una relación proporcional. Por ejemplo para un vendedor de carros, si él vende más carros (variable 1), va a ganar más dinero (variable 2).

  • Correlación negativa

Se presenta cuando una variable se comporta de forma contraria o a la otra, es decir que si una variable aumenta, la otra disminuye. Hay una relación inversa proporcional. Por ejemplo para la construcción de un edificio, entre más trabajadores estén construyendo un edificio (variable 1), menos tiempo se necesitará para tenerlo listo (variable 2)

  • Correlación nula

Si no encuentras un comportamiento entre las variables, existe una correlación nula.

  • Otros tipos de clasificación de correlación

Otros tipos de clasificación están basados en qué tan fuerte o débil es el tipo de correlación, tal como lo muestra Aiteco en los tipos de relación de un diagrama de dispersión:

  • Sin correlación: La misma correlación nula
  • Fuerte correlación positiva: Cuando el valor de una variable se incrementa o disminuye con una relación muy similar a la otra variable.
  • Débil correlación positiva: Cuando el valor de una variable se incrementa o disminuye en menor relación a la otra variable, por ejemplo, que el valor de x se incremente ligeramente al incrementar el valor de y.
  • Fuerte correlación negativa: Cuando el valor de una variable aumenta claramente en relación a una disminución de la otra variable.
  • Débil correlación negativa: Cuando el valor de una variable aumenta levemente en relación a la disminución de la otra variable.
  • Relación compleja: Parece haber algún tipo de relación entre ambas variables, pero no es muy evidente tornando la detección de la relación compleja.

El coeficiente de correlación en un diagrama de dispersión

El coeficiente de correlación nos describe cómo es la relación existente entre dos variables, en otras palabras, al conocer este número sabemos si la correlación es positiva o negativa y qué tan fuerte o débil es. Se usa la letra r para expresarla, veamos cómo:

  • r=1

La correlación es positiva perfecta. Si una variable crece, la otra también lo hace en una proporción constante. Es una relación directa, por eso si trazamos una linea de ajuste esta va pasar por todos y cada uno de los puntos.

  • 0<r<1

Es cuando r esta entre 0 y 1 sin llegar a ser 0 y 1. Es una correlación positiva. El grado de cercanía de 1 define qué tan directa y proporcional es la relación entre ambas variables, por ende entre más cerca esté de 0, más débil será su correlación negativa.

  • r=0

La correlación es nula, es decir que no existe una relación lineal entre ambas variables. Qué tal si pruebas buscando otro tipo de relación.

  • -1<r<0

Es cuando r esta entre -1 y 0 sin llegar a ser –1 y 0. Es una correlación negativa. El grado de cercanía a -1 define que tan inversa y proporcional es la relación entre ambas variables, por ende entre más cerca esté de 0, más debíl será su correlación negativa.

  • r=-1

La correlación es negativa perfecta. Si una variable crece, la otra va a disminuir en proporción constante. Es una relación directa e inversa, por lo tanto una línea de ajuste va a tocar todos los puntos graficados.

Un ejemplo más claro de todo lo mencionado lo muestra wikipedia en una imagen: Tipos de coeficiente de correlación

Cómo hacer un diagrama de dispersión paso a paso

  • Paso 1: Determina cuál es la situación. Si no entendemos qué es lo que esta ocurriendo, no podremos establecer las variables a estudiar.
  • Paso 2: Determina las variables a estudiar. Si ya determinaste las variables a estudiar, es porque crees que puede existir una relación entre ellas que te permita caracterizar la situación.
  • Paso 3: Recolecta los datos de las variables: Si ya los tienes, perfecto. Si no, definimos un período de tiempo para conseguir los datos de las variables antes definidas. Recuerda que los datos de las dos variables deben estar dados en el mismo período de tiempo.
  • Paso 4: Ubica los valores en el eje respectivo. Por lo general, la variable independiente es aquella que no está influenciada por la otra y se ubica en el eje x. La variable dependiente que es la que se ve afectada por la otra variable se ubica en el eje y. Así pues, procedemos a ubicar los valores en el plano cartesiano de acuerdo a su variable (x, y)
  • Paso 5: Determina el coeficiente de correlación: El coeficiente de correlación debe verse reflejado en la forma que toma el gráfico de dispersión. Es el cociente de la covarianza y la multiplicación de la desviación típica de las dos variables. Con excel logramos calcularlo de manera muy simple.
  • Paso 6: Analizamos: Con base en el coeficiente y en el gráfico, definimos cuál es la relación de las dos variables y tomamos las decisiones pertinentes.

Ejemplo de diagrama de dispersión

Vamos a ver desde una problemática empresarial, un ejemplo resuelto de diagrama de dispersión para el área de calidad.

Imagina que una litográfica está abriendo una nueva área de producción para la impresión de posters, y en este momento se encuentra haciendo todos los ensayos y pruebas para determinar la cantidad de tinta de cada color que deberían tener las maquinas.

Como prueba inicial, han decidido establecer la relación de errores de impresión según el grado de llenado de los recipientes de tinta de la máquina.

Bien, definida la situación, iniciamos desde el paso 2:

Las variables a estudiar para este ejemplo de grafico de dispersión en calidad son:

  • Cantidad de tinta en litros
  • Número de errores de impresión

Para el paso 3, comenzamos a recolectar las variables. En nuestro caso, hacemos 50 corridas o pruebas durante 5 días continuos.

Los resultados, a continuación:

Cantidad de errores vs grado de tinta
Cantidad de errores según el grado de tinta
Ejemplo de diagrama de dispersión
Ejemplo resuelto de diagrama de dispersión

Para el paso 4 ubicamos los ejes según las variables que tenemos. Al estar el número de errores influenciado por la cantidad de tinta, lo ubicamos como el eje y. Por consiguiente, el eje x es la cantidad de tinta. Ahora sí, hacemos el gráfico de dispersión.

Paso 5: Determinamos el coeficiente de correlación. En excel lo calculamos con la formula COEF.DE.CORREL. Para nuestro ejemplo resuelto, obtenemos 0,94, ¿se ve esto reflejado en el gráfico? Por supuesto que si, fíjate que los puntos están muy cerca unos de los otros, lo que indica que los valores se correlacionan fuertemente, es decir que la relación entre un aumento en los litros de tinta, impacta directamente en el número de errores en la impresión de posters. De hecho se hace evidente si miramos la tabla, no hay grandes saltos entre datos si miramos el número de errores.

Paso 6: Analizamos. Evidentemente hay una relación positiva fuerte entre la cantidad de tinta con la que se carga el tubo de la máquina y el número de errores generados en la impresión de los posters. Un paso siguiente para un problema de este tipo, sería buscar la forma de aprovechar la capacidad restante de la máquina, por ejemplo usar más tubos y más pequeños.

Plantilla en excel diagrama de dispersión

Una plantilla en excel en la cual únicamente tendrás que digitar los datos de tus dos variables. De forma automática obtendrás tus daros representados en un gráfico de correlación. Haz click para descargar.


Derechos de imagen

La imagen destacada del post es: Designed by Freepik

Si esto te ha sido útil...

Únete a la comunidad. ¡Es gratis! Vas a comenzar a recibir en tu bandeja de correo recursos, herramientas y novedades exclusivas para miembros de Ingenio Empresa.

Deja un comentario