Histograma de frecuencias como herramienta de calidad

Cómo hacer un histograma de Frecuencias: Un ejemplo práctico

Una de las 7 herramientas de la calidad es el histograma. El histograma o histograma de frecuencias es un gráfico que muestra por medio de barras la distribución de frecuencias de una o más variables.

Es quizá una de las herramientas más elementales en el uso estadístico y una de las más importantes en el análisis de problemas.

Hoy, para la gestión del negocio, vamos a ver qué es y cómo se hace un histograma.

¿Qué es un histograma?

Es una herramienta usada para representar una distribución por medio de barras. La altura de la barra está en función de la frecuencia (eje y) y el rango (eje x) de una variable continua.

Nos ofrece un vistazo general del comportamiento de las variables, donde logramos analizar aspectos como distribución, dispersión, aleatoriedad y tendencia.

Tiene diferentes beneficios dependiendo del uso que se le dé. Es común que en las empresas y comunidades se usen para:

  • Tomar de decisiones con base en la representación de los datos
  • Mostrar información de interés general, por eso es común verlos pegados en los tableros de corcho.
  • Analizar rendimientos de procesos
  • Evidenciar cambios ante intervenciones (antes y después)
  • Y un largo etc. Los beneficios dependerán de la interpretación del histograma.

Generalmente el histograma se usa con variables continúas, aunque también se trabaja con variables discretas. Recordemos que variables continúas son aquellas que pueden tomar cualquier valor, es decir un número real.

Son ejemplo de variables continúas el peso, altura, masa o temperatura. Las variables discretas son aquellas que adoptan un valor entero, por ejemplo el número de personas, el número de quejas, objetos, etc.

Por otra parte, una variable cualitativa es aquella que no es numérica y muestra una cualidad del objeto de medición. Por ejemplo, la nacionalidad de una persona, los animales de una granja o el tipo de comercio en una ciudad.

Esto es importante mencionarlo porque es común confundir el histograma con el diagrama de barras. El mismo Wikipedia lo hace al mencionar en tipos de histogramas el diagrama de barra simple (si el artículo en Wikipedia fue editado corrigiendo este pequeño error, agradezco me notifiques)

Con un histograma analizamos la distribución de frecuencias de una o más variables (y digo variables), donde lo que se analiza no es la altura sino el área de la variable. Por eso, en un histograma las barras están juntas y no separadas. Con un diagrama de barras si analizamos la altura de la barra, las cuales están separadas. Manuel molina lo explica mucho mejor mostrando la diferencia entre un histograma y un diagrama de barras.

Cómo hacer un histograma paso a paso

Comenzamos mostrando paso a paso cómo se construye un histograma y lo conducimos a través de un ejemplo práctico.

Paso 1: ¿Cuáles son los datos que se van a analizar? ¿Los tienes? Si es así, perfecto, vamos al paso 2. Si no, procedemos a capturar los datos del fenómeno que se desea analizar.

Paso 2: Cuando hablamos de clases o intervalos nos referimos a las barras verticales que tendrá nuestro histograma. Normalmente se dice que un histograma debe tener barras del mismo ancho, lo cual no es necesariamente cierto. Dependiendo de la situación que se analiza, es más conveniente utilizar intervalos de diferente ancho. Cuando los intervalos son del mismo ancho, la altura de cada barra será proporcional a su área. Caso contrario cuando tenemos intervalos de ancho distinto, y en este caso resulta conveniente analizar el área de la barra.

Bueno, me extendí un poco. Entonces, en el paso 2 vamos a determinar el rango. El rango se define como la resta entre el valor más grande con el valor más pequeño de tus datos capturados.

Paso 3: Existen diversas formas para definir cuántas clases considerar. K es el número de clases.

La primera es considerar una tabla guía. La siguiente está basada en la publicación de Roberto Behar Y Pere Grima (abajo te dejo la referencia).Clases según el número de datosOtras referencias sugieren 4 clases si tenemos menos de 50 datos, 7 clases para menos de 100 datos, 10 clases para menos de 150 datos, 12 clases para menos de 200 datos y 14 clases para más de 200 datos.

La siguiente opción es obtener la raíz cuadrada de la cantidad de datos. El resultado redondeado será el número de clases.Número de clases raíz cuadradaOtra opción es la regla de Sturges. Propuesta por Hebert Sturges, nos da una regla práctica para obtener el número de clases:Regla de sturgesHay otras formas, pero estas son las más difundidas. ¿Qué opción elegir? Como regla general considera que a mayor número de datos, más clases tendremos. Lo realmente importante es la forma que va a tomar nuestro histograma, así que lo más recomendable es que vayas probando con cada una de las opciones buscando la que te permita hacer un mejor análisis final.

Paso 4: Determina la amplitud de clase o ancho del intervalo. Se define con la letra h. Para ello divide el rango entre el número de clases definido en el paso 3. Si obtienes un número decimal, redondea al entero más cercano. ¿Por qué? Porque la información debe ser fácil de interpretar.

Paso 5: Define las clases. Ya tienes el número de intervalos de clase a considerar y su amplitud, con esto ya puedes establecer cada clase.

Busca el número más pequeño en todos tus datos, y a ese número le vas a sumar la amplitud de clase. Ya tienes tu primer intervalo o clase.

Por ejemplo si el número más pequeño que tienes es 10 y tu amplitud de clase es 5:

Tu primer intervalo será: [10 – 15], el segundo (15, 20], y así sucesivamente.

Si te encuentras con un dato que coincide con el límite de clase, como por ejemplo “15”, simplemente define un criterio para todos los intervalos de clase. Define si se ubica en el intervalo actual o el intervalo siguiente.

Por ejemplo nosotros definimos que el primer intervalo sea todos los números mayores o iguales a 10 y menores e iguales a 15. En consecuencia, el segundo intervalo será todos los números mayores a 15 y menores iguales a 20.

Paso 6: Tabula los datos con base en los intervalos de clase definidos. En otras palabras, agrupa los datos según su pertenencia a cada clase. Esto te dará la frecuencia de cada clase.

Paso 7: Construye el histograma:

  • En el eje x ubica los intervalos de clase.
  • En el eje y ubica la frecuencia.

Según la amplitud del intervalo, será el ancho de la barra. El paso a paso que venimos tratando es para intervalos de clase del mismo ancho.

Paso 8: Interpreta el histograma. Analiza aspectos como la tendencia, la variabilidad y la forma de distribución de los datos.

Ejemplo de histograma

Vamos a considerar que, una empresa de búsqueda de empleo ha decidido hacer un estudio del tiempo que se demoran sus asesores con cada usuario.

Paso 1: Para este estudio, se tomó el tiempo en minutos de asesoramiento con 50 usuarios.

Tiempo en minutos por usuario
Tiempo en minutos por usuario

Paso 2: Determinamos el rango. El valor más grande es 15,48 y el más pequeño es 8,58.

15,48-8,58=6,9

Paso 3: Calculamos el número de intervalos de clase (K). Lo hacemos con la formula de raíz cuadrada del número de datos.raíz cuadrada ejemplo histograma

K=7,07

Lo redondeamos al entero más cercano: 7

Paso 4: Calculamos la amplitud o ancho del intervalo. Es la división del rango (paso 2) entre el número de intervalos (paso 3)

El resultado es: 0,99. Bien podemos redondearlo a 1 o mantenernos en 0,99. Como el ejemplo lo estoy elaborando con la plantilla de histograma en excel, lo dejaré en 0,99.

Paso 5 y paso 6:

Definimos las clases sumándole al valor más pequeño, el ancho del intervalo hasta que obtenga 7 intervalos de clase, justo allí deberá estar el valor más grande de mis datos. A continuación, agrupamos cada valor dentro del intervalo de clase, o dicho de otra forma, determinamos la frecuencia. El resultado es el siguiente:

Intervalos de clase con frecuencia

Paso 7: Construimos el histograma.

Personalmente prefiero ubicar en el eje x la marca de clase y no los intervalos de clase. La marca de clase es el resultado de sumar el límite superior e inferior del intervalo y dividirlos por dos. El resultado no afecta la forma del histograma.

Además, me gusta junto al histograma trazar el polígono de frecuencias, que no es más que conectar con rectas la parte superior de cada columna, justo en la mitad. Esto da una mejor idea de la forma de distribución del histograma.

El resultado del ejercicio resuelto del histograma es el siguiente:

Ejemplo resuelto de histograma
Ejercicio resuelto de histograma

Lo anterior, es para un histograma que tiene sus columnas del mismo ancho. ¿Cómo se trabaja un histograma con ancho de columna variable?

Ejemplo de histograma con ancho de columna variable

Pensemos en que el agua es un elemento indispensable para la producción de una curtiembre, así mismo la decisión de cuánta agua usar es determinante en el acabado del cuero que se consigue.

Una empresa está definiendo la cantidad idónea de agua a usar en su proceso, para lo cual realiza diversos experimentos en los que recolecta datos asociados a la cantidad de agua usada y la conformidad en el acabado de los cueros terminados.

Primero: Definimos las categorías o intervalos.

Algunos autores y estudiosos han establecido métodos para definir el ancho variable de las columnas de un histograma. No es el objetivo de este post mostrar estos métodos. En nuestro ejercicio resuelto, la empresa ha decidido definirlo de la siguiente forma:

  • Mayores de 0 a 1,5 L
  • Mayores de 1,5 a 3.0 L
  • Mayores de 3.0 a 4,5 L
  • Mayores de 4.5 a 5.0 L
  • Mayores de 5.1 a 7.0 L

Segundo: Como la empresa no cuenta con datos, es necesario hacer las pruebas y tomar los resultados.

Tercero: Los datos tabulados son los siguientes:

Número de cueros por intervalo
Número de cueros por intervalo

Cuarto: Vamos a trazar el histograma.

Excel, hasta donde conozco, ni en su ultima versión (2016) incorpora herramientas para elaborar histogramas con columnas de ancho variable, razón por la cual te presento el histograma hecho en paint 🙂 Lo hice lo mejor que pude.

Ejemplo resuelto de histograma
Ejemplo de histograma con ancho de columna variable

 

Fíjate que el rango 3,01 – 4,5 es el que tiene el mayor número de cueros terminados en buen estado. En el ejercicio resuelto consideré intervalos variables únicamente para ilustrar un ejemplo diferente de los que se suelen ver en fuentes digitales y físicas.

Plantilla en excel histograma

La siguiente plantilla en excel te permitirá elaborar un histograma con barras del mismo ancho. únicamente tendrás que digital los datos.


Fuentes consultadas

Las siguientes fuentes te servirán para complementar, si lo consideras necesario, la información de este post:


Derechos de imagen

La imagen destacada del post es: Designed by Freepik

Si esto te ha sido útil...

Únete a la comunidad. ¡Es gratis! Vas a comenzar a recibir en tu bandeja de correo recursos, herramientas y novedades exclusivas para miembros de Ingenio Empresa.

Deja un comentario