NEUMOLOGÍA PEDIÁTRICA
Neumol Pediatr 2019; 14 (4): 194 - 199 C o n t e n i d o d i s p o n i b l e e n h t t p : / / www. n e umo l o g i a - p e d i a t r i c a . cl 197 Como leer y generar publicaciones científicas. Rol y definición de las variables en una investigación POLÍGONOS DE FRECUENCIA Los polígonos de frecuencia relacionan los valores de la variable con sus respectivas frecuencias, mostrando la distribución de los datos cuantitativos como una serie de puntos conectados por medio de líneas rectas, quedando representada una curva que resulta ser muy útil tanto para describir los datos (5,6) como para comparar dos o más grupos. Similar a lo mencionado en los histogramas, para la comparación resulta más adecuado usar porcentajes de ocurrencia. La Figura 4 muestra los pesos al nacer utilizando polígonos de frecuencia, comparando el grupo de madres fumadoras con el de no fumadoras. DIAGRAMAS DE CAJA Y BIGOTE El diagrama de caja y bigote o box plot (o box-and- whisker plot) es un gráfico comúnmente usado para comparar distribuciones entre grupos, incluso más que los histogramas y los polígonos de frecuencias. Son muy útiles para resumir visualmente la forma de una distribución y su grado de simetría (4). Como se puede ver en la figura 5, la caja muestra las posiciones de los percentiles 25 (extremo inferior), 50 (línea interior) y 75 (extremo superior), que corresponden a los cuartiles de la distribución o aquellos valores que dividen el conjunto de datos en cuatro partes iguales. Particularmente, el percentil 50 o segundo cuartil corresponde a la mediana, valor bajo el cual se encuentra la mitad de los datos. El extremo inferior (percentil 25) y superior (percentil 75) de la caja indican que ésta contiene la mitad central de los valores de las observaciones, lo que se conoce como el rango intercuartil de la distribución (4,5). Los bigotes se extienden, en ambos sentidos, hasta el dato más extremo que no esté más alejado de 1,5 veces el rango intercuartil desde el respectivo borde de la caja (7). Cualquier dato fuera de dicho rango, es decir, más allá de los bigotes, se denomina "outlier" y es mostrado en el gráfico (figura 5). Estos valores fuera de rango deben ser interpretados en el contexto de cada variable, identificando si corresponde a un valor plausible o a errores de registro o codificación. En este último caso, el investigador podrá corregir, si es posible, o tener en cuenta estos valores para tomar decisiones respecto a qué hacer con ellos en los análisis posteriores. Se han mencionado y explicado brevemente algunas medidas de resumen como la mediana y los percentiles, las cuales serán abordadas con profundidad en un próximo artículo de esta serie. No obstante, aunque no se recuerden o manejen del todo dichos conceptos, una gran ventaja de los diagramas de caja y bigote para distintos grupos es que permiten identificar visualmente si hay aparentes diferencias entre ellos. Otra característica de los datos que resulta fácil de visualizar en un diagrama de caja y bigote es su grado de simetría. Cuando la mediana se ubica cerca de la mitad de la caja, podemos decir que el 50% central de los datos es aproximadamente simétrico, en cambio si la mediana se acerca al borde superior de la caja (percentil 75) o al inferior (percentil 25), lo más seguro es que la distribución sea asimétrica (4). Una interpretación similar se hace en relación a la distancia de los bigotes desde la caja. En el diagrama de caja y bigote también es posible observar fácilmente la dispersión de la variable. Mientras más alargada es la caja, más amplio es el rango en el cual se encuentra la mitad central de los datos (rango intercuartil). Asimismo, mientras más amplio es el rango entre ambos bigotes mayor es la dispersión o variabilidad total de los datos. Evaluar el grado de dispersión de una variable es importante en el análisis estadístico, ya que indica qué tan homogénea (menor dispersión) o heterogénea (mayor dispersión) es la muestra respecto a dicha variable. Cuando un grupo es más homogéneo, los individuos son más parecidos entre ellos (al menos en la variable de interés), y por lo tanto resulta más sencillo describir y generalizar sus características. Figura 4. Polígonos de frecuencia de los pesos al nacer para madres fumadoras y no fumadoras usando (a) frecuencias absolutas y (b) porcentajes. Este tipo de gráfico es equivalente a superponer dos histogramas, pero en vez de representar las barras, se unen sus alturas en el punto medio (marca de clase del respectivo intervalo) a través de líneas rectas. De este modo, es fácil ver que ambas distribuciones presentan una dispersión similar, aunque los hijos de las madres fumadoras tendieron a tener menores pesos de nacimiento. Tal como en la Figura 2, las alturas de las gráficas son diferentes si se representan frecuencias o porcentajes, siendo mejor la segunda opción para comparar.
RkJQdWJsaXNoZXIy MTYwMjk1