Gráfico de tallo y hojas — es una vista tabular en la que cada valor de datos se desglosa en una "base" (primer dígito o números) y una "hoja" (generalmente el último dígito).
Interpretaciones:
"17" se divide en "1" (raíz) y "7" (hoja) "69" se divide en "6" (raíz) y "9" (hoja)
El orden de la sección tallo-hoja:
- Divida cada observación/datos en un tallo que constará de todos menos el dígito más a la derecha y la hoja, el dígito más a la derecha. Li >
- La hoja solo debe tener un dígito y el tronco puede tener tantos dígitos como sea posible.
- Escriba el tronco en una columna vertical con el más pequeño en la parte superior (pero en Python obtendrá el más grande en la parte superior), luego dibuje una línea vertical a la derecha de esa columna.
- Escriba cada hoja correspondiente en una fila a la derecha de su tallo justo después de la línea vertical, en orden ascendente desde el tallo.
Ejemplo:
Digamos que Python.Engineering tiene 10 autores de contenido tecnológico. Cada uno de ellos presentó 100 artículos para publicar en el sitio. De 100 artículos, a continuación se muestra el número de artículos con errores por cada 10 autores de contenido —
16, 25, 47, 56, 23, 45, 19, 55, 44, 27
El área tallo-hoja será —
1 | 69 2 | 357 4 | 457 5 | 56
Trazar en Python utilizando el módulo stem —
Para trazar los tallos y las hojas en Python, necesitamos instalar el módulo fuerte > gráfico de tallo Puede instalar el módulo Stemgraphic desde Jupyter Notebook como —
sistema de importación. {Sys.executable} -m pip install stemgraphic
Abajo está el código —
# datos y escala
stemgraphic.stem_graphic (datos, escala
Salida:
Explicación —
La columna más a la izquierda en el gráfico anterior es — esto es un contador de frecuencia. Hay dos observaciones en el rango 10-20 y 3 observaciones en el rango 20-30, lo que da un total de 5 observaciones en el rango 0-30. Continuando en esta línea, vemos 10 observaciones que están en la parte superior de la misma columna. Luego, después de la línea vertical, hay dos valores, uno de los cuales tenemos como máximo 16. Aunque en la parte superior tenemos 56, estos valores ‚Äã‚Äãno son más que los valores mínimo y máximo, respectivamente, en el dado conjunto de datos Después de eso tenemos los valores de la raíz, y después de eso nos quedan los valores "dividiendo la raíz a lo largo de una línea vertical".
Nota: Puede configurar esto Matplotlib una biblioteca de Jupyter Notebook como —
import sys! {sys.executable} -m pip install matplotlib
Usando matplotlib.pyplot.stem
—
matplotlib.pyplot as plt
datos
=
27
]
# separación de partes del tallo
stems
=
[
]
plt.ylabel (
`Data`
)
# para la etiqueta del eje Y
plt.xlim (
0
plt.stem (tallos, datos)
# sección requerida
Salida: