莖葉圖 —它是一個表格視圖,其中每個數據值都被分解為“基數”(第一個數字或數字)和“表格”(通常是最後一個數字)。
解釋:
解釋:
解釋:
strong>“17”分為“1”(詞幹)和“7”(葉子)“69”分為“6”(詞幹)和“9”(葉子)
莖葉部分的順序:
- 將每個觀察/數據分成一個莖,該莖將由除了最右邊的數字和葉子之外的所有部分組成,最右邊的數字。
- 葉子應該只有一個數字,樹幹可以有盡可能多的數字。
- 將樹幹寫在垂直列中,最小的在頂部(但在 Python 中,你會在頂部得到最大的),然後從該列向右畫一條垂直線。
- 在垂直線之後的莖右側連續寫下每個對應的葉子,從莖開始按升序排列。
示例:
假設 Python.Engineering 有 10 位技術作者的內容。他們每個人都提交了 100 篇文章以在網站上發表。在 100 篇文章中,每 10 位內容作者的錯誤文章數如下所示 —
16, 25, 47, 56, 23, 45, 19, 55, 44, 27
莖葉區域將是 —
1 | 69 2 | 357 4 | 457 5 | 56
在 Python 中使用 stem 模塊 —
要在 Python 中繪製莖葉,我們需要安裝 strong 模塊 >幹圖。您可以將 Jupyter Notebook 中的 stemgraphic 模塊安裝為 —
import sys! {Sys.executable} -m pip install stemgraphic
下面是代碼 —
#模塊導入
導入
stemgraphic
data
=
[
16
,
25
,
47
,
56
代碼> ,
23
,
45
,
19
,
55
,
44
,
27
]
# call stem_graphic with required parameters,
# data and scale
stemgraphic.stem_graphic (data, scale
=
10
)
輸出:
解釋 —
上圖中最左邊的一列是 —這是一個頻率計數器。在 10-20 範圍內有 2 個觀測值,在 20-30 範圍內有 3 個觀測值,這樣一共有 5 個觀測值在 0-30 範圍內。繼續這個思路,我們看到 10 個觀察值位於同一列的頂部。然後,在垂直線之後,有兩個值,其中一個我們最多有 16 個。雖然在最上面我們有 56 個,但這些值分別是給定的最小值和最大值數據集。之後我們得到了詞幹值,然後我們剩下的值是 ‚Äã‚Äã 沿一條垂直線劃分詞幹。
注意:你可以設置這個 Matplotlib 來自 Jupyter Notebook 的庫,例如 —
import sys! {sys.executable} -m pip install matplotlib
使用 matplotlib.pyplot.stem
—
# 導入 matplotlib.pyplot 庫
import
matplotlib.pyplot as plt
data
=
[
16
,
25
,
47
,
56
,
23
,
45
,
19
,
55
,
44
,
27
]
# 詞幹部分分離
stems
=
[
1
,
1
,
2
,
2
,
2
,
4
,
4
,
4
,
5
,
5
]
plt.ylabel(
`Data`
)
# 用於 Y 軸標籤
<代碼類= "plain"> plt.xlabel ( `stems`
)
#對於 x 軸上的標籤
plt.xlim (
0
,
10
)
# x-軸限制
plt.stem (stems, data)
# 必填部分
輸出: