样例数据集 ·使用pandas的Describe)方法 df.describe() Unnamed: normalized- wheel- symboling engine- length width height curb-weight bore stroke 0 osses base size count201.000000 201.000000 164.000000 201.000000 201.000000 201.000000 201.000000 201.000000 201.000000 201.000000201.000000 mean 100.000000 0.840796 122.000000 98.797015 174.200995 65.889055 53.766667 2555.666667 126.875622 3.319154 3.256766 std 58.167861 1.254802 35.442168 6.066366 12.322175 2.101471 2.447822 517.296727 41.546834 0.280130 0.316049 min 0.000000 2.000000 65.000000 86.600000 141.100000 60.300000 47.800000 1488.000000 61.000000 2.540000 2.070000 25% 50.000000 0.000000 NaN 94.500000 166.800000 64.100000 52.000000 2169.000000 98.000000 3.150000 3.110000 50% 100.000000 1.000000 NaN 97.000000 173.200000 65.500000 54.100000 2414.000000 120.000000 3.310000 3.290000 75% 150.000000 2.000000 NaN 102.400000 183.500000 66.600000 55.500000 2926.000000 141.000000 3.580000 3.410000 max 200.000000 3.000000 256.000000 120.900000 208.100000 72.000000 59.800000 4066.000000 326.000000 3.940000 4.170000 11
样例数据集 11 •使用瀃a瀁das 的 Describe() 方法
算数平均值 (The Arithmetic Mean)x 12
算数平均值 (The Arith瀀etic Mea瀁) 12 �̅
算数平均值 ·算数平均值是一组数的平均值 ·算数平均值的计算公式如下: 究= 是2州=1xn是x+.+xw) 13
算数平均值 • 算数平均值是一组数的平均值 • 算数平均值的计算公式如下: �̅= $ % ∑ �' % '($ = $ % (�$+. . +�%) 13
平均值 ·平均值描述了数据集的集中趋势 ·勒布朗詹姆斯有时发挥欠佳,得分较少 ·在发挥超常时,他得分会高很多 ·一般情况下,他发挥正常 ·平均值就位于这样的得分区间的中间 x 14
平均值 • 平均值描述了数据集的集中趋势 • 勒布朗.詹姆斯有时发挥欠佳,得分较少 • 在发挥超常时,他得分会高很多 • 一般情况下,他发挥正常 • 平均值就位于这样的得分区间的中间 �̅ 14
在Pandas中的操作 import pandas as pd df=pd.DataFrame('c1:[1,2,3],'c2':[l,2,100],'c3':[100,200,300]},index=['a',b','c']) df.head() c1 c2 c3 a 1 100 b2 2 200 100300 df.mean() cl 2.000000 c2 34.333333 c3 200.000000 dtype:float64 15
在Pa瀁das中的操作 15