数据科学论 —Python之道 第6课统计初步 本课程基于BigDataUniversity.com.cn的《Data science with Python Bootcamp》 进行了重新组织与扩充 1
数据科学引论 —— Pyth瀂瀁之道 第6课 统计初步 本课程基于BigDataU瀁iversity.c瀂瀀.c瀁的《Data scie瀁ce with Pyth瀂瀁 B瀂瀂tca瀀瀃》 进行了重新组织与扩充 1
内容提纲 ·描述性统计(Descriptive Statistics) ·算数平均值(Arithmetic Mean) ·中位值(Median) ·样本方差(Sample Variance) ·直方图(Histogram) ·概率质量函数(Probability Mass Function) ·正态分布(Normal Distribution) ·相关性(Correlation) 2
内容提纲 • 描述性统计(Descri瀃tive Statistics) • 算数平均值(Arith瀀etic Mea瀁) • 中位值(Media瀁) • 样本方差(Sa瀀瀃濿e Varia瀁ce) • 直方图(Hist瀂gra瀀) • 概率质量函数(Pr瀂babi濿ity Mass Fu瀁cti瀂瀁) • 正态分布(N瀂r瀀a濿 Distributi瀂瀁) • 相关性(C瀂rre濿ati瀂瀁) 2
描述性统计 (Descriptive Statistics) 3
描述性统计 (Descri瀃tive Statistics) 3
示例 ° 如果有人问“勒布朗.詹姆斯(LeBron James)是一位优秀的篮球运 动员吗?” ·我们可以让他去观看詹姆斯的所有比赛,但是詹姆斯在NBA效力 超过13年了,每年打了82场比赛,观看所有比赛要花多少时间呀! Year Team 200304 Cleveland 2004-05 Cleveland 2005-06 Cleveland 2006-07 Cleveland 2007-08 Cleveland 2008-09 Cleveland 2009-10 Cleveland 2010-11 Miami 2011-12寸 Miami 2012-13t Miami 2013-14 Miami 2014-15 Cleveland 4 2015-16+ Cleveland
示例 • 如果有人问“勒布朗.詹姆斯(LeBr瀂瀁 Ja瀀es)是一位优秀的篮球运 动员吗?” • 我们可以让他去观看詹姆斯的所有比赛,但是詹姆斯在NBA效力 超过13年了,每年打了82场比赛,观看所有比赛要花多少时间呀! 4 Year Team 2003–04 Cleveland 2004–05 Cleveland 2005–06 Cleveland 2006–07 Cleveland 2007–08 Cleveland 2008–09 Cleveland 2009–10 Cleveland 2010–11 Miami 2011–12† Miami 2012–13† Miami 2013–14 Miami 2014–15 Cleveland 2015–16† Cleveland
示例 ·或者,我们可以用詹姆斯的场均得分来描述他的表现 ·这被称为总结性或描述性统计 ·将大量原生数据总结为单个数字 勒布朗.詹姆斯场均得分 27.1!
示例 • 或者,我们可以用詹姆斯的场均得分来描述他的表现 • 这被称为总结性或描述性统计 • 将大量原生数据总结为单个数字 勒布朗.詹姆斯场均得分 27.1 ! 5