Course outline ·主要内容:U统计量,一样本方法,两样本方法,多样本方法,成对比 较与区组设计,趋势与关联的检验,经验分布函数与经验似然,非参 数Bootstrap方法,非参数回归,密度估计,其他光滑方法 ·预修课程:概率论,数理统计,回归分析,R语言 。参考书: 1.应用非参数统计,薛留根,科学出版社。 2.现代非参数统计,吴喜之译,科学出版社. 3.Practical nonparametric statistics,Conover,W.J.1999,3rd edi- tion.(实用非参数统计,人民邮电出版社,2006) 4.Nonparametric Statistical Inference,5th Ed.Dickinson-Gibbons J.Chakraborti S.2010
Course outline • ÃáSN: U⁄O˛, òê{, ¸ê{, ıê{, §È' Ü´|O, ™³Ü'Èu, ²©ŸºÍܲq,, öÎ ÍBootstrapê{, öÎÍ£8, ó›O, Ÿ¶1wê{ • ˝?ëß: V«ÿ, Ín⁄O, £8©¤, RäÛ • Î÷: 1. A^öÎÍ⁄O, Å3ä, âÆ—á. 2. yìöÎÍ⁄O, «UÉ», âÆ—á. 3. Practical nonparametric statistics, Conover, W.J. 1999, 3rd edition. (¢^öÎÍ⁄O, <¨e>—á, 2006) 4. Nonparametric Statistical Inference, 5th Ed. Dickinson-Gibbons J, Chakraborti S, 2010
·课程评定方法:课程评定分为网上和网下评定两部分,最终评分加权 得到。 1.每人网上提交一个知识点和一道习题解答,网上知识点10分:网上 作业解答提交8分。网上作业和知识点报告最后的分数只有两种情 况:满分或者0分。 2.课堂表现5分,由到课、提问、小测验等方式评定:网下作业17分。 3.作业的截止日期将以周来计算,根据网上的作业任务以及我们上 课的进度,请大家在每周上课之前完成相应的习题。 4.助教会负责检查每位同学的标准解答,并对没有达到要求的提出 修改意见。请同学们认真对待修改意见并作相应的修改。 5.课程总评分为期末考试(60%)+课堂评分(课堂5%+知识点10%)+作 业(网下作业17%+网上作业8%) ·网站http:/shjkx.wang Previous Next First Last Back Forward 1
• ëßµ½ê{: ëßµ½©è˛⁄eµ½¸‹©ßÅ™µ©\ " 1. z<˛Jòá£:⁄òSK)â߲£:10©; ˛ äí)âJ8©"˛äí⁄£:wÅ©Íêk¸´ú ¹µ˜©½ˆ0©" 2. ë,Ly5©ßdë!JØ!ˇê™µ½¶eäí17©" 3. äíéFœÚ±±5Oéß䂲äí?÷±9·Ç˛ ë?›ßûå[3z±˛ëÉc§ÉASK" 4. œ¨KIuz†”ÆIO)âßøÈvkàá¶J— ?UøÑ"û”ÆÇ@˝Èñ?UøÑøäÉA?U" 5. ëßoµ©èœ"£(60%)+ë,µ©(ë,5%+£:10%)+ä í(eäí17%+˛äí8%) • ’ http://shjkx.wang Previous Next First Last Back Forward 1
Chapter 0 Introduction and Review 0.1 Parametric and Nonparametric Statistics ·参数统计 -参数:刻画总体分布的(未知)常数 -统计量:仅依赖于样本的量 ·参数方法:基于总体分布的一些假设下进行估计和推断 例1.假设IQ得分X~N(4,102),我们观测到的10个1Q得分为121,98,95, 94,102,106,112,120,108,109.考虑的问题是:平均IQ得分是否显著的大 于1002 零假设:Ho:4=100 对立假设:1:4>100. 检验方法:在正态假设下,使用z-test进行检验, Previous Next First Last Back Forward 1/?
Chapter 0 Introduction and Review 0.1 Parametric and Nonparametric Statistics • ÎÍ⁄O - ÎÍ: èxoN©Ÿ(ô)~Í - ⁄O˛: =ù6u˛ - ÎÍê{: ƒuoN©Ÿò be?1O⁄̉ ~ 1. bIQ©X ∼ N(µ, 102 ), ·Ç*ˇ10áIQ©è121, 98, 95, 94, 102, 106, 112, 120, 108, 109. ƒØK¥: ²˛IQ©¥ƒwÕå u100? "b: H0 : µ = 100 È·b: H1 : µ > 100. uê{: 3be, ¶^z-test ?1u. Previous Next First Last Back Forward 1/??
·非参数统计 ·不假定总体分布的形式 ·估计和推断过程中对总体分布作较少的假设 ,多基于大样本性质 -“nonparametric'"一词使用不是很恰当,我们的目的仍然是对参数进 行估计或检验.但不假设分布形式已知,一般仅假设样本是简单随 机样本。 -更准确的术语:distribution-free Statistics 例2.假设1Q得分X:为i.i.d,我们观测到的10个IQ得分为121,98,95,94, 102.106,112,120,108,109.考虑的问题是:IQ得分的中位数是否显著的大 于1009 零假设:Ho:med(X)=100 对立假设:H1:med(X)>100 检验方法:使用非参数检验方法进行检验: Previous Next First Last Back Forward 2
• öÎÍ⁄O - ÿb½oN©Ÿ/™ - O⁄̉Lß•ÈoN©Ÿäb - ıƒuå5ü - “nonparametric”òc¶^ÿ¥ÈT, ·Ç8E,¥ÈÎÍ? 1O½u. ÿb©Ÿ/™Æ, òÑ=b¥{¸ë Å. - çO(‚ä: distribution-free Statistics ~ 2. bIQ©Xi èi.i.d, ·Ç*ˇ10áIQ©è121, 98, 95, 94, 102, 106, 112, 120, 108, 109. ƒØK¥: IQ©•†Í¥ƒwÕå u100? "b: H0 : med(X) = 100 È·b: H1 : med(X) > 100. uê{: ¶^öÎÍuê{?1u. Previous Next First Last Back Forward 2
·数据的测量尺度 -nominal scale:列名尺度,例如:性别、民族、职业 数据表现为“类别”,各类之间无等级次序,各类别可以用数字代码 表示 -ordinal scale:顺序尺度,例如健康状况、质量等级 数据表现为“类别”,可对等级、大小等排序,未测量出类别之间 的准确差值 -interval scale:间隔尺度,例如年份、摄氏温度 数据表现为“数值”,可以进行加减运算,“0”是只是尺度上的一 个点,不代表“不存在” -ratio scale:比例尺度,例如体重、身高 数据表现为“数值”,可以进行加减、乘除运算,“0”表示“没 有”或“不存在” Previous Next First Last Back Forward 3
• Í‚ˇ˛º› - nominal scale: ¶º›, ~Xµ5O!¨x!Öí Í‚Lyè/aO0,àaÉmÃ?gS,àaOå±^ÍiìË L´ - ordinal scale: ^Sº›, ~XËxG¹!ü˛? Í‚Lyè/aO0, åÈ?!å¸S, ôˇ˛—aOÉm O(ä - interval scale: mÖº›, ~Xc°!ºß› Í‚Lyè/Íä0,å±?1\~$é,/00¥ê¥º›˛ò á:ßÿìL/ÿ30 - ratio scale: '~º›,~XN!p Í‚Lyè/Íä0,å±?1\~!¶ÿ$é,/00L´/v k0½/ÿ30 Previous Next First Last Back Forward 3