第一节统计分析概要一统计分析六步曲 之 ·确定分析思路(续) √分析框架体系化一使各个分析点之间具有逻辑联系!如 何做到? 以相关的理论为指导,结合实际经验! 例3:进行产业分析时可以借鉴的其他理论,如 PEST/ *T(Political, Economic, Social, Technological) SWOT(strengths, weaknesses, opportunities, threats 一个好的经济绕计分析人员,最好具备:微观经济学、宏 观经济学、产业经济学、管理学等多方面知识!
第一节 统计分析概要—统计分析六步曲 之一 • 确定分析思路(续) 分析框架体系化—使各个分析点之间具有逻辑联系!如 何做到? 以相关的理论为指导,结合实际经验! 例3:进行产业分析时可以借鉴的其他理论,如: PEST分析(Political,Economic, Social, Technological); SWOT(strengths,weaknesses,opportunities,threats) 一个好的经济统计分析人员,最好具备:微观经济学、宏 观经济学、产业经济学、管理学等多方面知识!
第一节统计分析概要一统计分析六步曲 之 ·收集数据一数据来源 √原始资料(一手资料):直接从统计对象收集; 大数据时代:全样本面不需抽样。亚马通一监视着所有客户的购物 习惯,谷歌-)视着我们的网页划习惯;微教可能几平什么都 知道! 还有:全世界的工业设备、汽车、电表上有着无数的数码传感 器,随时测量和传递着有关位置、运动、震动、度源度乃兖空 气中化学物质的变化,也产生了海量的数据信息 √二手资料:经过加工整理得到的数据。主要来源: 公开出版物,如各种统计年鉴、期刊等: 数据库,如:国家统计数据库,wind数据库(金融),等等 互联网,尤其是通过搜索引擎可以帮助我们快速找到所需数据
第一节 统计分析概要—统计分析六步曲 之二 • 收集数据—数据来源 原始资料(一手资料):直接从统计对象收集; 大数据时代:全样本而不需抽样。亚马逊—监视着所有客户的购物 习惯;谷歌----监视着我们的网页浏览习惯;微软—可能几乎什么都 知道! 还有:全世界的工业设备、汽车、电表上有着无数的数码传感 器,随时测量和传递着有关位置、运动、震动、温度、湿度乃至空 气中化学物质的变化,也产生了海量的数据信息 二手资料:经过加工整理得到的数据。主要来源: • 公开出版物,如各种统计年鉴、期刊等; • 数据库,如:国家统计数据库,wind数据库(金融),等等 • 互联网,尤其是通过搜索引擎可以帮助我们快速找到所需数据
第一节统计分析概要一统计分析六步曲 之三 ·处理数据一数据预处理 √为什么要进行与处理?与数据质量有关 准确性、完整性、一致性、时效性、可信性、可解释性 ·一致性举例:教育年限法人力资本数据的衔接问题 800000 舌责值baed census) 虚值 pseud
第一节 统计分析概要—统计分析六步曲 之三 • 处理数据—数据预处理 为什么要进行与处理?与数据质量有关! • 准确性、完整性、一致性、时效性、可信性、可解释性 • 一致性举例:教育年限法人力资本数据的衔接问题
第一节统计分析概要一统计分析六步曲 之三 ·处理数据一数据预处理 √为什么要进行与处理?与数据质量有关 致性举例:教育年限法人力资本数据的衔接问题 00000 原始值 修订值(趋势离差法) 700000 600000 400000 300000 200000
第一节 统计分析概要—统计分析六步曲 之三 • 处理数据—数据预处理 为什么要进行与处理?与数据质量有关! • 一致性举例:教育年限法人力资本数据的衔接问题 200000 300000 400000 500000 600000 700000 800000 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 原始值 修订值(趋势离差法)
第一节统计分析概要一统计分析六步曲 之 处理数据一数据预处理 √数据清理,解决: ·数据缺失 ·数据异常(有噪声的数据)-离群点分析! 数据不一致 √数据集成:不同来源的数据集成到一起 √数据变换:比如生成不同的指标变量
第一节 统计分析概要—统计分析六步曲 之三 • 处理数据—数据预处理 数据清理,解决: • 数据缺失 • 数据异常(有噪声的数据)--离群点分析! • 数据不一致 数据集成:不同来源的数据集成到一起 数据变换:比如生成不同的指标变量