2*有序型数据 有序就是指有先后次序。例如经济发展就有先后顺序, 从第一产业到第四产业产业的升级就形成了一个序列。 记第二产业为XB,第四产业为XD,那么两者的关系 不仅有等与不等的关系,还可以有XD>XB,XB<XD, 但这里不包含“大多少”、“小多少”的概念。如记 最清洁为XA、清洁为XB、不清洁为Xc。三者排成序 列:XA>XB>Xc,但是它们三者的间隔并不相等 因此对这类数据不能简单地作算术四则运算 在实际应用中往往不用具体的数表示有序关系。人们 习惯把它们变成名义数据进行处理 序列中若有个m状态就要用m-1个虚拟变量
11 2*有序型数据 有序就是指有先后次序。例如经济发展就有先后顺序, 从第一产业到第四产业产业的升级就形成了一个序列。 记第二产业为XB,第四产业为XD,那么两者的关系 不仅有等与不等的关系,还可以有XD>XB,XB<XD, 但这里不包含“大多少”、“小多少”的概念。如记 最清洁为XA、清洁为XB、不清洁为XC。三者排成序 列:XA>XB>XC,但是它们三者的间隔并不相等。 因此对这类数据不能简单地作算术四则运算。 在实际应用中往往不用具体的数表示有序关系。人们 习惯把它们变成名义数据进行处理。 序列中若有个m状态就要用m-1个虚拟变量
用虚拟变量表示定性数据 性别D卫生等级|DD2 不清1|0 女|1
12 用虚拟变量表示定性数据 性别 D 卫生等级 D1 D2 男 0 不 清 洁 1 0 女 1 清 洁 0 1 最 清 洁 1 1
3*间隔型数据 不仅可以比较两两的大小,而且还可以确定相差的量。 温度是最典型的间隔型数据之一,例如10c、20c 和30°c。我们不仅可以比较温度的高低,还可以知道 10c比20°c低10c,30°c比20高10°c。 它具有通常意义下数据的性质,可以作复杂的四则运 算。但是,这类数据仍然包含了某种人为的因素: 首先,间隔的确定的任意性,当然,间隔一旦确定就 成为比较数据的标准 其次,0点的确定是任意的,而且0c并不是没有温度
13 3*间隔型数据 不仅可以比较两两的大小,而且还可以确定相差的量。 温度是最典型的间隔型数据之一,例如10C、20C 和30C。我们不仅可以比较温度的高低,还可以知道 10C比20C低10C,30C比20C高10C。 它具有通常意义下数据的性质,可以作复杂的四则运 算。但是,这类数据仍然包含了某种人为的因素: 首先,间隔的确定的任意性,当然,间隔一旦确定就 成为比较数据的标准 其次,0点的确定是任意的,而且0C并不是没有温度
4*比率型数据 这类数据的突出特点是0点具有明确的含义 例如,重量尽管有不同的计量单位,但0点的意义很明 确,不会因为不同的计量单位而有不同的含义 而且,任何计量单位都可以通过一个比例常数换算成 另一种相应的单位。 这种简单的比例关系在间隔数据中是不存在的。 定性数据与定量数据 从以上讨论,四种数据按照叙述的顺序,其量的概念, 后者比前者多一些内容 习惯上把前两种称为定性数据,把后两种成为定量数 14
14 4*比率型数据 这类数据的突出特点是0点具有明确的含义。 例如,重量尽管有不同的计量单位,但0点的意义很明 确,不会因为不同的计量单位而有不同的含义。 而且,任何计量单位都可以通过一个比例常数换算成 另一种相应的单位。 这种简单的比例关系在间隔数据中是不存在的。 定性数据与定量数据 从以上讨论,四种数据按照叙述的顺序,其量的概念, 后者比前者多一些内容。 习惯上把前两种称为定性数据,把后两种成为定量数 据
2)按数据与时间的关系分 口1.截面数据( Cross- Section Data) 口2.时间序列数据( Time Serles Data 口3.平行数据( Panel Data) 15
15 (2)按数据与时间的关系分 1.截面数据(Cross-Section Data) 2.时间序列数据(Time Series Data) 3.平行数据(Panel Data)