第二节相关分析及应用 两个随机变量的相关系数 通常两个变量之间若存在一一对应的确定关系,则称两者之间存在着函数 关系。当两个随机变量之间具有某种关系时,随着一个变量数值的确定, 另一变量却可能取许多不同值,但取值有一定的概率统计规律,这时称两 个随机变量存在着相关关系。 图5-14是表示由两个随机变量x和y组成的数据点分布情况。图a)各点 分布分散,x,y之间是无关的。图b)虽无确定关系,但从统计上看具有 某种线性关系,因此它们之间有着线性关系。 0 图514两随机变量的相关性 KDI
第二节相关分析及应用 通常两个变量之间若存在一一对应的确定关系,则称两者之间存在着函数 关系。当两个随机变量之间具有某种关系时,随着一个变量数值的确定, 另一变量却可能取许多不同值,但取值有一定的概率统计规律,这时称两 个随机变量存在着相关关系。 一.两个随机变量的相关系数 图5-14是表示由两个随机变量 x 和 y 组成的数据点分布情况。图a) 各点 分布分散,x,y 之间是无关的。图b) 虽无确定关系,但从统计上看具有 某种线性关系,因此它们之间有着线性关系。 0 x y 0 x y a) b) 图5—14 两随机变量的相关性 6
变量x和y之间的相关程度常用相关系数P表示之 EL(x-u-uvI (5-16) 式中E_数学期望离散情况E[x=∑ 连续情况Ex]=mx(ot T→>∞ x随机变量x的均值Hx= Elx p1随机变量y的均值,=EIyl 0x随机变量x的标准差a2=E|(x-Hx)2 随机变量y的标准差a2=E[U-1)21 用柯西许瓦兹不等式E(x=1)y-,)2≤印(x-,)3(y-,)(57) 故知 (可作相关性的绝对评价) 当数据点分布越接近于一条直线时,x的绝对值越接近1,x和y的线性 相关性程度越好,将这样的数据回归成直线才越有意义。P的正付号表示 变量随另一变量增加而增加或减少。当ρ灬接近零时,则认为x和y之 间完全无关。但仍可能存在某种非线性的相关关系甚至函数关系。 KDI
变量 x 和 y 之间的相关程度常用相关系数 ρxy 表示之 x y x y xy E x y [( − )( − )] = (5-16) 式中 E ——数学期望 离散情况 连续情况 = = n i i x n E x 1 1 [ ] → = 0 ( ) 1 [ ] lim x t dt T E x T μx—随机变量 x 的均值 μx = E [ x ] μy— 随机变量y 的均值 μy = E [ y ] σ x— 随机变量 x 的标准差 σ2 x=E [ (x –μx ) 2 ] σ y— 随机变量y 的标准差 σ2 y=E [ (y –μy ) 2 ] 用柯西—许瓦兹不等式 [( )( )] [( ) ( ) ] 2 2 2 x y x y E x − y − E x − y − (5-17) 故 知 xy 1 (可作相关性的绝对评价) 当数据点分布越接近于一条直线时,ρxy 的绝对值越接近1,x 和 y 的线性 相关性程度越好,将这样的数据回归成直线才越有意义。Ρ xy 的正付号表示 一变量随另一变量增加而增加或减少。当ρxy 接近零时,则认为 x 和 y 之 间完全无关。但仍可能存在某种非线性的相关关系甚至函数关系。 7
二.信号的自相关函数 假如x()是某各态历经随机过程的一个样本记录。x(计+r)是x(t)时移z 后的样本,见图5-15。在任何t=t时刻,从两个样本上分别得到两个 量值x(t)和x(tτ),而且x()和x(计+r)具有相同的均值和标准差。 假如把Px()x(+)简写成P2(z),那么有 xt)uxt+r)-ulat P1(r) 将分子展开并注意到imr|x()dt=H2 T→》∞ x(t+rat=u →∞T 从而 limax()x(t+r)dt-H p,(z) →)0 (5-18) 定义各态历经随机信号 自相关函数R(z)为 R()=lim=x(o)x(t+r)dt T→>0 (5-19) 则 R2(z) (5-20 KDI
假如 x(t) 是某各态历经随机过程的一个样本记录。x(t+τ) 是 x(t) 时移τ 后的样本,见图5-15。在任何 t =t0 时刻,从两个样本上分别得到两个 量值x(ti) 和 x(ti+τ),而且 x (t) 和 x (t+τ) 具有相同的均值和标准差。 假如把 x(t) x(t+ ) 简写成 x ( ) ,那么有 2 0 1 lim [ ( ) ][ ( ) ] ( ) x T T x x T x x t x t dt − + − = → 将分子展开并注意到 x T T x t dt T = → 0 ( ) 1 lim x T T x t dt T + = → 0 ( ) 1 lim 从而 2 0 1 2 lim ( ) ( ) ( ) x T T x T x x t x t dt + − = → (5-18) 二.信号的自相关函数 定义各态历经随机信号 自相关函数 Rx ( ) 为 = + → T T x x t x t dt T R 0 ( ) ( ) 1 ( ) lim (5-19) 则 2 2 ( ) ( ) x x x x R − = (5-20) 8
0 图5-15自相关 KDI
0 t x(t) 0 t x(t+τ) τ ti ti 图5—15 自相关 9
显然,P(z)和R3(z)均随r而变化,且两者成线性关系 如果随机过程均值=0,则n2()=R() 自相关函数性质见图5-16 (1)由式(520)有(r)=P2(r)0+2(可作相关性的相对评价)(521) 因为≤1,所以2-02sR()s2+2 (5-22) (2)自相关函数在r=0时为最大值,并等于该随机信号的均方差值v2 R:(0)=lmx()x(t=v2(523) 7→oT (3)当τ足够大或τ→∞时,x(),和x(计+)不存在内在联系,彼此无关。 p,(x)→00(r)→>H T→00 (4)自相关函数为偶函数,即R2(r)=R(r (5-24) (5)周期函数的自相关函数仍为同频率的周期函数,其幅值与原周期信号 幅值有关,而丢失了原信号的相位信息。 KDI
显然, x ( )和Rx ( ) 均随 τ 而变化,且两者成线性关系。 如果随机过程均值 x = 0 ,则 2 ( ) ( ) x x x R = 自相关函数性质见图5-16 (1)由式(5-20)有 (可作相关性的相对评价) 2 2 ( ) ( ) Rx x x x = + (5-21) 因为 xy 1 ,所以 2 2 2 2 ( ) x x Rx x x − + (5-22) (2)自相关函数在τ= 0时为最大值,并等于该随机信号的均方差值ψ2 x 2 0 ( ) ( ) 1 (0) lim x T T x x t x t dt T R = = → (5-23) (3)当τ足够大或τ→∞时,x(t) 和x(t+τ)不存在内在联系,彼此无关。 ( ) → 0 → x 2 ( ) x x → → (4)自相关函数为偶函数,即 ( ) ( ) Rx − = Rx (5-24) (5)周期函数的自相关函数仍为同频率的周期函数,其幅值与原周期信号 幅值有关,而丢失了原信号的相位信息。 10