社会网络研究导论(6)网络经典统计分析*Classical statistical analysis forsocial network杜海峰何晓晨(本部分PPT部分参考刘军2007年1月培训资料)
1 社会网络研究导论( 6 ) 网络经典统计分析* Classical statistical analysis for social network 杜海峰 何晓晨 (本部分PPT部分参考刘军2007年1月培训资料)
内容提要·引言:网络中的统计分析Statistical analysisQAP方法原理QAP method·网络间相关关系分析Analysis of correlation·网络间因果关系分析Causality analysis·P*模型简介P* model2
2 内容提要 • 引言:网络中的统计分析 Statistical analysis • QAP方法原理 QAP method • 网络间相关关系分析 Analysis of correlation • 网络间因果关系分析 Causality analysis • P*模型简介 P* model
引言·常规的统计分析要求自变量之间相互独立,否则会出现“共线性”,它会引起一些问题。一例如,在完全共线性的条件下,将得不到参数的估计量;在近似共线性情况下普通最小二乘法(OLS)估计量非有效。多重共线性使参数估计值的方差增大,变量的显著性检验失去意义。. Conventional statistical analysis requires independentvariables, otherwise there will be"collinearity", which willcausesomeproblems.For example, under the condition of complete collinearity,theestimator of parameters will not be obtained; under the condition ofapproximate collinearity, the estimator of ordinary least squaresmethod (OLS) is not effective. Multiple collinearity increases thevariance of parameter estimation, and the significance test of3variables is meaningless
3 引言 • 常规的统计分析要求自变量之间相互独立,否则 会出现“共线性”,它会引起一些问题。 – 例如,在完全共线性的条件下,将得不到参数的估计 量;在近似共线性情况下普通最小二乘法(OLS ) 估 计量非有效。多重共线性使参数估计值的方差增大, 变量的显著性检验失去意义。 • Conventional statistical analysis requires independent variables, otherwise there will be "collinearity", which will cause some problems. • For example, under the condition of complete collinearity, the estimator of parameters will not be obtained; under the condition of approximate collinearity, the estimator of ordinary least squares method (OLS) is not effective. Multiple collinearity increases the variance of parameter estimation, and the significance test of variables is meaningless
引言·网络研究“关系”,难以满足统计独立性假设一例如:在研究网络成员的“朋友关系”和“社会支持关系”之间是否有关系的时候,假设通过常规统计分析发现二者之间确实有关。实际上,此时的相关是虚假的,一方面是因为网络成员之间在地理位置上的相近带来的,一方面这种研究本身就具有重大缺陷:这两种关系本身就有相关性,. Network research "relationship" is difficult tomeet the statistical independence hypothesis4
4 引言 • 网络研究 “关系”,难以满足统计独立性 假设 – 例如:在研究网络成员的“朋友关系”和“社 会支持关系”之间是否有关系的时候,假设通 过常规统计分析发现二者之间确实有关。实际 上,此时的相关是虚假的,一方面是因为网络 成员之间在地理位置上的相近带来的,一方面, 这种研究本身就具有重大缺陷:这两种关系本 身就有相关性。 • Network research "relationship" is difficult to meet the statistical independence hypothesis
QAP方法原理· QAP (Quadratic Assignment Procedure,二次指派程序)一是一种对两个网络(方阵中各个值)的相似性进行比较的方法,即它对网络对应方阵的各个格值进行比较,给出两个矩阵之间的相关系数,同时对系数进行非参数检验,它以对矩阵数据的置换为基础。 It is a method to compare the similarity of two networks (each valuein the square matrix), that is, it compares each lattice value of thecorresponding square matrix of the network, gives the correlationcoefficientbetweenthetwomatrices,andconductsnon-parametertest on the coefficient.It is based onthe replacement of matrix data5
5 QAP方法原理 • QAP(Quadratic Assignment Procedure, 二次指派程序) – 是一种对两个网络(方阵中各个值)的相似性进 行比较的方法,即它对网络对应方阵的各个格值 进行比较,给出两个矩阵之间的相关系数,同时 对系数进行非参数检验,它以对矩阵数据的置换 为基础。 – It is a method to compare the similarity of two networks (each value in the square matrix), that is, it compares each lattice value of the corresponding square matrix of the network, gives the correlation coefficient between the two matrices, and conducts non-parameter test on the coefficient. It is based on the replacement of matrix data