上海充道大兽 SHANGHAI JIAO TONG UNIVERSITY SHANGHAI JIAO TONG UNIVERSTT 1日日 随机模拟方法与应用课程作业 课程名称:随机模拟方法与应用 学生姓名:马欣楠 学生学号:5111509100
SHANGHAI JIAO TONG UNIVERSITY 随机模拟方法与应用 课程作业 课程名称: 随机模拟方法与应用 学生姓名: 马欣楠 学生学号: 5111509100
基于MCMC的创业公司估值问题研究 摘要 对创业公司的估值只有偶尔才能观察到。要对其风险和收益做出有效估计,必须对样本 选择做出校正。本文介绍一种基于MCMC的动态样本选择法,并采用此方法用创业公司的 风险投资数据对其进行估值。 关键词:MCMC,上市公司估值,动态选择 Abstract Valuations of entrepreneurial companies are only observed occasionally,albeit more frequently for well-performing companies.Consequently,estimators of risk and return must correct for sample selection to obtain consistent estimates.We develop a general model of dynamic sample selection and estimate it using data from venture capital investments in entrepreneurial companies. Our selection correction leads to markedly lower intercepts and higher estimates of risks compared to previous studies. Keywords:MCMC,valuation of entrepreneurial companies,dynamic sample selection 1.引言 许多资产并不经常交易,如个人独资企业,房地产,公司和政府债券,许多期货产品等。 它们的估值只有在交易时才可观察到,所以这些资产的价值和收益数据是不连续的。如果认 为在新一次交易前资产价格一直保持前一次交易的价格不变,对风险和收益的估计会发生偏 差。而如果观测到收益的时间是由于资产自身引起的,则会出现样本选择问题。我们把此称 为动态选择问题,也是本文研究的问题。 动态选择问题非常普遍,在对冲基金、房地产、风险资本投资和私人投资等领域都会出 现。如表现更差的对冲基金更不愿披露收益,也更难在市场上生存。由此导致的自我选择和 生存问题是动态选择问题的一个体现。又如在房地产市场,只能观测到已交易房产的价格。 动态问题则体现在:保留价格(reservation price)较高的卖家卖出房产的可能性更低,而降 价的房产更有可能交易。 本文主要研究了创业公司的风险投资过程。动态选择问题体现在:对公司的估值仅在公 司获得投资或者上市或退市才可观测。对于运营良好的公司,这些事件发生频率更高,这些 公司也更容易在市场生存。研究发现:针对这一问题,动态选择十分重要。对选择过程进行 校正后,期望收益显著降低,而风险显著升高。 我们扩展了风险投资的经验模型。通过增加一个选择过程来校正收益观测值的自身选择 性(endogenous selection),我们将标准动态资产定价模型予以扩展。我们的模型确定了在观 测到的估值和收益之间未观测到的估值和收益。我们将一个动态过滤和平滑模型 (Kalman(1960)and Anderson and Moore(1979)与Ⅱ类型Tobit模型(Heckman(1979)and Amemiya(I985))相结合,采用Gibbs抽样法和Markov Chain Monte Carlo估计,通过迭代
基于 MCMC 的创业公司估值问题研究 摘要 对创业公司的估值只有偶尔才能观察到。要对其风险和收益做出有效估计,必须对样本 选择做出校正。本文介绍一种基于 MCMC 的动态样本选择法,并采用此方法用创业公司的 风险投资数据对其进行估值。 关键词:MCMC,上市公司估值,动态选择 Abstract Valuations of entrepreneurial companies are only observed occasionally, albeit more frequently for well-performing companies. Consequently, estimators of risk and return must correct for sample selection to obtain consistent estimates. We develop a general model of dynamic sample selection and estimate it using data from venture capital investments in entrepreneurial companies. Our selection correction leads to markedly lower intercepts and higher estimates of risks compared to previous studies. Keywords: MCMC, valuation of entrepreneurial companies, dynamic sample selection 1.引言 许多资产并不经常交易,如个人独资企业,房地产,公司和政府债券,许多期货产品等。 它们的估值只有在交易时才可观察到,所以这些资产的价值和收益数据是不连续的。如果认 为在新一次交易前资产价格一直保持前一次交易的价格不变,对风险和收益的估计会发生偏 差。而如果观测到收益的时间是由于资产自身引起的,则会出现样本选择问题。我们把此称 为动态选择问题,也是本文研究的问题。 动态选择问题非常普遍,在对冲基金、房地产、风险资本投资和私人投资等领域都会出 现。如表现更差的对冲基金更不愿披露收益,也更难在市场上生存。由此导致的自我选择和 生存问题是动态选择问题的一个体现。又如在房地产市场,只能观测到已交易房产的价格。 动态问题则体现在:保留价格(reservation price)较高的卖家卖出房产的可能性更低,而降 价的房产更有可能交易。 本文主要研究了创业公司的风险投资过程。动态选择问题体现在:对公司的估值仅在公 司获得投资或者上市或退市才可观测。对于运营良好的公司,这些事件发生频率更高,这些 公司也更容易在市场生存。研究发现:针对这一问题,动态选择十分重要。对选择过程进行 校正后,期望收益显著降低,而风险显著升高。 我们扩展了风险投资的经验模型。通过增加一个选择过程来校正收益观测值的自身选择 性(endogenous selection),我们将标准动态资产定价模型予以扩展。我们的模型确定了在观 测到的估值和收益之间未观测到的估值和收益。我们将一个动态过滤和平滑模型 (Kalman(1960) and Anderson and Moore(1979))与 II 类型 Tobit 模型(Heckman (1979) and Amemiya(1985))相结合,采用 Gibbs 抽样法和 Markov Chain Monte Carlo 估计,通过迭代
模拟以下三个分布产生后验分布:1)贝叶斯回归:2)截断随机变量的抽样(a draw from truncated variables):3)从Kalman Filter产生的一个路径。这三个分布结合起来构成一个估 计的过程。这一算法得出模型中所有参数和隐性变量的后验分布,同时得出所有未观测估值 的估计路径。 我们采用几种方法对算法的稳健性进行分析。首先我们假定误差项服从不同的正态分布, 发现模拟结果对此非常不敏感,然后我们用随机参数模型对不同公司的参数进行估计。模拟 结果对这一条件也非常不敏感。这与我们问题中更加严格的假定相一致。 这一模型的优点是它可以对有限样本进行精确推断,对非高斯参数的非线性函数也可进 行推断。这一模型有一定的局限性:基金的回报基于公司的投资组合,期限通常是10到13 年。由此用基金等级收益(fund level returns)衡量包含不同行业不同公司投资组合的短期回 报较为困难。用模型对单个公司进行估值可以得出更为独立的观测值,从而具有更强的统计 效力。 我们首先阐述了动态选择问题的基本定义:然后描述了我们的经济模型和估计算法:随 后我们用Matlab软件对针对此模型的MCMC程序进行6000次模拟,舍弃最初1000个,得 到5000个样本。最后将我们的模拟数据与实际样本的回归数据进行比较分析,得出结论。 2.动态选择问题 动态选择模型包含一个结果方程(outcome equation): v(t)=v(t-1)+X'(t)0+E(t) (1) v(t)是t时刻估值的对数值,0包含我们关心的参数。估值仅当 1w(t)≥0 (2) 时被观测到。 w(t)是一个隐性选择变量,由选择方程所定义 w(t)=Z'(t)Yo+v(),+7t) (3) 假设(t)⊥7(t),且E(t)]=0,当Y.≠0时会出现样本选择问题。因为在所有已观测 到数据的条件下,EL(t)川data]≠0。直观来讲,当观测到一个估值的概率与此估值本身 有关时会出现样本选择问题。在实际应用中,估值更高的创业公司更有可能获得新的投资, 所以&更高的公司在数据中会更频繁地出现,即EL()川data>O。 当v(t-1)在结果方程时,一个通常的做法是采用两阶段法:首先计算ELs(t)川data, 通过控制函数将计算结果作为结果方程的一个特殊变量,然后再计算Ev(t)川data]在此问 题中,由于观测到的估值的条件期望依赖于期间未观测到的估值,所以需要对未观测值的所 有可能路径进行积分,使得计算十分困难。 3.经济模型和估计过程
模拟以下三个分布产生后验分布:1)贝叶斯回归;2)截断随机变量的抽样(a draw from truncated variables);3)从 Kalman Filter 产生的一个路径。这三个分布结合起来构成一个估 计的过程。这一算法得出模型中所有参数和隐性变量的后验分布,同时得出所有未观测估值 的估计路径。 我们采用几种方法对算法的稳健性进行分析。首先我们假定误差项服从不同的正态分布, 发现模拟结果对此非常不敏感,然后我们用随机参数模型对不同公司的参数进行估计。模拟 结果对这一条件也非常不敏感。这与我们问题中更加严格的假定相一致。 这一模型的优点是它可以对有限样本进行精确推断,对非高斯参数的非线性函数也可进 行推断。这一模型有一定的局限性:基金的回报基于公司的投资组合,期限通常是 10 到 13 年。由此用基金等级收益(fund level returns)衡量包含不同行业不同公司投资组合的短期回 报较为困难。用模型对单个公司进行估值可以得出更为独立的观测值,从而具有更强的统计 效力。 我们首先阐述了动态选择问题的基本定义;然后描述了我们的经济模型和估计算法;随 后我们用 Matlab 软件对针对此模型的 MCMC 程序进行 6000 次模拟,舍弃最初 1000 个,得 到 5000 个样本。最后将我们的模拟数据与实际样本的回归数据进行比较分析,得出结论。 2.动态选择问题 动态选择模型包含一个结果方程(outcome equation): v t v t X t t ( ) ( 1) '( ) ( ) (1) vt() 是 t 时刻估值的对数值, 包含我们关心的参数。估值仅当 w t( ) 0 (2) 时被观测到。 wt() 是一个隐性选择变量,由选择方程所定义 0 ( ) '( ) ( ) ( ) w t Z t v t t v (3) 假设 ( ) ( ) t t ,且 E t [ ( )] 0 ,当 0 v 时会出现样本选择问题。因为在所有已观测 到数据的条件下, E t data [ ( ) | ] 0 。直观来讲,当观测到一个估值的概率与此估值本身 有关时会出现样本选择问题。在实际应用中,估值更高的创业公司更有可能获得新的投资, 所以 更高的公司在数据中会更频繁地出现,即 E t data [ ( ) | ] 0 。 当 v t( 1) 在结果方程时,一个通常的做法是采用两阶段法:首先计算 E t data [ ( ) | ] , 通过控制函数将计算结果作为结果方程的一个特殊变量,然后再计算 E v t data [ ( ) | ] 在此问 题中,由于观测到的估值的条件期望依赖于期间未观测到的估值,所以需要对未观测值的所 有可能路径进行积分,使得计算十分困难。 3. 经济模型和估计过程
3.1估值过程 假设某一经济体有价格为B()的无风险债券,连续复利由下式给出: dB(t)=rdt (4) B(t) 市场投资组合的价值符合布朗运动: dM()=Bdt+dw( (5) M(t) 设对一个给定公司的估值是V(),由单因素市场模型得到: dv(t) -rdt adt+B( (6) V(t) dM()-rdt)+adw(t) `M() 估值过程的额外收益是a,对每一单位B,dW(t)与dW,(t)相互独立。定义连续复利收 益: r(t,t)-(t'-t)r=('-)6+Bm(t,t)-(t-t)r)+(t,t) (7 (t,t')服从N(0,(t'-t)o2)分布,定义v(t)=lnV(t)],从t=t'-1开始,我们到达估值方 程的一阶段转移方程: v(t)=v(t-1)+r+δ+B(rm(t)-r)+(t) (8) N(0o,④=lnM0/Mu-川这是将X)-0- []w 式所得的方程。 3.2选择过程 仅当公司新获投资或上市、退市时估值才可观测到。这些事件的内在关联性由选择过程 处理。按照方程(2)、(3),估值仅当 1w()≥0 (9) 时被观测到。 w(t)是一个隐性选择变量,由选择方程所定义 w()=Z()Yo+v()+n(t) (10) 向量Z'()包含影响新获投资或上市、退市的因素,包括一个常数项,从上一轮投资到现在 的时间(一次项和平方项)以及捕获一般市场条件的变量。方程(10)的第二项是估值的对 数值。通过将前一轮投资估值的对数值乘以一个系数-Y,包含在Z()中,我们可以将Y,阐释
估值过程 假设某一经济体有价格为 Bt() 的无风险债券,连续复利由下式给出: ( ) ( ) dB t rdt B t (4) 市场投资组合的价值符合布朗运动: ( ) ( ) ( ) m m m dM t dt dW t M t (5) 设对一个给定公司的估值是 V t() ,由单因素市场模型得到: ( ) ( ) ( ) ( ) ( ) ( ) dV t dM t rdt dt rdt dW t V t M t (6) 估值过程的额外收益是 ,对每一单位 ,dW t( ) 与 ( ) m dW t 相互独立。定义连续复利收 益: ( , ') ( ' ) ( ' ) ( ( , ') ( ') ) ( , ') v m r t t t t r t t r t t t t r t t (7) ( , ') t t 服从 2 N t t (0,( ' ) ) 分布,定义 v t V t ( ) ln[ ( )] ,从 t t ' 1 开始,我们到达估值方 程的一阶段转移方程: ( ) ( 1) ( ( ) ) ( ) m v t v t r r t r t (8) ( ( ) ln[ ( ) / ( 1)] m r t M t M t 这是将 1 ( ) ( ) m X t r t r , = r 代入() 式所得的方程。 选择过程 仅当公司新获投资或上市、退市时估值才可观测到。这些事件的内在关联性由选择过程 处理。按照方程()、(),估值仅当 w t( ) 0 (9) 时被观测到。 wt() 是一个隐性选择变量,由选择方程所定义 0 ( ) '( ) ( ) ( ) w t Z t v t t v (10) 向量 Z t '( ) 包含影响新获投资或上市、退市的因素,包括一个常数项,从上一轮投资到现在 的时间(一次项和平方项)以及捕获一般市场条件的变量。方程(10)的第二项是估值的对 数值。通过将前一轮投资估值的对数值乘以一个系数- v 包含在 Z t() 中,我们可以将 v 阐释
为从前一轮投资以来获得收益的系数。由于运营更成功的公司的估值更频繁地被观测到,我 们期望Y,为正值。我们假定7(t)独立同分布,均服从N(0,1)的标准正态分布。 总的来说,模型包含两个方程。估值方程(8)和选择方程(10)。仅当w(t)≥0时v(t) 才可被观测到。误差项均独立同分布,ε~N(0,σ),7(t)~N(0,1)。我们所感兴趣的参数是 6,B,2和y=(Yo.)。 3.3估计过程概述 我们用贝叶斯-吉布斯抽样过程将我们的模型分解成三部分:第一部分包含估值变量。 数据中大多数估值过程是未被观测到的,这一部分把未被观测到的估值作为模型内的参数对 其进行估计。第二部分包括选择变量。第三部分包括我们感兴趣的参数。Gibs抽样法对这 三个部分的变量和参数进行迭代,最终模拟出模型校正后的联合后验分布。第二、三部分较 为简单。根据(9)、(l0)式的定义,我们从截断正态分布(truncated normal distribution)中 对第二部分的选择变量进行抽样:根据(8)、(10)式,用两个标准贝叶斯线性回归对第三 部分估值方程和选择方程中的参数进行估计。 第一部分中,对估值变量进行抽样是整个过程中最复杂的部分。这一部分需要探究未被 观察的估值在各参数、选择变量、市场回报,以及估值未被观察这一事实本身的条件下的整 个路径。我们使用Carter和Kohn 1994年提出的向前过滤、向后取样法(Forward Filtering Backwards Sampling,FFBS),这一方法提供了一种在所有已有信息下对隐性变量可能路径 进行取样的有效途径。 FBS算法规定模型在参数和选择变量的条件下是一个线性状态空间,隐性变量的路径 可以由通过Kalman过滤(Kalman filter)重现。从这一观点看,v(t)是未观测的状态变量, 估值方程(8)将r+δ+((1)-r)作为作用于状态的可观测的控制,由此规定了状态转 移规则。状态空间有一个或两个观测方程,取决于估值是否被观测到。选择变量W()可以 视作()的噪声观测,第一个观测方程即为式(8),当一次估值被观测到时,观测方程提供 当前状态的直接观测值,并有lVos()]=v(t),'os(t)是观测到的估值。我们假定所有观 测到的估值都是没有偏差的。 我们使用不同的先验分布和参数的初始值进行估计,进行了6000次Gibbs抽样迭代, 弃去开始1000次的结果来模拟后验分布。在开始的1000次迭代中,模拟结果收敛迅速。我 们又对算法的稳定性和收敛性进行验证,包括去除对高斯误差项的假设,去掉不同公司的 和B恒定不变的假设等。 4.数据阐释 月度市场收益和Fama-French投资组合的回报从Kenneth French网站获取,包括NYSE, AMEX和NASDAQ的上市公司。月度国库贴现率也可在网站获取。 4.1风险投资数据
为从前一轮投资以来获得收益的系数。由于运营更成功的公司的估值更频繁地被观测到,我 们期望 v 为正值。我们假定 ()t 独立同分布,均服从 N(0,1)的标准正态分布。 总的来说,模型包含两个方程。估值方程(8)和选择方程(10)。仅当 w t( ) 0 时 vt() 才可被观测到。误差项均独立同分布,( ,()t N(0,1)。我们所感兴趣的参数是 , , 和 =( ) 0 v , 。 3.3 估计过程概述 我们用贝叶斯-吉布斯抽样过程将我们的模型分解成三部分:第一部分包含估值变量。 数据中大多数估值过程是未被观测到的,这一部分把未被观测到的估值作为模型内的参数对 其进行估计。第二部分包括选择变量。第三部分包括我们感兴趣的参数。Gibbs 抽样法对这 三个部分的变量和参数进行迭代,最终模拟出模型校正后的联合后验分布。第二、三部分较 为简单。根据(9)、(10)式的定义,我们从截断正态分布(truncated normal distribution)中 对第二部分的选择变量进行抽样;根据(8)、(10)式,用两个标准贝叶斯线性回归对第三 部分估值方程和选择方程中的参数进行估计。 第一部分中,对估值变量进行抽样是整个过程中最复杂的部分。这一部分需要探究未被 观察的估值在各参数、选择变量、市场回报,以及估值未被观察这一事实本身的条件下的整 个路径。我们使用 Carter 和 Kohn 1994 年提出的向前过滤、向后取样法(Forward Filtering Backwards Sampling,FFBS),这一方法提供了一种在所有已有信息下对隐性变量可能路径 进行取样的有效途径。 FFBS 算法规定模型在参数和选择变量的条件下是一个线性状态空间,隐性变量的路径 可以由通过 Kalman 过滤(Kalman filter)重现。从这一观点看,vt() 是未观测的状态变量, 估值方程(8)将 ( ( ) ) m r r t r 作为作用于状态的可观测的控制,由此规定了状态转 移规则。状态空间有一个或两个观测方程,取决于估值是否被观测到。选择变量 wt() 可以 视作 vt() 的噪声观测,第一个观测方程即为式(8),当一次估值被观测到时,观测方程提供 当前状态的直接观测值,并有 ln[ ( )] ( ) V t v t OBS , ( ) V t OBS 是观测到的估值。我们假定所有观 测到的估值都是没有偏差的。 我们使用不同的先验分布和参数的初始值进行估计,进行了 6000 次 Gibbs 抽样迭代, 弃去开始 1000 次的结果来模拟后验分布。在开始的 1000 次迭代中,模拟结果收敛迅速。我 们又对算法的稳定性和收敛性进行验证,包括去除对高斯误差项的假设,去掉不同公司的 和 恒定不变的假设等。 4.数据阐释 月度市场收益和Fama-French投资组合的回报从Kenneth French网站获取,包括NYSE, AMEX 和 NASDAQ 的上市公司。月度国库贴现率也可在网站获取。 4.1 风险投资数据