基于矩阵值因子模型的高维已实现协方差矩阵建模-宋鹏.pdf

上传人:1890****070 文档编号:105554 上传时间:2018-05-12 格式:PDF 页数:9 大小:1.30MB
返回 下载 相关 举报
基于矩阵值因子模型的高维已实现协方差矩阵建模-宋鹏.pdf_第1页
第1页 / 共9页
亲,该文档总共9页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《基于矩阵值因子模型的高维已实现协方差矩阵建模-宋鹏.pdf》由会员分享,可在线阅读,更多相关《基于矩阵值因子模型的高维已实现协方差矩阵建模-宋鹏.pdf(9页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、第34卷第11期2017年11月统计研究Statistical ResearchV0134。No11NOV2017基于矩阵值因子模型的高维已实现协方差矩阵建模宋鹏胡永宏内容提要:随着大数据时代的来临,待分析数据维度越来越高,高维协方差矩阵的估计与建模已经成为统计学领域的一个基本问题。本文提出基于Cholesky分解的可预测矩阵值因子模型,对高维已实现协方差矩阵进行了建模及预测。模型有效地降低了矩阵维度,显著减少了待估参数数目,有效地避免了估计误差的累积,且因子分析降维使得协方差矩阵元素之间的相依关系更加清晰。实际建模结果表明,模型与VARLASSO方法预测误差较为接近,但是降维效果更加明显,待

2、估参数数目大大减少,更加具备应用价值。基于矩阵值因子模型构建的投资组合收益更加贴近真实投资组合收益,而且比VARLASSO方法更加稳健。关键词:矩阵值因子模型;高维已实现协方差矩阵;Cholesky分解;向量自回归DOI:1019343jcnki1 11302c201711010中图分类号:0212 文献标识码:A 文章编号:10024565(2017)110109一09Modeling High-Dimensional Realized Covariance MatrixVia MatrixValued Factor ModelSong Peng&Hu YonghongAbstract:Wi

3、th the advent of the Big Data Era,the dimension of data is higher and higher,and theproblem of modeling highdimensional covariance matrix becomes a fundamental issueIn this paper,wepropose a novel method called the predictable matrixvalued factor model with the Cholesky decomposition,which could red

4、uce the dimension of matrix effectively and reduce the number of estimated parameterssignificantly and avoid the aggregated errorsMeanwhile,due to the advantage of factor analysis,therelationships of entries in covariance matrix would be clarifiedThe consequence of modeling shows that theaccuracy of

5、 proposed model is disFlayed in accordance with VARLASSO methodHowever,the number ofestimated parameters decreases obviouslyLastly,we proceed empirical analysis and we learn that based on theforecasted realized covariance matrix constructed by different method,the final series of return derived from

6、proposed model is more dosed to real series of returnAdditionally,the proposed model is more robust thanVARLASS0 methodKey words:Matrix-Valued Factor Model;HighDimensional Realized Covarianee Matrix;CholeskyDecomposition;VARt本文获国家自然科学基金面上项目“稳健投资组合选择的并行最优化算法研究与实现”(61272193)、中央财经大学研究生科研创新基金项目“高维协方差阵建模

7、及投资组合应用”(201607)资助。万方数据110 统计研究 2017年11月一、引言高维协方差矩阵的估计与建模现已成为统计学领域中多变量分析的基本问题,并且在经济、金融、生物等众多领域中有着广泛应用。针对高维协方差矩阵的估计及建模,众多学者进行了相关研究,主要思想为稀疏化高维协方差矩阵和对其进行降维处理。Fan等(2008)1提出了因子模型,应用降维的思想来解决高维协方差矩阵的估计问题,模型假定高维变量由某些已知的共同因子刻画,通过对误差矩阵施加门限函数来估计总体协方差矩阵。而在因子未知时,Fan等(2013)悼1提出了主成分正交补估计量,首先对样本协方差矩阵进行谱分解,然后选取适当数目的

8、特征值,最后对正交补进行稀疏化,以此进行估计。Bollerslev等(1988)o发现协方差矩阵元素以很强的自相关结构随着时间变化,而现有的因子模型是对高维协方差矩阵的“总体”进行估计,并没有将矩阵时变产生的相关历史信息考虑在内,无法用来预测。如若采用时间序列方法进行条件预测需要单期样本,然而协方差矩阵本身无法观测。针对此问题,Andemon和Bollerslev(2003)H J基于单期内样本的高频数据,提出了已实现协方差矩阵的构造方法,解决了观测样本的来源问题;针对已实现协方差矩阵,Gourieoux等(2009)1假定已实现协方差矩阵服从Wishart分布,提出了Wishart自回归模型

9、,该方法有很强的分布假定,参数估计的精度也依赖于滞后阶数的选择与样本尺度;Golosnoy等(2012)o放宽了Wishart自回归模型的分布假定,但是模型并不适用于高维数据;Hautsch等(2009)1舍弃了严格的分布假定,用正则化区块方法对高维已实现协方差矩阵时间序列样本进行了建模,模型将高维协方差矩阵分割为若干低维协方差矩阵区块,对每一分块矩阵通过正则化方法进行估计,最后再进行合成;Callot和Kock(2017)。8 o提出VARLASSO模型,首先将高维已实现协方差矩阵拉直为向量,然后用向量自回归模型(VAR)刻画动态结构,在参数估计的过程中使用LASSO类收缩算法,稀疏化系数矩

10、阵。基于以上文献综述,可见在对高维已实现协方差矩阵的建模过程中,目前的方法大多需要“变换”及“拆分”矩阵,这些方法在降低矩阵维数和减少待估参数数目的同时,也破坏了矩阵本身的结构。而在信号与图像处理领域,Walden和Serroukh(2002)一1首次引入了矩阵值(MatrixVMued)时间序列概念,即变量以固定的矩阵结构进行时变,因而对矩阵值时间序列进行分析不会破坏变量的矩阵结构;之后众多学者对此展开了研究,但提出的分析方法均针对于元素独立的矩阵值时间序列数据,没有考虑矩阵元素之间的相依性;Wang等(2016)叫提出了矩阵值时间序列因子分析方法,对高维的股票收益率矩阵值时间序列进行了建模

11、,提取出了因子矩阵,从而降低了观测样本的维度,并且依据因子载荷系数,分析了各只股票收益率的风险暴露来源,从一定程度上验证了FamaFrench三因子的有效性。显然,矩阵值因子分析方法所体现的降维思想可以应用到高维已实现协方差矩阵的建模过程中,然而此方法并没有从模型设定上限定所估计矩阵的结构,如若直接应用则会导致估计的协方差矩阵不具备正定且对称的基本统计性质;此外,模型并不具备预测功能,实用价值有待提高。因此本文拟借鉴矩阵值因子分析的降维思想,尝试对高维已实现协方差矩阵进行建模。本文对原始模型进行改进,额外引入Cholesky分解和向量自回归方法,创新地提出基于Cholesky分解的可预测矩阵值

12、因子模型,在解决上述方法适用性问题的同时,赋予模型预测能力,提高实用价值,最终应用到高维已实现协方差矩阵的建模及预测中。二、模型的提出本文首先阐述基于Cholesky分解的可预测矩阵值因子模型的基本内容,之后简单介绍已实现万方数据第34卷第1l期 宋鹏胡永宏:基于矩阵值因子模型的高维已实现协方差矩阵建模 11l协方差矩阵的构造方法。()基于Cholesky分解的可预测矩阵值因子模型假定置(t=1,2,丁)为矩阵值时间序列,其中x,为P,xP:维矩阵:卜,ll戈叫P2x。=l i ; I (1)【-K 气舢:j假定x。为正定对称已实现协方差矩阵,令P。=P:=Z,利用Cholesky分解得:X。

13、=L。L。 (2):为Cholesky分解后的下三角矩阵,对其用矩阵值因子方法进行建模,设:L。=RF。C+E。 (3)F。为k。k:(k,k:n)维潜在的因子矩阵,R为凡k。维前载荷矩阵,c为nk:维后载荷矩阵,E。为误差矩阵。假设k。=,且R为n维单位阵,模型变为L。=fC+E。,在这种情况下,矩阵。的每一列均为矩阵F。所有列向量的一个线性组合,因此矩阵c称为列载荷矩阵。同理,矩阵R也称为行载荷矩阵。保持行和列载荷矩阵不变,对降维后的因子矩阵F。使用VAR模型进行建模预测,令vec()为向量化算子,滞后P阶,得:vec(F)=西Ff叫。vec(F帅+。)+e川 (4)庐,为后。k:kl五:

14、维系数矩阵,e为误差向量。综上所述,基于Cholesky分解的可预测矩阵值因子模型为:X。+1=L。+lL。+l=RF,+l CCF 7;+1R (5)Callot和Kock(2017)提出VARLASSO模型,直接对高维已实现协方差矩阵进行建模:vec(X,)=西,卜,vec(X,一,)+巳 (6)假定基于Cholesky分解的可预测矩阵值因子模型与VARLASSO滞后阶数均为1,协方差矩阵中不同的元素个数为n(n+1)2,因此中,为【掣掣维系数矩阵,el为误差向量。不考虑收缩算法,VAR模型多。中待估参数个数为n(n+1)22。然而,在矩阵值因子模型中,待估高维协方差矩阵可由低维因子矩阵刻

15、画,且C矩阵、R矩阵及中,矩阵待估参数数目一共为n尼。+nJ|:+瑶磋。因此,矩阵值因子模型能够有效降低矩阵维度,同时显著减少待估参数数目。(二)已实现协方差矩阵的构建基于高频数据,Anderson和Bollerslev(2003)提出了已实现协方差矩阵的构造方法。针对金融资产,在给定日内高频数据获取的频率下,假定日内获取的样本数量为m,资产对数收益率为P,资产i与资产J之间在第t天的已实现协方差由下式给出:RCO哆=(p从一P触一。)(一Pj,) (7)在得到两个资产之间的已实现协方差后,可以构建全部几维资产的已实现协方差矩阵。按照传统协方差矩阵的结构,依次按顺序排列已实现方差即可得到全部资

16、产的已实现协方差矩阵,如式(8)所示。万方数据112 统计研究 2017年11月rRCOVRCOV,:I;L RCOVol。三、模型估计方法及性质(8)(一)估计方法设高维协方差矩阵维度为乃,令任意U。、均为nn维的可逆矩阵,Cholesky分解后的L。矩阵可以用矩阵值因子模型表示如下:L。=RUl UilF。U2嵋1C+E: (9)可见,模型的估计面临识别问题。Lam和Yao(2012)11指出,虽然G矩阵与R矩阵无法识别,但是R矩阵与c矩阵的列空间彩(月)和彩(C)是唯一确定的。利用QR分解处理尺矩阵与c矩阵。R=Q。w。,c=Q2职 (10)Q。为p。k。维列正交矩阵,既为k。k。维上三

17、角矩阵(璐=l,2)。Q。、Q:的列空间篇(Q。)和么(Qz)与镅(R)和彩(c)分别等价,估计R矩阵与C矩阵的列空间转化为估计Q。、Q:的列空间,记:z。=w1F。W72 (1 1)则矩阵值因子模型转化为:L,=Qlz,Q2+E; (12)令oRi、q、Q。”s。分别表示L。、R、C、Q。、E,的第歹列;令足。、C 7。、Q砌分别表示R、c、Q。的第k行,可得:z幻=RF:e+占。=Qlz。Q2+s。J (13)设h为正整数步长,对于i=1,2,3,n,定义:1 rh嘎,“(矗)2南;c。(zQz舢Q。)(14)1 T-hQ,i(是)2高;Coill。,!mj)(15)蜴,(h)=Q。哦i(

18、h)Q, (16)给定h=h。,定义:必=骗口(是)力啊(是)2121 J 21ho n nM=Q,(蛾g()Q鲥()Q。可见M中的每一列均为Q,所有列的一个线性组合,所以。彩(M)样本观测值的特征向量去估计Jg;(Q。),得:1 T-hQ,i()2志娶儿一j(17)(18)=么(Q。),可以通过旋转M(19)ho n “庙=龟,u(危)白() (20)h=1 i=l J=1对M进行特征值分解,取前k,个最大特征值对应的特征向量蚕I,一,玩,可以得到0。=弓。,JnnK吃D;OGGRR万方数据第34卷第11期 宋鹏胡永宏:基于矩阵值因子模型的高维已实现协方差矩阵建模 1 13,孔,将L;转置,

19、用同样的方法可得D:。Lam和Yao(2012)给出了k。的确定方法,记天。爻:爻。0为庸的特征值,则:后。=argmin,讯:掣 f21)AiZc=Q-。Q2 (22)对互进行向量化处理,建立VAR模型,得到幺+。L川=Q,Zf+lQ2 (23)模型中川应为Ch。lesky分解后的下三角矩阵,上三角的非O元素均为误差,因此对三川中的元素l,口施加门限函数处理可得,:。=2,屯i t,其中,轧i=肛撕汤j: (24)【0 i0,i=1,2,3,凡,即不允许融券卖空,Fleming(2003):bj指出随着证券市场信息的更新,相比于持有资产,投资者更倾向于根据信息调整投资组合配置,本文测试天数为

20、108个交易日,进行日度调仓,忽略交易费用,投资组合收益率见图3。图3投资组合收益率时序图由图3可知,在测试前期,矩阵值因子模型和VARLASSO模型与真实投资组合收益率十分贴近;测试后期,两个模型构建的投资组合收益率均产生了波动,VARLASSO方法变得不稳健,产生了巨大波动,基于矩阵值因子模型构造的投资组合得到的收益率更加接近于真实投资组合收益率。五、结论随着大数据时代的来临,数据容量越来越大,维度也越来越高。在统计学领域,高维协方差矩阵的建模与预测成为了亟待解决的热点问题。本文在原始矩阵值因子模型的基础上进行了改进,引入Cholesky分解与向量自回归方法,提出了基于Cholesky分解

21、的可预测矩阵值因子模型,同时给出了其样本协方差空间收敛率,并在高维已实现协方差矩阵的动态建模中进行了应用。此外,针对16个行业指数,本文利用矩阵值因子分析方法对其高维已实现协方差矩阵进行了探究,聚类分析的结果表明一些行业的已实现波动率受特定因子影响的程度相对接近,行业之间存在关联。本文也对高维已实现协方差矩阵进行了建模预测,与VARLASSO方法进行了对比,结果表明二者预测误差相近,但是矩阵值因子分析方法降维效果明显,待估参数大大减少,更具应用价值。最后分别基于原始已实现协方差矩阵、可预测矩阵值因子模型预测的协方差矩阵、VARLASSO模型预测的协方差矩阵构建了投资组合,实证分析表明基于Cho

22、lesky分解的可预测矩阵值因子模型较VAR万方数据第34卷第11期 宋鹏 胡永宏:基于矩阵值因子模型的高维已实现协方差矩阵建模 117LASSO方法更加稳健。参考文献1Fan J,Fan Y,Lv JHigh dimensional covariance matrix estimation using a factor modelJJournal of Econometrics,2008,147(1):1861972Fan J,Liao Y,Mincheva MLarge covariance estimation by thresholding principal orthogonal c

23、omplementsJJournal of the RoyalStatistical Society,2011,75(4):6036803Bollerslev T,Engle R,Wooldridge JA capital asset pricing model with timevarying covariaucesJJournal of political Economy,1998,96(1):1161314Andersen T,et a1Modeling and forecasting realized volatilityJEconometrica,2003,71(2):5796255

24、Gourieoux C,Jasiak J,Sufana RThe wishart autoregressive process of multivariate stochastic volatilityJJournal of Econometrics,2009,150(2):1671816Gofosnoy V,Gribiseh B,Liesenfeld RThe conditional autoregTessive Wishart model for multivariate stock market volatilityJJournal of Econometrics,2012,167(1)

25、:21 12237Hautsch N,Kyj L,Oomen RA blocking and regularization approach to highdimensional realized covariance estimationJJournalof Applied Econometrics,2012,27(4):6256458Callot L,Kock A,Medeiros MModeling and forecasting large realized covariance matrices and portfolio choiceJJournal ofApplied Econo

26、metrics,2017,32(1):1401589Walden A,Serroukh AWavelet analysis of matrixvalued time seriesCProceedings of the Royal Society of London A:Mathematical,Physical and Engineering Sciences,2002,458(2017):15717910Wang D,Liu X,Chen RFactor models for matrixvalued highdimensional time seriesJArXiv Prepfint Wo

27、rking Paper No161001889,20161 1Lam C,Yao QFactor modeling for highdimensional time series:inference for the number of factorsJAnnals of Statistics,40(2):69472612Lunde A,Shephard N,Sheppard KEconometric analysis of vast covariance matrices using composite realized kernels and theirapplication to port

28、folio choiceJJournal of BusinessEconomic Statistics,2016,34(4):50451813Bauer G H,Vorkink KForecasting multivariate realized stock market volatilityJJournal of Econometrics,2011,160(1):9310114Markowitz H Portfolio selectionJThe journal offinance,1952,7(1):779115Fleming J,Kirby C,Ostdiek BThe economic value of volatility timing using“realized”volatilityJJournal of FinancialEconomics,2003,67(3):473509作者简介宋鹏,男,中央财经大学统计与数学学院在读博士研究生。研究方向为金融统计、高维统计推断。胡永宏,男,2008年毕业于北京林业大学经济管理学院,获管理学博士学位,现为中央财经大学统计与数学学院教授,博士生导师。现任中国现场统计研究会理事、统计综合评价研究分会副理事长。研究方向为金融统计与计量分析、统计综合评价。(责任编辑:郭明英)万方数据

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 研究报告 > 论证报告

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com