有别于建立在投资者行为完全理性基础之上的传统主流金融学,行为金融学认为市场中的参与者并非完全理性的,其投资决策行为并非完全建立在理性预期、风险回避、效用最大化以及相机抉择等假设基础之上,而往往会依据个人经验采用简单有效的主观推断来进行投资决策。并且,投资者的非理性情绪往往会相互影响、传染,并在外界的不断干扰下进一步得到强化、放大,从而影响市场运行趋势。也即,股票市场的价格走势不仅受制于其内在价值,而且在很大程度上还受投资者心理与行为的影响。因此,研究反应投资者心理行为的市场情绪,对于把握股票市场的运行趋势和运行特征有着一定的实践意义。一般认为,市场情绪是指受各种信息的影响,对风险资产未来价格具有偏差的投资者预期或者投资者信念,它可以在一定程度上反映市场的乐观或悲观程度,进而为投资者判断市场提供依据。正是基于这一认识,本文拟以行为金融学为理论基础,从不同角度来选择反映A股市场投资者情绪的指标,进而构建A股市场情绪指数,为投资者跟踪或研判A股市场运行趋势提供一些参考。
结合现有的相关研究文献和实践经验,为了比较全面地反映与市场情绪相关的各个方面,本文先从尽可能多的市场维度中挑选出相应的市场情绪指标(代理指标,共分7大类、11个细分指标),然后在考虑情绪衰减因子()的基础上,通过时序全局主成分分析法(TimeseriesanalysisandAll-aroundPCA)来构建中原证券市场情绪指数(CCSI-CentralChinaSentimentIndex),并就其应用给出了一些具体建议和择时的相关测试结果。具体指标及相关说明可参见表1。需要注意,融资融券和股指期货于2010年推出后,融资买入变化额、多空主力净持仓(或持仓比)、期现价差、成交持仓比等都体现了投资者的情绪。但由于这两业务推出的时间较短,相关的数据量还较少,因此我们暂时未将这些指标纳入到构建市场情绪指数的范畴。
在具体构建市场情绪指数(CCSI)之前,我们首先对各市场情绪指标(代理指标)与沪深300指数(以该指数近似代表A股市场整体的运行态势)之间的关系做初步的分析。时间层面上,首先基于全样本区间了解指标对沪深300指数的影响及关联性;其次,选定时间窗口(窗口长度从10到100,步长为5)滚动计算,并通过箱线图法分析对窗口的敏感性。需要注意:(1)在计算判定系数时,是将沪深300指数作为因变量、各指标作为自变量进行最小二乘回归;(2)箱线图法涉及数据中的五个统计量:最大值、最小值、中位数、上四分位数和下四分位数。它对数据的分布不作要求,可以粗略地看出数据是否具有对称性、分布的分散程度等信息,特别可以用于对不同样本之间的比较。
本文中,选取基金仓位与主要股东增减持来近似描述机构投资者的行为特性,前者投资于股市的仓位可以近似反映机构投资者对当前股市的认同度与投资热情,后者对持有上市公司股份的增减持行为,将在很大程度上影响市场对上市公司发展前景的预期,进而直接影响上市公司的股价。
基金仓位通过计算所有偏股型基金仓位的算术平均值得到。其样本区间为从2008年1月18日到2012年11月9日,共1171个日数据,其中取每周五的数据,共得到246个周数据。主要股东增减持数据通过计算每周主要股东所有增持参考市值与减持参考市值之差得到。其样本区间为从2008年1月18日到2012年11月9日,共246个周数据。由于增减持行为的公告日期有可能位于周末,因此在数据处理上,我们以上周六到本周五作为一个时间周期进行统计。
我们选取市盈率作为市场估值水平的代表。在剔除所有A股公司中归属母公司股东净利润为负值的基础上,对剩余所有公司的总市值和归属母公司股东净利润分别求和后相除得到市盈率值。其样本区间为从2008年1月18日到2012年11月9日,共246个周数据。由于该指标于每周五及时更新后得到,因此可以与其余指标同步使用。
活跃交易账户占比通过计算一周参与交易的A股账户数与期末持仓A股账户数的比值得到。其样本区间为从2008年1月11日到2012年11月9日,共246个周数据。由于要到每周三才能得到上周参与交易的A股账户数,因此在与其他同步更新的情绪指标同时使用时,需要将该指标滞后一阶。
亏损股指数为申万风格指数系列中的申万亏损股指数(代码:801851.SI)。其样本区间为从2008年1月18日到2012年11月9日,共得到246个周数据。由于该指标于每周五及时更新后得到,因此可以与其余指标同步使用。
我们选取信用价差来反映投资者的风险偏好水平,信用价差通过计算企业债1年期到期收益率与国债1年期到期收益率的差值得到。其样本区间为从2008年1月18日到2012年11月9日,共1202个日数据,其中取每周五的数据,共得到246个周数据。
我们选取海外股市中有代表性的VIX指数来近似代表外围市场的情绪。当VIX越高时,表示市场参与者预期后市波动程度会更加激烈,同时也反映其不安的心理状态;相反,如果VIX越低,则反映市场参与者预期后市波动程度会趋于缓和的心态,也因此VIX又被称为投资人恐慌指标(TheInvestorFearGauge)。
根据沪深300指数的周日期序列,得到对应时间段的VIX指数序列,数据有缺失时通过线性插值法补齐。其样本区间为从2008年1月18日到2012年11月9日,共得到246个周数据。由于该指标于每周五及时更新后得到,因此可以与其余指标同步使用。
资金相对流向通过计算全部A股一周主买金额之和与主卖金额之和的比值得到。该指标也可以近似衡量市场整体的相对资金流强弱,其样本区间为从2008年1月18日到2012年11月9日,共得到246个周数据。由于该指标于每周五及时更新后得到,因此可以与其余指标同步使用。
基于前述对各市场情绪指标的说明与初步分析,我们在考虑情绪衰减因子()的基础上,通过时序全局主成分分析法(TimeseriesanalysisandAll-aroundPCA)来构建中原证券市场情绪指数(CCSI-CentralChinaSentimentIndex)。
样本区间为从2008年1月18日到2012年11月9日,以周为时间单位,共246个时间点。情绪指标集为前述的共7大类、11个细分指标组成。根据各指标的更新频率,我们将市场活跃程度类别中的活跃交易账户占比指标滞后一阶,而其余10个指标均可同步使用。
在滚动计算市场情绪指数时,我们采用的是固定时间窗口长度(窗口长度为N)的方法。但在具体滚动计算时,随着时间的推移,数据会不断更新,这往往会牵涉到新计算出的指数点位如何与已有指数序列对接的问题。在处理方式上,可以将新的指数点位直接或者利用已有指数序列的若干个点通过简单的加减乘除对接到已有指数序列的后面,也可以将新的指数序列与已有指数序列进行最小二乘回归,根据回归系数对新的指数点位计算后,将其对接到已有指数序列的后面。具体示意图可参见图1和图2。
但通过主成分分析法,不同的时间窗口及对接方式会导致同一时点上情绪点位的差异,从而可能产生较大的累积偏差(由滚动计算产生的)。鉴于此,我们采用一种新的方法进行对接:引入情绪衰减(或传播)因子()(根据指数加权移动平均的思想来近似模拟市场情绪的衰减规律,即考虑不同时点的情绪对当前市场的影响程度;也可以认为不同时点的情绪相互影响、传递,情绪传播具有一定程度的记忆性;取值区间为(0,1]),通过对各期情绪指数值加权得到当前的综合市场情绪。具体示意图参见图3。
值得一提的是,通过情绪衰减因子()来模拟市场情绪的衰减规律时,不同的因子值会产生不同的衰减效果:当因子值较大时(参见图4,为了平缓权重的衰减速度,便于观察,我们在图中又通过指数函数(y=ex)简单处理了下权重序列),权重衰减速度越快,即离当前时点越近的情绪值的权重越大,可以认为当前市场主要受制于近期情绪的影响,而对较远时期的情绪不太敏感,情绪传播具有短记忆性;反之,当因子值较小时(参见图5),权重衰减速度略微趋缓,情绪传播的记忆性增强。
因此,我们构建出的市场情绪指数(CCSI)包含两个参数:时间窗口长度N和情绪衰减因子(即CCSI(N,)),而对这两个参数进行敏感性分析的结果显示:当的取值区间设定为[0.2,1]时,市场情绪指数(CCSI)与沪深300指数之间的相关性较为稳定。因此,在后续的应用测试时,暂时固定=0.8,即CCSI(N,=0.8)。事实上,对于这种需要滚动计算不断更新的类择时(或者类趋势)指标,在计算过程中肯定要考虑历史样本长度以及各样本影响程度(即权重)的选取,从而决定指标的平滑程度或者跟踪效果。
市场情绪指数只是投资者的心理与行为对市场表现的一种近似反应,能够大体反应出市场的运行态势与结构特性。但由于该指标也仅仅是影响(解释)市场表现的众多因素中的一个,因此在具体应用时,我们的态度较为谨慎。因为单从一个指标入手就能够较好的把握市场的动向,这是没有任何意义的,也根本不可能(因为只根据一堆与市场同步或者略微滞后的指标所加工合成出的指数,就期望能够产生具有领先市场的效果,这是根本不可能实现的,特别是在目前的A股市场。)。就算通过测试分析反映在数据结果上真的效果不错,那也很有可能是过度数据挖掘的产物。但是通过这一指标的运动轨迹为判断市场提供依据与借鉴,却是非常有意义的。因此,我们这里从定性和定量两个角度来对该指标进行应用上的拓展,尽量弱化数据挖掘的效果,以期能为投资者提供一定的参考。
为了了解CCSI的中期参考价值,以CCSI(N=50,=0.8)为例,先观察其频率分布情况(参见图6)。在全样本区间,CCSI的均值为0.03、标准差1.19、偏度-0.04、峰度2.44,具有负偏态及平顶峰度(比正态分布平坦)。但整体看,CCSI的分布接近于正态分布,且围绕0值上下波动。从表3可以看出,类似于正态分布的特性,CCSI在区间(-1,1)出现的频率为67.07%、在区间(-2,2)出现的频率为95.93%,而在区间(-2,2)以外出现的频率较低,只有4.07%。其中为CCSI的标准差。
(2)、-1(3)、1(4)、Y=2为极度乐观区域、Y从图7可以看出,在全样本区间,CCSI整体上共5次进入或者频繁进入极度情绪区域,其中有3次进入极度乐观区域、2次进入极度悲观区域,而沪深300指数往往会对应着阶段性拐点的出现,但出现周期上并没有统计上的规律可循。特别地,当CCSI从阶段性拐点转为趋势性时,基本上也对应着沪深300指数的阶段性拐点(具体可参见表4)。
因此当市场弥漫浓重的乐观情绪时,投资者往往比较亢奋,盲目的交投热情空前高涨,乐观情绪的宣泄会助推市场进一步惯性上扬。但随着热情逐渐冷却,市场的上扬动力显现不足(成交量不能再有效配合),人们开始质疑之前的过激行为,谁都不想做最后一个傻子(博傻理论),因此纷纷止盈锁定收益。由于后续得不到更多资金的支持,市场很可能在震荡整理后出现阶段性的顶点。
而当市场充斥着大量悲观情绪时,大部分投资者偏向于谨慎观望,此时交投会比较清淡。一旦市场出现利好的政策预期或者经济数据,交投热情往往很容易被点燃,随着更多资金的参与,市场很可能出现阶段性的底点,随后走出一波上攻行情。
因此可以将CCSI作为辅助的参考指标:CCSI进入极度情绪区域后会表现出一定的反转效应,而情绪缓和时可能表现出一定的动量效应。具体来看:当CCSI进入极度情绪区域发出信号时,虽然市场还可能会进一步惯性上扬,但此时需要注意控制好仓位,可考虑是否通过股指期货对冲随后可能产生的系统性风险;而当CCSI处于情绪缓和区域时,可以在控制仓位的前提下顺势而为。
但需要注意的是,CCSI进入极度情绪区域发出信号与沪深300指数阶段性拐点之间只具备充分条件,即当CCSI进入极度情绪区域发出信号时,后市指数往往会以较大概率出现阶段性的拐点;但反过来,当指数出现阶段性拐点时,CCSI并不一定会进入极度情绪区域中提前发出信号。
基于上述的分析结论与CCSI的分布特性,在尽量弱化数据挖掘对历史数据过度优化的前提下,我们尝试从定量的角度设计了如下两个交易策略:短期投机策略和中期趋势策略,以期为投资者应用CCSI提供一定的参考与借鉴。
根据上述定性分析的结论,我们设计了如下的短期投机策略:设置缓冲阈值(=0),当本周CCSI时,发出买入信号,下周买入沪深300指数(假设可以买卖指数);而当本周CCSI该策略与两个参数有关:时间窗口长度N和缓冲阈值。为了避免过度优化,我们测试了不同参数下策略的胜率。其中,N在区间[5,100]范围内变化,时间间隔为1;在区间[0,2]范围内变化,时间间隔为0.01。具体测试效果如图9到图12所示。需要注意,为了作图的方便,我们分别对N和进行了坐标变换,即N=Y轴坐标点+4,=(X轴坐标点-1)/100。
从图中可以看出,当N取值区间为[32,41]、为[1.35,1.70]或N取值区间为[85,88]、为[1.80,1.90]时,策略的表现相对稳定、效果也比较好(第一组参数下的整体胜率平均为62.15%、第二组参数下的整体胜率平均为71.47%,但第一组参数下的触发次数要大于第二组参数下的,大约为5.25倍)。具体区间内的统计信息如表5所示。
根据前述分析,对于CCSI(N,=0.8),当N=17且逐渐变大时,CCSI与沪深300指数之间的相关性均大于0值,整体呈倒“V”字型走势,在区间[47,61]内相关性的变化较为稳定、且相对较高,最高可达0.79。即N在该区间内变化时,CCSI与沪深300指数之间的同步性较好。在下述测试中,不妨取N=50。
据此,我们利用简单的均线指标来设计中期趋势跟踪策略:当短期均线MaS上穿长期均线MaL时,表明近期市场情绪出现好转并有可能逐步走强,发出买入信号,买入沪深300指数;而当短期均线MaS下穿长期均线MaL时,表明近期市场情绪有转向低迷的迹象,发出卖出信号,卖出后保持空仓(注:买卖时未考虑交易费用)。
该策略与短期和长期均线的长度(MaS和MaL)有关。我们同样测试了不同参数下的策略效果。其中,MaS在区间[5,30]范围内变化,时间间隔为1;MaL在区间[5,60]范围内变化,时间间隔为1。具体测试效果如图13和图16所示。需要注意,(1)为了作图的方便,我们分别对MaS和MaL进行了坐标变换,即MaS=Y轴坐标点+4,MaL=X轴坐标点+4;(2)由于需要MaLMaS,因此图中左上角的取值均为0。
从图中可以看出,当MaS取值区间为[5,7]、MaL为[21,25]时,策略表现的较为稳定,也有不错的效果(区间内的胜率平均为70.95%、收益率平均为11.86%、累计收益率平均为76.73%,显著超额同期沪深300指数,如图17所示)。具体区间内的统计信息如表6所示。
为了比较全面地反映与A股市场情绪相关的各个方面,我们在尽可能多的市场维度中挑选相应的市场情绪代理指标,共分为7大类、11个细分指标。然后在考虑情绪衰减因子的基础上,通过时序全局主成分分析法来构建中原证券市场情绪指数(CCSI-CentralChinaSentimentIndex)。
根据CCSI的分布特性以及行为金融学的相关理念,我们首先将其运行轨迹划分为五个区域:极度乐观、乐观稳定、情绪缓和、悲观稳定和极度悲观区域。进一步的分析表明:CCSI进入极度情绪区域后会表现出一定的反转效应,而情绪缓和时可能表现出一定的动量效应。也即,当CCSI进入极度情绪区域发出信号时,虽然市场还可能会进一步惯性上扬,但此时需要注意控制好仓位,可考虑是否通过股指期货对冲随后可能产生的系统性风险;而当CCSI处于情绪缓和区域时,可以在控制仓位的前提下顺势而为。
对于短期投机策略,当时间窗口长度N的取值区间为[32,41]、缓冲阈值为[1.35,1.70]或N取值区间为[85,88]、为[1.80,1.90]时,策略的表现相对稳定、效果也比较好(第一组参数下的整体胜率平均为62.15%、第二组参数下的整体胜率平均为71.47%,但第一组参数下的触发次数要大于第二组参数下的,大约为5.25倍)。
对于中期趋势策略(利用简单的均线指标进行设计),当短期均线]、长期均线]时,策略表现的较为稳定,也有不错的效果(区间内的胜率平均为70.95%、收益率平均为11.86%、累计收益率平均为76.73%,显著超额同期沪深300指数)。