数据分析最重要的目的就是从数据中寻找规律找到能够指导我们未来实践的原则和方法是产生智慧的主要途径。所以预测分析是数据分析的终极目的。虽然数据分析承担了很多功能但是预测才是最为关键的所以掌握数据分析和挖掘的预测方法才是数据分析师的看家本领。
预测包括现象的预测和规律的预测。自然科学的本质上也是对事物的属性、本质和规律的预测。有了对事物的认知和对规律的掌握我们就能够创造出更多的东西。商业也是如此我们能够知道影响销售的因素并能够掌握这些因素的数据就能够对市场做出精准的预测从而指导我们商业的决策做到稳定的发展。但事物具有复杂性我们无法掌握所有的信息更无法轻易掌握所有的规律。
随着大数据、物联网等技术的快速发展和应用我们会拥有越来越多的数据在这些数据上通过各种分析技术我们就能够加工出越来越多的“智慧”从而就能够知道我们的实践而我们对未来的预测越来越精准越来越有效。
人们总是把数据分析师想象的过于美好认为做大数据的人能够上知天文下晓地理能够准确的预测未来。人类掌握了一些基本的事物发展规律对人类大脑、情感、心里的认知也逐步深入但是我们对这些学科的掌握程度还远远达不到准确的预测未来的程度至少现在还是没有这个能力未来可能会有。
事物是复杂的我们对事物的认知是有限的正因为如此事物在发展的过程中会发生超越我们预期的偶然时间和随机时间我们把这些叫做误差误差是必然存在的。随着我们对事物的认知越清楚掌握的信息数据越完善这个误差就睡越小偶然时间就会越少。预测不准确的正常的我们不能因为预测不准确而放弃对事物的预测掌握未来发展是人类的本能也是人类进化的动力。
我们现在出行是我们会根据地图应用提供的交通流量信息选择不堵车最近的线c;这是一个典型的应用场景把大数据当做平台和基础设施的应用场景。未来会有越来越多的这种应用场景这就是预测在我们的日常生活中影响着我们的日常生活。
我们认为一个优秀的人才一般都在优秀的公司中所以企业会更加看中应聘者是不是在优秀的公司中工作过这些都是为了佐证应聘者拥有丰富的相关“经验”。所以优秀的公司在人才招聘方面的成本越低。而越是一般的公司用人成本越高——因为我们过度依赖经验来管理。
经验预测法在生活、工作中有大量的应用实例。人们最容易用自己过去的经验做出判断所以人们几乎每时每刻都在做经验预测。量化的经验预测是一种数据化的方法。单纯依靠少数人的预测往往风险很高因为我们每个人的生活经历都是有限的并且看问题的视角也是有限的所以对于重大决策在没有其他更好的方法可以预测是需要让更多的人一起利用经验来预测这个方法被称为德尔菲法。
德尔菲法能发挥专家会议法的优点即能充分发挥各位专家的作用集思广益准确性高。能把各位专家意见的分歧点表达出来取各家之长避各家之短。同时德尔菲法又能避免专家会议法的缺点权威人士的意见影响他人的意见有些专家碍于情面不愿意发表与其他人不同的意见出于自尊心而不愿意修改自己原来不全面的意见。
德尔菲法的主要缺点是缺少思想沟通交流可能存在一定的主观片面性易忽视少数人的意见可能导致预测的结果偏离实际存在组织者主观影响
事物有很多的相似性事物发展的规律也有相似性。例如人的成长历程环境相同人的成长历程也会有相近之处。当我们“阅人无数”后基本上能够判断这个人是一个什么样的人。另外人的行为习惯和思维习惯都有一致性虽然会发生剧烈的变化但在大多数情况下都是可以预测的。我们可以根据一个人对一件事情的反应找到这个人的行为模式从而预测其未来的行为模式这就是类比预测法。
人的行为模式的背后是人的心智模式。无论是九型人格学说还是MBTI的人格测试其背后都是通过评测人的心智模式来预测人的行为模式从而为人们找到一个比较好的事业发展规划。通过研究大量人员的行为模式为个人以后的发展做出知道这种方式的本质就是类比。
通过一个行业的发展来类比另一个行业的发展能够给我们很多的启发。例如智能手机取代了功能手机苹果打败了诺基亚和摩托罗拉成为智能手机的领导者。根据智能手机行业的发展规律我们可以预测未来智能汽车的发展规律特斯拉的创新性的智能汽车不止单纯的电动汽车如果不出意外特斯拉很可能会彻底颠覆驱车行业那些原有的行业大佬在未来短短的几年就会重新洗牌。
手机行业中消费者的更换周期为2-3年所以智能手机在2-3年就颠覆了手机行业原有的潮流。在城市中消费这更换汽车的周期为5-7年运用类比的方法未来的5-7年就是智能手机慢慢取代原有汽车行业。取代是一个缓慢且顺应时代的产物取代的周期就是消费者的一个更换周期。
标杆研究也是一种类比的方法可以通过研究标杆企业的做法借鉴其经营和管理的决策。如果一家公司采用某种管理模式成功解决了一类问题那么我们也可以采用同样的方法来解决类似的问题。所以当我们对于某些管理问题找不到方法的时候做简单有效的方法就是寻找标杆企业的做法。学会站在巨人的肩膀上看待问题。
类比法也有局限性主要的局限在于类的可比性。类比的本质含义就是同类的或者相近类别之间的对比如果不具有可比性则类比的预测就会出现问题。当然没有两个事物是完全相同的也没有相同的历史和未来我们还需要在不同类别中寻找共同点在这个共同点上找到差异例如智能手机用了2年就颠覆了手机行业那是因为消费者更换手机的周期比较短。汽车行业就不适用这个周期因为消费者更换汽车的周期要比手机的更换周期长的多。
所以我们类比的过程中我们要思考可比的基础是什么从而做出预测对结论进行修订确保预测的合理性和准确性并在以后的过程中反思忽略了哪些重要因素以后在进行预测时还需要考虑哪些因素。
本质上惯性只存在于信息不对称的领域在信息足够对称的情况下大家转向的风向一致那么股票价格就不会有这样的波动图形。在信息不够对称的环境下以信息谋取利润的行业就会有更多的暴力。如果信息已经充分对称了那么以信息谋取利润的行业就会消失。未来商品的价格会越来越透明根据信息不对称来销售商品的公司会倒闭。
时间序列分析模型是最典型的惯性分析法其本质就是探寻一个事物的数量化指标随时间变化的规律。如果事物完全按照时间顺序发展则一定会按照一定的规律继续发展下去如果是向上的趋势就会继续向上发展如果是向下的趋势就会继续向下发展如果存在周期性就会按照周期性的规律发展如果具有循环往复的特征就会按照循环往复的特征发展下去
从上面的描述中可以看出时间序列模型最本质的局限忽略了现在的变化影响因素。即如果事物过去都是向上发展的则时间序列认为事物还会继续向上发展但是因为某些因素的原因出现了下滑则这个因素不予考虑会认为是误差或者受随机因素的影响。
时间序列模型有多种类型这些类型的分类是从事物变化是否具有规律性来评价的。如果事物的变化很有规律性而随机影响较小则可以通过惯性预测法对事物的变化进行预测如果事物变化是有规律的但是噪声过大容易掩盖事物自身的规律这个时候惯性预测法就不太使用了。噪声的大小是我们是否可以使用惯性预测法来预测的非常重要的因素噪声大规律就容易被掩盖噪声小我们可以通过趋势来发现事物的规律。
我们对事物变化规律的认知其实是有限的。一般来说再利用惯性发探测事物变化规律时我们能够掌握三种变化规律的探测分别是季节性、周期性、趋势性。季节性是与时间变化有关系的变化规律。周期性是与变量取值有关系的盛极而衰触底反弹。趋势性是随时间呈增长或者下降的趋势这个趋势可能线c;也可能是幂级增长或者指数增长。
沃尔玛的“纸尿裤和啤酒”的事件让我们觉得纸尿裤和啤酒的销售量有较大的相关性。但是这个相关性能否站的住脚是否有足够的逻辑解释是否在任何情况都适用还是需要数据的支持没有数据的完美论证。
在逻辑关系方面我们可以用各种模型来解读数据需要不断尝试才能找到一个最佳的逻辑关系。有些逻辑关系只在特殊的情景下才成立而在其他的情境下就不会成立。逻辑关系的数学模型不是一成不变的他会随时间、市场状况的变化而变化。
每个逻辑规律都有其成立的条件。在广告投放初期构建的模型不见得适合中期和后期品牌的知名度较低的时候广告与销售额的关系会被弱化边际效应显现。当公司的品牌已经非常强大的时候广告本应该承担一个提醒功能这个时候如果还是采用说服式广告就非常不妥了消费者会觉得这是“忽悠”其自我保护机制显现导致一些负面的成绩。
。趋势外推法的假设条件是:(1)假设事物发展过程没有