政府部门、BAT为代表的互联网企业、运营商是当前中国大数据的主要拥有者。除此之外,利用网络爬虫或公开应用程序接口API等途径对网络数据进行采集也是一大重要来源。在大数据时代,拥有数据就拥了核心资源:工业时代,石油是最大的巨头,数据时代,BAT等因为拥有最多、最全的搜索、电商和社交数据,也成为绝对的王者。此外,一些在细分领域拥有入口资源的公司也是稀缺标的,如已发布位置大数据平台的四维图新等。
其中,数据存储是产业链的支撑,参与者以传统数据库企业为主,国际上有IBM、Oracle、Intel、Green-plum等;国内主要有华为、中兴、同有、浪潮、中科曙光等,各家企业针对大数据应用的具体领域开展数据库架构和数据组织管理研究,形成各自的优势产品。数据安全是产业发展的重要保障,渗透数据存储、传输、交互的各个环节,主要参与方包括赛门铁克、360、启明星辰、绿盟科技、美亚柏科等。而产业链最核心的当属数据分析与挖掘,其能力直接决定着大数据应用的推广程度和范围。数据分析一是从大量的结构化、半结构化、非结构化数据中分析出计算机可以理解的语义信息或知识,二是对隐性的知识,如关联情况、意图等进行挖掘。当前Hadoop、Spark是使用较为广泛的两种开源处理框架,算法层面除分类、聚类、关联规则挖掘、序列模式挖掘等常用方法外,神经网络算法受益人工智能关注度再次高涨,国际上主要参与者包括谷歌、亚马逊、Facebook、IBM、甲骨文、微软等,国内主要包括海康威视、科大讯飞、BAT、网易、智慧星光、思必驰等。
应用为王,对大数据分析结果进行应用是完成产业商业化目标,实现价值的终点。经过近几年的发展,大数据应用已渗透政府、电信、金融、人力资源、医疗、物流、等多个行业。分析认为应用市场的成熟程度与数据的完备性息息相关,当前,政府、BAT、运营商是数据源的主要拥有者,因此为这些领域服务的数据应用厂商拥有部分先天优势,对比市场空间、政策倾向及惠及民生等方面,目前市场更为看好政务大数据及医疗大数据市场。而从产品形态看,整体解决方案商掌握多元技术、跨场景服务能力强、可解决客户的综合性需求,因此更容易树立标杆案例,灯塔效应明显。
大数据时代对企业的存储架构、数据中心的基础设施等提出了挑战,为了更快、更好、更准确地按需存储数据,需要企业提高存储性能和计算能力,这些潜在需求的存在为存储器和服务器等硬件提供商提供了一个不错的发展机会。但是,由于国际巨头在存储和服务器市场垄断优势明显,中国本土企业很难获得较大的市场机会。
虽然近几年,在传统数据库软件市场,国产数据库比重持续提升,但Oracle、IBM、Microsoft和Sybase依然牢牢占据国内数据库软件市场的前四位,拥有超过90%的市场份额。而大数据时代的数据库软件将更多是基于新一代的Nosql架构,中国企业无论是技术积累还是市场开拓离国际企业仍有较大差距。因此,短期内不看好中国企业在基础软件层的投资机会。