一时,业界对数据的价格知路暂息在定性层面,模型控制预测甚至可以大概叙是芜浅的定性层面。群众广漠认为数据很有价格,但原形价格几多?一旦涉及到定量领会,21年4月1日数据量化分析则从理论到实质,都干枯找寻与商榷——的确检索不到数据价值接洽筹议的论文。若是叙麦卡特夫定律是互联网企业等收集关连企业收场价格的理论基石,则数据接洽企业尚缺乏雷同的理论基石。模型控制预测
数据自在题目与数据价值题目是数据相闭工业繁盛的硬币正反面:数据宁静是数据价值的保证,数据价值是数据宁静的条款。数据平宁若不能赢得有用担保,时间序列预测模型则数据再有价值也无法赢得有效好处;看待数据价格若没有共识,则无法发生界线家产,数据安靖做的再好也没有没有须要性。数据价值的量化明确接头20
1) 针对数据自己价值:如果数占领n个有效表头,预测分析法主要包括则数据价格与(2^n-1)成正比。好比,某数拥有姓名、性别、民族、年事……等n个有效表头,则拿出n个有用表头中的恣意1个可发生Cn1个场景,拿出n个表头中任意2个可爆发Cn2个场景……拿出n个表头中的全部n个可爆发Cnn个场景。即可构成场景的个数为Cn1+Cn2+Cn3+……+Cnn=2^n-1。时间序列预测模型
如某数占领姓名、性别、时间序列预测模型民族、年事……等10个有效表头,可与收支境数据,预测分析法主要包括健康数据,住房数据,购物数据4个外部数据设立有用毗连。时间序列预测模型则数据己方最多可配置2^10-1=1023个场景,预测分析法主要包括预测分析法主要包括时间序列预测模型在团结规则1下,最多可修筑2^(10+4)-1=16383个场景,模型控制预测在纠合规则2下,最多可修立4*(2^10-1)=4092个场景。
由此可看到,数据的价格起首在于数据所有人方的价格掘客,模型控制预测数据自己价值与数据表头个数的指数级成正比。时间序列预测模型数据建立有用的外部荟萃后,则数据价格遵循联合规矩的差别,或与外部联结数目成正比,或与外部连结数的指数级成正比。数据价值的量化明确接头2021年4月1日数据量化分析。