微软BI开拓者数据挖掘专区数据挖掘建模 时间序列算法 原理及其应用

1  /  1  页   1 跳转 查看:3109

[技术文档] 时间序列算法 原理及其应用

[技术文档]时间序列算法 原理及其应用

如果引用此文,请注明转载自www.windbi.com,多谢!

时间序列算法是用于分析和预测基于时间的数据,该算法的主导思想是基于过去预测未来,是决策树算法技术的延伸。
时间序列算法的主要应用场景有两个,一是预测未来产品的销售情况,二是执行交叉预测,查看各个产品型号的销售是否相关。
下面我们以一个实际的例子来看理解SQL Server 2005中时间序列算法。
一、案例需求
某零售商对于本公司的销售业绩通过多种方法(包括使用OLAP技术建立多维数据库,进行多维分析),已经很好的掌握了在过去的历史销售中,各个产品的销售走势如何,某个产品在所有产品中的销售比例如何,等等。那么除了这些,他们现在最想知道的就是,通过现有的销售情况预测下个月,后者是下一个时间段的销售情况,对于销售的影响因素为当前的库存和当月的销售,如何来做呢?
二、准备数据
使用ETL或者其他的数据整合方式,将我们所需的数据准备好的,我们需要的数据,当前只要一张表就可以了,这张表的有这样几列:编号(表示单一客户单一产品编号,如1002573361),时间(如:200706),库存(如:201),销售(如:49)。
三、建立模型
我们使用Visual Studio平台,建立分析服务的项目,首先第一步就是要定义好数据源,选取本机的Test数据库作为数据挖掘的数据源:




 附件: 您所在的用户组无法下载或查看附件

第二步是要定义数据源视图:


 附件: 您所在的用户组无法下载或查看附件


选取数据源中的dbo.TimesSeries_OriData表作为数据挖掘案例的数据表来建立挖掘模型。
第三步:建立挖掘模型,选取“Microsoft时序”算法

 附件: 您所在的用户组无法下载或查看附件
第四步:选择键值、输入列和预测列


 附件: 您所在的用户组无法下载或查看附件


第五步:定义内容类型和数据类型


 附件: 您所在的用户组无法下载或查看附件


第七步:设置参数,进行模型的处理


 附件: 您所在的用户组无法下载或查看附件

第八步:利用DMX进行预测


 附件: 您所在的用户组无法下载或查看附件

该语句的含义是预测单客户单商品下一个时间段的销售。


 附件: 您所在的用户组无法下载或查看附件


这样我们就得到了单一客户单一商品的200703的销售数据量,实现了对于未来销售的预测。
时间序列算法的优化:
1、对于编号定义为数值类型,这样可以提高模型处理效率,节省模型处理时间
2、参数中使用“MISSING_VALUE_SUBSTITUTION”,是为了达到时间戳一致,使得缺记录的情况下,可以顺利的处理完模型。
3、使用“MAXIMUM_SERIES_VALUE”和“MINIMUM_SERIES_VALUE”两个参数进行预测值的上限和下限的约束,使得预测的结果更准确。
还有其他的提高预测准确度的方式方法,我会通过其他的机会和大家沟通的,也希望朋友们多多交流,提出更好的想法。


最后编辑Administrator 最后编辑于 2007-08-12 22:43:37
 

回复: 时间序列算法 原理及其应用

吼吼,顶喽
 

回复: [技术文档]时间序列算法 原理及其应用

请问这个算法比较适用于哪些应用场景?
如果能比较准确的预测到销售量,那么就可以提前做好生产计划,所以要想实际运用,算法准确度很重要。另外就是这个算法对于数据有哪些要求?
 

回复: [技术文档]时间序列算法 原理及其应用

这个算法一般就是用于这种时间上连续进行的数据的分析,基于过去的曲线来预测未来。
 

回复:时间序列算法 原理及其应用

有没有选择库存量做为输入量应该对结果没有影响吧
 

回复:时间序列算法 原理及其应用

可以选择多个键值吗?比如,四个
我想实现对单一店铺,单一商品,某天单一时间段销售量的预测,搂主有什么好的建议吗?
 
1  /  1  页   1 跳转

版权所有 微软BI开拓者 

Powered by Discuz!NT 2.1.202    Copyright © 2001-2008 Comsenz Inc.
Processed in 0.109375 second(s) , 6 queries.
返顶部