字号: 小 中 大 |
推荐给好友
上一篇 |
下一篇
使用数据挖掘获取商业智能
发布: 2008-5-05 12:55 |
作者: 王翔 |
来源:
本站原创 |
查看: 55次 | 进入软件测试论坛讨论
在决策树显示区域中,颜色代表“事例”的密度,在例中即代表满足相关条件的客户的密度。颜色越深则节点中包含的事例就越多。从图2-51可以发现,“Yearly Income = $150K+”这一节点的密度高于其他任何节点,代表符合“Yearly Income = $150K+”这一条件的金卡客户是最多的。
根据决策树上的“全部”节点,“挖掘图例”窗格会有如图2-52所示的显示数据,这表明总共抽样的数据有10 281条,其中铜卡用户最多,占了55.42%。
树的第一个级别由“yearly income”属性决定。树的组织由算法决定,其基础是该属性在输出中的重要性。这意味着“yearly income”属性是最重要的因素,它将决定客户可能选择的会员卡的类型。选择“Yearly Income = $150K+”节点。该特性窗格显示收入较多的客户中,45.98% 的客户可能会选择金卡。这个百分比要比“全部”节点中的(11.67%)高得多。
可以通过改变图2-51的“显示级别”滑块的值或者直接在决策树显示区域中,单击“+”或“-”号来改变决策树显示分支的层级。当用这种方法在树中做进一步调查时,可以探索到金卡客户的百分比是如何演化的。
打开“Yearly Income = $150K+”节点,如图2-53所示。选择颜色很深的“Marital Status不等于S”节点。在“挖掘图例”窗格中,可以看到收入高于150 000美元且已婚的客户中,较高百分比(83.54%)的客户可能会选择金卡。而同时“Marital Status =S”节点的颜色非常浅,这意味着这些客户选择金卡的可能性非常小。

另一方面,从图2-52还可以看到“Yearly Income = $10K-$30K”节点的颜色非常浅,这意味着这些客户选择金卡的可能性非常小。“挖掘图例”窗格显示在此年收入范围内的客户中,92.47% 的客户可能会选择普通卡。树还显示已无法对此节点进行进一步调查,这意味着在树的这个分支中,年收入是决定客户选择普通卡可能性的唯一因素。
将挖掘模型查看器切换到“依赖关系
网络”选项卡,可以看到如图2-54所示的界面,这是和“Member Card”的属性关联的客户属性依赖图,通过拖动左边的滑块,可以发现,“Yearly Income”的确是影响会员卡类型的最重要的因素。

有了以上信息,市场部就可以确定最可能选择某种类型卡的客户的特征。根据这些特征(收入、子女数和婚姻状况等),可以重新定义会员卡的服务和方案以便更好地适应其客户。
到此为止,本章按照商业智能体系结构完成了从业务
数据库到智能决策的整个过程,其间涉及到一些重要的技术,比如OLAP分析和数据挖掘等,只有对此深刻理解才能深入基于
SQL Server 2005的BI应用,在后面的章节中,将会以商业智能体系结构为框架,详细讲述这些技术。
文章来源于领测软件测试网 https://www.ltesting.net/