• 软件测试技术
  • 软件测试博客
  • 软件测试视频
  • 开源软件测试技术
  • 软件测试论坛
  • 软件测试沙龙
  • 软件测试资料下载
  • 软件测试杂志
  • 软件测试人才招聘
    暂时没有公告

字号: | 推荐给好友 上一篇 | 下一篇

使用数据挖掘获取商业智能

发布: 2008-5-05 12:55 | 作者: 王翔 | 来源: 本站原创 | 查看: 55次 | 进入软件测试论坛讨论

领测软件测试网

  在决策树显示区域中,颜色代表“事例”的密度,在例中即代表满足相关条件的客户的密度。颜色越深则节点中包含的事例就越多。从图2-51可以发现,“Yearly Income = $150K+”这一节点的密度高于其他任何节点,代表符合“Yearly Income = $150K+”这一条件的金卡客户是最多的。

  根据决策树上的“全部”节点,“挖掘图例”窗格会有如图2-52所示的显示数据,这表明总共抽样的数据有10 281条,其中铜卡用户最多,占了55.42%。

  树的第一个级别由“yearly income”属性决定。树的组织由算法决定,其基础是该属性在输出中的重要性。这意味着“yearly income”属性是最重要的因素,它将决定客户可能选择的会员卡的类型。选择“Yearly Income = $150K+”节点。该特性窗格显示收入较多的客户中,45.98% 的客户可能会选择金卡。这个百分比要比“全部”节点中的(11.67%)高得多。

  可以通过改变图2-51的“显示级别”滑块的值或者直接在决策树显示区域中,单击“+”或“-”号来改变决策树显示分支的层级。当用这种方法在树中做进一步调查时,可以探索到金卡客户的百分比是如何演化的。

  打开“Yearly Income = $150K+”节点,如图2-53所示。选择颜色很深的“Marital Status不等于S”节点。在“挖掘图例”窗格中,可以看到收入高于150 000美元且已婚的客户中,较高百分比(83.54%)的客户可能会选择金卡。而同时“Marital Status =S”节点的颜色非常浅,这意味着这些客户选择金卡的可能性非常小。

  另一方面,从图2-52还可以看到“Yearly Income = $10K-$30K”节点的颜色非常浅,这意味着这些客户选择金卡的可能性非常小。“挖掘图例”窗格显示在此年收入范围内的客户中,92.47% 的客户可能会选择普通卡。树还显示已无法对此节点进行进一步调查,这意味着在树的这个分支中,年收入是决定客户选择普通卡可能性的唯一因素。

  将挖掘模型查看器切换到“依赖关系网络”选项卡,可以看到如图2-54所示的界面,这是和“Member Card”的属性关联的客户属性依赖图,通过拖动左边的滑块,可以发现,“Yearly Income”的确是影响会员卡类型的最重要的因素。

  有了以上信息,市场部就可以确定最可能选择某种类型卡的客户的特征。根据这些特征(收入、子女数和婚姻状况等),可以重新定义会员卡的服务和方案以便更好地适应其客户。

  到此为止,本章按照商业智能体系结构完成了从业务数据库到智能决策的整个过程,其间涉及到一些重要的技术,比如OLAP分析和数据挖掘等,只有对此深刻理解才能深入基于SQL Server 2005的BI应用,在后面的章节中,将会以商业智能体系结构为框架,详细讲述这些技术。

延伸阅读

文章来源于领测软件测试网 https://www.ltesting.net/

22/2<12

关于领测软件测试网 | 领测软件测试网合作伙伴 | 广告服务 | 投稿指南 | 联系我们 | 网站地图 | 友情链接
版权所有(C) 2003-2010 TestAge(领测软件测试网)|领测国际科技(北京)有限公司|软件测试工程师培训网 All Rights Reserved
北京市海淀区中关村南大街9号北京理工科技大厦1402室 京ICP备10010545号-5
技术支持和业务联系:info@testage.com.cn 电话:010-51297073

软件测试 | 领测国际ISTQBISTQB官网TMMiTMMi认证国际软件测试工程师认证领测软件测试网