IBM SmartCloud Enterprise 上的敏捷预测分析(2)

发表于:2012-08-31来源:IBM作者:Alex Guazzell点击数: 标签:敏捷预测
除了支持建模技术本身之外,ADAPA 还支持 PMML 在预处理和后处理方面提供的所有产品。事实上,它还更进了一步。如果预测解决方案实现的函数不属于 P

  除了支持建模技术本身之外,ADAPA 还支持 PMML 在预处理和后处理方面提供的所有产品。事实上,它还更进了一步。如果预测解决方案实现的函数不属于 PMML 标准,ADAPA 允许用 Java™ 实现它们(参见图 2)。然后,由此产生的 JAR 文件可以作为一种资源被上传到引擎,并且它所包含的任何函数都直接从 PMML 进行实例化。

  图 2. 允许自定义函数以 Java 代码实现的方式形式嵌入,从而扩展 PMML 标准

ADAPA Decision Engine 允许自定义函数被嵌入为 Java 中的编码资源,从而扩展 PMML 标准

  实际的预测模型和规则

  观看 Zementis 分析副总裁 Alex Guazzelli 博士的演示,即在 Zementis ADAPA Decision Engine 上运行资格预审应用程序,它使用预测模型和规则来分析贷款申请的默认按揭风险。

  观看演示

  如图 2 所示,除了基于 PMML 的预测分析引擎,ADAPA 也包含了规则引擎的全部功能。事实上,它提供预测分析和业务规则的无缝集成。通过这种方式,它使数据驱动的洞察力和专业知识能够结合成一个决策战略。

  下一步,以 ADAPA 为例,说明如何部署和执行预测解决方案。

  回页首

  预测模型的部署和执行

  对于 PMML 和 ADAPA,部署预测模型的过程相当于将相应的 PMML 文件上传到引擎。只要上传成功,模型就可以通过 Web 服务或通过 ADAPA Web Console 执行。用户还可以直接从 Excel 内访问 ADAPA 中的模型(参见图 3)。

  图 3. 通过 ADAPA Web Console 可以在 ADAPA 中部署和测试模型

通过 ADAPA Web Console 可以在 ADAPA 中部署和测试模型

  实际上,Web 服务使整个企业的应用程序都可以实时访问模型及其预测。按需模式和批处理模式的执行也可以通过同样的方式完成,同时也受益于 ADAPA Web Console。这可以用作一个交互式管理门户,手动管理和验证模型。

  业务用户还可以通过使用 ADAPA Add-in 受益于直接从 Microsoft® Office Excel® 内访问使用模型和评分数据。它使得在使用复杂的预测解决方案时不需要涉及构建和部署模型的复杂性。利用该加载项,用户只需在 Excel 中选择他们想评分的数据,从可用模型列表中选择合适的模型,并单击 Score。

  请注意,现在您是在一个真正的跨平台、多厂商环境中操作。由于可以使用各种 PMML 兼容工具来开发模型,所以在部署过程中,需要谨慎的一个步骤是模型验证,确保评分引擎和模型开发环境会产生完全相同的结果。ADAPA 提供一个综合的测试过程,以确保模型成功上传,并按预期工作。它允许上传一个包含任意数量记录与所有必要的输入变量和每个记录的预期结果的测试文件,进行得分匹配。同样的过程也可以嵌入到 PMML 文件本身,在这种情况下,PMML 文件将有一个专用于模型验证的额外元素。

  一旦完成模型验证,统计信息就会返回匹配和不匹配的记录总数及百分比。如果有任何记录无法通过匹配测试,则会显示一个失败记录列表。用户可以通过每个记录的计算信息进行跟踪,以定位预期值和计算值有差异的地方,从而找出问题的根源。

  回页首

  在 IBM SmartCloud Enterprise 上的 ADAPA

  如前所述,ADAPA 使用 Web 服务调用,让自动决策真正被嵌入到整个企业的系统和应用程序中。为了最大限度地减少总拥有成本,ADAPA 中的模型执行通过 SmartCloud Enterprise 以服务的形式提供(参阅 参考资料)。

  挖掘过去,了解未来:预测分析

  IBM 的 Ed Bottini 和 Zementis 的 Michael Zeller 演示 Zementis ADAPA Decision Engine 在 IBM SmartCloud Enterprise 上的技术功能。知识点包括如何结合预测解决方案(SPSS 和 R 编程语言)、如何实现一个具备预测分析能力的、灵活的最佳实践云环境,并了解开放标准的 PMML 如何采用不同的预测模型。

  观看演示

  SaaS 许可模型为像 Zementis 这样的厂商提供了机会,使他们可以将软件解决方案提供为具有成本效益的服务,这些服务可以随用户需求扩展,并按实际消费进行支付,就像您的水电费账单一样。SmartCloud 上的 ADAPA 是一个完全托管的 SaaS 解决方案。用户只需每月支付服务和容量,即可消除使用昂贵的软件许可以及内部硬件资源的必要性。SaaS 模型消除了用户管理一个可扩展的、按需的计算基础架构的负担。

  在 IBM SmartCloud 中启动一个虚拟 ADAPA,该过程相当于传统场景中的购买硬件并安装在服务器机房。惟一的区别是,在这种情况下,服务器位于云上,配备了预装版本的 ADAPA,在短短几分钟内就能按需启动,并随时可以使用。在任何时候,您都可以运行一个或多个实例。

  每个实例类型都具有独立的处理能力,提供了一个单租户架构。服务被实现为一个私有的专用实例,其中封装了预测模型和业务规则。通过这种方式,对任何实例的访问(通过 HTTPS)都是私有的。因此,决策文件和数据从来不会与其他客户共享相同的引擎。

  结束语

  预测分析使当今企业做生意的方式发生变革。作为一门学科,它使将要构建的预测解决方案可以窥探日益增加的数据,这些数据是作为社会人的我们从人和传感器(通过交易数据)中收集的。数据在分析和转化后,可用于预测技术的输入,预测技术负责学习隐藏在数据中的重要模式。每当发生这种情况,就会诞生一个预测模型。

  然而,要投入到工作中,它需要从科学家的桌面转移到运营环境。为此,我们受益于 PMML 标准。它使通过某种工具构建的预测解决方案能够很容易地被迁移动到另一个工具中执行。

  PMML 是一个成熟精炼的标准,所有顶尖的数据挖掘工具都支持它。这些工具包括商用和开源的环境。随着对 PMML 的支持的不断增加,在如何使用 PMML 表示其预测解决方案方面,不同的工具表现得越来越复杂。这包括从全面的数据预处理一直到模型集成,其中数百种模型都可以表示为单个 PMML 文件,而输出是所有模型的加权平均。

原文转自:http://www.ltesting.net