大数据分析之数据仓库和数据挖掘在ERP的应用
沉沙 2018-10-31 来源 : 阅读 2258 评论 0

摘要:本篇教程介绍了大数据分析之数据仓库和数据挖掘在ERP的应用,希望阅读本篇文章以后大家有所收获,帮助大家对大数据云计算大数据分析的理解更加深入。

本篇教程介绍了大数据分析之数据仓库和数据挖掘在ERP的应用,希望阅读本篇文章以后大家有所收获,帮助大家对大数据云计算大数据分析的理解更加深入。

<

    ERP是EntERPrise Resources Planning的简称,即为企业资源计划,是20世纪90年代发展起来的企业信息管理系统。ERP的内在含义是指利用计算机技术,将企业内部和外部资源信息按照成本管理原则分类整理所形成的信息管理系统。它的主要宗旨就是籽企业各方面的资源(包括人,财,物、产、供、销等方面)充分调配和平衡,使企业在激烈的市场竞争中能够合理地配置企业内部与外部的资源,全方位地发挥各方面的能量,从而使企业取得更好的经济效益。ERP在我国的应用起步比较晚,取得成功的企业更是少之又少。为了加强ERP在我国企业应用的成功率,必须结合我国的实际情况,并辅之以其它先进技术。把数据仓库和数据挖掘技术应用到ERP中,增强传统ERP的决策功能,就是一种新的尝试。

    一、数据仓库

    什么是数据仓库呢?一般认为,数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。

    一个典型的企业数据仓库系统通常包含数据源、数据存储与管理、OLAP服务器(建立面向联机分析处理Online Analysis Processing,简称OLAP)以及前端工具与应用四个部分。

    在传统的ERP系统中,一般的核心应用都是进销存管理和账务管理,数据库中的数据也是紧紧围绕产品信息、票据和账目明细进行的。这样的数据层可以很好地实现OLTP(面向联机事务处理Online Transaction Processing,简称OLTP),但如果要为企业高层提供决策数据的话,就有必要对这样原始的、松散的、孤立的数据进行抽取、清洗、加上时间标记并进行合理的分类,以使之能够进入数据仓库并支持OLAP.

    二、数据仓库与ERP的关系

    (一)数据仓库之外的EPP应用系统

    ERP环境将数据提供给数据仓库的接口与非ERP环境的接口是很相象的,但也有以下不同之处:①ERP接口只需要处理ERP所支持的DBMS技术,而非ERP接口必须处理所有的接口技术;②由于ERP供应商拥有和控制着该接口,用户能更好地把握构成应用程序环境的数据和结构;③该接口经常需要进入到ERP环境,找到正确的数据并把它们“粘”到-起以使得这些数据在数据仓库中是有用的。

    (二)建造在ERP内部的数据仓库

    数据仓库可以建造在ERP环境之中,SAP的Bw和PeopleSoft的EPM就是如此。在这种情况下,ERP产品供应商同时提供了应用程序和数据仓库。其主要的优点是ERP供应商提供了邀个体系结构,这就节省了大量的设计工作,并且降低了设计和开发的复杂程度。简而言之,将数据仓库包含在ERP应用中极大地简化了数据仓库的设计工作。此外,这种方式还降低了长期维护的难度。

    (三)通过ERP和非ERP系统为数据仓库提供数据

    因为将数据仓库纳入ERP应用之后,客户就有了完整的解决方案,因此这是一种常见的选择。然而,也存在别的选择,一个数据仓库可以建在ERP环境之外。同时非ERP系统也向该数据仓库提供数据。
    由于存在非ERP数据和ERP数据的集成问题,大多数企业并没有一个完整的ERP环境。非ERP应用系统总是存在的,在这种情况下,两种类型的数据必须要集成在一起。企业经常在构建ERP环境的同时为他们的非ERP数据建立数据仓库。当ERP环境完成时(或至少在功能上完成时)。非ERP数据的数据仓库也己经建立。在需要将ERP数据放入数据仓库的时候,将ERP数据从ERP环境中取出移入数据仓库是一件简单的事情。

    三、ERP数据仓库设计中的关键技术

    (一)数据的装载

    在数据装载到数据仓库中时首先要定义良好的数据清洗规则,保证数据的质量;其次对不同的功能要尽量做到模块化,以提高模块的重用性;再次,因为装载需要经常进行,数据可能会定期进行抽取,所有要优化装载程序,提高装载效率;最后不同的装载程序要在不同的时间运行, 因此要确定一个合理的数据抽取计划。

    (二)聚合

    数据从ERP系统抽取到目标数据仓库后,为了进一步提高查询系统性能,最大限度地减少查询响应时间,以便更好地服务与决策支持,在设计数据仓库时,针对不同的用户,不同的查询要求。采用聚合设计导出了大量与聚合相对应的实体化视图,存储汇总数据,大大提高了易用性。但用户的需求往往是不断变化的,不可能预先定义所有的聚合,可以采用聚合导航器建立新的聚合。一旦新的聚合建立起来,将会通知聚合管理器,并在数据库管理系统范围内的汇总或全局表中注册,使可提供给用户查询使用。

    (三)数据模型

    数据仓库的实现是从逻辑模型到物理模型的转换过程,数据仓库的逻辑模型主要有:星形模型和雪花模型两种。一个简单的星形模式由一个事实表和多个维表组成。设计的方法简单,容易实现,但不能表示数据的多维层次结构;而雪花形模式却弥补了星形模式的不足,对维表进行了扩展,用添加子维表的方式来表示数据的维层次,使结构清晰。在ERP系统中,很多数据集合的维具有复杂的层次结构,如时间维由属性集合(年、季、月、星期、日)构成。ERP数据仓库的第一层可以考虑采用星型模型,第二层可以考虑选择雪花模型。这样能更好地满足不同层次的用户的需要,表达数据的维层次结构。

    (四)联机分析处理的数据清理和数据挖掘

    由于访问ERP数据仓库的用户分布于不同的部门和组织,主要通过Internet/Intranet访问信息,因此OLAP采用三层结构模式。OLAP服务器用来对数据仓库中的数据进行多维化或预综合处理,形成多维视图,使用户能从多角度、多侧面、多层次地分析数据,为具有明确查询分析需求的用户提供高性能的决策支持。

    (五)数据挖掘

    数据挖掘一般都是在数据仓库的基础上进行的,从数据仓库中直接得到进行数据挖掘的数据有许多好处。数据仓库的数据清理和数据挖掘的数据清理差不多,如果数据在导入数据仓库时已经清理过,在做数据挖掘的时候就没有必要再清理了,而且所有的数据不一致的问题都已经被解决。这样可以提高效率,节省挖掘数据所需要的时间。由于数据仓库的数据量大,直接在数据仓库上进行挖掘,会影响挖掘的效率,因此数据的挖掘一般不在数据仓库上直接进行,而是要单独的建立数据挖掘库。      
          

本文由职坐标整理并发布,希望对同学们有所帮助。了解更多详情请关注职坐标大数据云计算大数据分析频道!

本文由 @沉沙 发布于职坐标。未经许可,禁止转载。
喜欢 | 0 不喜欢 | 0
看完这篇文章有何感觉?已经有0人表态,0%的人喜欢 快给朋友分享吧~
评论(0)
后参与评论

您输入的评论内容中包含违禁敏感词

我知道了

助您圆梦职场 匹配合适岗位
验证码手机号,获得海同独家IT培训资料
选择就业方向:
人工智能物联网
大数据开发/分析
人工智能Python
Java全栈开发
WEB前端+H5

请输入正确的手机号码

请输入正确的验证码

获取验证码

您今天的短信下发次数太多了,明天再试试吧!

提交

我们会在第一时间安排职业规划师联系您!

您也可以联系我们的职业规划师咨询:

小职老师的微信号:z_zhizuobiao
小职老师的微信号:z_zhizuobiao

版权所有 职坐标-一站式IT培训就业服务领导者 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
 沪公网安备 31011502005948号    

©2015 www.zhizuobiao.com All Rights Reserved

208小时内训课程