大数据分析之自助式商业智能面对数据质量问题挑战
沉沙 2018-10-31 来源 : 阅读 1364 评论 0

摘要:本篇教程介绍了大数据分析之自助式商业智能面对数据质量问题挑战,希望阅读本篇文章以后大家有所收获,帮助大家对大数据云计算大数据分析的理解更加深入。

本篇教程介绍了大数据分析之自助式商业智能面对数据质量问题挑战,希望阅读本篇文章以后大家有所收获,帮助大家对大数据云计算大数据分析的理解更加深入。

<

    对于那些不想在IT人员协助下就可以完成数据分析的终端用户来说,微软的PowerPivot for SQL Server 2008 R2是一个很好的工具。业务人员可以自己动手将上百万行数据进行切割,并通过SharePoint Server 2010将结果与同事共享。

    PowerPivot是一个十分强大的“自助式”商业智能(BI)工具,但随之而来的是数据质量问题,一些专家认为使用微软的PowerPivot工具,在没有IT人员的监督管理之下,将很容易造成数据质量低下。PowerPivot可以在数据库层面上设定访问权限和策略,但同时还让终端用户在经过清洗的企业数据和来自外部的数据源上创建分析项目。Forrester机构的首席分析师Boris Evelson表示:“这就像是打开了潘多拉魔盒,因此企业需要进行某种程度上的治理。如果上千名终端用户在没有监督和控制的情况下创建并分享应用的话,其后果对于企业来说将是不堪设想的。”

    举例来说,任何错误的分析结果都可能会在公司内部进行分享,甚至其他业务人员还会反复使用错误的分析。不良的软件程序会在IT部门的监管范围之外不断扩散,没有被检查过的数据集会充斥整个企业。

    数据仓库与决策支持系统专家Rick Sherman表示:“我看过许许多多不良的数据系统,这些系统中,人们访问数据库,然后调取需要的数据到电子表格中再用PowerPivot生成分析结果。然后其他的用户再用电子表格随便做什么,添加宏和公式,而做出的变更则并不总是记录下来。”

    此外,一旦数据流出企业数据库之外,那更多的人将能够访问敏感的专有信息。

    监控PowerPivot文件

    那么,IT部门该如何维护新创建数据源以及企业数据库的准确性和一致性呢?

    企业中,业务人员希望使用像PowerPivot这样的自助式工具进行分析工作,究其原因有很大一部分是源自对IT部门的耐心不足。分析员肯定不希望等待IT人员把正式的数据分析模型创建之后再开展工作,所以PowerPivot是必不可少的,彻底抛弃这一工具显然并非明智之举。

    最佳的方法,就是花时间去创建一套策略来控制数据的安全。

    Gartner研究总裁Rita Sallam建议DBA充分利用SharePoint中的安全特性,它能够使管理员和用户对文件设定不同类型的限制条件。

    DBA还可以要求用户把所有的工作都保存到信任的文件位置,然后使用SharePoint来控制用户的访问权限。这些用户能够允许将文件保存到指定位置,或者能够下载相应文件。

    “让他们把所有的BI应用和数据存放到SharePoint Server共享的文件夹中,而不是之前都存放到自己的PC机。然后有规律地监控这些文件的使用率,如果其中一个使用率过高,说明它涉及到的用户和数据量就是比较大的,那么DBA可以在系统平台上标注一个红旗以示注意。” Evelson这样建议道。

    SharePoint 2010可以使管理员限制文件访问为只读,限制更改或创建特定的文件类型等。这能够使得DBA限制其他用户如何访问特定类型的文件或数据,举例来说,DBA可以限制用户在向SharePoint创建一个Workbook之前,先申请相应的授权。创建者还能够设定一个警告,当有人更改他们的文件时,警报启动能够通知到该用户。

    Sallam说:“IT人员可以监控到那些workbook被访问的次数最多。如果有workbook活跃度异常,他们就会在SQL Server数据库中创建相应的数据分析cube。这个功能可以让用户访问到正确的经过清洗的数据。”

    根据Sherman的说法,当自助式BI工具变得越来越强大时,终端用户更加需要对数据进行必要的保护。他建议IT部门加强对企业数据的访问控制,并将更多的权限授予高级用户,他们可以作为最终的裁定者,决定哪些用户可以访问数据并进行必要的业务分析。

    针对微软PowerPivot中的数据质量管理问题,Sherman建议制定细化的规则,根据数据需求和技术能力,把不同级别的访问权限授予不同的用户组,然后规定用户对自己的数据文件进行加密或设定访问权限,这样的话能够最大程度上减轻不良数据的蔓延。

    “决定加什么权限,数据中那些属性可以更改,这些都应该是由高级的用户进行管理的,这部分用户对企业的忠诚度比较高,并通过了IT部门的验收测试。”

    Sherman还表示,这样做的方法还有利于找出业务人员究竟希望获得怎样的工作模式,并不是所以终端用户都想要一样的数据访问级别。所以一些高级用户的限制政策在普通用户的眼中也许并不算是严格。多数情况下,能够把公式拖拽到pivot中在旁观者看来就已经是自助式了,他们也许并不想要更改公式或者数据。(原文出处://www.searchdatabase.com.cn/showcontent_52155.htm)      
          

本文由职坐标整理并发布,希望对同学们有所帮助。了解更多详情请关注职坐标大数据云计算大数据分析频道!

本文由 @沉沙 发布于职坐标。未经许可,禁止转载。
喜欢 | 0 不喜欢 | 0
看完这篇文章有何感觉?已经有0人表态,0%的人喜欢 快给朋友分享吧~
评论(0)
后参与评论

您输入的评论内容中包含违禁敏感词

我知道了

助您圆梦职场 匹配合适岗位
验证码手机号,获得海同独家IT培训资料
选择就业方向:
人工智能物联网
大数据开发/分析
人工智能Python
Java全栈开发
WEB前端+H5

请输入正确的手机号码

请输入正确的验证码

获取验证码

您今天的短信下发次数太多了,明天再试试吧!

提交

我们会在第一时间安排职业规划师联系您!

您也可以联系我们的职业规划师咨询:

小职老师的微信号:z_zhizuobiao
小职老师的微信号:z_zhizuobiao

版权所有 职坐标-一站式IT培训就业服务领导者 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
 沪公网安备 31011502005948号    

©2015 www.zhizuobiao.com All Rights Reserved

208小时内训课程