数据治理难逃大数据

作者: 霍俊婷

责任编辑: 阚智

来源: 中小企业IT网

时间: 2012-09-04 09:16

关键字: 数据治理,大数据, 软件

浏览: 0

点赞: 0

收藏: 0

数据治理的作用便是为了保护大数据。虽然大数据通常涉及到大量非结构化信息,许多企业的IT部门发现大数据还仅仅只是最近的现象。因此,根据数据管理分析师表示,大数据的环境治理还处在其早期阶段,关于如何有效地进行大数据的管理还存在诸多广泛的方法。
             

“大数据”的能够带给企业竞争优势的诱人条件,包括可以使用其来解锁客户的机密,了解网站使用情况和业务的其他关键要素。但是,一切应以谨慎为准:如果没有适当的数据管理过程,只是一味的热情,大数据项目可能会带来混乱的麻烦,包括虚假数据和意想不到的成本。

数据管理程序提供了一个框架,用于设置数据使用政策和实施控制,以确保信息保持准确一致和可以被访问。显然,在这个重大挑战的过程中,管理大数据需要分类、建模和数据映射,并进行数据捕获和储存,特别是针对大量非结构化特性的信息。

在大数据中寻找线索

困难的是,大数据治理过程中的一切是那么的新。在谈到大数据时,存在着很大的不成熟,大部分数据管理者真的可以说是毫无头绪。

大数据,其中也包括大量的结构性交易数据,具有特殊的功能。通常用三个词来定义:数量、种类和速度。而Forrester还在其定义中增加了变化性这一特性,而其对手咨询公司Gartner则将这一特性定义为复杂性。

此外,数据往往来自外部来源,其准确性并不总是能很容易地验证;同时,文本数据的含义和上下文不一定是连贯的。在许多情况下,它存储在Hadoop的文件系统或NoSQL数据库,而不是传统的数据仓库。对于许多企业来说,大数据涉及所有有关的人员:IT经理、程序员、数据架构师、数据建模师和数据管理专业人员。

例如,被企业抓获的大部分非结构化数据来自社会媒体,通常只有一小部分信息是有价值的,试图管理或控制一切非结构化数据,将是一个很大的错误。企业最终可能会浪费时间和资源在不重要的数据上面。

企业应该避免让程序员和用户从筒仓驱动的角度来建立大数据系统和所需的数据模型和映射工作。这可能会耗费很多的费用,造成设施不足,无法达到预期的商业利益,同时又浪费了不必要的系统投资。

©本站发布的所有内容,包括但不限于文字、图片、音频、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序等,除特别标明外,均来源于网络或用户投稿,版权归原作者或原出处所有。我们致力于保护原作者版权,若涉及版权问题,请及时联系我们进行处理。