Sergey Nivens - Fotolia

开始 让你自己跟上我们的介绍内容。

6企业最佳数据最佳实践

这些最佳实践可以帮助企业将大数据战略放在正确的轨道上,以满足分析需求,并产生预期的业务效益。

在过去的十年,大数据管理和分析工具已经成为各种行业中各种规模的公司的变革技术。例如,零售商现在可以很好地了解他们的整个供应链。制造商可以监控和管理他们工厂中数以千计的部件和机器的性能。营销人员可以分析每一个客户接触点,从网站访问到电话和购买。

然而,我仍然听到很多关于如何获得最佳人选的混淆大数据架构。如果您喜欢,如果您喜欢,如果您喜欢,您可以在您的组织中出现更广泛的数据技术的更广泛主题,您可以牢记六大数据最佳实践。这些不是本质上的过度技术。请记住,大数据是商业资产,而不仅仅是技术资源。事实上,让我们从那里开始。

1.专注于业务需求,而不是技术

技术,尤其是在领域大数据分析,正在快速推进。现在,数据管理和分析团队现在可以处理几年前的数据和分析复杂性,而不是最先进的公司和政府机构。我们可以通过技术本身被带走,假设如果存在新功能,则必须有利于使用它。

例如,许多企业告诉他们想要做的供应商和顾问实时分析他们的数据。但如果我们挖掘这意味着什么,我们经常发现两个问题根本没有技术。

首先,数据的生成和收集要比许多业务用户能够理解或使用的详细程度要精细得多。其次,即使大数据系统能够在数据收集或变化时提供可操作的分析,企业也无法以这样的速度做出相关决策。一个结果是,业务主管和员工总是发现他们的行动落后于数据分析,这意味着在某种程度上,您花费了不必要的成本。

这种数据流和商业决策的流程之间的这种不匹配也可以让用户感到压力并过载,以妨碍自己的工作方式。在大数据环境中处理实时分析请求时,值得询问“正确的分析”是否会更好地遵循业务的节奏。

大数据最佳实践图表
组织应作为其大数据举措的一部分采用这些最佳实践。

2.收集大量数据是一件好事,而不是一个问题

许多数据科学家和分析师抱怨数据不堪重负,并将大数据视为该问题的一部分。肯定,您不应该扫荡具有更多数据的分析专业人员,而不是舒适地携带和理解。

尽管如此,人类必须分析所有数据。机器学习算法和AI工具可以利用数据科学团队无法自己处理的大数据量。

此外,即使你决定不做实时分析,收集和存储这些数据仍然是有价值的流数据未来使用。在路上,数据科学家可能会很好地找到大型的模式,然后是可用于检测潜在业务问题或机会的历史数据。然后,他们可以提供有助于改善业务决策的警报和通知。

只有在我们让它的情况下,只有大数据的体积才会压倒我们。您的大数据策略应专注于有效地为现在的业务决策提供最合适的分析,同时还存储,管理和管理数据用例和分析场景你甚至可能还不知道。

3.使用数据可视化以启用数据发现和分析

在按规模工作的信息时,我们的视觉能力是无与伦比的。甚至没有编码技能的人才能编写聚类算法或描述它如何工作的能力可以轻松地在由该算法生成的图表中轻松拾取关闭数据点的离合器。那些可能无法以编程方式发现一组大数据中的异常值的人会发现它直截了当地发现一些不适合他们看到的视觉模式的值。和适当的数据可视化,我们都是自然数据分析师。

当然,并不是所有的可视化都简单易懂。但在处理大数据时,业务用户如何理解大数据,以及如何在决策中使用大数据,将更有效地使用设计良好的数据可视化表示和分析结果。这尤其适用于预测分析应用程序在这里,即使未来趋势和概率的大图与业务目标高度相关,对数据细节的解释也可能非常技术性。

通过考虑到这些发现模式,您的大数据策略应包括合适的数据可视化工具,以及分析师和商业用户的相关培训。

4.迭代结构构建大数据以匹配特定应用

就其本质而言,大数据必须进行大规模管理,但你也应该认识到它的多样性。例如,客户支持电话的音频记录可能存储在一个大数据环境中,可能与产品图像、相关的社交媒体内容、各种类型的文档和更传统的数据(如交易和操作记录)一起存储。

因此,此数据的用途也非常多样化。您根本无法提前锻炼所有可能的用例和业务需求。同样,您无法在单个项目中开发所有这些分析方案。随着时间的推移,您将在分析团队开发时发现大数据集的新用途,业务需求变化和技术进步。

未来校样是数据湖泊和大数据平台(如Hadoop和Spark)的大优势之一:您不需要在第一次处理和存储时构建数据。相反,数据可以是留在其本地格式然后根据每个新分析应用程序过滤,转换和组织。

这种迭代方法应该是您对大数据的长期战略思想的重要组成部分。记住:这是马拉松,而不是冲刺。

5.考虑云进行大数据系统的部署

通过管理数据的增量过程和需要将非常大量的卷存储出来的未来使用,您可能担心保持如此多的数据的成本。云服务可以真正帮助,而不是对您的大数据策略的昂贵障碍。

首先,云平台供应商将数据存储作为一种商品来定价,这通常比购买自己的本地存储设备便宜得多。此外,他们还为您管理数据的安全性、可用性、备份和恢复、复制和归档。云中的大数据平台可能不仅具有更大的处理能力,而且还具有更好的工具和更有经验的人员来支持它,这是您的组织自己无法负担的。

6.管理遵从性和可用性的数据

在今天的监管环境下,实力很强数据治理不再是可选的:它必须是您的大数据策略中的主要考虑因素。无论您是否需要处理常规数据安全和隐私法例,如欧盟的GDPR,或在美国的医疗保健信息等HIPAA等垂直法规,都是管理您的数据的关键动机。

这听起来是消极的吗?数据治理真的只是为了确保我们不违反法律吗?事实上,治理良好的数据也是大数据分析应用程序更好的资源。这在一定程度上可以归结为信心的问题。如果在监管框架内仔细管理数据,数据科学家和分析师就可以更自由地探索和试验新的、可能具有创新性的使用场景。此外,公司通常发现,管理良好的数据——经过精心编录、描述、保护和部署——也更容易使用。

将这些大数据最佳实践放入行动中

如您所见,在考虑和制定大数据战略时,有许多相关问题需要解决。IT、数据管理和分析领导者需要与业务决策者进行这些对话——因为正如我们一再看到的,光靠技术是不够的。正如我上面所说,大数据是一种商业资产。没有以业务为中心的分析,它可能是一种浪费。

深入挖掘大数据分析

搜索数据管理
搜索AWS.
搜索内容管理
搜索甲骨文
搜索树液
搜索SQL.服务器
关闭