评估 权衡你正在考虑的技术、产品和项目的利弊。

如何构建和管理数据科学团队

数据科学团队通常包括各种分析和数据专业人员,可以以不同的方式组建,本文将介绍如何管理这些团队。

越来越多的组织将数据视为一种有价值的资产,它将帮助他们在现在和未来取得成功。在2019年对BI和分析专业人士的一项调查中,500名受访者中有94%的人认为数据和分析对其组织的业务增长和数字化转型战略非常重要或有些重要的贡献。

这项调查是为BI软件供应商MicroStrategy进行的,并在一份题为“2020年全球企业分析状况”的报告中详细说明”,还发现59%的公司都在前进高级和预测分析应用程序——数据科学领域。这比一年前的类似调查高出7个百分点。

然而,该调查也证实,在将数据转化为可操作的信息方面存在许多挑战。受访者将安全和隐私问题列为更有效地使用数据和分析的头号障碍,但其他最主要的障碍包括无法获取竖竖式数据缺乏合格的人才员工培训不足,缺乏分析策略。

高管们应对这些挑战的方式之一是,创建数据科学团队,领导他们在诸如数据挖掘,预测建模,机器学习和AI。这一点恰逢许多企业中越来越多的数据相关职位,以及开发结构和管理数据科学团队的最佳实践。让我们看起来更仔细地看。

用于构建数据科学团队的不同模型

“在某种程度上,建立和维护一个强大的数据科学团队是一门艺术,”EDM理事会(EDM Council)主席约翰·波特加(John Bottega)说。该理事会是一个全球协会,专注于数据管理最佳实践、标准和培训。

数据收集、管理和分析的职责通常属于CIO,其IT团队与业务用户一起工作实现数据仓库BI系统负责数据的保存和整理,并进行基本的分析和报告。然而,在过去20年里,随着内部数据存储数量的增长、支持技术的发展以及与数据相关的任务变得更加分化和专业化,越来越多的组织将数据功能划分到自己的部门中。

高级分析对商业成功的重要性与日俱增,这也推动了对有技能的数据科学团队的需求数据科学家和其他工人。今天,许多组织都有一个团队或整个数据科学部门;较大的公司可能有多个独立或协调运作的团队。

根据数据科学项目的成熟度、数据分析目标、整体组织结构和企业文化,公司如何构建团队会有所不同。然而,出现了一些常用的数据科学团队结构模型,每种模型都有优缺点。团队结构可以是:

  • 分散。数据科学团队成员在他们支持的单个业务单元中工作。这允许团队成员与业务执行人员和工作人员紧密协作数据科学项目,但它会阻碍跨组织的数据战略性使用,并需要比小公司可能拥有的更多的资源。
  • 集中。数据科学函数在单个经理下巩固企业级,谁将团队成员分配给个别项目并监督其工作。该模型更容易允许企业范围的战略视图和分析最佳实践的统一实施,但它可以限制团队成员成为企业特定领域专家的能力。有些组织建立了一个正式的数据科学卓越,可以追上一个集中团队。
  • 混合动力车。数据科学团队在集中管理,但成员被分配到与特定业务运营合作,并对这些单位达成其目标进行数据驱动的决策负责。在混合结构中,卓越中心也可以专注于促进数据科学最佳实践和标准。与去中心化模型一样,资源约束可能是一个问题。

数据科学团队的角色和责任

要想成功,数据科学团队必须具备一些共同的要素。

“无论行业如何,数据科学团队需要在三个核心领域强势:数学,技术和商业敏锐,”Bottega说。“在三个中寻找一个擅长的人是非常罕见的。许多公司将有一个人在三者中有流利的人,然后可以建立围绕这一团队的剩余部分,填补了整个团队的差距三者都很强大。“

小型组织或那些只有有限的分析需求或早期数据科学项目的组织可能会有一个通才来处理所有所需的任务。更大的实体,以及那些拥有更成熟程序的实体,通常在其数据科学团队中包含以下角色的组合。

数据科学家。正如标题所示,数据科学家是一个团队的核心成员。他们使用统计方法,机器学习算法以及其他分析数据和创建预测模型的工具;一些公司还为各种用例构建数据产品、推荐引擎、聊天机器人和其他技术。数据科学家通常具有数学、统计、数据争论、数据挖掘、编码和建模等领域的各种技能,以及业务知识、沟通和协作技能。他们也越来越多地拥有高级数据科学学位。

数据分析师。数据分析师不具备数据科学家的全部技能,但可以支持数据科学工作。数据分析人员的主要职责是从操作系统和数据库中收集和维护数据,使用统计方法和分析工具来解释数据,以及准备仪表盘和报告对于商业用户。

数据工程师。数据工程师负责建立、测试和维护数据管道;他们通常有软件工程或计算机科学的背景,这适合他们专注于技术基础设施和数据收集、管理和存储。他们也经常与数据科学家密切合作关于数据质量,数据准备和模型部署和维护任务。

数据架构师。数据架构师设计并监督团队使用的底层系统和数据基础设施的实现。在某些情况下,数据工程师也可以处理这个角色。

机器学习工程师。该职位有时也被称为AI工程师,与数据科学家一起创建、部署和维护所需的算法和模型机器学习和人工智能项目

在一些组织中,数据科学团队也可能包括这些职位。

公民数据科学家。这是一种非正式的角色,可能涉及业务分析师、业务单元高级用户和其他能够完成自己的数据分析工作的员工。公民数据科学家虽然它们使用的技术 - 例如,虽然技术的技术往往对高级分析有兴趣,敏锐或对先进分析的一些培训自动化的机器学习工具——通常不需要编码。他们通常在数据科学团队之外工作,但也可能被合并到嵌入业务单元的团队中。

业务分析师。在某些情况下,业务分析师可能是数据科学团队的成员,他们的常规角色包括评估业务流程并将业务需求转化为分析计划 - 他们可以帮助支持数据科学家的工作。

资料翻译。这些专业人员——也被称为分析翻译人员——是名单上的新成员担任联络人在数据科学团队和业务运营之间,帮助规划项目,并将从数据分析中收集到的见解转化为推荐的业务行动。

数据可视化开发人员或工程师。他们负责创建数据可视化使信息对业务专业人员更容易访问和理解。然而,在一些团队中,数据科学家和数据分析师可能会自己处理这个角色。

谁来管理和监督数据科学团队?

一个团队可以由数据科学,数据科学经理,铅数据科学家或类似的管理职位领导。团队的报告结构类似地不同。但是,但是,组织分配C级执行或高级职能经理以监督数据科学团队。

最明显的数据科学领导者是首席数据官员。CDO职位日期返回2002年,金融服务公司首都一个被广泛认可为第一家实施作用的公司。此外,许多其他人被诉讼:数据和分析咨询公司NewVantage Partners报告称,2020年在2020年调查的85家大公司中有65%的CDO,从12%开始于2012年年度调查。最初主要专注于数据治理,管理层和安全功能,许多CDO现在也有承担责任数据科学、分析和人工智能。

其他组织也设立了首席分析官(CAO)的角色监督他们的数据科学和分析团队而有些公司则将CDO和CAO职位合并为一个首席数据和分析官。此外,数据科学团队的负责人可能要向不同的高管汇报——比如COO、CFO或CIO,或者分析副总裁、业务数据副总裁或数据和战略总监等职位。

数据科学团队的组织图表示例
这个组织结构图是如何构建数据科学的一个例子。

数据科学家如何与商业用户合作

各种组织都是努力成为数据驱动型,有充分的理由:许多人认为它是数字时代持有竞争力的关键。为此,数据科学团队应与商业管理人员合作起作用:

  1. 清楚地理解他们希望团队回答的业务问题。
  2. 阐明他们使用其提供的信息的目标。
  3. 规划如何应用这些信息来做决定和采取行动。

“数据科学家需要与业务部门密切合作,了解他们提供的数据如何帮助推动业务,并确切地了解[商业用户]需要从数据中得到什么,”波士顿地区副总裁Josh Drew说,他负责Robert Half Technology和the Creative Group,人力资源公司罗致恒富国际有限公司的两个部门。

一旦他们有了这样的理解,数据科学团队就不能仅仅展示他们的发现。他们必须帮助业务同事理解从数据中获得的见解,以及这些信息如何影响产品和服务的提供、营销活动、供应链管理和其他业务操作的关键部分,以支持企业目标,如更高的收入、提高效率和更好的客户服务。

数据科学团队需要的工具

从数据可视化和报告软件到高级分析、机器学习和人工智能技术,数十种工具使数据科学团队的工作成为可能。基于目标和技能水平,每个团队所需要的技术数量和组合是独特的。

以下是常用的数据科学工具列表,包括商业和开源技术:

  • 统计分析工具,如SAS和IBM SPSS;
  • 机器学习框架和库,包括TensorFlow、Weka、Scikit-learn、Keras和PyTorch;
  • 来自不同供应商的数据科学平台,提供分析、自动机器学习、工作流管理和协作等多种功能;
  • 编程语言,特别是Python,R,Julia,SQL,Scala和Java;
  • jupiter Notebook和其他交互式笔记本应用程序,用于共享包含代码、方程式、注释和相关信息的文档;
  • 数据可视化工具和库,例如Tableau,D3.JS和Matplotlib;
  • Spark、Hadoop等大数据平台和分析引擎,云对象存储服务和NoSQL数据库;和
  • Kubernetes容器编排服务,用于在云中部署分析和机器学习工作负载。

管理数据科学团队的最佳实践

寻求建立和完善数据科学项目的高管和团队领导者应该考虑以下管理团队的最佳实践。

  • 寻找一系列的工人商业和人际交往技能除了技术人员,有助于确保团队能够满足组织目标。
  • 创造一种学习和创新的文化,挑战团队成员,鼓励他们对业务问题和问题提出新的想法。
  • 推动分析项目,鼓励数据科学团队和他们支持的业务单位之间的密切合作。
  • 对团队成员的工作成就进行至少部分的评估。
  • 制定一个指导计划,以帮助提高初级团队成员的技能,并进行持续的培训,以确保所有员工都与时俱进关键数据科学技术和技术。
  • 因为数据科学家需求量很高有经验的人有很多工作机会,设计一个人才管理计划,以帮助他们和其他团队成员离开。

深入挖掘商业智能团队

搜索数据管理
搜索AWS.
搜索内容管理
搜索甲骨文
搜索SAP
搜索SQL服务器
关闭