数据科学 - 科学家



数据科学家是经过培训的专业人士,负责分析和解读数据。他们利用其数据科学知识帮助企业做出更明智的决策并提高运营效率。大多数数据科学家都拥有丰富的数学、统计学和计算机科学经验。他们利用这些知识来研究大型数据集,并发现趋势或模式。数据科学家也可能提出收集和存储数据的新方法。

如何成为一名数据科学家?

目前,企业对能够利用数据分析为其提供竞争优势的人才需求旺盛。作为一名数据科学家,您将基于数据创建业务解决方案和分析。

成为数据科学家的途径有很多,但由于这通常是一个高级职位,因此大多数数据科学家都拥有数学、统计学、计算机科学和其他相关领域的学位。

以下是一些成为数据科学家的步骤:

步骤 1 - 掌握数据技能

即使您没有数据相关的工作经验,也可以成为一名数据科学家,但您需要获得从事数据科学职业所需的必要基础知识。

数据科学家是一个高级职位;在达到这一专业水平之前,您应该在一个相关领域建立一个全面的知识基础。这可能包括数学、工程学、统计学、数据分析、编程或信息技术;一些数据科学家是从银行或棒球球探开始职业生涯的。

但无论您从哪个领域开始,都应该从 Python、SQL 和 Excel 开始。这些技能对于处理和组织原始数据至关重要。熟悉 Tableau 也很有益,这是一个您将经常用于创建可视化效果的工具。

步骤 2 - 学习数据科学基础知识

参加数据科学训练营可能是学习或提高数据科学原理的理想方法。您可以参考数据科学训练营,其中详细介绍了每个主题。

学习数据科学基础知识,例如如何收集和存储数据、分析和建模数据以及使用数据科学领域中的所有工具(例如 Tableau 和 PowerBI 等)来显示和呈现数据。

在培训结束时,您应该能够使用 Python 和 R 创建评估行为和预测未知因素的模型,以及以用户友好的格式重新打包数据。

一些数据科学职位列表将高级学位列为先决条件。有时,这是不可协商的,但当需求超过供应时,这一点越来越揭示了真相。也就是说,必要的技能证明往往胜过单纯的资格证书。

招聘经理最关心的是您能否证明自己掌握了该主题,并且越来越多的人意识到,这并不一定需要通过传统的方式来实现。

数据科学基础知识

  • 收集和存储数据。

  • 分析和建模数据。

  • 构建一个可以使用给定数据进行预测的模型。

  • 以用户友好的形式可视化和呈现数据。

步骤 3 - 学习数据科学的关键编程语言

数据科学家使用各种专门用于清理、分析和建模数据的工具和程序。数据科学家需要掌握的不仅仅是 Excel。他们还需要了解像 Python、R 或 Hive 这样的统计编程语言,以及像 SQL 这样的查询语言。

RStudio Server 是数据科学家最重要的工具之一,它提供了一个用于在服务器上使用 R 进行开发的环境。另一个流行的软件是开源的 Jupyter Notebook,它可以用于统计建模、数据可视化、机器学习等等。

机器学习在数据科学中得到了最广泛的应用。它指的是利用人工智能赋予系统学习和改进的能力,而无需对其进行专门编程。

步骤 4 - 学习如何进行可视化并进行练习

使用 Tableau、PowerBI、Bokeh、Plotly 或 Infogram 等程序练习从头开始创建自己的可视化效果。找到最佳方法让数据自己“说话”。

Excel 通常用于此步骤。即使电子表格的基本概念很简单——通过关联单元格中的信息进行计算或绘图——但 Excel 在 30 多年后的今天仍然非常有用,并且几乎不可能在没有它的情况下进行数据科学。

但是,创建漂亮的图片仅仅是开始。作为一名数据科学家,您还需要能够使用这些可视化效果向现场观众展示您的发现。您可能已经具备了这些沟通技巧,但如果没有,也不要担心。任何人都可以通过练习变得更好。如果需要,可以从小做起,先向一个朋友甚至您的宠物进行演示,然后再扩展到一个群体。

步骤 5 - 从事一些数据科学项目来提升您的实践数据技能

一旦您了解了数据科学家使用的编程语言和数字工具的基础知识,就可以开始使用它们来练习和提高您的新技能。尝试承担需要广泛技能的项目,例如使用 Excel 和 SQL 来管理和查询数据库,以及使用 Python 和 R 来使用统计方法分析数据,构建分析行为并提供新见解的模型,以及使用统计分析来预测未知的事物。

在练习过程中,尝试涵盖流程的不同部分。从研究一家公司或市场领域开始,然后定义并收集适合当前任务的数据。最后,清理和测试这些数据,使其尽可能有用。

最后,您可以创建和使用自己的算法来分析和建模数据。然后,您可以将结果放入易于阅读的可视化效果或仪表板中,用户可以使用这些可视化效果与您的数据交互并提出相关问题。您甚至可以尝试向其他人展示您的发现,以提高沟通能力。

您还应该习惯于处理不同类型的数据,例如文本、结构化数据、图像、音频甚至视频。每个行业都有自己类型的数据,可以帮助领导者做出更好、更明智的决策。

作为一名工作中的数据科学家,您可能会在一个或两个领域成为专家,但作为一名正在构建技能的初学者,您需要学习尽可能多的类型的基础知识。

承担更复杂的项目将使您有机会了解数据可以如何以不同的方式使用。一旦您了解了如何使用描述性分析来查找数据中的模式,您将更有准备地尝试更复杂的统计方法,例如数据挖掘、预测建模和机器学习,以预测未来事件甚至提出建议。

步骤 6 - 创建展示您数据科学技能的作品集

完成初步研究、获得培训并通过创建一系列令人印象深刻的项目来练习新技能后,下一步就是通过创建经过精心打磨的作品集来展示您的新技能,从而获得您梦寐以求的工作。

事实上,在求职过程中,您的作品集可能是您最重要的资产。如果您想成为一名数据科学家,您可能希望在 GitHub 上(或者除了您自己的网站之外)展示您的作品。GitHub 使您能够轻松展示您的工作、流程和结果,同时在公共网络中提升您的个人形象。但这还不是全部。

将引人入胜的故事与您的数据结合起来,并展示您试图解决的问题,以便雇主能够了解您的能力。您可以更全面地在 GitHub 上展示您的代码,而不仅仅是单独列出它,这使得您的贡献更容易理解。

在申请特定职位时,不要列出您所有的工作。重点突出一些与您申请的职位最相关的作品,并最佳地展示您在整个数据科学流程中的技能范围,从开始使用基本数据集到定义问题、清理、构建模型和找到解决方案。

您的作品集是您展示自己不仅仅能够处理数字和进行良好沟通的机会。

步骤 7 - 展示您的能力

您独立完成的一个精心制作的项目可以成为展示您的技能并给可能聘用您的招聘经理留下深刻印象的好方法。

选择一个您真正感兴趣的东西,提出一个关于它的问题,并尝试用数据来回答这个问题。

记录您的旅程,并通过以一种美观的方式呈现您的发现并解释您是如何获得这些发现的,来展示您的技术技能和创造力。您的数据应伴随着引人入胜的故事,展示您解决的问题,突出您的流程和采取的创造性步骤,以便雇主能够看到您的价值。

加入 Kaggle 等在线数据科学网络是另一种证明您参与社区、展示您作为有抱负的数据科学家的技能以及继续提升您的专业知识和影响力的绝佳方式。

步骤 8 - 开始申请数据科学职位

数据科学领域有很多工作机会。在学习基础知识之后,人们通常会继续专注于不同的子领域,例如数据工程师、数据分析师或机器学习工程师等等。

了解一家公司重视什么以及他们在做什么,并确保它符合您的技能、目标和未来的职业规划。并且不要只关注硅谷。像波士顿、芝加哥和纽约这样的城市也面临着技术人才短缺的问题,因此有很多机会。

广告

© . All rights reserved.