早知道就好了!自学转型成为数据科学家必须明白的10件事[通俗易懂]

早知道就好了!自学转型成为数据科学家必须明白的10件事[通俗易懂]近日,泰国的一所研究型大学的教授、Youtube数据科学类优秀博主Chanin Nantasenamat 结合自己的学习经历给大家做了系统总结。

欢迎大家来到IT世界,在知识的湖畔探索吧!

如何成为一名数据科学家?

数据科学家的学习成长路径是怎样的?

要学习数据科学,我需要学习哪些课程?

这是大多数想转型成为数据科学家的自学者最关心的三个问题。

近日,泰国的一所研究型大学的教授、Youtube数据科学类优秀博主Chanin Nantasenamat 结合自己的学习经历给大家做了系统总结。

以下是具体博文:

什么是数据科学?

简而言之,数据科学是一个实质上利用数据来解决问题并为公司和组织带来影响、价值和见解的领域。数据科学已应用于教育、金融、医疗保健、地质、零售、旅行和电子竞技等广泛的学科和行业。

数据科学的技术技能涉及使用数据收集,数据预处理,探索性数据分析,数据可视化,统计分析,机器学习,编程和软件工程。除了技术方面,数据科学家还需要各种软技能。

以下信息图概述了数据科学家的基本技能:

早知道就好了!自学转型成为数据科学家必须明白的10件事[通俗易懂]

1.您的数据科学之旅与他人无关

您的数据科学之旅是个人的。不要将自己与他人进行比较,请记住每个人都是独一无二的,我们每个人都在不同的旅程中。专注于您自己的数据科学之旅,受挫折或者有拖延都是可以接受,但不要让这些障碍阻止您实现目标,迟到总比不到好。

制定自己要学习和要做的事情清单。找出您尚不了解的数据科学概念和技能,并记下您想知道的内容。然后,从这个数据科学概念/技能列表中,专注于每天仅学习一件事。在1年的时间里,您会惊讶于您学到了多少新概念和新技能。

2.如何学习数据科学?

我们如何学习?学习风格通常分为以下三种主要类型:

  • 视觉的(见)
  • 听觉(听力)
  • 动觉(做)

知识无处不在,学习的来源也多种多样。例如,您可以从书本,博客,视频,播客,有声读物,演讲,教学中学习,而这当中最重要的就是“做(doing)”。

“The Best Way to Learn Data Science is By Doing Data Science.”

— Chanin Nantasenamat (AKA Data Professor)

当您学习新的概念或技能时(即从视觉和听觉上),您可以通过立即将新发现的知识应用于数据科学项目(即要做的事情)来增强所学内容。通过不断地进行数据科学,您将逐渐加强和磨练刚学到的新概念和技能。随着时间的流逝,您将掌握它们。

此外,为进一步加深您对这些新概念或技能的理解,您可以教其他人(即,撰写教程博客,制作视频教程并教他人)。通过这样做,您可以利用上述3种学习方式,从而最大程度地发挥学习潜力。还值得一提的是,教别人可以帮助您将新概念或技能具体化为自己的措辞,从而有助于重新组织思想并更好地理解。

3.免费学习数据科学的资源

有大量的学习资源可用于学习数据科学。实际上,有太多选择的余地。我将可用的学习资源分为两种主要类型:费用与免费。

在以下各节中,我将列出一些免费的学习数据科学的资源。

Kaggle的14门小课:

https://www.kaggle.com/learn/overview

1. Python

2. Intro to Machine Learning

3. Intermediate Machine Learning

4. Data Visualization

5. Pandas

6. Feature Engineering

7. Deep Learning

8. Intro to SQL

9. Advanced SQL

10. Geospatial Analysis

11. Microchallenges

12. Machine Learning Explainability

13. Natural Language Processing

14. Intro to Game AI and Reinforcement Learning

YouTube —有几个出色的频道,涵盖了数据科学中的多个重要主题。

1. Data Professor

2. Ken Jee

3. Krish Naik

4. Codebasics

5. 3Blue1Brown

6. StatQuest with Josh Starmer

7. Sentdex

8. Data School

9. Python Programmer

10. Lex Fridman

11. Abhishek Thakur

12. Two Minute Papers

13. Andreas Kretz

14. Cory Schafer

15. Siraj Raval

16. Story by Data (Kate Strachnyi)

17. RichardOnData

18. Joma Tech (Data Science Playlist)

19. 365 Data Science

20. Data Science Dojo

21. Data Camp

22. Import Data

23. Data Science Jay

24. David Langer

25. Daniel Bourke

4.为什么选择数据科学?

对于要学习数据科学的目的和理由有明确的了解,可以帮助您更加欣赏数据科学。通过探索以下主要问题,花一些时间思考一下。

我为什么要学习数据科学?

您想问自己最重要的问题就是您为什么要学习数据科学?通过回答这个问题,您将更好地了解首先需要重点研究数据科学的哪个领域,因为该领域广阔且容易迷失方向。

我将如何在项目中使用数据科学?

确定在项目中如何使用数据科学非常重要。您要回答的一些问题包括:

  • 您将进行探索性数据分析吗
  • 您会开发回归/分类/聚类模型吗
  • 你会开发一个聊天机器人吗
  • 您会开发一个推荐系统吗

通过使用数据科学,我可以为工作带来什么价值

正如斯蒂芬·科维(Stephen Covey)在“高效人才的七个习惯”中所说的那样,“从头脑中的尽头开始”。

因此,花点时间考虑一下您希望通过Data Science到达的理想目的地。

有了明确的目标,您会为实现该目标的决心而感到惊讶。

5. 让自己对自己负责,让自己富有成效

以下是提高生产力的一些基本建议:

每天拨出专用时间(最好是每天1-2小时或至少45分钟),您可以花时间学习和做数据科学

避免分心(关闭手机,避免检查社交媒体等)。如果您无法阻止分心,那么将自己从分心的环境中移走可能是一个更好的主意。这意味着您应该在某个安静的地方找到可以集中注意力的地方。

不要拖延,不要过度思考,就去做吧!(例如耐克),为了帮助您克服这一问题,请尝试应用2分钟规则(请阅读有关如何通过使用“ 2分钟规则”停止拖延运动的中型文章),以帮助您保持运动。

因为归根结底,如果您没有取得进展,就意味着您没有学习,也没有取得成功,无法实现目标。

6.拥抱失败并学会debug

拥抱失败。您必须学会适应不舒服的地方。简而言之,这里没有免费的午餐。一分耕耘一分收获。因此,当您遇到失败时,请不要沉迷于此,而要重新站起来并继续尝试。

完全可以停下来,不了解算法X也可以,并且不知道如何调试失败的代码也可以。您可以先休息一下,然后再重新解决挑战。有时,您的思维会变得阻塞而变得迟钝,因此,稍事休息可能有助于使思维焕发活力和恢复活力。

当您因数据科学项目的编码错误而陷入困境,并且不确定如何进行时。如果您有一个精通编码的朋友,请询问他或她。如果没有,借助搜索引擎。

学会热爱debug,将其作为学习的机会,您可以从失败和错误中获得宝贵的见解和教训。因为如果不失败,就不会学习。但是,当你失败时,不要对自己太苛刻,要学会重新起步并重新开始。

7.不要担心尝试学习一切

所有新奇的术语可能会使该领域的新手大跌眼镜,但不要被吓倒,并记住数据科学和机器学习是一个动态,不断发展和发展的领域,因此总会引入新技术。简而言之,唯一不变的就是改变本身。

如上所述,不要被吓倒。无论从哪里开始,都没有关系,最重要的是您实际上开始了数据科学之旅。

专注于基础

  • 数据争论(Python pandas, R dplyr)。
  • 阅读统计信息,以便可以将其应用到模型中。例如,应用适当的统计信息以比较模型(参数与非参数)。
  • 探索性数据分析和描述性统计信息,以获取数据概览
  • 从构建简单且可解释的机器学习模型(线性回归,基于树的方法)开始
  • 使用您有信心使用的机器学习方法(了解其背后的数学原理)

专注于项目而不是技术

  • 不要过度思考。克服“我应该学习哪种语言?” 困境,选择一个继续前进。
  • 知道编程是一种工具,它可以帮助您将项目的构想推进开发和部署
  • 编程的基本概念与语言无关,这意味着核心基础适用于各种语言:
  • 定义变量,数组,数据框等
  • 流控制(例如for循环,if和else语句)

数据科学中的特定任务

  • 数据整理/数据预处理
  • 数据可视化
  • 模型构建
  • 模型部署

8.使您的项目具有可复制性

使您的数据科学项目可复现的一些好处如下:

  • 别人可以帮助你
  • 当您遇到编码错误时,必须制作一个最小的工作示例(MWE),因为它可以使其他人复现您的错误,以便他们可以为您提供帮助。
  • 为未来的自己和他人节省时间

将项目导出为Docker容器以及Python和Conda的环境。因为由于您的编码环境中安装的基础库的版本不断变化,所以今天可行的方法可能会在六个月后失效。因此,必须使用虚拟环境,Docker容器或至少导出库版本(如下所示的pip和conda)。

早知道就好了!自学转型成为数据科学家必须明白的10件事[通俗易懂]

9.学习成功从内心开始

这里探讨的是数据科学之旅的成功级别从内心开始的思想。它是关于让你的思想为即将到来和将来的你做好准备。这些概念包括:好奇心、热爱过程、成长心态和毅力。

好奇心可以被认为是成为一名数据科学家的核心和必要技能之一,因为它让我们在追求创造性的方法来解决问题的过程中保持动力和毅力。正如爱因斯坦所说,好奇心比知识更重要。

然后是热爱过程,再之后是培养起自己的成长心态和做事的毅力。

10.自己承担全部责任

通常很容易找借口,把无数事情归咎于生活的不幸。当我们这样做时,正如Gary Vaynerchuk总是会说的那样,“我们的责任是零”。

学习数据科学与我们一生中所做的其他努力没有什么不同。问题是我们应该为自己在学习过程中遇到的延误或障碍负责,还是我们不承担全部责任并将责任推卸到其他地方。

现在,花点时间反思一下。让我们开始承担责任并承担全部责任,您会惊讶于您在数据科学之旅中可以取得的成就。只有我们能够客观地对自己的行动和缺乏进步承担全部责任,我们才有能力对此采取行动。

参考链接:

https://towardsdatascience.com/10-things-i-wish-i-knew-about-learning-data-science-7a30bfb91759

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://itzsg.com/17795.html

(0)

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们YX

mu99908888

在线咨询: 微信交谈

邮件:itzsgw@126.com

工作时间:时刻准备着!

关注微信