0基础学大数据,数据科学初学常见的5个误区

2020-02-14 16:34:35 浏览数 (2)

这篇文章中列举了五个数据科学家可能常犯的误区,并对如何防止这些失误的出现给出了一定的建议。

专注于电脑,而不是同事

在数据科学初学者之中有一个常见的误解,即在实际工作中他们的工作主要是编写技术代码。但实际上数据科学家的工作是发现有助于业务增长的信息。

首先,数据科学家必须能够与业务人员交流,共同探讨他们发现的信息如何在更大程度上对业务产生影响;其次,他们必须知道到哪里寻找这些信息。

忽略业务领域的大环境

除了定期与业务部门的同事沟通之外,花时间了解你所在行业的大环境也很重要。更全面地理解业务环境,对于提供业务洞察和数据科学最佳实践至关重要。

当您对业务的大环境有了一定的了解之后,就可以找到失效的流程,查看数据,并推测出了什么问题,在对您的假设进行测试并确认之后,做出相应的改进。

只注重理论,忽视实践

与许多领域一样,数据科学往往是实践重于理论。数据科学的实践必须在真实的环境中运行。

在企业中,数据科学家必须经受各种压力,包括:

与其他部门和团队协调;

代码集成的挑战;

预算限制等。

虽然关注最新的文章、博客和前沿技术也很重要,但在这份工作中,有些部分你只能边做边学。一个具备高工作效率的数据科学家,应知道如何平衡他们的专业发展。

从不问为什么

要成为更好的数据科学家,只需问一问为什么。这个问题有助于消除数据科学家和公司其他部门同事之间的沟通障碍。为了建立一个真正有用的模型,你必须理解你的同事希望用它去解决的问题。

假设数据是干净的

在许多情况下,数据科学家80%的工作是清理数据——最后20%的工作是运行机器学习或深度学习模型,以获取数据洞察。

接收数据集时要做的第一步是辨认有多少数据是直接可用的,第二步是确定如何让获得一个完全可用的数据集。

0 人点赞