摘要:本篇文章探讨了大数据分析之都是数据科学家,为什么TA薪水比你高,希望阅读本篇文章以后大家有所收获,帮助大家对相关内容的理解更加深入。
本篇文章探讨了大数据分析之都是数据科学家,为什么TA薪水比你高,希望阅读本篇文章以后大家有所收获,帮助大家对相关内容的理解更加深入。
同样做数据科学,为什么有人赚得多,有人赚的少?为了科学地回答这个问题,Kaggle 进行了一项系统的调查。结果表明,行业、经验、掌握的数据类型等是影响数据科学家薪酬的主要因素。行业是自己选的,经验是自己攒的,这些都没啥好说的。至于数据类型,你会的更高级就赚得越多。
如何提高薪酬?本文作者从 2018 年 Kaggle ML & DS 调查问卷中总结出 124 条「该做」和「不该做」之事。
做什么能为你的数据科学职业生涯加码?很多人已经非常清楚巩固数据科学职业和加薪的重要因素。但我从没有见过一个系统的、基于数据的方法来回答这个问题。所以我想通过建模来解释「哪些因素可以提高数据科学家的市场价值」。有些你可能已经了解,但有些可能真的有助于你加薪呢~
根据数据估计薪酬
我们只能做这种研究,因为 Kaggle 已经发布了其第二次年度机器学习和数据科学调查的数据。该调查于 2018 年 10 月展开,耗时一周,共获得 23859 份回复。结果包括一些原始数据,如什么人在研究数据、不同行业中机器学习的情况、新数据科学家进入该领域的最佳方式。
有了这些数据,我们想了解影响 Kaggler 薪酬的因素(我们把回复调查的人称之为 Kaggler)。我们想让你了解什么对市场更有价值,这样你就可以停止把时间花在投资回报率(ROI)低的事情上,并加速获得更高的报酬。根据这些从数据中提炼出来的见解,我希望你有一天能够像 Babineaux 一样——躺在钱堆上。
在进入正题之前,我们可以先做一些基本的探索性数据分析(EDA)。首先看一下大家的薪水↓↓
薪酬主要集中分布在较低的水平范围内(每年 1 万美元),在 10 万美元左右还有另一个高峰。很多学生也填写了这份调查问卷,看看他们赚多少?
不出所料,学生们赚得不多,因为他们还没有正式工作。既然如此,我们可以把学生从数据中剔除并确定收入前 20% 的 Kaggler 薪酬是多少。
根据这些数据,我们定义了用于建模的目标变量,如下:
我们将计算一个 Kaggler 年收入超过 10 万美元的概率。
数据科学中的性别不平衡
在继续建模之前,我想告诉你的是,在收入最高的 20%Kaggler 中存在性别不平衡,但是其余的 80% 中不存在这种现象。这意味着男性高管的薪资要高于女性。
本文由职坐标整理发布,学习更多的相关知识,请关注职坐标IT知识库!
您输入的评论内容中包含违禁敏感词
我知道了
请输入正确的手机号码
请输入正确的验证码
您今天的短信下发次数太多了,明天再试试吧!
我们会在第一时间安排职业规划师联系您!
您也可以联系我们的职业规划师咨询:
版权所有 职坐标-一站式IT培训就业服务领导者 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
沪公网安备 31011502005948号