大数据分析之自学Python入行数据挖掘,听听数据挖掘美女工程师怎么说
沉沙 2019-02-19 来源 : 阅读 1098 评论 0

摘要:本篇文章探讨了大数据分析之自学Python入行数据挖掘,听听数据挖掘美女工程师怎么说,希望阅读本篇文章以后大家有所收获,帮助大家对相关内容的理解更加深入。

本篇文章探讨了大数据分析之自学Python入行数据挖掘,听听数据挖掘美女工程师怎么说,希望阅读本篇文章以后大家有所收获,帮助大家对相关内容的理解更加深入。

大数据分析之自学Python入行数据挖掘,听听数据挖掘美女工程师怎么说

这次我请到了在数据挖掘岗位的一位美女工程师Cathy,程序员本来就是一个比较少的群体,男的居多,女的工程师很少,美女就更少了!这次非常荣幸请到了Cathy,她原来是海外从事海量数据挖掘工作,目前在上海一家大型的互联网公司工作,她从数据挖掘岗位内部人士的角度来解读,什么是数据挖掘,需要那些技能,那些注意事项,希望对大家有帮助。

分享主要分为四个方面:

  • 什么是数据挖掘?

  • 工作中我们是怎么做的呢?

  • 想入行?

  • 如何提升?

1
什么是数据挖掘

机器学习和人工智能可能是这几年最火的话题了,但其实不论是人工智能还是机器学习,是战胜李世石的阿尔法狗还是各种深度学习模型算法,都是数据挖掘的一个分支。所以每当别人问我是做什么的时候,我也不想说的很玄乎,通常就说我是一只数据挖掘攻城狮了。

数据挖掘的方法有很多种,除了上面讲到的深度学习,和各种算法模型,任何能从数据中挖掘,总结出有用结果的,都叫数据挖掘。所以说,可视化,数据分析,看分布,哪怕是一拍屁股定下来的rule base,都可以算。

2
工作中我们是怎么做的

我在这里指的工作主要还是指在工业界,学术界可能就是另一种模式,我就不在这里不懂装懂了。在上班的时候,我们算法模型组里经常自黑,其中有一张图很好解释了我们的日常工作……

其实现在大多数模型都开源了,并且也有了很多现成的包,我们的工作就变成了将一堆数据整一整,丢进模型,有时候就能得到一个不错的结果。如果结果不好呢?也不着急……调调参数,多增加几轮迭代,或者换个模型…… (哭笑不得)。。

我说这些其实不光是为了自黑,目的是为了告诉大家,其实机器学习也好,深度学习也好,重要的永远不是在模型本身,而是在特征工程

如何做特征,如何变幻特征,体现了你对业务的理解,也体现了你经验的积累,和你的灵光一现。有时候做了很久的模型,AUC 总在一个地方上不去,但突然有天想到一个牛逼的特征,于是就一下子拉上了一个台阶。

而且,在使用每个模型之前,阅读一下模型相关的paper也是一个很好的习惯。这会帮助你更好的选择最合适的模型,而不是每个万精油模型都用一遍。

所以,即使是在万物开源的年代,急于求成,也是很难做好一个模型,特征工程是需要智慧、耐心和积累的,也是机器学习中最最重要的一环。

本文由职坐标整理发布,学习更多的相关知识,请关注职坐标IT知识库!

本文由 @沉沙 发布于职坐标。未经许可,禁止转载。
喜欢 | 0 不喜欢 | 0
看完这篇文章有何感觉?已经有0人表态,0%的人喜欢 快给朋友分享吧~
评论(0)
后参与评论

您输入的评论内容中包含违禁敏感词

我知道了

助您圆梦职场 匹配合适岗位
验证码手机号,获得海同独家IT培训资料
选择就业方向:
人工智能物联网
大数据开发/分析
人工智能Python
Java全栈开发
WEB前端+H5

请输入正确的手机号码

请输入正确的验证码

获取验证码

您今天的短信下发次数太多了,明天再试试吧!

提交

我们会在第一时间安排职业规划师联系您!

您也可以联系我们的职业规划师咨询:

小职老师的微信号:z_zhizuobiao
小职老师的微信号:z_zhizuobiao

版权所有 职坐标-一站式IT培训就业服务领导者 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
 沪公网安备 31011502005948号    

©2015 www.zhizuobiao.com All Rights Reserved

208小时内训课程