摘要:本篇文章探讨了大数据分析之自学Python入行数据挖掘,听听数据挖掘美女工程师怎么说,希望阅读本篇文章以后大家有所收获,帮助大家对相关内容的理解更加深入。
本篇文章探讨了大数据分析之自学Python入行数据挖掘,听听数据挖掘美女工程师怎么说,希望阅读本篇文章以后大家有所收获,帮助大家对相关内容的理解更加深入。
这次我请到了在数据挖掘岗位的一位美女工程师Cathy,程序员本来就是一个比较少的群体,男的居多,女的工程师很少,美女就更少了!这次非常荣幸请到了Cathy,她原来是海外从事海量数据挖掘工作,目前在上海一家大型的互联网公司工作,她从数据挖掘岗位内部人士的角度来解读,什么是数据挖掘,需要那些技能,那些注意事项,希望对大家有帮助。
分享主要分为四个方面:
什么是数据挖掘?
工作中我们是怎么做的呢?
想入行?
如何提升?
机器学习和人工智能可能是这几年最火的话题了,但其实不论是人工智能还是机器学习,是战胜李世石的阿尔法狗还是各种深度学习模型算法,都是数据挖掘的一个分支。所以每当别人问我是做什么的时候,我也不想说的很玄乎,通常就说我是一只数据挖掘攻城狮了。
数据挖掘的方法有很多种,除了上面讲到的深度学习,和各种算法模型,任何能从数据中挖掘,总结出有用结果的,都叫数据挖掘。所以说,可视化,数据分析,看分布,哪怕是一拍屁股定下来的rule base,都可以算。
我在这里指的工作主要还是指在工业界,学术界可能就是另一种模式,我就不在这里不懂装懂了。在上班的时候,我们算法模型组里经常自黑,其中有一张图很好解释了我们的日常工作……
其实现在大多数模型都开源了,并且也有了很多现成的包,我们的工作就变成了将一堆数据整一整,丢进模型,有时候就能得到一个不错的结果。如果结果不好呢?也不着急……调调参数,多增加几轮迭代,或者换个模型…… (哭笑不得)。。
我说这些其实不光是为了自黑,目的是为了告诉大家,其实机器学习也好,深度学习也好,重要的永远不是在模型本身,而是在特征工程。
如何做特征,如何变幻特征,体现了你对业务的理解,也体现了你经验的积累,和你的灵光一现。有时候做了很久的模型,AUC 总在一个地方上不去,但突然有天想到一个牛逼的特征,于是就一下子拉上了一个台阶。
而且,在使用每个模型之前,阅读一下模型相关的paper也是一个很好的习惯。这会帮助你更好的选择最合适的模型,而不是每个万精油模型都用一遍。
所以,即使是在万物开源的年代,急于求成,也是很难做好一个模型,特征工程是需要智慧、耐心和积累的,也是机器学习中最最重要的一环。
本文由职坐标整理发布,学习更多的相关知识,请关注职坐标IT知识库!
您输入的评论内容中包含违禁敏感词
我知道了
请输入正确的手机号码
请输入正确的验证码
您今天的短信下发次数太多了,明天再试试吧!
我们会在第一时间安排职业规划师联系您!
您也可以联系我们的职业规划师咨询:
版权所有 职坐标-一站式IT培训就业服务领导者 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
沪公网安备 31011502005948号