【异周话题 第 4 期】如何在一年内成为优秀的数据挖掘工程师?(已结束)

  图像说明文字

【异周话题 第 4 期】如何在一年内成为优秀的数据挖掘工程师??

话题背景

数据挖掘(Data Mining),顾名思义是指从海量的数据中通过算法搜索隐藏于其中信息的过程,它是数据库知识发现中的一个步骤。近年来,数据挖掘引起了信息产业界的极大关注。数据挖掘能够将大量数据转换成有用的信息和知识,并可以广泛用于各种应用于各行各业,例如商务管理、生产控制、市场分析、工程设计和科学探索等。

早在2009年,Google通过分析5000万条美国人最频繁检索的词汇,将之和美国疾病中心在2003年到2008年间季节性流感传播时期的数据进行比较,并建立一个特定的数学模型。最终google成功预测了2009冬季流感的传播甚至可以具体到特定的地区和州。数据挖掘的应用远远不止于此,本周的【异周话题】我们就来聊聊【数据挖掘】的相关话题。

话题内容

大家可以围绕以下一个或多个问题展开讨论:

1.如何入门数据挖掘?需要学习哪些知识请分享你的经验与建议。
2.如何成为一名优秀的数据挖掘工程师?需要突破哪些难点?请分享你的经验与心得。
3.如何看待数据挖掘的行业前景?如何看到数据工程师的职业前景?请分享你的观点与看法。
4.数据挖掘和机器学习有什么区别?你更看好两者之中的哪一个方向?

话题时间

2017年10月10日-10月15日

话题奖励

活动结束后,我们将选取 4 位讨论精彩的同学,各送技术图书《写给程序员的数据挖掘实践指南》图书 1 本。


《写给程序员的数据挖掘实践指南》

图书作者:【美】Ron Zacharski(扎哈尔斯基)

作者简介:Ron Zacharski拥有软件开发和计算语言学方面的背景。他是一位计算机科学副教授,并且为从事机器学习和信息提炼的几家创业公司担任过咨询顾问。此前,他在New Mexico的计算研究实验室工作,从事机器翻译、特别是人们较少学习的语言方面的研究工作。他曾获得明尼苏达大学计算机科学博士学位,爱丁堡大学的语言学博士后,并且拥有音乐艺术学士学位。Ron Zacharski 的经历颇具传奇色彩:他初学音乐,做了十年的音乐理疗师。后获得计算机科学博士学位,专攻自然语言处理。现在是一名软件开发工程师,同时也是一位松冈操雄曹洞宗的禅师。。

图书简介:本书是写给程序员的一本数据挖掘指南,可以帮助读者动手实践数据挖掘、集体智慧并构建推荐系统。全书共8章,介绍了数据挖掘的基本知识和理论、协同过滤、内容过滤及分类、算法评估、朴素贝叶斯、非结构化文本分类以及聚类等内容。本书采用“在实践中学习”的方式,用生动的图示、大量的表格、简明的公式、实用的Python代码示例,阐释数据挖掘的知识和技能。每章还给出了习题和练习,帮助读者巩固所学的知识。
本书适合对数据挖掘、数据分析和推荐系统感兴趣的程序员及相关领域的从业者阅读参考;同时,本书也可以作为一本轻松有趣的数据挖掘课程教学参考书。

《写给程序员的数据挖掘实践指南》


【异周话题 第 4 期】获奖名单

图像说明文字

恭喜以上 4 位获奖的同学,请 4 位同学私信小编,并提供收件人姓名收件地址邮编联系电话,小编会尽快将《写给程序员的数据挖掘实践指南》寄到各位同学的手中!

2 推荐
  • Guibs 今年 10-15 09:27

    关于数据挖掘的学习,我认为,首先要关注的并不是语言、框架工具等方面,作为第一步,我们应当先确定自己所需要进行数据挖掘的数据方向。根据以往的工作经验来看,不同方向的数据,由于数据采集、清洗等过程的差异,会造成数据结构的重大差异。因此,第一步是要先确立自己所感兴趣以及所需要的数据方向,而后根据所确立的方向,进行语言及工具的选择。

    在具体的挖掘过程中,则是要注重数据的实际使用常识。要将数据挖掘过程进行阶段化拆分,定期对挖掘结果进行测试并根据测试结果对挖掘方式加以改进。同时,要注意日常挖掘过程中,对资料查阅的方式方法。不要一味信奉,要将资料结果与实际需求相比对后加以利用。

    最后,最重要的,即便是以满足现有需求的挖掘结果,也要时刻保持100%对数据纯度怀疑的原则。

    2
  • Guibs 今年 10-15 09:27

    关于数据挖掘的学习,我认为,首先要关注的并不是语言、框架工具等方面,作为第一步,我们应当先确定自己所需要进行数据挖掘的数据方向。根据以往的工作经验来看,不同方向的数据,由于数据采集、清洗等过程的差异,会造成数据结构的重大差异。因此,第一步是要先确立自己所感兴趣以及所需要的数据方向,而后根据所确立的方向,进行语言及工具的选择。

    在具体的挖掘过程中,则是要注重数据的实际使用常识。要将数据挖掘过程进行阶段化拆分,定期对挖掘结果进行测试并根据测试结果对挖掘方式加以改进。同时,要注意日常挖掘过程中,对资料查阅的方式方法。不要一味信奉,要将资料结果与实际需求相比对后加以利用。

    最后,最重要的,即便是以满足现有需求的挖掘结果,也要时刻保持100%对数据纯度怀疑的原则。

    1
  • 东风玖哥 今年 10-13 10:48

    1.如何入门数据挖掘?需要学习哪些知识请分享你的经验与建议。

    入门数据挖掘首先要精通Java,然后要熟悉Hadoop框架

    3.如何看待数据挖掘的行业前景?如何看到数据工程师的职业前景?请分享你的观点与看法。

    行业前景:靠数据挖掘起家的公司是百度,大多数互联网产品依赖百度的数据挖掘,两款自有数据挖掘的产品一个是淘宝,另一个是微信。

    职业前景:同行业前景

    4.数据挖掘和机器学习有什么区别?你更看好两者之中的哪一个方向?

    数据挖掘和机器学习都是靠海量数据支持的,两者之间的区别在于数据挖掘的目的是从海量数据中偶然地发现非预期但很有价值的信息,而机器学习的目的则是利用经验来改善计算机系统自身的性能。

    5.关于这本《写给程序员的数据挖掘实践指南》

    这本书是2015年出版的,数据挖掘这门学科在2016年以后有个更火的名字——“大数据”

    1
  • xiaocan5221 今年 10-12 18:19

    数据挖掘感觉更像是建造一把超级武器,可以通过简单的调整在海量数据中发现自己需要的数据,进而找出数据背后的规律。

    机器学习感觉像是建造一台超级电脑,掌握了进化的本领,我们只需要设定简单的规则和一定的初始条件,它就可以给我们趋向理想结果的最优解,虽然这个解可能在某些地方很费解,但是它确实是相对最优的,可以革新设计领域,艺术领域等很多个领域。

    就我个人而言更看好数据挖掘领域,一方面随着互联网的浸润和物联网的发展,可以获得的信息越来越多,如何高效有序的处理则显得越来越重要,比如在疾病领域的征兆预测,应用前景就很广。另一方面对于超级智能的先天不信任,我觉得虽然深度学习不会在近期产生人工智能,不过进化这种东西谁也说不清,终结者中的天网虽然暂时不太现实,但三体中的科技爆炸如果在机器智能中产生我想后果会更严重吧……

    2
  • 鸿 今年 10-12 16:54

    数据挖掘,字面理解就是从一堆数据中找出来规律,或者你觉得有价值的数据出来,具体体现在找数据的方法上,这里就应该是书里重点介绍的吧,举一反三,可能会在找目标数据的过程中发现其他有价值的信息。

    机器学习,按照我对数据挖掘的理解,在挖掘出数据的基础上,不断的堆积积累,从而形成惯性,哈哈。。

    2
    • 算法之道
      算法之道 今年 10-12 18:43

      理解错了。。

    • 鸿
      鸿 今年 10-16 12:04

      @堂仔 如何理解呢?看了您的留言,大概也是这意思,利用各种算法整理数据,机器学习也是按着数据模型走的

异步君
异步君 V6

北京 丰台

3.5K经验值

相关技术

相关图书

相关文章