新东方网>留学>留学生活>工作学习>正文

Kaggle——数据科学领域的“华山论剑”

2022-01-14 13:06

来源:前途出国

作者:zhangxiupu

  1.Kaggle是什么?

  Kaggle公司是由联合创始人兼首 席执行官AnthonyGoldbloom2010年在墨尔本创立的,主要是为开发商和数据科学家提供举办机器学习竞赛、托管数据库、编写和分享代码的平台。这一平台已经吸引了许多科学家和开发者的关注,他们也纷纷入驻这一平台。这些科学家和开发者资源正是谷歌看中他们的地方。

  数据科学社区一直有这样一个难题:对于同一个问题,可以有多个模型来解决,但是研究者不可能在一开始就了解哪些模型是最 好的。Kaggle就是为了解决这样的问题诞生的,它试图通过众包的形式来解决这一难题。在这个平台上,企业和研究者可在其上发布数据和问题,并提供奖金给能解决问题的人。多个数据分析相关的能人志士在其上进行竞赛以产生最 好的模型来解决问题。进而使数据科学成为一场运动。这就好比,金庸小说里的华山论剑,吸引了江湖各大有武功的人前来。同样的,Kaggle就是数据科学领域的“华山论剑”,吸引了来自数据分析,机器学习,深度学习等领域的人。

  Kaggle 官网:https://www.kaggle.com/

  2.什么人会使用Kaggle?

  参赛者主要分为下面两种:

  1)一种是以奖金和排名为目的,包括靠奖金为生的职业Kaggler。这些人有丰富的数据分析,机器学习工作经验的业内人士。

  2)一种就是以提升相关技能和背景为目的业余爱好者甚至在校学生了。这类型人有一定技术能力,但经验欠缺,是想从中进行学习和锻炼的“长江后浪”。

  3.在Kaggle上做项目对你找工作有什么用?

  1)用Kaggle项目经验弥补你没有工作经验的不足

  把Kaggle上的项目经验写在你的简历上可以很直观的展现自己的能力,同时作为你的项目经验。

  2)Kaggle的Profile是你能力的证明

  Kaggle竞赛另一个有趣的地方在于每个人都有自己的Profile(个人资料),上面会显示所有你自己参与过的项目、活跃度、实时排位、历史最 佳排位等,看上去非常有成就感。

  同时,Kaggle作为数据科学业内享有盛名的平台,在业界拥有非常高的认可度。所以如果你是想寻找相关行业的工作,当你把这个Kaggle Profile的地址放到你的求职简历里,会被优先录取。

  正如在回答“kaggle的比赛在机器学习领域中属于什么地位”里说的:

  写上参加过Kaggle比赛,我会看简历。

  得过一次10%,我会给电话面试。

  得过2次或者以上10%,我会给on site面试。

  得过一次前10,我们会谈笑风生。

  (在 Kaggle 上一次比赛的结果除了排名以外,还会显示三挡: Prize Winner,10% , 25% 。所以刚刚接触Kaggle 的人很多都会以 25% 或是 10% 为目标。)

  4.Kaggle上的项目竞赛分成下面4个最常见的类别

  1)Featured:这些通常是由公司、组织甚至政府赞助的,奖金池最大。

  2)Research:这些是研究方向的竞赛,只有很少或没有奖金。它们也有非传统的提交流程。

  3)Recruitment:这些是由想要招聘数据科学家的公司赞助的。目前仍然相对少见。

  4)Getting Started(练习项目):这些竞赛的结构和 Featured 竞赛类似,但没有奖金。它们有更简单的数据集、大量教程。

  如果你从未独立做过一个数据分析相关的项目,就从Getting Started(练习项目)开始入门。练习项目不仅难度低,并且还有很多社区创造的教程,你可以用来对比改善自己的测试结果,从中进行提高。

新东方托福

新东方留学考试辅导专区

班级名称 上课地点 上课时间 费用 详细

焦点推荐

版权及免责声明

凡本网注明"稿件来源:新东方"的所有文字、图片和音视频稿件,版权均属新东方教育科技集团(含本网和新东方网) 所有,任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他任何方式复制、发表。已经本网协议授权的媒体、网站,在下载使用时必须注明"稿件来源:新东方",违者本网将依法追究法律责任。

本网未注明"稿件来源:新东方"的文/图等稿件均为转载稿,本网转载仅基于传递更多信息之目的,并不意味着赞同转载稿的观点或证实其内容的真实性。如其他媒体、网站或个人从本网下载使用,必须保留本网注明的"稿件来源",并自负版权等法律责任。如擅自篡改为"稿件来源:新东方",本网将依法追究法律责任。

如本网转载稿涉及版权等问题,请作者见稿后在两周内速来电与新东方网联系,电话:010-60908555。