新闻中心

EEPW首页 > 智能计算 > 牛人业话 > 谁才是机器学习时代最合适的编程语言?

谁才是机器学习时代最合适的编程语言?

作者:时间:2017-11-23来源:网络收藏

  开发者到底应该学习哪种编程语言才能获得或数据科学这类工作呢?这是一个非常重要的问题。我们在许多论坛上都有讨论过。现在,我可以提供我自己的答案并解释原因,但我们先看一些数据。毕竟,这是者和数据科学家应该做的事情:看数据,而不是看观点。

本文引用地址:http://www.eepw.com.cn/article/201711/371947.htm

  让我们看一些数据。我将在Indeed.com上使用趋势搜索。它可以根据时间搜寻实际工作机会中特定的条款。这表明了雇主们正在寻找拥有该技能的人才。然而,请注意,这并不是一项有效使用技能的民意调查。这种指标更能体现技能的受欢迎程度。

  话不多说,上数据。我搜索了与“”和“数据科学”一起使用的技能,搜索选项包括编程语言Java、C、C+++和JavaScript。然后还包括了和R,因为我们知道它在机器学习和数据科学方面很受欢迎,当然还有Scala,考虑到它与Spark的关系,再加上Julia,一些开发中认为这是“the next big thing”。运行这个查询,我们得到的数据如下:

    

 

  当我们关注机器学习时,我们得到了类似的数据:

    

 

  我们能从这些数据中得到什么启示呢?

  首先,我们看到并不是一招通吃。在这种情况下,各种机器学习编程语言都很受欢迎。

  其次,所有这些编程语言都在急剧增长,反映出在过去几年里,企业对机器学习和数据科学的关注和需求正在急速增加。

  第三,很明显的领导者,其次是Java,然后是R,再然后是C++。对Java的领先优势正在增加,而Java在R上的领先地位正在下降。必须承认,我很惊讶地看到Java名列第二;我本来是以为是R语言。

  第四,Scala的增长令人印象深刻。它在三年前几乎是不存在的,现在和这些成熟的编程语言几乎在同一个层面。当我们切换到Indeed.com上的数据的相对视图时,这更容易发现。

    

 

  第五,Julia的受欢迎程度虽然不明显,但肯定有上升的趋势。Julia将成为一种流行机器学习和数据科学编程语言吗?未来会告诉你。

  如果我们忽略Scala和Julia,以便能够聚焦其他编程语言的增长,那么我们毫无疑问可以确认:Python和R的增长速度要快于通用语言。

    

 

  考虑到增长率的差异,R的受欢迎程度可能很快就会超过Java。

  当我们专注于深度学习这个问题时,数据是完全不同的:

    

 

  这时,Python仍然是领导者,但C++现在是第二,然后是Java,而C在第四,R只在第5。这里显然强调了高性能计算语言。Java正在快速发展。它可以很快达到第二名,就像一般的机器学习一样。R不会很快接近顶部。令我惊讶的是Lua的缺席,尽管它在一个主要的深度学习框架(orch)中使用,而Julia不存在。

  到这时,到底哪种语言才是最受欢迎的编程语言呢?答案应该很清楚了。当涉及到机器学习和数据科学工作时,Python、Java和R是最流行的技能。如果你想专注于深度学习,而不是一般的机器学习,那么,在某种程度上来说C++、C也是值得考虑的。然而,请记住,这只是看待问题的一种方式。如果你想找一份工作,或者你只是想在业余时间学习机器学习和数据科学,你可能会得到不同的答案。

  我的个人答案呢?除了有许多顶级机器学习框架的支持之外,Python对我来说很适合,因为我有计算机科学的背景。对于开发新的算法,我也会感到很舒服,因为我的大部分职业生涯都是用这种语言编程的。但这就是我,有不同背景的人可能会觉得用另一种语言更好。一个拥有有限编程技能的统计学家肯定会更喜欢R。一个强大的Java开发人员可以使用他最喜欢的语言,因为有大量的Java API的开放源代码。对于这些图表上的任何一种语言,都可以有类似的例子。

  因此,我的建议是,在花大量时间学习一门语言之前,根据自己的情况来决定选择哪种编程语言,切记千万不可跟风。



关键词: 机器学习 Python

评论


相关推荐

技术专区

关闭