数据科学家常用的工具有哪些?

作者: 大圣众包 | 来源:发表于2016-08-31 11:48 被阅读177次

    工具/产品/解决方案是数据科学家洞察数据的利器。KDNuggets网站对此观点进行了年度调查,来分析数据科学家在用哪些类型的工具。下面大圣众包小编整理了对大数据从业的你可能会有些帮助的工具!

    数据科学常用的工具有哪些?

    大数据生态(Hadoop、Spark)和开源项目:

    Hadoop,HBase,Hive,Mahout,MLlib,OtherHadoop/HDFSbasedtools,Pig,Scala,Spark,SQLonHadooptools

    微软数据科学家工具:

    MicrosoftAzureML,MicrosoftPowerBI,MicrosoftSQLServer,RevolutionAnalytics

    基于Python的机器学习:

    Dataiku,H2O(0xdata),Python,scikit-learn,Theano,Vowpal Wabbit

    SAS公司产品:

    JMP,SAS Base,SAS Enterprise Miner

    MATLAB、R语言等统计工具:

    GnuOctave,MATLAB,Orange,R,Rapid Miner,Rattle,Weka

    IBM公司产品:

    IBM Cognos,IBM SPSSModeler,IBM SPSSStatistics,IBM WatsonAnalytics

    Linux工具和SQLang:

    Actian,C/C++,Perl,SQLang,Unixshell/awk/gawk

    深度学习:

    Caffe,Pylearn2

    商务智能软件:

    PentahoandQlikView

    数据分析平台:

    Datameer and Zementis

    Excel和Word统计工具:

    XLSTAT for Excel

    其它:

    OtherDeep Learningtools,Other free analytics/data mining tools,Other Hadoop/HDF based tools,Other paid analytics/datamining/datascience software,Other programming languages

    数据可视化:

    C4.5/C5.0/See5,Miner3D,OracleDataMiner

    数据科学家在选择大数据、数据挖掘和数据分析工具时,更倾向于有一定生态基础的工具,这样各个工具间可以相互支持。

    为了提高在大数据项目中成功的机会,选择正确的工具是非常重要的。没有一个孤立的工具能够做所有的数据分析,职业的数据专家趋向于使用不止一种相关的工具(分析中发现,数据专家平均使用5种数据分析工具)。你可以根据使用相关工具的数据专家来决定自己的选择。

    另外一个观点是,要选择大厂的产品,比如,IBM、微软和SAS,大品牌的产品更丰富,可以使得你的产品更容易扩展。

    (更多大数据与商业智能领域干货、兼职机会请关注大圣众包平台,或添加大圣花花个人微信号(dashenghuaer),拉你入bigdata&BI交流群330648564。)

    相关文章

      网友评论

        本文标题:数据科学家常用的工具有哪些?

        本文链接:https://www.haomeiwen.com/subject/hlbqettx.html