我是15年9月份接触的R语言,当时还没研究生入学,看到师姐电脑里安装了R,百度一查了解到R是统计学方面特别牛掰,适合社科编程小白学习使用。于是我就买了本《R语言实战》,开始了数据科学编程学习之旅。
网上有很多关于数据科学到底该用哪个,哪个到底好,谁更有前途的文章,一搜一大把。但我还是要写一下我的观点:
分析比较这两种语言到底哪个好,得看你的用途。比如我只需要分析数据,即导入数据,分析数据,可视化,那按理说R语言确实很占优势。如果想在学习工作之外再将编程语言应用的话,毫无疑问python更占优势,有句话是这么说的“人生苦短,请用python”。
单就数据分析对比,我认为R的优势有:
-
学习先易后难,不会把小白们吓掉;
-
数据科学的包特别多
-
可视化特别吊
R的缺点也不少:
-
经常更新,更新后经常不支持之前你安装的包;我电脑里安装了10+个R的版本,不停的切换
-
R语言的包、函数名起的很随意,看名字不知道是干什么用的,记不起名字如何让小白使用啊。
-
R语言社区人少,遇到问题你只能自己解决
-
即使有RStudio,写代码还是不方便
下面再说下python,优点:
-
是一门看的懂的,说人话的语言。库名、函数名都很好理解记忆,而且你看别人写的代码基本知道这代码的意思,不信你试试。
-
数据获取占优势,数据分析第一步是数据获取,现在人文社科很多数据需要网上抓取,不过就抓数据而言,python更占优势。各种教程,代码,网上一大片。
-
社区人数特别多,基本你遇到的问题都能找到
python的缺点:
-
学习起来,开头很难,学习曲线与R正好相反。
-
公平起见,我还是写上,python的数据分析库不如R多
-
可视化不如R
其实明眼人一看就知道我偏向python,说下我这两种语言的学习经历。我2015年9月开始学的R,当时觉得自己要读研究生研究网络中的消费者,那肯定要收集数据,分析数据。而R正好都满足,于是我就学啊学,学到12月份,停住了。
今年3月份,老师第一次决定让我研究大数据,从网上收集数据,于是我又拾起R语言,又学了两个月,觉得基础差不多了,那就买本爬虫的书吧《基于R语言的自动数据收集-网络抓取和文本挖掘实用指南》,书是写的很好,把很多相关知识说的很通透,但R语言经常更新,下载安装库特别坑爹,去网上找专家找不到啊,问问商学院同学,没有一个研究R 的,这让我这个小白找谁帮忙帮我解决困难呢。
最关键的是R的收集数据这方面,网上特别少,搜有关R爬虫的也很少。
于是我五月份开始转头学python,而且我是一开始就学python3,坚持选择有前途的版本,坚持。目前我已经可以用python爬数据了,这是我写的第一个完整的爬虫,爬取一BBS论坛所有的帖子标题名。
综合下,建议大家学习python,语言通俗易懂,功能强大,越来越简单
欢迎关注公众号 大邓带你玩转python
大邓带你玩转python每周有直播哦,扫码即可加入
网友评论