美文网首页R炒面
104-linux mint安装配置RSelenium

104-linux mint安装配置RSelenium

作者: wonphen | 来源:发表于2020-12-03 19:45 被阅读0次

注意:一定要注意浏览器与对应驱动间的版本对应关系,否则会报错。

1、Firefox浏览器

Firefox与对应的geckodriver:
火狐下载:http://ftp.mozilla.org/pub/firefox/releases/
geckodriver下载:https://github.com/mozilla/geckodriver/releases
geckodriver下载后解压放到火狐浏览器的安装文件夹下。查看Firefox的安装目录:
bash中输入:

whereis firefox
## firefox: /usr/bin/firefox /usr/lib/firefox /etc/firefox /usr/share/man/man1/firefox.1.gz

默认是在/usr/lib/firefox文件夹中。不确定的话可以再次查询:

ll /usr/bin/firefox

2、chrome浏览器

下载地址:http://npm.taobao.org/mirrors/chromedriver/
下载后将chrome driver解压放到chrome的安装目录,查询目录位置:

which google-chrome-stable
## /usr/bin/google-chrome-stable

但这个不是真正的目录,只是一个软连接,再次查询:

ll /usr/bin/google-chrome-stable
## lrwxrwxrwx 1 root root 32 5月  15  2018 /usr/bin/google-chrome-stable -> /opt/google/chrome/google-chrome*

得到真实安装目录为/opt/google/chrome/。
Google Chrome与chrome driver对应表:


对应版本

Google Chrome Linux Version:64-bit deb for Ubuntu/Debian

Version Size Date
86.0.4240.75 67.85 MB 2020-10-7
84.0.4147.135 66.36 MB 2020-08-20
83.0.4103.116 65.47 MB 2020-07-6
81.0.4044.92 63.58 MB 2020-04-13
80.0.3987.149 60.21 MB 2020-03-23
79.0.3945.88 59.3 MB 2019-12-29
78.0.3904.97 59.49 MB 2019-11-12
76.0.3809.100 56.72 MB 2019-08-15
75.0.3770.80 56.21 MB 2019-06-5
71.0.3578.80 53.98 MB 2018-12-11
70.0.3538.77 53.46 MB 2018-11-6
69.0.3497.92 52.27 MB 2018-09-16
68.0.3440.84 51.57 MB 2020-04-29
67.0.3396.79 50.1 MB 2020-04-29
66.0.3359.181 49.91 MB 2020-04-29
65.0.3325.181 49.72 MB 2020-04-29
64.0.3282.140 49.29 MB 2020-04-29
63.0.3239.108 46.76 MB 2020-04-29
62.0.3202.75 46.47 MB 2020-04-29
61.0.3163.79 62.5 MB 2020-04-29
60.0.3112.90 55.65 MB 2020-04-29
59.0.3071.86 58.02 MB 2020-04-29
58.0.3029.96 51.44 MB 2020-04-29
57.0.2987.133 45.13 MB 2020-04-29
56.0.2924.87 43.77 MB 2020-04-29
55.0.2883.75 43.96 MB 2020-04-29
54.0.2840.71 43.42 MB 2020-04-29
53.0.2785.116 47.87 MB 2020-04-29
52.0.2743.116 46.98 MB 2020-04-29
51.0.2704.84 47.17 MB 2020-04-29
50.0.2661.75 46.12 MB 2020-04-29
49.0.2623.75 46.5 MB 2020-04-29
48.0.2564.109 45.84 MB 2020-04-29

3、使用

使用前一定要提前安装好java,下载地址:https://www.java.com/en/download/,安装配置过程网上搜索。
下载selenium standalone版本,并放至指定位置,下载地址:http://www.seleniumhq.org/download/
然后手动运行selenium-server-standalone,启动selenium。在R或RStudio中运行:

system("java -jar ~/selenium-server-standalone-4.0.0-alpha-1.jar", wait = FALSE)

或者手动打开bash命令,注意运行时不要关闭窗口:

java -jar ~/selenium-server-standalone-4.0.0-alpha-1.jar
library(pacman)
p_load(RSelenium)
# 前面已经运行过
# system("java -jar ~/selenium-server-standalone-4.0.0-alpha-1.jar", wait = FALSE)

# 连接并打开chrome
remDr <- remoteDriver(browserName = "chrome")
# 打开浏览器
remDr$open()

可以开始爬虫了。

相关文章

网友评论

    本文标题:104-linux mint安装配置RSelenium

    本文链接:https://www.haomeiwen.com/subject/ushvwktx.html