commons-httpclient项目初始化
1,创建项目并添加git控制
本次仓库提交:https://gitee.com/michael-first/commons_httpclient/commit/53a402babad13714bf416e43cc833cc28ed326c6
2,第一次修改pom.xml文件
- 添加commons-httpclient、log4j两个依赖;
- 将编译Java 代码的JDK指定为1.8版本;
- 修改maven远程下载仓库
本次仓库提交:https://gitee.com/michael-first/commons_httpclient/commit/491354ce3d7b0fe20975c13d7c1279ee606146f2
3,添加正则表达式工具类RegexUtil
-
关于Java的Pattern与Matcher类参考文章:https://www.jianshu.com/p/9c0043dd93ba
-
关于懒惰匹配
String regexStr = "a(.*?)a";
参考文章:https://www.jianshu.com/p/d5aba1714c26
本次仓库提交:https://gitee.com/michael-first/commons_httpclient/commit/beb02f28e576e563e34205c304f6111c8a8b2e9f
4,CrawlBase可以请求页面比如get请求简书,log4j日志控制台和文件输出配置完成
本次仓库提交:https://gitee.com/michael-first/commons_httpclient/commit/60c4f535f12418e53c2ca38903c284004b0fe5de
网友评论