美文网首页高级框架
HttpClient 4.5.2-(一)入门

HttpClient 4.5.2-(一)入门

作者: 大漠知秋 | 来源:发表于2017-07-17 23:39 被阅读0次

最近深度学习了下HttpClient 4.5.2,大家都知道,HttpClient 是Apache Jakarta Common 下的子项目,可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包,并且它支持 HTTP 协议最新的版本和建议

理解不是太深刻,理解错误之处还请指出。废话不多说,开始记录。


使用工具
  • HttpClient 4.5.2
  • maven地址
    <dependency> <groupId>org.apache.httpcomponents</groupId> <artifactId>httpclient</artifactId> <version>4.5.2</version> </dependency>
public static void main(String[] args) {
    // 获取连接客户端工具
    CloseableHttpClient httpClient = HttpClients.createDefault();
    // 创建GET请求对象
    HttpGet httpGet = new HttpGet("https://www.baidu.com");
    
    String entityStr = null;
    CloseableHttpResponse response = null;

    try {
            
        // 执行请求
        response = httpClient.execute(httpGet);
        // 获得响应的实体对象
        HttpEntity entity = response.getEntity();
      // 使用Apache提供的工具类进行转换成字符串
        entityStr = EntityUtils.toString(entity);
        
    } catch (ClientProtocolException e) {
        System.err.println("Http协议出现问题");
        e.printStackTrace();
    } catch (ParseException e) {
        System.err.println("解析错误");
        e.printStackTrace();
    } catch (IOException e) {
        System.err.println("IO异常");
        e.printStackTrace();
    } finally {
        if (null != response) {
            try {
                // 释放连接
                response.close();
                httpClient.close();
            } catch (IOException e) {
                System.err.println("释放连接出错");
                e.printStackTrace();
            }
        }
    }
    
    // 打印响应内容
    System.out.println(entityStr);
}

我们平常使用浏览器进行访问网站时,httpClient 就相当于浏览器的一个标签页httpGet 就相当于浏览器上面的每一个超连接。我们需要建立在已经存在标签页的基础上,才能发起一个新的请求。EntityUtils就相当于浏览器的渲染引擎,把服务端响应回来的数据解析出来,当然,这里解析出来的是字符串,而浏览器解析出来的结果是已经渲染好的界面。httpClient的每一次访问都需要开启一个Http连接,而每一个Http连接都是很珍贵的,随意这地方后边会使用连接池进行管理。

  • 打印结果:
乱码结果乱码结果
  上图所示,出现响应结果,但是细心可以发现,有一部分是 乱码显示,这部分为中文乱码

解决办法是把上面代码中的entityStr = EntityUtils.toString(entity);修改成entityStr = EntityUtils.toString(entity, "UTF-8");指定编码格式解析响应数据即可解决;

  • 打印结果:
正确结果正确结果
  • 关于消耗HTTP实体内容

HttpClient推荐使用HttpEntity的getConent()方法或者HttpEntity的writeTo(OutputStream)方法来消耗掉Http实体内容。HttpClient也提供了EntityUtils这个类,这个类提供一些静态方法可以更容易地读取Http实体的内容和信息。和以java.io.InputStream流读取内容的方式相比,EntityUtils提供的方法可以以字符串或者字节数组的形式读取Http实体。但是,强烈不推荐使用EntityUtils这个类,除非目标服务器发出的响应是可信任的,并且http响应实体的长度不会过大

有些情况下,我们希望可以重复读取Http实体的内容。这就需要把Http实体内容缓存在内存或者磁盘上。最简单的方法就是把Http Entity转化成BufferedHttpEntity,这样就把原Http实体的内容缓冲到了内存中。后面我们就可以重复读取BufferedHttpEntity中的内容。

CloseableHttpResponse response = <...>
HttpEntity entity = response.getEntity();
if (entity != null) {
    entity = new BufferedHttpEntity(entity);
}
借鉴:HttpClient 4.3教程

入门结束,下一节记录【为GET和POST请求添加请求参数请求头

相关文章

网友评论

    本文标题:HttpClient 4.5.2-(一)入门

    本文链接:https://www.haomeiwen.com/subject/htvqkxtx.html