美文网首页HACKER
爬取图片链接(让简书更漂亮)

爬取图片链接(让简书更漂亮)

作者: 关guan关guan | 来源:发表于2017-11-03 11:39 被阅读0次

最近开了简书,准备在简书中找些有feel的图片作为插图,刚好也有目标网站的图片链接,但是由于有300+张,不方便一张张下载,所以写了个小工具,直接上java代码:

package com.guanstudy;

import java.io.DataInputStream;
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.UnsupportedEncodingException;
import java.net.MalformedURLException;
import java.net.URL;

public class HelloWorld {
  public static void main(String[] args) throws UnsupportedEncodingException {
    for(int i=0;i<355;i++){
      downloadPicture("http://www.***.com/images_pub/pub_"+(i+1)+".jpg","/Users/user/Documents/pics/pub_"+(i+1)+".jpg"); 
    }
  }

  public static void downloadPicture(String urlString, String path) {
    URL url = null;
    try {
      url = new URL(urlString);
      DataInputStream dataInputStream = new DataInputStream(url.openStream());
      FileOutputStream fileOutputStream = new FileOutputStream(new File(path));
      byte[] buffer = new byte[1024];
      int length;
      while ((length = dataInputStream.read(buffer)) > 0) {
        fileOutputStream.write(buffer, 0, length);
      }
      dataInputStream.close();
      fileOutputStream.close();
    } catch (MalformedURLException e) {
      e.printStackTrace();
    } catch (IOException e) {
      e.printStackTrace();
    }
  }
}
fox

相关文章

  • 爬取图片链接(让简书更漂亮)

    最近开了简书,准备在简书中找些有feel的图片作为插图,刚好也有目标网站的图片链接,但是由于有300+张,不方便一...

  • Python 爬虫实战计划:第一周第三节作业

    第三节:爬取小猪短租租房信息要求:1. 爬取详情页面内的:标题,地址,租金,第一张房源图片链接,房东图片链接,房东...

  • 简书用户动态信息爬虫

    第一步 爬取简书推荐用户 爬取简书推荐用户,加入到用户信息表(第一批用户) 第二步 从推荐用户出发,爬取每个推荐用...

  • 简书用户动态信息爬虫

    第一步 爬取简书推荐用户 爬取简书推荐用户,加入到用户信息表(第一批用户) 第二步 从推荐用户出发,爬取每个推荐用...

  • 爬取简书文章

    爬取目标:简书七日热门的文章数据(如标题,作者,阅读量,评论,喜欢等等),并把这些数据存放到Mongodb中! 接...

  • 初识scrapy爬取糗事百科全部段子

    爬取糗事百科所有段子加上作者(图片部分不做爬取)效果 感谢简书作者xiyouMc的建议和他的作品爬取成人网xiyo...

  • Python爬虫:基于Scrapy的淘宝登陆后实现数据爬取并保存

    介绍: 本次数据爬取只进行一些简单数据的爬取,如商品标题、价格、图片链接以及详情页中的销量、评价和送的天猫积分,相...

  • 使用Scrapy框架 爬取简书首页文章(Selenium)

    直接贴代码 解析可参考: 使用Scrapy框架 爬取简书首页文章(XPath)缺点:爬取速度太慢 需要等待2s ,...

  • 简书风云榜

    由于开学原因,数据爬取中断,共爬取了347294条数据。 爬取时间为2月14号。 以粉丝量进行排序排名,列出简书千...

  • 爬取Amazon商品销售排行榜

    概要:基于python实现Amazon商品排行榜爬取:排名、商品标题、商品链接、星级、评论数、图片链接、价格。关注...

网友评论

    本文标题:爬取图片链接(让简书更漂亮)

    本文链接:https://www.haomeiwen.com/subject/ppftmxtx.html