华尔街金融爬虫-python实践

作者: 极致简洁 | 来源:发表于2017-10-12 17:13 被阅读0次

本次爬虫并没有什么特殊的技术，写这个小爬虫主要是为了巩固一下所学到的知识，防止遗忘。
好了，话不多说，本次抓取的是华尔街实时新闻，大家可自主选择需要抓取的channel，或者搞个并发，同时抓取五个channel。

#!/usr/bin/env python
# -*- coding:utf-8
import requests
import time
import pandas as pd
from collections import OrderedDict
def getNewsDetail(item_list):
    news_list = []
    for item in item_list:
        news=OrderedDict()
        news['time'] = time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(item['display_time']))
        news['id']   = item['id']
        news['content'] = item['content_text']
        news_list.append(news)
    return news_list

APIurl = 'https://api-prod.wallstreetcn.com/apiv1/content/lives'
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36',
            'Accept':'application/json, text/plain, */*'}

pc_params = {'channel':'global-channel',
        'client':'pc',
        'cursor':0,
        'limit':40}

news_list = []
for Loop_count in range(5): 
    resp = requests.get(APIurl,headers=headers,params=pc_params)
    content = resp.json()['data']
    pc_params['cursor'] = content['next_cursor']
    news_list.extend(getNewsDetail(content['items']))

df = pd.DataFrame(news_list)
df.to_excel('华尔街.xlsx')

网友评论

本文标题：华尔街金融爬虫-python实践

本文链接：https://www.haomeiwen.com/subject/kjdoyxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

华尔街金融爬虫-python实践

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

爬虫专题

大数据爬虫Python AI Sql

华尔街金融爬虫-python实践

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

爬虫专题

大数据 爬虫Python AI Sql

大数据爬虫Python AI Sql