美文网首页
Python小试牛刀

Python小试牛刀

作者: 小樓 | 来源:发表于2014-01-30 00:08 被阅读136次

我 Python完全新手一个,才看了教程没两天,但是今天正好碰到难题,就决定拿Python实验一下,没想到竟然就成功了。那种成就感不言而喻。流程记录一下。

动因

最后的论文决定写和 IPO有关的内容,本来设定的时间范围是 01.2011 - 12.2013。可是昨天真的去找数据的时候,才发现数据库里的数据还没有更新一三年最后一个季度的。先不说别的,首先就是那三个季度里的 IPO的公司,我找不到他们的行业代码(SIC),初步筛选都做不了,又舍不得把这些公司全部剔除。

好在SEC的官网上有每家公司的 SIC信息,但是比较痛苦的是,SEC的搜索引擎一次只能搜索一家公司,出来一个公司的结果。也就是说,如果我要把缺的信息全部找到,我起码得搜索近二百次。这时候,我就开始打 Python的注意了。

目的

写之前,我已经想好大概这个小程序有什么样的功能。说来其实也很简单,我那时候已经发现 SEC搜索引擎给出的每个公司的页面地址是规律而固定的,我用 Excel很轻易地已经把所有将近二百个公司的查询结果页面的地址写出来了。所以,程序的目的就是便访这些地址,把期中带 “SIC=” 字样的信息和后四位数字摘取出来,生成文件。

代码

目的明确以后,凭着脑海里面对 Python那唯一一点理解,和网络上无数好心人的文章,终于捉摸出来了代码,并且运行成功。贴在这里,留个纪念,并请多指教。

out = open('C:/....../sic.txt','w') import urllib.request import re a = [ 'http://....', 'http://....', ...... ...... ...... 'http://....', 'http://....' ] for i in range(len(a)): response=urllib.request.urlopen(a[i]) html=response.read().decode("utf-8") s=re.search(r'(\SIC=....)',html) if s: print(s.group(0),file=out) else: print('sorry, no sic!',file=out) out.close()

相关文章

  • 小试牛刀--Python爬虫BeautifulSoup使用

    python爬数据小试牛刀--beautifulSoup使用 1.环境配置 编译环境:python 2.7 编译器...

  • 基础·函数

    Python基础教程 函数定义 小试牛刀 参数 因为python中的变量没有明确标明类型,所以函数中可以直接使用一...

  • python入门(一)

    小试牛刀,看到自动化测试需要用Python写脚本,又重拾起之前半途而废的Python啦。 按照Python大牛推荐...

  • Python小试牛刀

    我 Python完全新手一个,才看了教程没两天,但是今天正好碰到难题,就决定拿Python实验一下,没想到竟然就成...

  • python二级--python内置的is前缀的函数,你知道哪些

    一、小试牛刀 二、细说那些python内置的is前缀的函数 三、实例 1、s.islower() 输出结果: 2、...

  • python找茬系列15-赋值语句

    一、小试牛刀 输出结果: 二、分析 1、难点 上述写法称为同步赋值语句 2、赋值语句 【1】python普通赋值语...

  • Python小试牛刀二

    继续上次的话题,今天的目的是要抓取给定公司上市一个月内的股价。 貌似我用了比脚笨的办法,不过不管怎么说还是成功了。...

  • 2018/04/10

    小试牛刀。

  • 水粉画

    小试牛刀

  • 谁表白

    小试牛刀

网友评论

      本文标题:Python小试牛刀

      本文链接:https://www.haomeiwen.com/subject/xgnctttx.html