美文网首页
python笔试试题

python笔试试题

作者: sidyph | 来源:发表于2019-04-25 08:48 被阅读0次

    说明:提交做题时的录屏视频。

    1、爬虫类(选1题)

    (1)爬深交所2019-03-26这一天上市公司公告,结果保存为dataframe格式。地址:http://www.szse.cn/disclosure/listed/notice/index.html

    (2)爬中国货币网机构信息,结果保存为dataframe格式。地址: http://www.chinamoney.com.cn/chinese/qwjsn/?searchValue=

    2、抓取豆瓣新片榜的前10个电影,要求利用lxml抓取html页面、xpath定位电影,并且按顺序排成一个list。

    3、利用re抽取以下数据,并利用json库解析成dict数据。

    a_str = ' jsonpCallback92685{"areaName":"","csrcCode":"","downloadFileName":null,"execlStream":null,"jsonCallBack":"jsonpCallback92685","pageHelp":{"beginPage":1,"cacheSize":1,"data":1,"stockCode":"","stockType":"1"}}'

    4、

    aa1 = [['高速1',56656],['高速2(备注)',5662],['高速3[1]',545],['高速4',775],['高速6',78]]

    aa2 = [['高速1',78798],['高速2',6524445],['高速3',343],['高速4',21215],['高速5',21215]]

    将上面两个列表转为dataframe格式,

    将aa2的转为2016的日均收入。

    并且按照外联结的方式合并成一个dataframe

    5、

    df_list = [['','干扰列1','营业收入','干扰列2'],['高速1',23434,45454,5454],['高速2',6756,24,5465454],['高速3',3435,45454,5656],['其他项目',3435,45454,8989]]

    将该列表转化为dataframe格式后,从中抽取出营业收入列和高速x所在的行数据,并保存为excel格式(显示列表头,但不显示行表头)。

    相关文章

      网友评论

          本文标题:python笔试试题

          本文链接:https://www.haomeiwen.com/subject/rjoogqtx.html