美文网首页
2018-12-17数据

2018-12-17数据

作者: 最近练习R语言 | 来源:发表于2018-12-19 08:06 被阅读0次

    结构数据

    • xml
    • json

    非结构化数据

    • html
      处理方法 xpath 正则表达式

    json

    • 怎么找json的url地址?
    1. response 搜不到中文实属正常,去preview中搜索
    2. 还没有想要的数据,搜英文与数字
    3. 不在这个响应里,可能在其他的里面 可能js生成(数据太多则不 太可能)
    4. css 与 js 响应可以不用看
    5. 有没有比较简单的方法找对应相应?
    • XHR Ajax请求ctrl 按住,选择文件
    • search all files 搜数字,再搜相关'subject',找到对应响应url
    • 找到响应发现并不是json怎么办?json应该像字典 --->正则表达式&

    并不是每个网站用chrome的手机版登陆都能返回json
    抓包手机APP&楼上的方法

    从json中提取数据,变为python的数据

    • json.loads&json.dumps
    str.decode(encoding='UTF-8',errors='strict')
    
    from pprint import pprint
    pprint(字典)
    

    json.dumps将python类型转化为json(字符串)

    f.write(json.dumps(dict))
    写入的时候,ascii默认将内容用码编码写入json
    
    with open('douban.json','w',encoding='utf-8') as f#(默认用utf-8打开)         
         f.write(json.dumps(ret1,ensure_ascii=False,indent=2)#写入时别转换成ascii了        
    

    json字符串使用注意点

    归根到底,‘json’字符串是‘字符串str'

    • 字符串都是由双引号括起来的
      • 如果不是双引号
        • eval :能实现简单的字符串与python之间的转化
        • replace : 把单引号替换为双引号
    str = "this is string example....wow!!! this is really string";
    print str.replace("is", "was");
    print str.replace("is", "was", 3)
    

    相关文章

      网友评论

          本文标题:2018-12-17数据

          本文链接:https://www.haomeiwen.com/subject/nyhckqtx.html