美文网首页python自学爬虫
代码小工蚁Python学习之json模块

代码小工蚁Python学习之json模块

作者: 代码小工蚁 | 来源:发表于2018-01-03 12:06 被阅读64次

代码小工蚁Python学习之json模块

一、什么是JSON
什么是JSON,网上搜索是:

JavaScript Object Notation(JS 对象标记),简称JSON,JSON是一种轻量级的数据交换格式。
JSON是基于 ECMAScript (w3c制定的js规范)的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据。
简洁和清晰的层次结构使得 JSON 成为理想的数据交换语言。
易于人阅读和编写,同时也易于机器解析和生成,并有效地提升网络传输效率。

简单地说,JSON是指有类型的键值对 key:value 构建的信息表达方式。如:

"name":"AntsPi"
"number":2018
"objects":{"comment":"hello","newname":"Python"}
"array":[2,0,1,8,"Year","数组内可放任何信息"]

其中:
键:一定要使用引号""来表示键(注意必须是双引号)!
值:支持多种数据类型,如:

字符串: “hello”, “\"A quote.\”“, ”\u0abe", “Newline.\n”
数字: 23, 0.11, 12e10, 3.141e-10, 1.23e+4
对象: { “key”: “value” }
数组: [“Values”]
其他: true, false, null

注意:纯正的JSON实际上是没有注释的。

小知识:信息标记的三种形式:XML、JSON、YAML

主流编程语言都支持JSON,如Javascript、Java、C/C++/C#、Fortran、Lua、Matlab、Python、Ruby等[1]
通过 JSON,不同编程语言之间可以方便地交换数据。

JSON简明教程可参考:
X分钟速成Y Y=JSON
https://learnxinyminutes.com/docs/zh-cn/json-cn/

二、Python中的json模块
1、python支持json操作。使用前先导入库import json。
import json

2、json模块最常用到的操作
json操作有以下4个方法:
json.dumps(): 对数据进行编码,将python对象序列化(Serialize)成JSON格式的字符串str(python转json)。
json.loads(): 对数据进行解码,将包含JSON文档的str、bytes、bytearray实例反序列化(Deserialize)成Python对象(json转python)。
json.dump(): Python对象序列化成文件(json格式)
json.load(): 文件(json格式)反序列化成Python对象

这里的术语“序列化”可理解成:将对象的状态信息(内存变量)保存成文件或者转换成适合网络传输的数据形式。
与之相对应的,“反序列化”则可以通过读取文件或接收网络传输的数据,重新创建该对象的状态信息(内存变量)。

特别注意:python中的序列化与反序列化并不是完全互逆的关系!
由于JSON键值对中的键是str类型,当字典转换成JSON时,字典的键都会被强制转换成字符串。
如果字典中有非字符串的键,此时执行loads(dumps(x))的结果并不会与原有的x相同。
即:loads(dumps(x)) != x

序列化或反序列化操作中会遵循以下规则:
默认按以下类型编码(序列化):

    +-------------------+---------------+
    | Python            | JSON          |
    +===================+===============+
    | dict              | object        |
    +-------------------+---------------+
    | list, tuple       | array         |
    +-------------------+---------------+
    | str               | string        |
    +-------------------+---------------+
    | int, float        | number        |
    +-------------------+---------------+
    | True              | true          |
    +-------------------+---------------+
    | False             | false         |
    +-------------------+---------------+
    | None              | null          |
    +-------------------+---------------+

默认按以下类型解码(反序列化):

    +---------------+-------------------+
    | JSON          | Python            |
    +===============+===================+
    | object        | dict              |
    +---------------+-------------------+
    | array         | list              |
    +---------------+-------------------+
    | string        | str               |
    +---------------+-------------------+
    | number (int)  | int               |
    +---------------+-------------------+
    | number (real) | float             |
    +---------------+-------------------+
    | true          | True              |
    +---------------+-------------------+
    | false         | False             |
    +---------------+-------------------+
    | null          | None              |
    +---------------+-------------------+

可以参阅:菜鸟教程[2] 或 python官方资料[3]

深入研究可查看:
python语言安装目录下的json库下的源码。
X:\Python36\Lib\json\decoder.py 和encoder.py

3、实例演示
python程序示例

# coding=utf-8

# JSON操作演示
# datte: 2018-01-03

import json

__author__ = 'AntsPi.com'

dct_demo = {
    "name"      : 'AntsPi',
    "age"       : 102,
    "motto"     : 'Plan for the worst and hope for the best',
    "language"  : 'python',
    "data"      : ['I','Love','Python'],
    }
print(dct_demo)
# 注意输出时的对比,单引号、双引号的变化
print(json.dumps(dct_demo))
print(type(json.dumps(dct_demo))) # 类型为str
# 美化输出:对键排序sort_keys=True,缩进indent=4
print(json.dumps(dct_demo,sort_keys=True,indent=4))
print('-' *60)

lst_demo = ['one','two','three',{"N":90,"E":80,"S":70}]
print(lst_demo)
# 自定义输出分隔符separators=(项分隔符,键分隔符),为元组类型。
# 常用的紧凑输出格式:separators=(',',':')
print(json.dumps(lst_demo, separators=(',',':')))
print('-' *60)

# 百度翻译通用API翻译返回数据,为JSON格式的字符串
bd_ret = '{"from":"en","to":"zh","trans_result":[{"src":"he is a happy man.","dst":"\u4ed6\u662f\u4e00\u4e2a\u5feb\u4e50\u7684\u4eba\u3002"}]}'
ret_dct = json.loads(bd_ret)
print(ret_dct)
# 数据类型已由str,变成dict
print(type(ret_dct))
# 此时可以直接获取字典数据
print(ret_dct["trans_result"][0]["dst"])
print('-' *60)

# 保存JSON文件
with open('person.js','w') as fw:
    json.dump(dct_demo,fw, indent=4)
print('Write JSON file OK.')
print('-' *60)

# 读取JSON文件
with open('person.js','r') as fr:
    read_dct = json.load(fr)
print('Read JSON file.')
print(read_dct)
print('-' *60)

程序运行显示:


程序运行输出

程序运行后生成的文件person.js内容如下图:


JSON文件person.js内容

jQuery读取JSON文件的示例[4]
相应的html文件及配套的jquery-3.2.1.min.js、演示数据文件person.js都要放在网络服务器上。

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>Javascript .getJSON获取JSON数据</title>
<script type="text/javascript" src="jquery-3.2.1.min.js"></script>
<style type="text/css">
    #divframe{border:1px solid #999; width:500px; margin:0 auto;}
    .loadTitle{background:#fff; height:30px;}
</style>
<script type = "text/javascript">
    $(function(){
        $("#btn").click(function(){
            $.getJSON("person.js", function(data){
                var $jsontip = $("#jsonTip");
                var strHtml = "";//存储数据的变量
                $jsontip.empty();//清空内容
                // 获取的data已是JSON数据
                strHtml += "姓名  : " + data["name"] + "<br>";
                strHtml += "年龄  : " + data["age"] + "<br>";
                strHtml += "座右铭 : " + data["motto"] + "<br>";
                strHtml += "编程语言: " + data["language"] + "<br>";
                strHtml += "其它数据: " + data["data"] + "<br>";
                strHtml += "<br>"
                $jsontip.html(strHtml);
                //显示处理后的数据
            })
        })
    })
</script>
</head>
<body>
<div id="divframe">
    <p> 此示例需要放置在服务器端访问</p>
    <div class="loadTitle"><input type="button" value="获取数据" id="btn" /></div>
    <div id="jsonTip"></div>
</div>
</body>
</html>
jQuery读取JSON示例

实验发现的奇怪现象:扩展名为.json的文件不能被服务器端Javascript中调用。改个扩展名即可,如.js。

文章如有错误,欢迎指正,谢谢。


文章参考:
[1]各种编程语言支持JSON,详见 http://www.json.org/json-zh.html
[2]菜鸟教程:Python3 JSON 数据解析
http://www.runoob.com/python3/python3-json.html
[3]python官方资料
https://docs.python.org/3/library/json.html#py-to-json-table
[4]JavaScript读取本地json文件
http://blog.csdn.net/dusea/article/details/48464969

相关文章

网友评论

    本文标题:代码小工蚁Python学习之json模块

    本文链接:https://www.haomeiwen.com/subject/hvtzixtx.html