美文网首页python交流学习
jsonlines库:高效率的保存多个python对象

jsonlines库:高效率的保存多个python对象

作者: 78c40b03ee4e | 来源:发表于2019-03-13 15:20 被阅读38次

前言

json文件因其简洁精炼,在网上特别流行,我们写爬虫时经常碰到网站使用json格式传输数据。但是如果要存储的数据有1G,那么读取一个json文件需要一次性读入,这需要占用很大的内存,对电脑压力过大。所以我们需要将数据存储为很多个对象,通过逐行读取方式减轻内存占用压力。所以今天就讲到jsonlines这个库,希望大家能有所收获。

json文件因其简洁精炼,在网上特别流行,我们写爬虫时经常碰到网站使用json格式传输数据。但是如果要存储的数据有1G,那么读取一个json文件需要一次性读入,这需要占用很大的内存,对电脑压力过大。所以我们需要将数据存储为很多个对象,通过逐行读取方式减轻内存占用压力。所以今天就讲到jsonlines这个库,希望大家能有所收获。

jsonlines

  • 每一行都是一个json或python对象
  • 采用utf-8编码

jsonlines库的特性

便捷的open()功能

  • 易于写入
  • 传入文件名和写入方式mode
  • 返回Reader或Writer实例
  • 能被用做上下文管理器

安装

pip install jsonlines

使用方法

jsonlines可以保存python的各种数据类型对象,如列表、字典、数字、元组、集合等等。

例如以python字典类型逐行写入到jsonl文件里

import jsonlines

with jsonlines.open('data.jsonl', mode='w') as writer:
    writer.write({'a':5})
    writer.write({'a':6})
    writer.write({'a':7})

发现当前工作路径下已经生成了一个jsonl文件。

小编推荐一个学python的学习qun 740,3222,34
无论你是大牛还是小白,是想转行还是想入行都可以来了解一起进步一起学习!裙内有开发工具,很多干货和技术资料分享!

以逐行的方式读取jsonl文件里的多个字典

with jsonlines.open('data.jsonl', mode='r') as reader:
    for row in reader:
        print(type(row), row)

运行

<class 'dict'> {'a': 5}
<class 'dict'> {'a': 6}
<class 'dict'> {'a': 7}

部分素材来源于网络:侵删

相关文章

  • jsonlines库:高效率的保存多个python对象

    前言 json文件因其简洁精炼,在网上特别流行,我们写爬虫时经常碰到网站使用json格式传输数据。但是如果要存储的...

  • 高效率地保存多个 Python 对象!你学会了吗?

    json文件因其简洁精炼,在网上特别流行,我们写爬虫时经常碰到网站使用json格式传输数据。但是如果要存储的数据有...

  • 三、HomeKit之Homes的创建和Accessories的添

    HomeKit对象被保存在可以共享的HomeKit数据库中,通过HomeKit框架该数据库可以被多个应用进行访问。...

  • 读写R格式文件

    R文件的格式 .Rdata(保存R的多个对象但无法保存绘制的图).RDS(保存R的单个对象) 使用saverds函...

  • 数据源操作原理

    数据源操作的核心原理就是,在一个对象池中保存多个数据库的连接(也称为数据库连接池,Connection Pool)...

  • JavaScript 对象

    对象 对象是保存多个数据的封装体。用于保存多个数据的容器。一个对象代表现实生活中的一个事物。 为什么要使用对象:统...

  • Python进阶学习---GUI篇

    python GUI python提供了多个图形开发界面的库,几个常用Python GUI库如下: Tkinter...

  • python gui - 001 tkinter 入门

    Python 提供了多个图形开发界面的库,几个常用的Python GUI库如下:Tkinter:wxPython:...

  • [Python常用库]shelve

    shelve类似于一个key-value数据库,可以很方便的用来保存Python的内存对象,其内部使用pickle...

  • Python GUI编程(Tkinter)

    Python 提供了多个图形开发界面的库,几个常用 Python GUI 库如下: Tkinter:Tkinter...

网友评论

    本文标题:jsonlines库:高效率的保存多个python对象

    本文链接:https://www.haomeiwen.com/subject/jaxtmqtx.html