解决Pandas读取大文本文件导致内存溢出的问题

作者: chenglansky | 来源:发表于2019-11-26 11:34 被阅读0次

解决Pandas读取大文本文件导致内存溢出的问题
[自用]遇到的问题及解决办法
02. Pandas读取数据
poi 大数据量写入写出
Android内存优化—内存优化总结
21年第41周：什么是内存泄露？内存溢出？
说说内存溢出？
离网用户预警
什么叫内存溢出？内存泄漏的定义又是什么？使用中如何避免？
深入解析Java--变量

问题描述

当使用pandas读取大文本文件时，会由于内存不足产生MemoryError异常，可以设置分块读取的方式来解决。

代码实现

import pandas as pd
# 由于数据量较大，一次性读入可能造成内存错误(Memmory Error),因而使用pandas的分块读取
def read_from_local(file_name, chunk_size=500000):
    reader = pd.read_csv(file_name, header=0, iterator=True, encoding="utf-8")
    chunks = []
    loop = True
    while loop:
        try:
            chunk = reader.get_chunk(chunk_size)
            chunks.append(chunk)
        except StopIteration:
            loop = False
            print("Iteration is stopped!")
    # 将块拼接为pandas dataFrame格式
    df_ac = pd.concat(chunks, ignore_index=True)
    
    return df_ac

转载自 https://blog.csdn.net/qq_41689620/article/details/95106239

解决Pandas读取大文本文件导致内存溢出的问题
问题描述当使用pandas读取大文本文件时，会由于内存不足产生MemoryError异常，可以设置分块读取的方式...
[自用]遇到的问题及解决办法
问题：pandas读取文件过大时内存爆炸解决：分块读取数据再拼接https://blog.csdn.net/wei...
02. Pandas读取数据
02. Pandas读取数据本代码演示：pandas读取纯文本文件读取csv文件读取txt文件pandas读取x...
poi 大数据量写入写出
poi文件读写方案引入jar 读取大批量数据，使用CVS模式解决内存溢出的问题直接调用XLSXCovertCS...
Android内存优化—内存优化总结
内存问题内存抖动：导致GC导致卡顿内存泄漏：导致频繁GC，可用内存减少内存溢出：导致OOM 工具排查 AS中...
21年第41周：什么是内存泄露？内存溢出？
内存泄漏遇到过没？什么原因导致的？怎么解决？那么内存溢出呢，是什么情况？本文带你理解。内存溢出 out of ...
说说内存溢出？
哪些情况下会导致oom问题？基本概念首先明确一点，内存泄漏和内存溢出是不同的，但是过多的内存泄漏会导致内存溢出...
离网用户预警
读取数据 pandas可以读取文本文件、json、数据库、Excel等文件使用read_csv方法读取以逗号分隔...
什么叫内存溢出？内存泄漏的定义又是什么？使用中如何避免？
有时候会有人问你，内存泄漏是什么？什么原因导致的？如何解决？那么内存溢出又是什么呢？内存溢出 out o...
深入解析Java--变量
变量使用变量是为了解决问题，解决内存中的数据读取比较麻烦这一问题，因为计算机读取内存中的数据时，是通过内存地址地...