美文网首页
pandas学习笔记

pandas学习笔记

作者: 阴天_1f99 | 来源:发表于2018-11-16 14:13 被阅读0次

筛选数据


读取文件

import pandas as pd

pd.read_csv( "Lung.txt" ,header=None)

字符匹配

data[0].str.contains(a_r)       #选择第0列的数据,看每行数据是否包含字符串a_r。返回布尔值

data1=data[data[0].str.contains(a_r)]        #筛选出布尔值为TRUE的数据块给data1,data数据块不变

写入文件

bol.to_csv('data_new_1.csv',mode='a',header=0)   #将数据bol写成csv文件,文件自动创建,mode参数默认为w,每次写入会覆盖整个文                                                                                     #件,设置为a,在文件后追加数据

去重复数据

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)

#subset :用来指定特定的列,默认所有列  如subset=[0,1,2]

#keep : {‘first’, ‘last’, False}, default ‘first’  删除重复项并保留第一次出现的项

#inplace :default False  是直接在原来数据上修改还是保留一个副本

例子

import pandas as pd

import numpy as np

#读取两个文件

data1 = pd.read_csv("Lung.txt",header=None)

data = pd.read_csv("data_new.csv",header=None)

#将data1的第零列转化为列表a

a=list(data1[0])

print(a)

#循环读取每一列到数据中去查找

for a_r in a:

        print(a_r)

         bol=data[data[0].str.contains(a_r)]     #得到数据第零列包含特定类名的数据块

#写入csv文件

bol.to_csv('data_new_1.csv',mode='a',header=0)

相关文章

  • 大师兄的Python机器学习笔记:Pandas库

    大师兄的Python机器学习笔记:实现评估模型 一、关于Pandas 1. Pandas和Numpy Pandas...

  • pandas索引取数

    注:《利用python进行数据分析》的学习笔记-pandas import pandas as pd import...

  • pandas-基础笔记

    Pandas学习笔记-基础篇 参考资料 https://www.yiibai.com/pandas/ 导入模块 S...

  • 学习笔记----机器学习(三)

    我是iOS开发者之一。我们的App:今日好出行 申明一下,只是学习笔记,只是学习笔记,只是学习笔记。 Pandas...

  • pandas学习笔记

    pandas学习笔记 1.安装 2.学习代码-Series code 1 0 1001 py...

  • pandas学习笔记

    Pandas库的介绍 Pandas是一个开放源码的Python库,它使用强大的数据结构提供高性能的数据操作和分析工...

  • pandas学习笔记

    pandas 读取 csv 文件 查看pandas的列名以及列数 pandas 查看某一列的全部数据或部分数据 查...

  • pandas学习笔记

    筛选数据 读取文件 import pandas as pdpd.read_csv("Lung.txt",heade...

  • pandas 学习笔记

    pd.Series 简介: Series 是一个定长的有序字典 简单创建: Series 中可以包含多种基本数据类...

  • pandas学习笔记

    最近在学python,正好看到一个讲解pandas的系列视频,正好做一下笔记,笔记会参考视频,同时也会参考pand...

网友评论

      本文标题:pandas学习笔记

      本文链接:https://www.haomeiwen.com/subject/idlmfqtx.html