Python-科学计算-pandas-08-列字符串操作1

作者: Data_Python_VBA | 来源:发表于2020-03-14 08:28 被阅读0次

Python-科学计算-pandas-08-列字符串操作1
Python-科学计算-pandas-09-df列字符串操作2
不适用索引的SQL
pandas中级操作示例及说明记录1
Python-科学计算-pandas-03-两列相乘
Python基础-day06
C代写 CSCE 155E：Homework 5代写留学生asp
Python-字符串操作
PHP全栈学习笔记22
PHP全栈学习笔记22

微信公众号原文

系统：Windows 7
语言版本：Anaconda3-4.3.0.1-Windows-x86_64
编辑器：pycharm-community-2016.3.2
pandas：0.19.2

这个系列讲讲Python的科学计算版块

今天讲讲pandas模块：对列的每一个元素进行同样的字符串操作

今天讲其中的3个操作：切片，字符串替换，字符串连接

Part 1：目标

已知Df某列都是字符串，每一个字符串都有一个文件与其对应，目标在于获取每一个文件的名称
存在以下规律：
- 字符串的最后一个字符是D或者F
- 其中D表示该字符串是一个txt文本文件的名称
- 其中F表示该字符串是一个pdf文本文件的名称
- 这些文件的名称最终组成是：FINAL_列元素.文件类型
实现方法：
- 提取该列每个元素的最后一位字符
- 根据规则进行替换，获取文件类型
- 字符串连接，加上常量 FINAL_ 和 .

Part 2：代码

import pandas as pd

dict_1 = {"C1": ["P1-CD", "P2-EF", "P3-BD", "P4-GF", "P5-HD", "P6-LF"],
          "C2": [0.5, 0.8, 1.0, 5, 6, 2]}

df_1 = pd.DataFrame(dict_1, columns=["C1", "C2"])
print("初始DF：\n", df_1)

print("\n")
df_1["flag"] = df_1["C1"].str[-1:]
print("列每个元素切片：\n", df_1)

print("\n")
df_1["newFlag"] = df_1["flag"].replace("D", "txt").replace("F", "pdf")
print("列每个元素字符替换：\n", df_1)

print("\n")
df_1["FINAL"] = "FINAL_" + df_1["C1"] + "." + df_1["newFlag"]
print("不同列每个元素连接：\n", df_1)

代码截图

1.png

执行结果

2.png

Part 3：部分代码解读

df_1["C1"].str[-1:]，将C1列每个元素字符串化，并对其分别进行切片操作，其实就是将切片操作分别作用于每个元素

2.df_1["flag"].replace("D", "txt").replace("F", "pdf")，执行字符串替换作用，将代码改为df_1["newFlag"] = df_1["flag"].str.replace("D", "txt").replace("F", "pdf")，也就是按照上一条的逻辑，将每一个元素字符串化，执行效果是一样的

3.df_1["FINAL"] = "FINAL_" + df_1["C1"] + "." + df_1["newFlag"]，字符串连接。效果看起来像是，先将标量 FINAL_ 和 . 向量化，然后执行元素间分别连接

综上，整体效果是按列整体进行字符串操作，无需遍历循环，大大减少代码量

本文为原创作品，欢迎分享朋友圈

长按图片识别二维码，关注本公众号
Python 优雅帅气

12x0.8.jpg

网友评论

本文标题：Python-科学计算-pandas-08-列字符串操作1

本文链接：https://www.haomeiwen.com/subject/ztapshtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Python-科学计算-pandas-08-列字符串操作1

Part 1：目标

Part 2：代码

Part 3：部分代码解读

相关文章