文件的理解
文件是数据的抽象和集合
- 文件是存储在辅助存储器上的数据序列
- 文件是数据存储的一种形式
- 文件展现形态:文本文件和二进制文件
文件文件和二进制文件只是文件的展示方式; 本质上,所有文件都是二进制形式存储;形式上,所有文件采用两种方式展示
文本文件
由单一特定编码组成的文件,如UTF-8编码; 由于存在编码,也被看成是存储着的长字符串;适用于例如:.txt文件、.py文件等
二进制文件
直接由比特0和1组成,没有统一字符编码;一般存在二进制0和1的组织结构,即文件格式;适用于例如:.png文件、.avi文件等
文本文件vs. 二进制文件
文件的打开和关闭
文件处理的步骤: 打开-操作-关闭
1. 文件的打开
文件的打开模式
文件的关闭
文件内容的读取
文件的全文本操作
遍历全文本,法一 遍历全文本,法二文件的逐行操作
逐行遍历文件:方法一 逐行遍历文件:方法 二数据文件的写入
数据组织的维度
维度:一组数据的组织形式
一维数据:由对等关系的有序或无序数据构成,采用线性方式组织
二维数据:由多个一维数据构成,是一维数据的组合形式
多维数据:由一维或二维数据在新维度上扩展形成
高维数据:仅利用最基本的二元关系展示数据间的复杂结构
数据的操作周期
一维数据的表示
如果数据间有序:使用列表类型
如果数据间无序:使用集合类型
一维数据的存储
方式一:空格分隔
方式二:逗号分隔
方式三:其他方式(特殊符号)
一维数据的处理
1. 1 从空格分隔的文件中读入数据
1.2 从特殊符号分隔的文件中读入数据
2.1 采用空格分隔方式将数据写入文件
2.2 采用特殊分隔方式将数据写入文件
二维数据的格式化和处理
二维数据的表示
使用列表类型
CSV格式与二维数据存储
CSV: Comma-Separated Values
国际通用的一二维数据存储格式,一般.csv扩展名;每行一个一维数据,采用逗号分隔,无空行;Excel和一般编辑软件都可以读入或另存为csv文件
如果某个元素缺失,逗号仍要保留;二维数据的表头可以作为数据存储,也可以另行存储; 逗号为英文半角逗号,逗号与数据之间无额外空格
按行存或者按列存都可以,具体由程序决定;一般索引习惯:ls[row][column],先行后列;根据一般习惯,外层列表每个元素是一行,按行存
二维数据的读入处理
从CSV格式的文件中读入数据
将数据写入CSV格式的文件
二维数据的逐一处理
采用二层循环
网友评论