在使用MATLAB的时候,想必各位一定会遇到导入数据的问题。如果需要导入的数据其数据量巨大的话,那么在MATLAB编辑器中将这些数据复制粘贴进来,显然会在编辑器中占据巨大的篇幅,这是不明智的。
一般来说储存这些数据的文件有两种形式:
- txt文件
- excel表格
针对这两种类型的文件,需要使用两个不同的函数。
就导入txt文件来说,个人习惯使用importdata这个函数。
导入txt文件
01 | 导入全是数字类型的txt文件(一)
如果导入的txt文件中,储存的数据全是数字类型的,且同一行的两个数字之间使用空格或者制表符进行分隔。这种形式的txt文件如下所示。
image
储存这种形式数据的txt文件直接使用如下代码即可。
present01=importdata('present01.txt');
在MATLAB运行之后的结果如下:
image
02 | 导入全是数字类型的txt文件(二)
如果数据不像刚才给出的数据那么规整,那么就不能继续使用上面的代码了
如果txt文件储存如下的数据:
image很明显这个txt文件,第一行只有1,第二行有2和3,第三行有4、5、6和7,第四行有8、9、10和11,第五行有12、13、14和15。
如果我们继续使用上面的代码,看看能否成功导入数据。
present02=importdata('present02.txt');
在MATLAB运行之后结果如下,是一个15行1列的矩阵,这个很明显和我们想要的形式不太一样。
在这里插入图片描述可以发现前两行的数据个数与后三行的数据个数不同,所以在实际导入的时候需要分开导入,这时可以使用如下代码导入present02.txt文件。
filename='present02.txt'; %文件名
delimiterIn = ' '; %列分隔符
headerlinesIn = 2; %读取从第 headerlinesIn+1 行开始的数值数据
present02=importdata(filename,delimiterIn,headerlinesIn);
dataset=present02.data; %导出的3行以后的数据,即3行4列的矩阵
parameters=present02.textdata; %导出的2行以前的数据,即2行1列的元胞数组
- filename是文件名
- delimiterIn是列分隔符,也就是同一行的两个数据之间是如何分隔的,可以是空格,也可以是制表符,也可以是逗号
- headerlinesIn表示读取从第 headerlinesIn+1 行开始的数值数据,因为前两行的数据个数与后三行的数据个数不同,所以这里headerlinesIn = 2,即从读取从第 3行开始的数值数据。
在MATLAB运行之后的结果如下,是一个结构体,其中包括一个3行4列的矩阵data,和一个2行1列的元胞数组textdata。使用变量dataset储存这个3行4列的矩阵,使用parameters储存这个2行1列的元胞数组。
image
image
image
image
image
其中这个3行4列的矩阵data就是后三行的数据,这个2行1列的元胞数组textdata就是前两行的数据。
其实在MATLAB中建议不到万不得已的时候尽量不用元胞数组cell,因为元胞数组在处理数据时不方便。但这个txt文件由于每行的数据个数不同,所以我们没有办法将其导入为一个5行4列的矩阵,我们才万不得已将前两行数据导入为元胞数组,后三行数据导入为3行4列的矩阵。
03 | 导入全是数字类型的txt文件(二)拓展
在上述代码中将headerlinesIn设为5,导入的结果
filename='present02.txt'; %文件名
delimiterIn = ' '; %列分隔符
headerlinesIn = 5; %读取从第 headerlinesIn+1 行开始的数值数据
present02=importdata(filename,delimiterIn,headerlinesIn);
在MATLAB运行之后的结果如下,是一个5行1列的元胞数组。
image
因为一共只有5行数据,而又将headerlinesIn设为5,所以此时读取从第6行开始的数值数据,这句话包含两层意思:1)读取从第6行开始的数值数据,在present02.txt文件中第6行没有数据,所以没有将数据以矩阵的形式导入进来。2)读取第5行之前的非数值数据,然后用元胞数组cell的形式进行储存。
04 | 导入数字和字母混合类型的txt文件
比如说现在导入标准的solomon测试算例,前8行中既有数字又有字母,且每行数据个数不同。
image观察发现,第10行以后的数据是一个101行7列的规整的数据。因此,可以将headerlinesIn设为9,具体的代码如下:
filename = 'c101.txt'; %文件名
delimiterIn = ' '; %列分隔符
headerlinesIn =9; %读取从第 headerlinesIn+1 行开始的数值数据
c101=importdata(filename,delimiterIn,headerlinesIn);
row4=c101.textdata{4,1};
len=length(row4);
dataset=c101.data; %导出的10行以后的数据,即101行7列的矩阵
parameters=c101.textdata; %导出的9行以前的数据,即7行1列的元胞数组
在MATLAB运行之后的结果如下:
image
image
image
05 | 导入同一个文件中的多个txt 文件
matlab中给我们提供了dir
这个函数,十分方便。这里是读取所有txt文件,所以是dir('父目录路径\*.txt')
%读取该目录下的所有txt文件
% namelist = dir('C:\Users\Administrator\Desktop\xxx\*.txt');
% 读取后namelist 的属性有
% name -- filename
% date -- modification date
% bytes -- number of bytes allocated to the file
% isdir -- 1 if name is a directory and 0 if not
%通过字符串拼接,获取绝对路径可以直接用[],也可以用strcat()函数
path = 'C:\Users\Administrator\Desktop\xxx\';
namelist = dir([path,'*.txt']);
l = length(namelist);
P = cell(1,l);%定义一个细胞数组,用于存放所有txt文件
for i = 1:l
namelist(i).name;%这里获得的只是该路径下的文件名,如1.txt是相对路径
filename{i} = [path,namelist(i).name];%通过字符串拼接获得的就是绝对路径了
P{1,i} = load(filename{i});
end
面对多个 .txt 文件的依次读入,且文件名按一定的规律命名,如:filename1.txt,filename2.txt,... 。是纯数字数据类型的文本(不掺杂字符类型)依次读入,我们可以将其存储为cell数据类型,以便于后面关于数据的操作。在这里我们举一个例子:假如有10个 .txt 文件,我们把这些数据读入并存储为cell数据类型。我们可以使用循环依次读入文件,Matlab 程序如下:
data = cell(1,10); %建立细胞存储空间
for i = 1:10
g = ['filename' num2str(i) '.txt'];
data(1,i) = {textread(g)};%读入 .txt 文件置于 data 细胞中
end
对于读入的cell数据的显示,我们可以采用 : data{m,n}(p,q); %对存入的cell数据进行显示
在 .txt 文件中掺杂着字母+数字 类型的,我们同样也可以存储为struct 结构体数据的类型。这里我们再举一个列子。比如:两幅带有英文+数字的 .txt文件。我们将其读入并存储为结构体类型。
for i=1:2
str=strcat('filename',num2str(i),'.txt');
hh{1}{i}=importdata(str);
end
对于读入的struct数据的显示,我们可以采用:pp.textdata(2)%数据显示
导入Excel文件
01 | 用xlsread函数读取一个Excel文件
-
num=xlsread(filename)
filename是单引号括起来的带路径的文件名,函数直接读取filename所指文件的sheet1中的数据区域存储到双精度矩阵num中;其中,数据区域的选取规则是:对表格前几个含有非数值的行(列)直接忽略,不算入数据区域。 -
num = xlsread(filename, -1)
输入后matlab将会打开相应的exel文件,用鼠标选择需要导入的数据区域,可以切换到想要的sheet。 -
num = xlsread(filename, sheet)
其中sheet用来指定读入excel文件的第几个sheet,此时的sheet取值大于1的整数。 -
num = xlsread(filename,sheet, 'range')
其中range指定一个矩形的区域,用单引号括起来;例如:'D2:H4
'代表以D2和H4为对角定点的矩形域;
注意当excel中有合并单元格时,任何一个合并前的单元格的名字(比如D1)都会指代整个合并后的单元格,而将整个单元格读入,所以为了避免麻烦,尽量避免在需要读入的表格中合并单元格。
例如:将读取D盘下的一个文件路径为:D:/test/daxia.xls
num = xlsread('d:/test/daxia.xls',2,'D2:H4')
读取sheet2的D2:H4区域数据
如果要进行交互式的选择用:num= xlsread('d:/test/daxia.xls',-1)
02 | 批量的文件要读取
首先将多个文件进行批量重命名例如daxia1.xls,daxia2.xls,daxia3.xls,...
然后用循环的方式实现:
for i=1:100
filename=['d:/test/daxia',num2str(i),'.xls'];
num=xlsread(filename)
end
资源传送门
- 关注【做一个柔情的程序猿】公众号
- 在【做一个柔情的程序猿】公众号后台回复 【python资料】【2020秋招】 即可获取相应的惊喜哦!
「❤️ 感谢大家」
- 点赞支持下吧,让更多的人也能看到这篇内容(收藏不点赞,都是耍流氓 -_-)
- 欢迎在留言区与我分享你的想法,也欢迎你在留言区记录你的思考过程
网友评论