做数据分析首先就要数据,本文介绍的是如何理解数据?数据来源有哪些?供大家阅读。
一、理解数据
1.字段与记录:
字段是事物或现象的某种特征。我们称列名称为字段。
记录是事物或现象某种特征的具体表现。我们称每一行数据为一条记录。
2.数据类型:字符型数据和数值型数据
字符型数据是不具有计算能力的文字数据类型。
数值型数据是直接使用自然数或度量单位进行计算的数值数据。
更改数据类型的操作:选中某一单元格---单击鼠标右键---设置单元格格式---不同数据类型
![](https://img.haomeiwen.com/i22440010/9cb589378bcfae76.png)
3.数据表:
数据表是由字段、记录和数据类型构成的,其要求:
(1)数据表由标题行和数据部分组成的
(2)第一行是表的列标题(字段),不能重复
(3)第二行起是数据部分,不允许出现空白行或空白列
(4)数据表中不能有合并单元格
(5)数据表和其他数据表之间至少留出一个空白行和一个空白列
(6)数据表应该以一维形式存储,若是二维表要转化为一维表
4.二维转一维:
![](https://img.haomeiwen.com/i22440010/bb0bedf52a84eb4b.png)
操作步骤:打开"数据透视表和数据透视图向导"功能---选择"多重合并计算数据区域"---"创建单页字段"---"选定区域"位置选中二维表的数据区域---"添加"---"新建工作表"---完成---最后双击透视表的右下角最后一个汇总数据即可得到一维表。
二、数据来源
1.导入数据:
(1)导入文本数据:数据---自文本---txt格式的文本
(2)自动导入网站数据:数据---自网站---新建Web查询---输入网址---转到---导入---选择区域---确定。
从网站导入的数据可不断地刷新,就可获取最新的数据。
刷新的方法:(1)数据---刷新数据(2)点击某单元格---鼠标右键---刷新
(3)点击某单元格---鼠标右键---数据范围属性---修改刷新频率/勾选打开文件时自动更新
2.问卷录入:多选题录入方法ABCDEF
二分法:把每个相应选项定义为一个变量,对每个变量做定义:0代表未选,1代表已选。若选择ACD,应该是'101100'
多重分类法:事先定义录入的值,并且根据限选的项数确定应录入变量的个数。
本文为《谁说菜鸟不会数据分析-入门篇》第三章读书笔记
网友评论