(一)
清洗处理类
主要是文本、格式以及脏数据的清洗和转换。很多数据并不是直接拿来就能用的,需要经过数据分析人员的清理。数据越多,这个步骤花费的时间越长。
1、Trim
作用:清除掉字符串两边的空格
mysql有同名函数,py有近似函数strip
2、concatenate
=concatenate(单元格1,单元格2...)
合并单元格的内容,当然还有另外一种合并方式是&。
‘天’&‘气’&‘好’=天气好。
当合并内容过多是,concatenate的效率高。
mysql有近似函数concat。
3、replace
作用:替换掉单元格的字符串。
=replace(指定字符串,哪个位置开始,替换几个字符,替换成什么)
mysql和Python中都有同名函数。
4、Substitute
和replace功能接近,区别在于,该替换是全局替换,没有起始位置的概念。
5、left/right/mid
作用:截取字符串中的字符。
=mid(指定字符串,开始位置,截取长度)
=left/right(指定字符串,截取长度)
mysql中有同名函数
6、Len/Lenb
返回字符串的长度,在len中,中文计算为一个,在lenb中,中文计算为两个。
Mysql和python中有同名函数。
7、Find
Find(要查找字符,指定字符串,第几个字符)
查找某字符出现的位置,可以指定为第几次出现,与left/right/mid结合能完成简单的文本提取。
mysql中有近似函数find_in_set,python中有同名函数。
8、search
和find类似,区别是search大小写不敏感,但支持*通配符。
9、Text
将数值转化为指定的文本格式,可以和时间序列函数一起看。
关联匹配类
在进行多表关联或者行列对比时用到的函数,越复杂的表用的越多,但良好的表习惯可以减少这类函数的使用。
1、lookup
=lookup(查找的值,值所在的位置,返回相应位置的值)
最被忽略的函数,功能性和vlookup一样,但是引申有数组匹配和二分法。
2、vlookup
=vlookup(查找的值,哪里找,找哪个位置的值,是否精准匹配)
3、index
=index(查找的区域,区域内第几行,区域内第几列)
和match组合,媲美vlookup,但是功能更强大。
4、match
=match(查找指定的值,查找所在区域,查找方式的参数)
5、row
返回单元格所在的行
6、column
返回单元格所在的列
7、offset
=offset(指定点,偏移多少行,返回多少行,返回多少列)
建立坐标系,以坐标系为原点,返回距离原点的值或者区域。正数代表向下或向左,负数则相反。
网友评论