美文网首页数据分析,从入门到放弃呆鸟的Python数据分析我爱编程
数据分析 | 零基础入门数据分析(二):从入门到绊倒?

数据分析 | 零基础入门数据分析(二):从入门到绊倒?

作者: 娜某人 | 来源:发表于2018-06-22 01:01 被阅读38次

    大家好,我是从零开始菜鸡娜。o(〃'▽'〃)o

    从零开始是我的强项,也是我很享受的事情。一直以来我都在不断地整理背包,重新出发,去新的城市独自生活,甚至在异国他乡一个人和房东讨价还价,一个人学着给口音奇怪的客服打电话缴各种bill……之前看过的一段话特别喜欢,是这么说的:

    当一个人在独自在远方的时候,他获得了一种自由、一种“特权”,叫做“反正没人认识我”。人们总说,不要活在父母、亲戚、同学、同事的嘴里,要勇敢做自己,可是人是社会性动物,这张无形的大网哪是用勇气和力量就能挣脱的呢?但当你在异国他乡走出机场的一瞬间,这张网,这张在你前半生里捆着你、绑着你、拉着你、拽着你的网,这张从你出生以来就给你安全、给你依靠但也使你痛苦、使你压抑的网,消失了,没有灰尘也没有痕迹,只是静静地空气里分崩离析,留下一丝淡淡的脱力感。离开这张网,你会经历一段无所适从的慌乱与孤独,然而不久之后你会发现你变了:有的穿上了一直想穿而不敢穿的衣服、有的内向变开朗、有的勇敢拥抱了自己的性取向、有的原来害怕争论现在能为一个政治观点辩一下午、有的原来多一事不如少一事现在跳上讲台为弱势群体发声、有的终于去追求诗人、画家、歌手这些“不现实”的梦想……每个人的变化都不一样,不能说是变得更好还是更坏了,只是在漫漫人生路中第一次如此真实地感受到“我是我”、“我活着”、“我有无限可能”。

    所以你也试试从零开始吧!(๑→ܫ←)


    从零开始学习基础语言:Python 

    为了在入门时少走弯路,并且让高涨的积极性不至于太受打击,这里推荐使用Anaconda来管理安装环境和各种工具包。Anaconda是一个用于科学计算的Python发行版,支持 Linux, Mac, Windows系统,提供了包管理与环境管理的功能,可以很方便地解决多版本python并存、切换以及各种第三方包安装问题。下载链接(密码: kpkr)

    在各种平台的网课学习中,听懂只是第一步,接下来一定要配合各种作业来练手~✧୧(๑•̀⌄•́๑)૭✧

    娜娜酱的第一个python学习小作业:商铺数据加载及存储

    作业要求:

    1、成功读取“商铺数据.csv”文件,数据大概长成下图的样子:

    2、解析数据,存成列表字典格式:[{'var1':value1,'var2':value2,'var3':values,...},...,{}]

    3、数据清洗:

        ① comment,price两个字段清洗成数字

        ② 清除字段缺失的数据

        ③ commentlist拆分成三个字段,并且清洗成数字

    4、结果存为.pkl文件

    胸有成竹娜娜酱:

    1. csv文件读取,定义两个函数

    加载路径后,文件用open()函数读取,函数中加上“ encoding = 'utf8' ”可以解决中文文件打开乱码的问题。

    定义的第一个函数:getNUM()函数可以把字符串中的数字部分提取出来,这里用到了filter(function, iterable)函数来筛选数字,filter()函数会依次用function作用于每个元素,然后根据返回值是True还是False决定保留还是丢弃该元素。Python3中,filter()的返回值是一个filter类,所以需要在外面加上list( filter() )来把返回值变成列表显示。

    定义的第二个函数:getscore()函数用来把commentlist里的三个字段拆开,方便后面评分。

    commentlist字段中,有三个方面的评分,但是每一条数据中都含有多个空格

    我们希望可以把每条数据中的commentlist字段整理成这样:['口味8.3', '环境8.4', '服务8.5'],这个问题的本质在于如何去掉字符串中的空格(这里空格数量是一定的,可以简单地用逗号替换掉这些等量的空格),将这种情况延伸一下:如何去掉字符串中数量不定的连续空格呢?可以将filter()函数和匿名函数lambda结合在一起使用。

    通过上文已经了解了filter()函数的用法,下面介绍一下这里用到的匿名函数lambda,( 函数语法为lambda parameters:express)冒号左边x是我们想得到的,冒号右边为一个关于x的表达式,这个表达式的值是True或者False。

    到底怎么结合呢,先看一下例子:

    空值会被“过滤”掉 先用split()函数处理字符串ss,此时空格被转换成了空值

    Tips:去掉字符串中连续空格可以用list(filter(lambda x: x, ss.split(' ')))

    2. for循环遍历,处理数据

    3. 数据存储

    4. 最终数据被整理成了列表字典的样式,大概长这样:

    截图了一部分列表字典

    以上就是从计算机白痴到会用python做一点点点点点数据整理的人生赢家娜娜酱,暂时还没有绊倒!请继续期待后续的打怪升级小作业(作业题目来自数据分析师(python)微专业)~

    这是零基础入门数据分析系列的第二篇,其他内容在这里:

    第一篇:零基础小白自学数据分析:从入门到摔门?

    第三篇:零基础小白自学数据分析:从入门到住院?

    第四篇:零基础小白自学数据分析:从入门到出家?

    第五篇:零基础小白自学数据分析:从入门到脱发?

    (-'๏_๏'-)谢谢您阅读,请勿转载。

    相关文章

      网友评论

      • 数据空间:娜娜酱,你好厉害啊!!😃😃
        娜某人:@数据空间 :flushed:
      • 娜某人::sob:不能修改~好吧……
      • 娜某人:哇,真的是令人窒息,刚发现我应该用markdown插代码:flushed:明天更新一下,还好还没人看嘿嘿嘿

      本文标题:数据分析 | 零基础入门数据分析(二):从入门到绊倒?

      本文链接:https://www.haomeiwen.com/subject/jnocyftx.html