美文网首页
56. 关于因子的一些个人理解

56. 关于因子的一些个人理解

作者: 心惊梦醒 | 来源:发表于2021-09-09 23:05 被阅读0次

【上一篇:55.关于正则表达式在其他函数中的应用】
【下一篇:57.关于因子的四要素之创建因子】

    我按照自己的理解,认为R中的变量分为离散型变量和连续型变量。连续型变量就是数值型的且是有序的;离散型变量一般是字符型的,可以是无序的也可以是有序的。连续型变量可以转化成离散型变量,方式是将连续型变量分bin。
    离散型变量也可以叫做分类变量。在数据整理(data wrangling)中,分类变量的wrangling是其中最重要的一部分。R中分类变量的转换过程中,可能引起一些问题,例如在无意识间改变category numbers和category labels之间的对应关系。因子就可以解决这个问题。
    因子其实是R存储分类变量的一种方式。例如性别有两个分类:male和female,我们可以用因子来存储这个分类信息,也可以用字符型字符串来存储。早期的R版本中,将分类数据存储为因子变量比存储为strings更有效,因为factor variale仅存储factor labels一次,正是由于此,导致现在的很多函数仍然默认将分类变量存储为因子。例如read.table()函数,输入R的数据中,分类变量可以转换成因子类型(stringsAsFactors=TRUE),如果想抑制这个功能,需要注意设置stringsAsFactors=FALSE。
    因子在两个地方发挥很重要的作用:绘图时和回归模型中
    字符串向量可以用factor()函数转化成因子(正式说法是将字符向量编码成因子),也就是说字符型向量通过一种编码方式变成因子。
    因子有四要素,也即factor()函数的四要素:实际的分类变量、Levels、Labels和顺序。详细见下一篇。

【上一篇:55.关于正则表达式在其他函数中的应用】
【下一篇:57.关于因子的四要素之创建因子】

相关文章

  • 56. 关于因子的一些个人理解

    【上一篇:55.关于正则表达式在其他函数中的应用】[https://www.jianshu.com/p/5b16b...

  • 57.关于因子的四要素之创建因子

    【上一篇:56.关于因子的四要素之创建因子】[https://www.jianshu.com/p/d4269547...

  • 关于GCDAsyncSocket的一些个人理解

    GCDAsyncSocket GCDAsyncSocket 的读写都是异步的不会阻塞线程。 socket读写都是数...

  • 关于Promise的一些个人理解

    提醒:本文中的内容是我看了一些文档后自己的理解,可能会有一些理解上的错误。若简友发现了可以提出来,我会及时修改。_...

  • 理解关于Function的原型链问题

    理解关于Function的原型链问题 关于Function的原型链问题的一些个人粗略理解,欢迎指正错误的地方 要理...

  • 关于 Python 装饰器的一些个人理解

    装饰器 本质是一个接受参数为函数的函数。 作用:为一个已经实现的方法添加额外的通用功能,比如日志记录、运行计时等。...

  • 关于Ulord的个人理解

    作为初入币圈的一棵新韭菜,通过对白皮书的研读,算是对Ulord项目初步有了大概的了解。 首先,从项目性质上...

  • 关于理财的个人理解

    前些天和一位毕业没几年的朋友吃饭,说到把钱存哪儿,他说,大部分都放余额宝了,今年还存了个银行一年定期。 “我晕,银...

  • 关于幸福的个人理解

    最近电视剧(都挺好)热播,期间可以说引爆了原生家庭对个人影响的这个话题,而我,觉得,原生家庭各有不同,每个家...

  • 关于测试的个人理解

    针对测试,专业的知识可以自行百度我只谈谈我目前的理解:我目前理解的测试包含两方面:单元测试和集成测试我理解的单元测...

网友评论

      本文标题:56. 关于因子的一些个人理解

      本文链接:https://www.haomeiwen.com/subject/olejwltx.html