美文网首页
STATA的因子变量

STATA的因子变量

作者: 冬之心 | 来源:发表于2022-11-13 07:45 被阅读0次

定义

因子变量(factor variable)是对现有变量的展开,即展开成一组变量。常用于从分类变量中创建虚拟变量。注意,带因子变量操作符的分类变量的取值必须是非0的正整数,不能存在小于0的负数。

因子变量运算符

Operator Description 说明
i. unary operator to specify indicators 指定为分类变量各类别
c. unary operator to treat as continuous 指定为连续变量
o. unary operator to omit a variable or indicator 忽略一个变量或类别
# binary operator to specify interactions 交互
## binary operator to specify full-factorial interactions 全因子交互

例子

Factor specification Result
i.group indicators for levels of group
i.group#i.sex indicators for each combination of levels of group and sex, a two-way interaction
group#sex same as i.group#i.sex
group#sex#arm indicators for each combination of levels of group, sex, and arm, a three-way interaction
group##sex same as i.group i.sex group#sex
group##sex##arm same as i.group i.sex i.arm group#sex group#arm sex#arm group#sex#arm
sex#c.age two variables—age for males and 0 elsewhere, and age for females and 0 elsewhere; if age is also in the model, one of the two virtual variables will be treated as a base
sex##c.age same as i.sex age sex#c.age
c.age same as age
c.age#c.age age squared
c.age#c.age#c.age age cubed

基准类别

默认为组1(取值最小的组别)为基准类别。指定基准类别,使用操作符ib.

Base operator [1] Description 说明
ib#. use # as base, # = value of variable 指定值
ib(##). use the #th ordered value as base [2] 指定次序值
ib(first). use smallest value as base (default) 指定最小值,即第一组
ib(last). use largest value as base 指定最大值,即最后一组
ib(freq). use most frequent value as base 指定频数最高
ibn. no base level 没有基准项

操作符ibn.的特殊用法

i.varlist的系数为其他类别与基准类别的偏差。
ibn.varlist配合noconstant选项使用,则varlist的系数变成各类别的实际系数而非偏差。
试比较下列命令的结果。

reg  y  i.group age
reg  y  ibn.group age,  noconstant

参考文献

STATA参考手册[U] User's Guide

  • 11 Language syntax
    • 11.4 varname and varlists
      • 11.4.3 Factor variables

  1. The i may be omitted. For instance, you can type ib2.group or b2.group.

  2. For example, ib(#2). means to use the second value as the base.

相关文章

  • STATA的因子变量

    定义 因子变量(factor variable)是对现有变量的展开,即展开成一组变量。常用于从分类变量中创建虚拟变...

  • Stata:因子变量的全攻略

    作者:连玉君 | 杨柳 ( 知乎 | 简书 | 码云 ) 注:该文已发表: 连玉君, 杨柳.《郑州航空工业管理学院...

  • A002. Stata中字符型变量生成数值型变量

    Stata中字符型变量生成数值型变量 stata中在将纯字符型变量(如A,B,A1)生成新的数值型变量(只能生成,...

  • Stata语言编程 | 图表制作

    一:问题描述 如何用stata软件制作不同类型的图表? 二:解决方案 打开stata软件,插入变量数据文件。[变量...

  • 【转载】stata 内置系统变量有哪些?

    注:以下翻译自stata手册。 描述 包含_variables(发音为“下划线变量”)。 这些是由 Stata 创...

  • 第六天:因子分析

    因子分析是指研究从变量群中提取共性因子的统计技术。 因子分析是通过研究变量之间的相关系数矩阵,把这些变量之间错综复...

  • Stata:文字型日期格式的转换

    作者:Stata连享会 (知乎 | 简书 | 码云) Stata 现场培训报名中 问题背景 导入数据后,日期变量显...

  • R for data Science (11章)

    使用forcats处理因子 1 简介因子在R中用于处理分类变量,分类变量是在固定的已知集合中取值的变量。 准备工作...

  • 2018-05-03

    如何利用STATA进行因子分析 首先在进行因子分析之前,一定要将数据清理好后再进行,否则你有可能会得到不同的结果,...

  • 定量数据分析笔记

    用stata算集中指数采用Stata系统自带数据库auto.dta。 一、集中趋势的统计描述以变量price为例进...

网友评论

      本文标题:STATA的因子变量

      本文链接:https://www.haomeiwen.com/subject/tndhxdtx.html