美文网首页
R语言中工具变量:例题二

R语言中工具变量:例题二

作者: 多美丽 | 来源:发表于2022-01-18 11:59 被阅读0次

这篇文章主要是:R语言中工具变量的使用、涉及到的数据处理以及模型含义。(本例题涉及数据处理很常用)

两个例题:例题一涉及6个问题,使用的数据集为R语言自带的fertil2。例题二涉及3个问题,使用的数据集为stata格式的eitc.dta。本文介绍例题二。例题一见上篇。

例题一

1.1 问题

使用数据集eitc.dta,因变量为children,educ为自变量(是否为内生在问题1-6中会讨论),还有其他自变量如age等。


1
2
3

1.2 我的解答

解答

1.3 R语言代码

> library(tidyverse)   # ggplot(), %>%, mutate(), and friends
> library(scales)      # Format numbers with functions like comma(), percent(), and dollar()
> library(broom)       # Convert models to data frames
> library(wooldridge)  # Econometrics-related datasets like injury
> library(stargazer)
> library(foreign)
> library(readstata13)
> eitc = read.dta13("C:\\Users\\LENOVO\\Desktop\\eitc.dta")
> 
> head(eitc,2)
  state year urate children nonwhite      finc       earn age ed work   unearn
1    11 1991   7.6        0        1 18714.394 18714.3943  26 10    1 0.000000
2    12 1991   7.2        1        0  4838.568   471.3656  22  9    1 4.367203

#问题7:(这些不同级别儿童的平均工作、收入、收入、非白人、教育程度和年龄是多少? 这些群体有何不同?)
#7.1 将儿童数分为3类,即0,1,2。
> eitc <- eitc %>%  mutate(children_cat = case_when(
+   children == 0 ~ "0",
+   children == 1 ~ "1",
+   children >= 2 ~ "2+"
+ ))

#7.2 选取儿童数为0的,求work、finc等的均值
> eitc %>%
+   filter(children =="0")%>%
+   summarize(mean_0_work = mean(work),
+             mean_0_finc = mean(finc),
+             mean_0_earn = mean(earn),
+             mean_0_nonwhite = mean(nonwhite),
+             mean_0_ed = mean(ed),
+             mean_0_age =mean(age)
+             )
  mean_0_work mean_0_finc mean_0_earn mean_0_nonwhite mean_0_ed mean_0_age
1   0.5744896    18559.86    13760.26        0.515944  8.548676   38.49823

#7.3 选取儿童数为1的,求work、finc等的均值
> eitc %>%
+   filter(children =="1")%>%
+   summarize(mean_1_work = mean(work),
+             mean_1_finc = mean(finc),
+             mean_1_earn = mean(earn),
+             mean_1_nonwhite = mean(nonwhite),
+             mean_1_ed = mean(ed),
+             mean_1_age =mean(age)
+   )
  mean_1_work mean_1_finc mean_1_earn mean_1_nonwhite mean_1_ed mean_1_age
1   0.5376063    13941.57    9928.279       0.5964683  8.992479   33.75899

#7.4 选取儿童数为2的,求work、finc等的均值
> eitc %>%
+   filter(children =="2")%>%
+   summarize(mean_2_work = mean(work),
+             mean_2_finc = mean(finc),
+             mean_2_earn = mean(earn),
+             mean_2_nonwhite = mean(nonwhite),
+             mean_2_ed = mean(ed),
+             mean_2_age =mean(age)
+   )
  mean_2_work mean_2_finc mean_2_earn mean_2_nonwhite mean_2_ed mean_2_age
1   0.4782972    12357.29    7487.978       0.6527546  9.082638   32.26002
> 
> eitc <- eitc %>%  mutate(children_cat = case_when(
+   children == 0 ~ "0",
+   children == 1 ~ "1",
+   children >= 2 ~ "2+"
+ ))
> 
> 
> #问题8:(创建一个名为 any_kids 的新变量(如果 children > 0,则应为 TRUE 或 1)和一个名为 after_1993 的时间变量(如果 year > 1993,则应为 TRUE 或 1))
> any_kids = (eitc$children > 0)*1
> eitc = cbind(eitc,any_kids)
> 
> after_1993 = (eitc$year > 0)*1
> eitc = cbind(eitc,after_1993)
> 
> 
> #问题9:(创建一个新数据集,显示治疗组和对照组(即有孩子和没有孩子)中每年就业女性(工作)的平均比例。)
> eitc %>%
+   filter(any_kids =="1")%>%
+   summarize(mean_any_kid_1_work = mean(work)
+   )
  mean_any_kid_1_work
1           0.4664279
> 
> eitc %>%
+   filter(any_kids =="0")%>%
+   summarize(mean_any_kid_0_work = mean(work)
+   )
  mean_any_kid_0_work
1           0.5744896

以上是我自己做的答案,也不知道正确答案如何,如果有会的同学来点评帮助一下,小编将感激不尽。共勉。

相关文章

  • R语言中工具变量:例题二

    这篇文章主要是:R语言中工具变量的使用、涉及到的数据处理以及模型含义。(本例题涉及数据处理很常用) 两个例题:例题...

  • R语言中工具变量:例题一

    这篇文章主要是:R语言中工具变量的使用、涉及到的数据处理以及模型含义。 两个例题:例题一涉及6个问题,使用的数据集...

  • R基础快速入门(2)

    文集地址 R语言快速入门 R语言变量 R语言中的变量可以存储原子向量,原子向量组或许多R对象的组合 注意:使用ca...

  • R语言中变量的赋值

    原理:R中给变量赋值用"="或"<-"两个字符串 实验: 将3赋给变量x,用变量x通过函数生成变量y,使用命令: ...

  • R语言初级教程(06): 变量命名、赋值运算

    在R语言中,使用变量前不需要声明变量的类型。变量是在赋值运算后才创建的。 1. 变量命名 对于变量的命名,我们主要...

  • JavaScript基础知识点解读—变量(声明/赋值/使用/类型

    变量是每一门编程语言中非常重要的一个概念,不同的编程语言中变量的作用也基本一致。变量可以通过变量名访问,是计算机语...

  • R语言因子2021.2.1

    因子 在R语言中,变量可以分为名义型变量,有序型变量和连续型变量。其中数值型数据更容易是连续型变量,字符串型数据更...

  • 【r<-高级|理论|分享】R中的环境变量

    分享两篇关于环境变量的介绍: 揭开R语言中环境空间的神秘面纱 解密R语言函数的环境空间

  • R语言中的因子型变量

    原文链接:R语言中的因子型变量 微信公众号:机器学习养成记 搜索添加微信公众号:chenchenwings 因子...

  • R programming - WEEK4

    参考文献 R语言实例-数据过滤grep正则表达式R 语言中,数据框依据不同列进行排序R语言rank函数详细解析R语...

网友评论

      本文标题:R语言中工具变量:例题二

      本文链接:https://www.haomeiwen.com/subject/lzdkhrtx.html