贡献
dataex 是 Statalist 社区贡献的命令。 它由作者 Robert Picard 和 Nicholas J. Cox 编写和维护。它与官方 Stata 一起安装,以方便用户在 Statalist 等在线论坛上发帖生成示例数据。 它也可以从 SSC 存档中以相同的形式获得( 请参阅 help ssc )。
语法
dataex [varlist] [if] [in] [, varlabel elsewhere count(#)]
描述
dataex 用于生成数据示例,以便在 Statalist 发帖求助。首先,确保您在发帖求助前已阅读常见问题解答。阅读帖子的用户将能够复制 dataex 生成的代码并重新创建显示的数据集。
input 命令用于将数据输入到与内存中原始变量相同类型的 Stata变量中。 将正确格式化所有数字 datetime 变量,并且还将重新创建具有关联值 labels 的所有数字变量。 如果指定了 varlabel 选项,则结果将包含重新生成所有变量标签的命令。
将 Stata Results 窗口中 dataex 生成的内容复制到 Statalist 上的帖子。确保包含 [CODE] 和 [/ CODE]行。 您可以使用 Post 按钮左侧的
Preview 按钮,在 Statalist 中验证数据示例的格式是否正确。
评论
dataex 产生的输出在 Statalist 之外的其他论坛中也有作用,甚至可以私下用于与 StataCorp 技术支持人员沟通。 在其他论坛或私下,[CODE] 和 [/ CODE] 行将没有用,可以省略。 为方便起见,可以使用 elsewhere 选项来取消这些线的显示。
示例数据的一般建议包括以下内容:
- 显而易见的是,只有在您清楚地解释数据集的情况下,读者才能理解您的数据集。尽管可以详细的口头解释,但需要的时间也很长,读者也难以完全理解。 所以,使用例子很重要!
- 旨在获得最小,完整且可验证的示例。
- minimal 这个词强调了小例子(比如5到10个观察结果)可能足以解释你的数据结构,变量类型和名称。 你的例子应该“完整”,以使你的问题清楚,这也是事实。 通过提供您使用过的数据,您也可以使问题“可验证”。
- 即使您使用可相互访问的数据集(例如使用 sysuse 或 webuse 读入),提供其他人可以快速运行的代码也会非常有用。
选择项
varlabel: 显示生成变量标签的命令。
elsewhere: 表示您的示例是在 Statalist 以外的地方使用。 因此,将禁止显示用于 Statalist 的 CODE 分隔符。
count(#): 指定列出的观察数量的限制。 默认值为 count(100) 。
例子
从标准自动数据集中准备一个小示例。
sysuse auto
dataex make price mpg rep78 in 1/5
您可以按所需顺序显示变量。 如果某些变量具有值标签,则结果将包括重新创建它们的命令。
dataex make rep78 price foreign if rep78 == 5
您可以使用 varlabel 选项包含用于重新生成变量标签的命令。
dataex make rep78 price foreign if rep78 == 5, var
数字 datetime 变量也将正确格式化。 在以下示例中,使用 Stata 的内部数值重新生成每日日期变量日期,然后使用 %td 格式进行格式化。 下一个示例显示了季度日期变量。
sysuse sp500
dataex in 1/5
sysuse gnp96
dataex in 1/5
如果数据集很大,请考虑选择随机样本。 以下示例使用 randomtag (来自 SSC )来选择10个随机观察。
ssc install randomtag
sysuse icd9_cod.dta, clear
randomtag if length(__code9) == 4, count(10) gen(pick)
dataex __code9 __desc9 if pick
网友评论