SDTM中CO数据集属于特殊目的域(Special-Purpose),主要收集临床试验项目中的注释信息,这里的注释信息一般有2个来源:
- Ⅰ:在CRF页面上与其他数据一起收集;
- Ⅱ:在CRF单独页面中收集。
临床试验项目中,收集的注释通常有3类:
- Ⅰ:与其他Domain无关联的注释;
- Ⅱ:与其他Domain有关联,但与Domain具体观测无关联的注释;
- Ⅲ:与其他Domain有关联,且与Domain具体观测相关联的注释。
下面介绍一下CO数据集中的变量,CO数据集理解的难点在于第Ⅲ类Comments,主要体现在变量IDVAR, IDVARVAL的理解上。结合3类Comments,希望读者能够理解CO变量的内在联系,在具体SAS编程中思路清晰,提高效率。
COVAL
CO数据集的主题变量,保存收集的注释信息,这也是CO数据集存在意义之所在。
RDOMAIN
CO中的RDOMAIN变量(Related Domain Abbreviation),保存与注释相关的数据集名称。如果CRF收集的注释与其他数据集无关联,那么这个变量就会置空。即,Ⅰ类注释Rdomian变量为空,Ⅱ、Ⅲ类注释Rdomain变量为关联的数据集名称。
IDVAR, IDVARVAL
对于Ⅲ类注释,与其他Domain中的特定观测相关联,那如何表现这样的关联呢?在一般观测类的SDTM数据集中(Interventions, Events, Findings),都会有变量来标记某一条观测或某一类观测。这可以理解成,数据集中会有变量来标记某些观测在数据集中的“具体位置”。例如,--SEQ变量(Sequence Number)标记观测在数据集中的唯一性(即标记观测的顺序);--GRPID变量(Group ID)标记受试者的一组相关联的观测。所以Ⅲ类注释,可以通过获取所相关联观测的标记变量的名称(IDVAR,例如,--SEQ,--GRPID)以及对应的标记变量值(IDVARVAL),来表现与该观测的关联。即,通过获取所关联的观测在数据集中的“具体位置”,来表示与之关联。
那如何获取标记变量(IDVAR)以及对应的标记变量值(IDVARVAL)呢?
Ⅲ类注释通常与CRF页面上所关联的数据一起收集,即注释来源为Ⅰ。一般观测类的SDTM数据集(Interventions, Events, Findings),都会保留申办方自定义的标识符变量(--SPID, Sponsor-Defined Identifier),这个变量的值通常包含CRF页名、具体页码、记录编号等信息,用于追溯数据记录的来源。因为Ⅲ类注释与相关联的数据观测是一起收集的,所以两者来源一致,即可以用“COSPID”与所关联的观测的--SPID拼接,来获取IDVAR、IDVARVAL的值。
CODTC
对于Ⅰ、Ⅱ类注释,CODTC变量(Date/Time of Comment),注释的采集日期都需要提供。而对于Ⅲ类注释,收集时间与相关联的其他数据集观测是一致的,所以CODTC变量应该为空。即,在CO数据集中,具有非空的IDVAR、IDVARVAL的观测的CODTC变量是为空的。
VISIT, VISITNUM
VISIT、VISITNUM变量与CODTC变量类似。对于Ⅰ、Ⅱ类注释,可以基于CODTC或对应的CRF访视信息获取这两个变量;对于Ⅲ类注释,VISIT、VISITNUM变量与相关联的其他数据集观测一致,在CO数据集中,这两个变量也是置空的。
若有疑问,欢迎评论区交流!
网友评论