ADSL数据集中的变量可以分成8个部分,分别是 Identifier , Subject Demographics , Treatment , Dose , Treatment Timing , Period Subperiod and Phase Timing , Trial Experience , Stratification ,各有不同的作用。当然,ADSL的变量可以增加,这里只是介绍官方文件里提到的。
在变量中y表示数字,比如 REGIONy,实际中可以代表 REGION1 REGION2 REGION3等等,它表示的是区域的分组方法,REGION2并不表示分组中的第二个组,而是代表第二种分组方法。x表示两位数字,比如TRTxxPN,实际中可以代表 TRT01PN TRT02PN TRT03PN等等。
一、Identifier
这类变量是标识符变量,其作用是在联表的时候用来作为连接键的。一共有8个,STUDYID,USUBJID,SUBJID,SITEID,SITEGRy,SITEGRyN,REGIONy,REGIONyN。分为4个类别研究、受试者,中心,地理区域。
STUDYID 表示研究名字,有的时候试验会有联合进行的情况。
USUBJID表示受试者编号,该编号是包含研究名的,可以区分不同研究下的受试者。
SUBJID只是受试者编号。
SITEID表示的是中心号。以上变量都是Req的,也就是说必须存在不可缺失。
SITEGRy 表示的是中心的分组方法,SITEGRyN是 SITEGRy 的数值型表达。以上变量都是Perm的。
REGIONy 表示的是地理区域的分组方法,REGIONyN是 REGIONy 的数值型表达。以上变量都是Perm的。
二、Subject Demographics
这类变量是人口学数据,共9个变量,实际上是3个内容,年龄,性别,民族。AGE,AGEU,AGEGRy,AGEGRyN,AAGE,SEX,RACE,RACEGRy,RACEGRyN,作用如下:
AGE 是来自SDTM中收集的数据,数值型变量。
AGEU是年龄的单位,以上变量都是Req的。
AAGE 是分析年龄,数值型变量。当分析年龄的计算方式和收集的年龄不一样的时候,必须使用否则可以不用。该变量是Cond的,也就是在某种情况下是Req的,其他情况是Perm的。
AGEGRy 表示的是年龄的分组方法,AGEGRyN是 AGEGRy 的数值型表达。以上变量都是Perm的。
SEX 表示性别。
RACE 表示民族,以上变量都是Req的。
RACEGRy 表示的是民族的分组方法,RACEGRyN是 RACEGRy 的数值型表达。以上变量都是Perm的。
三、Treatment
这类变量是关于治疗给药的变量,一共18个:ARM,ACTARM,TRTxxP,TRTxxPN,TRTxxA,TRTxxAN,TRTSEQP,TRTSEQPN,TRTSEQA,TRTSEQAN,TRxxPGy,TRxxPGyN,TRxxAGy,TRxxAGyN,TSEQPGy,TSEQPGyN,TSEQAGy,TSEQAGyN。
ARM(Req),受试者计划分组,是从SDTM中复制来的。
ACTARM(Perm),受试者计划分组,是从SDTM中复制来的。
就变量结构来说,可以先把ARM类的2个变量归为一类。剩下的16个变量,实际上只有两个对象,一个是TRT,一个是TRT的SEQ。两者根据:计划的还是实际的,数值的还是字符的,原始的还是再分组的,这3个维度,每个变量可以分成8个变量。
先说TRT的8个变量:
TRTxxP(Req):第XX周期的计划治疗(给药)。
TRTxxPN(Perm):TRTxxP的数值型。
TRTxxA(Cond):第XX周期的实际治疗(给药)。
TRTxxAN(Perm):TRTxxA的数值型。
TRxxPGy(Perm):第XX周期的计划治疗(给药)的第y个分组方法。
TRxxPGyN(Perm):TRxxPGy的数值型。
TRxxAGy(Cond):第XX周期的实际治疗(给药)的第y个分组方法。
TRxxAGyN(Perm):TRxxAGy的数值型。
然后是SEQ的8个变量:
TRTSEQP(Cond):计划治疗(给药)序列(按周期顺序)。
TRTSEQPN(Perm):TRTSEQP的数值型。
TRTSEQA(Cond):实际治疗(给药)序列(按周期顺序)。
TRTSEQAN(Perm):TRTSEQA的数值型。
TSEQPGy(Perm):计划治疗(给药)序列(按周期顺序)的第y个分组方法。
TSEQPGyN(Perm):TSEQPGy的数值型。
TSEQAGy(Cond):实际治疗(给药)序列(按周期顺序)的第y个分组方法。
TSEQAGyN(Perm):TSEQAGy的数值型。
四、Dose
这类变量是表示剂量的,P是计划,A是实际,U是单位。xx表示周期。一共3个:DOSExxP,DOSExxA,DOSExxU。这些变量都是Perm的。
五、Treatment Timing
这类变量是表示给药治疗的时间。一共有20变量,可以分成4部分,分别是开始时间,结束时间,各周期开始时间,各周期结束时间。每个部分内包含5种时间变量,分别是日期(数值),时间(数值),日期时间(数值),日期填补标记(字符),时间填补标记(字符)。这20个变量为:TRTSDT,TRTSTM,TRTSDTM,TRTSDTF,TRTSTMF,TRTEDT,TRTETM,TRTEDTM,TRTEDTF,TRTETMF,TRxxSDT,TRxxSTM,TRxxSDTM,TRxxSDTF,TRxxSTMF,TRxxEDT,TRxxETM,TRxxEDTM,TRxxEDTF,TRxxETMF。
开始时间类:
TRTSDT(Cond):给药开始日期。
TRTSTM(Perm):给药开始时间。
TRTSDTM(Cond):给药开始日期时间。
TRTSDTF(Cond):给药开始日期填补标记。当对应变量被填补时必须有。
TRTSTMF(Cond):给药开始时间填补标记。当对应变量被填补时必须有。
结束时间类:
TRTEDT(Cond):给药结束日期。
TRTETM(Perm):给药结束时间。
TRTEDTM(Cond):给药结束日期时间。
TRTEDTF(Cond):给药结束日期填补标记。当对应变量被填补时必须有。
TRTETMF(Cond):给药结束时间填补标记。当对应变量被填补时必须有。
各周期开始时间:
TRxxSDT(Cond):第xx周期的给药开始日期。
TRxxSTM(Cond):第xx周期的给药开始时间。
TRxxSDTM(Cond):第xx周期的给药开始日期时间。
TRxxSDTF(Cond):第xx周期的给药开始日期填补标记。当对应变量被填补时必须有。
TRxxSTMF(Cond):第xx周期的给药开始时间填补标记。当对应变量被填补时必须有。
各周期结束时间:
TRxxEDT(Cond):第xx周期的给药结束日期。
TRxxETM(Cond):第xx周期的给药结束时间。
TRxxEDTM(Cond):第xx周期的给药结束日期时间。
TRxxEDTF(Cond):第xx周期的给药结束日期填补标记。当对应变量被填补时必须有。
TRxxETMF(Cond):第xx周期的给药结束时间填补标记。当对应变量被填补时必须有。
六、Period Subperiod and Phase Timing
在“五”中的时间是给药的各种时间,在这里则是周期,子周期,阶段的各种时间,一共有变量32个。和“五”中的时间变量一样,每组时间变量有5个,算上开始结束时间的话,每个对象是10个变量,这样周期,子周期,阶段就有了30个变量。而子周期和阶段则单有一个变量用来描述和解释,所以一共是32个,他们分别是:APxxSDT,APxxSTM,APxxSDTM,APxxSDTF,APxxSTMF,APxxEDT,APxxETM,APxxEDTM,APxxEDTF,APxxETMF,PxxSw,PxxSwSDT,PxxSwSTM,PxxSwSDM,PxxSwSDF,PxxSwSTF,PxxSwEDT,PxxSwETM,PxxSwEDM,PxxSwEDF,PxxSwETF,APHASEw,PHwSDT,PHwSTM,PHwSDTM,PHwSDTF,PHwSTMF,PHwEDT,PHwETM,PHwEDTM,PHwEDTF,PHwETMF。
周期开始时间:
APxxSDT(Perm):第xx周期开始日期。
APxxSTM(Perm):第xx周期开始时间。
APxxSDTM(Perm):第xx周期开始日期时间。
APxxSDTF(Cond):第xx周期开始日期填补标记。当对应变量被填补时必须有。
APxxSTMF(Cond):第xx周期开始时间填补标记。当对应变量被填补时必须有。
周期结束时间:
APxxEDT(Perm):第xx周期结束日期。
APxxETM(Perm):第xx周期结束时间。
APxxEDTM(Perm):第xx周期结束日期时间。
APxxEDTF(Cond):第xx周期结束日期填补标记。当对应变量被填补时必须有。
APxxETMF(Cond):第xx周期结束时间填补标记。当对应变量被填补时必须有。
子周期开始时间:
PxxSwSDT(Perm):第xx周期第w子周期的开始日期。
PxxSwSTM(Perm):第xx周期第w子周期的开始时间。
PxxSwSDTM(Perm):第xx周期第w子周期的开始日期时间。
PxxSwSDTF(Cond):第xx周期第w子周期的开始日期填补标记。当对应变量被填补时必须有。
PxxSwSTMF(Cond):第xx周期第w子周期的开始时间填补标记。当对应变量被填补时必须有。
子周期结束时间:
PxxSwEDT(Perm):第xx周期第w子周期的结束日期。
PxxSwETM(Perm):第xx周期第w子周期的结束时间。
PxxSwEDTM(Perm):第xx周期第w子周期的结束日期时间。
PxxSwEDTF(Cond):第xx周期第w子周期的结束日期填补标记。当对应变量被填补时必须有。
PxxSwETMF(Cond):第xx周期第w子周期的结束时间填补标记。当对应变量被填补时必须有。
阶段开始时间:
PHwSDT(Perm):第w阶段开始日期。
PHwSTM(Perm):第w阶段开始时间。
PHwSDTM(Perm):第w阶段开始日期时间。
PHwSDTF(Cond):第w阶段开始日期填补标记。当对应变量被填补时必须有。
PHwSTMF(Cond):第w阶段开始时间填补标记。当对应变量被填补时必须有。
阶段结束时间:
PHSwEDT(Perm):第w阶段结束日期。
PHSwETM(Perm):第w阶段结束时间。
PHSwEDTM(Perm):第w阶段结束日期时间。
PHSwEDTF(Cond):第w阶段结束日期填补标记。当对应变量被填补时必须有。
PHSwETMF(Cond):第w阶段结束时间填补标记。当对应变量被填补时必须有。
最后两个描述变量:
PxxSw(Perm):对第xx周期下的w子周期的描述。
APHASEw(Perm):对阶段w的描述。
七、Trial Experience
这里的变量描述试验相关的信息,共包含变量35个。可以大致分为5个部分:试验完结(13个),相关时间(7个),依从性(3个),周期持续时间(6个),死亡相关(6个)。第七部分除特殊说明,所有变量均为Perm的。
试验完结部分共有13个变量,以3个变量为一组一共4组12个变量,外加一个日期变量构成。每组3个变量为:结束时的状态,结束时未完成的原因,未完成的其他原因。4个组分别是:试验结束时间点,给药结束时间点,第xx周期结束时间点,第xx周期给药结束时间点。
EOSDT:试验结束日期,数值型。
试验结束时间点的3个变量:
EOSSTT:试验结束时间点的状态。
DCSREAS:试验结束时间点,未完成的原因
DCSREASP:试验结束时间点,未完成的其他原因
给药结束时间点的3个变量:
EOTSTT:给药结束时间点的状态。
DCTREAS:给药结束时间点,未完成的原因
DCTREASP:给药结束时间点,未完成的其他原因
第xx周期结束时间点的3个变量:
EOPxxSTT:第xx周期结束时间点的状态。
DCPxxRS:第xx周期给药结束时间点,未完成的原因
DCPxxRSP:第xx周期给药结束时间点,未完成的其他原因
第xx周期给药结束时间点的3个变量:
EOTxxSTT:第xx周期给药结束时间点的状态。
DCTxxRS:第xx周期给药结束时间点,未完成的原因
DCTxxRSP:第xx周期给药结束时间点,未完成的其他原因
相关时间部分共有7个变量,包含4个时间点,知情日期,入组日期,随机日期,已知最后生存日期。除了最后一个日期外,每个日期还可以不止一个。所有变量都是数值型。
RFICDT:知情同意日期,数值型。
RFICyDT:第y个知情同意日期。
ENRLDT:入组日期日期,数值型。
RFICyDT:第y个知情同意日期。
RANDDT:随机日期日期,数值型,Cond类型。
RFICyDT:第y个知情同意日期,Perm类。
LSTALVDT:已知最后生存日期。
依从性部分共有3个变量:
TRCMP:对试验药物的依从性。
TRCMPGy:对TRCMP的第y种分类方法,比如80%-120%,<80%,>120%等等。TRCMPGyN 是 SITEGRy 的数值型表达。
周期持续时间部分共有6个变量,描述的是治疗持续时间,分为整体持续时间和每个周期的持续时间。每个持续时间分成年,月,日三个变量,均为数值型。
TRTDURD:以日为单位,描述整个试验中给药持续时间。
TRTDURM:以月为单位,描述整个试验中给药持续时间。
TRTDURY:以年为单位,描述整个试验中给药持续时间。
TRxxDURD:以日为单位,第xx周期中给药持续时间。
TRxxDURM:以月为单位,第xx周期中给药持续时间。
TRxxDURY:以年为单位,第xx周期中给药持续时间。
死亡相关部分共有6个变量:
DTHDT:死亡日期,数值型。
DTHDTF:死亡标记,属于Cond变量。
DTHCAUS:死亡原因。DTHCAUSN 是 DTHCAUS 的数值型表达。
DTHCGRy:对DTHCAUS的第y种分组方法。DTHCGRyN 是 DTHCGRy 的数值型表达。
八、Stratification
这里的变量描述的是分层相关的内容,共包含9个变量:STRATAR,STRATARN,STRATwD,STRATwR,STRATwRN,STRATAV,STRATAVN,STRATwV,STRATwVN。结构上除了一个描述型变量外,剩下的8个变量是4个主要变量和4个对应的数值型变量。
STRATwD:第w个分层因素的文字描述。
STRATAR:用于随机的各个分层因素的总和。STRATARN 是 STRATAR 的数值型表达。
STRATwR:用于随机的第w个分层因素。STRATwRN 是 STRATwR 的数值型表达。
STRATAV:STRATAV是经过验证的STRATAR,如果所有的用于随机的受试者信息都正确,那么STRATAV和STRATAR是相等的。而对应的STRATAVN 是 STRATAV 的数值型表达。
STRATwV:STRATwV是经过验证的STRATwR,如果所有的用于随机的受试者信息都正确,那么STRATwV和STRATwR是相等的。而对应的STRATwVN 是 STRATwV 的数值型表达。
网友评论