MH数据集收集在试验开始之前的病史信息。作为Events类数据集,结构上MH与AE很类似;但是具体内容上,在我看来MH要相对简单许多,同样,编程上也没有太多的复杂点。
MH数据集一般来源都是CRF的Medical History相关页,通常分为两类,第一类,一般既往病史(General Medical History);第二类,目标既往病史(Targeted Medical History)。前者收集受试者入组前一般的医疗病史,后者收集研究者感兴趣的特定的医疗病史。
MH数据集的主题变量是MHTERM,其标准编码是MHDECOD。在SDTMIG的说明中,不像AE数据集那样,一些编码变量(例如,--LLT, --LLTCD, --PTCD, --HLT, --HLTCD, --HLGT, --HLGTCD, --BDSYCD, --SOC, 和 --SOCCD)并没有出现在MH的说明文件中,这并不意味着MH不使用这些变量信息。如果原始数据集中有这些变量的信息,这些变量还是要保存到MH数据集中的。
对于目标既往病史,它是研究者提前指定收集的,所以MHPRESP变量的值为"Y",CRF Form上也会有特定区域记录改事件是否发生的变量(MHOCCUR)。一般来讲,如果MHPRESP = "Y",MHOCCUR这个变量是要有值的;如果没有值,MHSTAT变量就会显示“NOT DONE”。这三个变量通常是一起出现的,但也有一些研究的CRF设计中,对于MHPRESP=“Y”的情况下,MHOCCUR这个区域是必填项,不会出现空值的情况,这时MHSTAT这个变量其实就没必要存在。
对于一般既往病史,并没有提前指定病史,所有上面谈到的3个变量都为空。
关于MH,我还想谈一点编程结构的问题,一个项目中MH的来源可能有多个CRF Form。从个人经验上讲,分别对单独的Form信息进行处理生成对应的变量,要比,生成单个变量考虑不同Form信息,简洁明了得多。具体一点讲,假设MH只有两个Form来源,前者可能要考虑“2 * N”种情况,后者要考虑“N * 2”种情况。情况总数一样,前者只要分2类进行讨论,后者要分N类进行讨论。造成“N * 2”这种情况的原因,可能是SDTM编程的说明文档是按各个变量维度进行整理的。如果没注意,就很容易按变量维度进行编程,这样编程的复杂度会大很多,也不容易进行直观理解。其他多来源的SDTM数据集编程也是要考虑这个问题的,希望读者能够注意。
以上。
若有疑问,欢迎评论区留言讨论!
网友评论