今天讲一下年前的第二篇文章《递交CDE文件的一些个人看法》。
最近有个比较“古老”的项目在经CDE审批,然后提出了一些补交文件的要求。其中当头就说“请根据《药物临床试验数据递交指导原则》....”,然后要干嘛干嘛。
当时那个项目连aCRF都没有,也没有做SDTM,也没有define,只有PDF的数据说明文件,但是现在的话一个相对正规的项目,肯定会签aCRF,SDTM,SDTM Define,cSDRG,ADaM,ADaM Define,ADRG,TFL这些东西,那么就没有上述的那些烦恼了,按照CDISC标准做就是了。
但是在递交给CDE的时候,还是需要重点关注一下《药物临床试验数据递交指导原则》(以下简称文件)这份文件,这个在CDE官网就可以直接下载了。
这里顺便说下个人的理解,在对临床行业还没有那么深刻的认识的时候,只知道一个CDISC。但是现在的我觉得ICH的那些指导原则是临床行业的第一执行标准,后面各国颁布的什么指导原则啊,说明文件都是在遵守ICH指导原则的基础上来的,这个就有点像宪 法和各个地方法规之间的关系,大家可以了解一下。
一:原始数据库
以前我总好奇,平时我们做项目,大多数都会有外部文件,然后一般是以EXCEL的格式传输,比如血药浓度数据、各种抗体数据、或者一些编码报告等,接着我们会做到我们的SDTM或者ADaM数据集里面。那我就在想,这些外部文件,CDE审评的那些人需要看吗?需要把这些文件也发给他们吗?
或者说如果不递交这些文件,就看数据集,他们能保证这些数据是真实的吗?他们需要追溯到数据产生的源头吗?这是一直让我困惑的地方。
如果我们有做SDTM,那么在递交的时候,SDTM就是原始数据库,这个在TCG还是哪里看到过,而不是我们以为的从DM那接收的RAW数据集是原数据库。
换句话说就是:虽然我们做SDTM会有各种各样的外部文件,但是这些外部文件都被我们做到SDTM里面的变量,成为变量里的值了。那么这些外部数据也被当作原始数据库一并提交了。
至于你说审评的人要追究这些数据是不是真实的,那我就不知道了,也不知道他们的审评流程具体是什么样的。
文件中也说了原始数据库包括外部文件,如果是直接从RAW到ADaM的项目,那么这时候EDC数据就是原始数据库,如果包含外部文件,那么外部文件也需要转换成XPT格式,同时在数据说明文件里面说明外部文件各个列代表什么意思(其实也就是做成变量了)。

同时这些外部EXCEL文件也需要递交的,但是 不是放在m5文件夹里。应该有一个专门的部门负责这部分内容,要不然审评的人真的溯源起来,你却提供不了这些文件,那不是有合理理由怀疑你数据造假吗。
这是关于原始数据库的个人理解,欢迎大家讨论!
二:数据说明文件
文件里说到“数据说明文件是一份用来描述递交数据的文件,至少应包含递交数据库中各数据集名称、标签、基本结构描述及每一数据集中各变量的名称、标签、类型、来源或衍生过程。”。
“数据说明文件是监管机构审评时准确理解递交数据内容最重要的文件之一”
“需要通过数据说明文件建立起数据间良好的可追溯性”
“数据说明文件一般为可扩展标记语言(Extensible Mark-up Language,XML)或便携文档格式(Portable Document Format,PDF)文件”

如果我们有做define,那么define里的内容就满足上面的那些要求,这里顺便讲下大家在写SPEC的时候,对于一些变量的值的衍生,尤其是ADaM里的一些变量衍生规则,尽量写的详细一些,然后尽量避免用一些编程表达式。
因为审评老师他的编程能力可能没你专业啊,如果你用了一些特殊的编程语言,那么在审阅人看来就有点麻烦,不能理解这是什么意思了,就有可能拒绝你的申请。举个例子就是 = 换成 equal to (当然等于号谁都看得懂,我只是想表达文中的意思)
同时我也发现转换规则里少写一些编程的东西,可以避免双侧的程序员一下子把SPEC上的东西复制过去,结果SPEC写错了,那么两个人都有可能写错了,这是挺严重的一些事情,尤其是在判断TEAE的时候或者其他一些关键性数据的时候。
三:数据审阅说明
在文件里,虽然用了“鼓励”这两个字,但是能递交就递交吧,这次就要求我们补充数据审阅说明,但是没明确指出是cSDRG还是ADRG还是两个都要。
数据审阅说明其实就是cSDRG和ADRG,ADRG好说,但是对于从RAW到ADaM的项目来说,cSDRG就显得很不合理了,因为cSDRG里面的大多数东西都是关于对SDTM的一些说明,用在RAW数据就有点牵强了,有这方面的经验欢迎分享一下,如果非要的话,那就按照cSDRG的模式对RAW进行一些说明吧。

四:程序代码

文件里说了“申报资料中递交的程序代码应当易懂、可读性强,建议提供充分的注释、避免外部(宏)程序调用。”。
但是我们知道,每个公司都有一套自己内部的宏,比如读取SPEC获取各个变量属性的宏、输出RTF的宏,那么这些宏是否需要解析还是直接把程序递交给他们就可以了?
如果需要解析,那也没问题,但是比如输出RTF,我们一般会用到TOC文件,可能是导出数据集,虽然我们解析了输出RTF的宏,但是应该也需要TOC这个数据集吧,那么审阅的人在跑程序也可能因为没有这个TOC文件而报错。
所以如果我们不提供公司内部的文件夹结构和文件的话,程序大概率是报错的,或者说CDE内部自己有工具,能避免这个问题?这个对于我来说是个迷。

文件最后附录了一个m5的文件夹结构,告诉了临床试验数据相关的文件该怎么放置,在adam的program文件夹下,还说明了最好放上生成相关图表的程序代码,这是需要注意的一点。
另一个就是外国的m5文件夹结构和文件列举的文件夹结构还不一样,外国的多了misc和profiles两个文件夹,我搜了一下,这个misc文件就是放没做到SDTM数据集的一些外部的excel文件。

所以关于递交的一些细节有很多模糊不清的地方,也是值得讨论的地方。在CDE的官网上,也有一些视频培训,我看了第一堂课,跟我们关系不是很大,看下后续的培训涉不涉及临床试验数据递交的东西,大家可以关注一下。

m5属于eCTD的一部分,上次我已经把eCTD的一部分资料发给付费的小伙伴了,看下有时间写一下关于eCTD的文章。年后我看下再录一节如何递交上面这些文件的课吧。
最后再说一句:大家在做项目或者递交的时候,还是需要多多注意这些指导原则的要求。然后文中有错误的地方,欢迎指正!
网友评论