本PDF文档详细记录了作者在学习标准数据传输模型实现指南(SDTMIG)过程中的心得体会与总结,旨在帮助其他研究者更好地理解和应用这一重要行业规范。
SDTMIG(Study Data Tabulation Model Implementation Guide)是一种国际公认的临床试验数据标准化模型,在生命科学领域特别是新药研发过程中向监管机构如FDA提交数据时使用。该模型旨在提供清晰的数据结构、属性及内容描述,便于审评人员高效评估临床试验数据。
以下是关于SDTMIG的一些关键知识点:
1. **数据集结构**:不同于传统的一般数据集,SDTM将根据来源和主题细分到不同的域中,每个域都有独特的两字符代码。例如,“AE”表示不良事件,“CM”代表伴随用药,“DA”是药物发放回收记录,“DM”则为人口统计信息。
2. **记录与变量**:在SDTM中,每个人每次事件、每种用药或每次不良反应都会单独形成一条记录,这增加了记录数量但减少了变量数量。每个受试者在各访视的各个时间点可能会有多条观测记录,通过特定变量确保唯一性。
3. **关联数据集**:为处理多阶段、多时间点和多剂量等复杂试验情况,SDTM包含了用于连接相关数据的数据集。
4. **元数据**:对数据项进行描述及定义的语义规则语法被称为元数据。这有助于提高数据库的质量与标准化,并促进跨组织间的交流协作。制定统一的标准是确保变量名及其值的一致性的重要步骤。
5. **选择域和变量**:并非所有预设的SDTM域和变量都需要在每个研究中使用,实际应用需根据具体需求决定哪些需要采用。
6. **域模型**:各类特殊用途及通用观察类(如干预、事件等)构成了不同类型的域。依据特定的研究要求选定必需项、预期值或许可提交的信息,并且这些变量必须按照标识符、主题相关信息、修饰词和时间顺序排列。
7. **变量命名规则**:“USUBJID”是所有数据集中都应包含的唯一受试者识别码,而每个域内各变量标签及其名称长度通常限制为8个字符以内。
8. **文本输入与大小写规范**:在提交过程中建议使用全大写字母表示文本信息(除非涉及长段落、描述性内容或已经采用特定格式)。分类代码如—CAT、—SCAT等用于组织和编码各类数据项。
9. **缺失值处理机制**:单个数据点的丢失通常以空格的形式呈现,同时需要借助—STAT与—REASND变量来记录其状态及原因。通过SDTMIG的学习应用可实现临床试验数据标准化,从而提升审查效率并促进全球范围内此类信息的一致性和互操作性。