导出方法对比
本页概述了研究数据提取(SDE)、研究文件格式(SFF)和 CDB 原始导出类型之间的主要区别。
关键概念
以下部分提供了每种导出方法的关键概念。
研究文件格式 API
- 一种自描述型 API,支持从特定研究中提取完整和增量的研究数据及研究设计数据。自描述意味着该 API 为用户提供了使用下游内容所需的所有信息。
- manifest.json 文件提供了每个列的架构和描述,以及用户可用于理解 CSV 文件并确保其集成不会中断的额外元数据。
- 同时适用于 EDC 和 CDB 客户。
- 不支持自定义。
SFF API 提供两种检索模式:
- 完整数据:完整数据指截至数据包生成时点的全部研究和研究设计数据。
- 增量数据:增量数据指与上一研究数据包相比,记录的所有变更(新增、修改或删除)。
研究数据提取
- 一种提取包,包含完整的研究和研究设计数据集,可以按计划运行或以作业形式按需运行。
- 支持 CSV、SAS 和 XPT 文件格式。
- 支持有限自定义。
- 从 EDC 工具或通过 EDC REST API 运行。
- 可交付至 FTP 或 AWS S3 位置。
- 在 CDB 中非原生可用。
CDB 原始导出
- 一种导出,包含列表并将列表转换为标准化格式。
- 默认包含临床数据(核心列表)和运营数据(系统列表)。
- 支持包含自定义列表、质疑、观察和方案偏离。
- 可通过 CQL 列表自定义并包含在导出定义中。
- 支持 CSV 和 SAS 文件格式。
- 可通过导出用户界面(计划或按需)或通过 REST API 使用。
- 可将用户界面作业交付至 FTP 位置。
- 适用于 CDB 和临床报告用户。
主要区别
以下部分重点介绍 SFF API、SDE 和 CDB 原始导出之间的主要区别。
用例
每种导出方法服务于不同的需求。
研究文件格式
SFF 作为一个自描述型 API,面向集成、报告和分析场景,提供快速可靠的连接。它支持重复的快速数据加载,使目标系统保持同步。SFF 还提供增量数据,使用户无需依赖完整加载即可维护最新数据,从而提升性能。
用户以编程方式使用 SFF。它使用标准输出格式,该格式支持来自三个来源的数据:
- EDC
- CDB
- 非 Veeva EDC 数据
研究数据提取
SDE 仅包含 Veeva EDC 数据。它通过 CSV 或 SAS 数据集交付数据,自定义能力有限。其目的是供用户用于完整研究数据的分析和下游处理。数据可由机器或人工摄取。
CDB 原始导出
CDB 原始导出的用例与 SDE 类似,但支持同时包含 EDC 和外部第三方数据。
交付方式
三种导出方法的交付机制各不相同。主要区别在于 API 检索和计划作业。
研究文件格式
可通过多个端点检索 SFF,系统在给定时间发布数据包(增量数据包为 15 分钟,完整数据包为 24 小时)。无需通过作业来“启动”SFF,而是直接通过 API 下载 SFF 数据包。此外,除了在 EDC 工具中启用该功能外,SFF 没有界面。
研究数据提取
SDE 是一个作业,可通过 EDC 工具的用户界面访问,或通过 API 按需启动。通过界面或 API 检索 ZIP 数据包。然而,该作业需要调度或启动,尽管调度仅通过界面进行。系统可以通过 FTPS 将其交付到外部目标。
CDB 原始导出
类似地,CDB 原始导出是一个作业,可以通过 CDB 或临床报告导出界面按计划或按需运行,并交付到类似于 SDE 的外部连接。也可以通过 API 端点运行。
版本控制
SDE 和 SFF 均使用版本控制。当列、数据类型或其他可能影响文件结构的更改发生时,SDE 会为正式版本添加一个新版本。SDE 维护所有版本,任何版本弃用都会提前通知,以便客户有时间升级。
作为自描述型 API 的 SFF 有两个版本控制概念,在正式发布周期中推出:
- API 版本:当 API 请求或响应负载发生结构性更改时更新。
- 数据包版本:当数据包架构发生可能具有破坏性的结构性更改时更新。
SFF 与 SDE 的区别在于,新增列不一定需要版本更新,因为 manifest.json 文件供用户以编程方式读取,因此它可以理解列添加等更改。如果 manifest.json 文件更改了现有属性(例如,可能导致使用时出现破坏性更改的属性),我们会考虑更新包版本。SFF 为其 API 和数据包分别仅维护两个活动版本(当前版本和先前版本)。
CDB 原始导出没有数据包版本控制的概念。然而,当系统从父列表向 CQL 结果集添加新列时,系统会为受影响的导出定义和导出列表检测到一个更改指示器,用户必须手动接受才能更改其导出结果的输出。
自定义
SDE 支持有限自定义,包括数据集选择、格式和文件名自定义。SFF 不支持自定义。SFF 旨在为用户提供标准统一的格式,预计他们将在下游应用任何自定义或数据转换。CDB 原始导出支持更多自定义,因为用户可以选择导出定义中包含哪些列表,并可以在输出中包含自定义 CQL 列表和由列表生成器创建的列表。
文件内容
SFF 的 ZIP 文件包含一个数据文件夹,用于存放所有 CSV 文件和一个 manifest.json 文件。manifest.json 文件实现了该功能的自描述特性,供用户以编程方式将 CSV 文件的内容摄取到他们的下游系统中。
SDE 的 ZIP 文件包含 CSV 文件、SAS 和/或 XPT 文件。CDB 原始导出的 ZIP 文件包含 CSV 文件和/或 SAS 文件。
所有 ZIP 文件都包含临床数据和运营或系统数据。SDE 在 definitions 文件夹中包含研究设计信息,便于人工阅读。相比之下,SFF 在 manifest.json 文件中包含必要的研究设计信息,该文件以编程方式描述来自临床数据文件的数据。当 EDC 中发生研究设计更改时,SFF 研究设计信息会随完整数据包提取而更新。
由于 SFF 包含受限数据,必须授予自定义用户研究文件格式访问权限,该权限默认包含“受限数据访问”。
临床数据
所有导出格式都按表单展示临床数据。这意味着每个文件代表一个表单定义,文件中的每一行代表一个表单的记录。系统将记录“扁平化”以表示临床数据研究层级,其中临床数据条目显示为列,单元格中的数据代表条目的值。
每个文件都包含标题列,以表示一行数据所属的关键概念,如研究、研究中心和国家/地区。这代表了 CRF 的临床数据研究层级。
格式差异
SDE、SFF 和 CDB 原始导出之间临床数据格式化的主要差异如下表所示。
| 数据字段 | SFF | SDE | CDB 原始导出 |
|---|---|---|---|
| 表单状态 | 包括来自 eCRF 的“已提交”和“编辑中”数据。 | 包括所有表单状态,可选择排除空白表单数据。 | 在 CQL 投影中默认包含“已提交”数据。 |
| 日期 | 具有标准化日期和研究中心输入的“原始”日期。 | 具有标准化和格式化日期以及研究中心输入的“原始”日期。 | 具有标准化日期和研究中心输入的“原始”日期。 |
| 日期时间 |
|
日期时间有四列:
|
具有标准化的日期时间和研究中心输入格式的“原始”日期时间(未附加时区)。 |
| 布尔值 | 表示为 true/false。 | 提供格式化布尔值的选择。 | 表示为 true/false。 |
| 动态列 |
额外列包括:
|
额外列包括:
|
额外列包括:
|
| 名称与标签 | 主要使用“名称”值。标签和显示覆盖标签存储在完整 SFF 数据包提取中的单独 CSV 文件中。 | 主要使用“标签”值。 | 主要包含“名称”值。一些系统列表包含标签。自定义列表可能包含标签,具体取决于 CQL。 |
| 外部 ID | 存在于 study_design 块的 manifest.json 文件中。 |
存在于 CSV 文件中。 | 存在于某些系统列表中。 |
| 唯一标识符 | SFF 具有行 ID(ROWID)的概念,对于给定的数据行是唯一的,是帮助跟踪数据包之间增量更改的基础。 | SDE 使用全球唯一标识符(GUID)列帮助用户识别数据集的唯一键。 | 存在于某些系统列表中。 |
| 重复项组 | SFF 不假设来自非重复条目组的数据应在重复条目组实例中重复。如果需要,可以通过编程方式转换和填充数据,并使用清单文件作为辅助。 | SDE 将非重复条目组行的数据应用于重复条目组行,但紧凑格式(23R1 及更高版本)的本地实验室数据和编码请求数据除外。这有助于提升 SDE 的人工可读性。 | CDB 原始导出不假设来自非重复条目组的数据应在重复条目组实例中重复。如果需要,可以通过编程方式转换和填充数据,并使用清单文件作为辅助。 |
标题
以下标题列在所有临床表单中保持静态,并出现在代表条目及其值的列之前。
注意,在 SFF 中,ROWWRITEDT 和 ROWID 列出现在每个文件的末尾。
| 数据字段 | SDE | SFF | CDB 原始导出 |
|---|---|---|---|
| 研究 ID | STUDYNAME | Study.Name | 研究名称 |
| 研究标签 | 研究标签 | ||
| 国家/地区名称 | 国家/地区 | 国家/地区名称 | |
| 研究中心国家/地区代码 | SITECOUNTRY | Site.Country | SFF 中的三位国家/地区代码缩写 |
| 研究机构编号 | SITENUM | SITENUM | Site.Number |
| 受试者 ID | SUBJID | SUBJID | Subject.Name |
| 事件组定义标签 | EGROUP | 事件组定义标签 | |
| 事件组定义名称 | EGROUPDEF | EGROUPNAME | EventGroup.Name |
| 事件组定义外部 ID | EGROUPEID | 事件组定义外部 ID | |
| 事件定义标签 | 事件 | 事件定义标签 | |
| 事件定义名称 | EVENTDEF | EVENTNAME | Event.Name |
| 事件定义外部 ID | EVENTEID | 事件定义外部 ID | |
| 事件日期 | EVENTDT | 事件日期 | |
| 访视方法 | VISMETHOD | 访视方法 | |
| 会议状态 | 会议状态 | ||
| 事件组序列号 | ESEQ | EGSEQ | EventGroup.SeqNbr |
| 表单定义标签 | FORM | 表单定义标签 | |
| 表单定义名称 | FORMDEF | FORMNAME | Form.Name |
| 表单定义外部 ID | FORMEID | 表单定义外部 ID | |
| 表单序列号 | FSEQ | FSEQ | Form.SeqNbr |
| 表单状态 | FORMSTATUS | FORMSTATUS | |
| 表单创建日期时间 | CREATEDT | CREATEDDT | |
| 表单首次提交日期时间 | FIRSTSUBMITDT | FIRSTSUBMITDT | |
| 表单最后提交日期时间 | LASTSUBMITDT | LASTSUBMITDT | |
| 条目组定义标签 | IGROUP | 条目组定义标签 | |
| 条目组定义名称 | IGROUPDEF | 条目组定义名称 | |
| 条目组定义外部 ID | IGROUPEID | 条目组定义外部 ID | |
| 项目组序列号 | IGSEQ | IGSEQ | ItemGroup.SeqNbr |
| 表单上次修改的日期时间 | DLASTMOD | FORMLASTMODDT | Form.LastModifiedDate |
| 写入文件的日期时间行 | ROWWRITEDT | ||
| 行的唯一 ID | ROWID | ||
| 内部表单 ID | FGUID | ||
| 内部条目组 ID | IGGUID | ||
| 表单标记为故意留空 | FORMILB | ||
| SDE 的上次运行 | LASTRUN | ||
| 表单链接条目定义名称 | <Form Link ItemDef Name>_DEF | ||
| 表单链接条目定义内部 ID | <Form Link ItemDef Name>_LINKEDFORMID | ||
| 表单链接条目定义链接 ID | <Form Link ItemDef Name>_LINKID | ||
| 链接到表单及其条目 | LINKEDTO | ||
| 条目链接到的表单和显示条目 | ITEMLINKEDTO | ||
| 链接的条目 | LINKEDITEM |
编码
在启用医学编码的 EDC 临床表单中,会显示以下列,这些列专门对应 MedDRA、WHODrug 和 JDrug 词典。
MedDRA 词典
| SDE | SFF | CDB 原始导出 |
|---|---|---|
| CRSTATUS | CRSTATUS | 编码状态 |
| DICTTYPE | DICTTYPE | DictionaryType |
| DICTVER | DICTVER | 词典版本 |
| SOC | SOC | SOC |
| SOCID | SOCID | SOCCD |
| HLGT | HLGT | HLGT |
| HLGTID | HLGTID | HLGTCD |
| HLT | HLT | HLT |
| HLTID | HLTID | HLTCD |
| PT | PT | PT |
| PTID | PTID | PTCD |
| LLT | LLT | LLT |
| LLTID | LLTID | LLTCD |
| PRIMPATH | PRIMPATH | 主路径 |
| LASTCODEDAT | LASTCODEDDT | 上次编码日期 |
| LASTCODEDBY | LASTCODEDBY | 上次编码者 |
WHODrug 词典
| SDE | SFF | CDB 原始导出 |
|---|---|---|
| CRSTATUS | CRSTATUS | 编码状态 |
| DICTTYPE | DICTTYPE | DictionaryType |
| DICTVER | DICTVER | 词典版本 |
| ATC1 | ATC1 | ATC1 |
| ATC1CD | ATC1CD | ATC1CD |
| ATC2 | ATC2 | ATC2 |
| ATC2CD | ATC2CD | ATC2CD |
| ATC3 | ATC3 | ATC3 |
| ATC3CD | ATC3CD | ATC3CD |
| ATC4 | ATC4 | ATC4 |
| ATC4CD | ATC4CD | ATC4CD |
| SUBSNAME | PREFNAME | 首选名称 |
| SUBSCODE | PREFCODE | 首选 CD |
| SUBSBASE | PREFBASE | |
| SUBSLABEL | PREFLABEL | |
| DRUGNAME | DRUGNAME | 药物名称 |
| DRUGCODE | DRUGCODE | 药物 CD |
| LASTCODEDBY | LASTCODEDBY | 上次编码者 |
| LASTCODEDAT | LASTCODEDDT | 上次编码日期 |
JDrug 词典
| SDE | SFF | CDB 原始导出 |
|---|---|---|
| CRSTATUS | CRSTATUS | 编码状态 |
| DICTTYPE | DICTTYPE | DictionaryType |
| DICTVER | DICTVER | 词典版本 |
| DRUGCODE | DRUGCODE | 药物 CD |
| DRUGNAME | DRUGNAME | 药物名称 |
| GDRUGNAME | GDRUGNAME | GenericDrugName |
| DRUGCODECAT1 | DRUGCODECAT1 | DrugCDCategory1 |
| DRUGCODECAT2 | DRUGCODECAT2 | DrugCDCategory2 |
| USECAT1 | USECAT1 | UseCategory1 |
| USECAT2 | USECAT2 | UseCategory2 |
| MANNAME | MANNAME | ManufacturerName |
| MANCODE | MANCODE | ManufacturerCD |
| MAINTFLG | MAINTFLG | MaintenanceFlag |
| MAINTDT | MAINTDT | MaintenanceDate |
| LASTCODEDBY | LASTCODEDBY | LASTCODEDBY |
| LASTCODEDAT | LASTCODEDAT | LASTCODEDAT |
实验室
在 EDC 中启用了本地实验室的临床表单会显示以下列。
| SDE | SFF | CDB 原始导出 |
|---|---|---|
| LBDTC | LBDTC | LBDTC |
| LBDTC_UTC | ||
| LBDTC_USER | ||
| LBDTC_RAW | LBDTC_RAW | LBDTC_RAW |
| LBLOC | LBLOC | LBLOC |
| LBAGE | LBAGE | LBAGE |
| LBAGE_U | LBAGE_UOM | LBAGE_UOM |
| LBAGE_TRANS | LBAGE_TRANSLATED | LBAGE_TRANSLATED |
| LBAGE_TRANSU | LBAGE_UOM_TRANSLATED | LBAGE_UOM_TRANSLATED |
| LBFAST | LBFAST | LBFAST |
| LBFAST_D | LBFAST_DECODE | LBFAST_DECODE |
| LBFEMALECYCLE | LBFEMALECYCLE | LBFEMALECYCLE |
| LBFEMALECYCLE_D | LBFEMALECYCLE_DECODE | LBFEMALECYCLE_DECODE |
| LBTEST | LBTEST | LBTEST |
| LABMODIFIER | LABMODIFIER | LABMODIFIER |
| LABMODIFIER_D | ||
| LBORRES | LBORRES | LBORRES |
| LBORRES_U_D | LBORRES_UOM_DECODE | DECODE_LBORRES |
| LBORRES_TRANS | LBORRES_TRANSLATED | TRANSLATED_LBORRES |
| LBORRES_TRANSU | LBORRES_UOM_TRANSLATED | UOMTRANSLATED_LBORRES |
| LBORNRLO | LBORNRLO | LBORNRLO |
| LBORNRHI | LBORNRHI | LBORNRHI |
| LBORNRLO_UOM | UOM_LBORNRLO | |
| LBORNRLOHI_U | LBORNRHI_UOM | UOM_LBORNRHI |
| LBORNRLO_TRANS | LBORNRLO_TRANSLATED | TRANSLATED_LBORNRLO |
| LBORNRHI_TRANS | LBORNRHI_TRANSLATED | TRANSLATED_LBORNRHI |
| LBORNRLO_UOM_TRANSLATED | UOMTRANSLATED_LBORNRLO | |
| LBORNRLOHI_TRANSU | LBORNRHI_UOM_TRANSLATED | UOMTRANSLATED_LBORNRHI |
| LBOVRDNRLO | LBOVRDNRLO | LBOVRDNRLO |
| LBOVRDNRHI | LBOVRDNRHI | LBOVRDNRHI |
| LBOVRDNRLO_UOM | UOM_LBOVRDNRLO | |
| LBOVRDNRLOHI_U | LBOVRDNRHI_UOM | UOM_LBOVRDNRHI |
| LBOVRDNRLO_TRANS | LBOVRDNRLO_TRANSLATED | TRANSLATED_LBOVRDNRLO |
| LBOVRDNRHI_TRANS | LBOVRDNRHI_TRANSLATED | TRANSLATED_LBOVRDNRHI |
| LBOVRDNRLO_UOM_TRANSLATED | UOMTRANSLATED_LBOVRDNRLO | |
| LBOVRDNRLOHI_TRANSU | LBOVRDNRHI_UOM_TRANSLATED | UOMTRANSLATED_LBOVRDNRHI |
| LBSTNRC | LBSTNRC | LBSTNRC |
| LBSTNRC_D | LBSTNRC_DECODE | DECODE_LBSTNRC |
| LBOVRDNRC | LBOVRDNRC | LBOVRDNRC |
| LBOVRDNRC_D | LBOVRDNRC_DECODE | DECODE_LBOVRDNRC |
| LBNRIND | LBNRIND | LBNRIND |
| LBCLSIG | LBCLSIG | LBCLSIG |
操作数据
SFF、SDE 和 CDB 原始导出中的运营数据用于追踪受试者在临床数据研究对象(例如表单、事件或质疑)上下文中的进度。
SFF 包含以下运营数据文件:
- SYS_EVENTS
- SYS_FORMS
- SYS_SUBJECTS
- QUERIES
- QUERY_MSGS
- SYS_ILB
- SYS_LINKS
- SYS_SITES
- SYS_PD
CDB 原始导出包含以下运营数据文件:
- Sys_Events
- Sys_Forms
- Sys_ILB
- Sys_Links
- Sys_PD
- Sys_Sites
- Sys_Subjects
SDE 包含以下运营数据文件:
- SYS_EVT
- SYS_FORM
- SYS_SUB
- SYS_Q
- SYS_QT
- SYS_ILB
- SYS_LINKS
- SYS_SITE
- SYS_ASM
- SYS_ASMR
- SYS_ANALYTES
- SYS_LABLOC
- SYS_LABRANGES
- SYS_PD
- SYS_RAND
- SYS_SAFC
- SYS_SAFM
SYS_FORM & SYS_FORMS
下表通过 SYS_FORM 和 SYS_FORMS 数据集的可用列,对 SDE、SFF 和 CDB 原始导出进行了比较。列顺序与每种导出文件中的实际顺序并不完全一致。
| SDE | SFF | CDB 原始导出 | 描述 |
|---|---|---|---|
| STUDYID | Study.Label | 研究标签 | |
| STUDYNAME | Study.Name | 研究名称 | |
| 国家/地区 | Site.CountryName | 国家/地区名称 | |
| SITECOUNTRY | SITECOUNTRY | Site.Country | SFF 中的三位国家/地区代码缩写 |
| SITENUM | SITENUM | Site.Number | 研究机构编号 |
| SUBJID | SUBJID | Subject.Name | 受试者 ID |
| EGROUP | EventGroup.Label | 事件组定义标签 | |
| EventGroup.RepeatLabel | 事件组定义重复标签 | ||
| EGROUPDEF | EGROUPNAME | EventGroup.Name | 事件组定义名称 |
| 事件组 |
SYS_EVT & SYS_EVENTS
下表通过 SYS_EVT 和 SYS_EVENTS 数据集的可用列,对 SDE、SFF 和 CDB 原始导出进行了比较。列顺序与每种导出文件中的实际顺序并不完全一致。
| SDE | SFF | CDB 原始导出 | 描述 |
|---|---|---|---|
| STUDYID | Study.Label | 研究标签 | |
| STUDYNAME | Study.Name | 研究名称 | |
| 国家/地区 | Site.CountryName | 国家/地区名称 | |
| SITECOUNTRY | SITECOUNTRY | Site.Country | SFF 中的三位国家/地区代码缩写 |
| SITENUM | SITENUM | Site.Number | 研究机构编号 |
| SUBJID | SUBJID | Subject.Name | 受试者 ID |
| EGROUP | EventGroup.Label | 事件组定义标签 | |
| EventGroup.RepeatLabel | 事件组定义重复标签 | ||
| EGROUPDEF | EGROUPNAME | EventGroup.Name | 事件组定义名称 |
| EGROUPORDER | 事件组顺序 | ||
| EGROUPEID | EventGroup.ExternalID | 事件组定义外部 ID | |
| ESEQ | EGSEQ | EventGroup.SeqNbr | 事件组序列号 |
| 事件 | Event.Label | 事件定义标签 | |
| EVENTDEF | EVENTNAME | Event.Name | 事件定义名称 |
| EVENTEID | Event.ExternalID | 事件定义外部 ID | |
| EVENTORDER | 事件顺序 | ||
| EVENTDT | EVENTDT | Event.Date | 事件日期 |
| VISMETHOD | VISMETHOD | Event.VisitMethod | 访视方法 |
| PLANNEDDT | PLANNEDDT | Event.PlannedDate | Event Planned Date |
| OVERDUEDT | 事件逾期 | ||
| 状态 | EVENTSTATUS | Event.Status | 会议状态 |
SYS_ILB
下表通过 SYS_ILB 数据集的可用列,对 SDE、SFF 和 CDB 原始导出进行了比较。列顺序与每种导出文件中的实际顺序并不完全一致。
| SDE | SFF | CDB 原始导出 | 描述 |
|---|---|---|---|
| STUDYID | Study.Label | 研究标签 | |
| STUDYNAME | Study.Name | 研究名称 | |
| 国家/地区 | Site.CountryName | 国家/地区名称 | |
| SITECOUNTRY | Site.Country | SFF 中的三位国家/地区代码缩写 | |
| SITENUM | SITENUM | Site.Number | 研究机构编号 |
| SUBJID | SUBJID | Subject.Name | 受试者 ID |
| EGROUP | EventGroup.Label | 事件组定义标签 | |
| EventGroup.RepeatLabel | 事件组定义重复标签 | ||
| EGROUPDEF | EGROUPNAME | EventGroup.Name | 事件组定义名称 |
| EGROUPEID | EventGroup.ExternalID | 事件组定义外部 ID | |
| ESEQ | EGSEQ | EventGroup.SeqNbr | 事件组序列号 |
| 事件 | Event.Label | 事件定义标签 | |
| EVENTDEF | EVENTNAME | Event.Name | 事件定义名称 |
| EVENTEID | Event.ExternalID | 事件定义外部 ID | |
| FORM | Form.Label | 表单定义标签 | |
| FORMDEF | FORMNAME | Form.Name | 表单定义名称 |
| FORMEID | Form.ExternalID | 表单定义外部 ID | |
| FSEQ | FSEQ | Form.SeqNbr | 表单序列号 |
| IGROUP | ItemGroup.Label | 条目组定义标签 | |
| IGROUPDEF | IGROUPNAME | ItemGroup.Name | 条目组定义名称 |
| IGROUPEID | ItemGroup.ExternalID | 条目组定义外部 ID | |
| IGSEQ | IGSEQ | ItemGroup.SeqNbr | 项目组序列号 |
| ITEM | Item.Label | 条目定义标签 | |
| ITEMDEF | ITEMNAME | Item.Name | 条目定义名称 |
| ITEMEID | Item.ExternalID | 项目定义外部 ID | |
| LABANALYTENAME | LABANALYTENAME | LABANALYTENAME | 实验室分析物名称 |
| ILBREAS | ILBREASON | ILBREASON | 故意保留为空的原因 |
| ROWWRITEDT | 将行写入文件的日期时间 | ||
| GUID | ROWID | SDE:内部条目 ID SFF:行的唯一 ID |
|
| LASTRUN | SDE 的上次运行 |
SYS_LINKS
下表通过 SYS_LINKS 数据集的可用列,对 SDE、SFF 和 CDB 原始导出进行了比较。列顺序与每种导出文件中的实际顺序并不完全一致。
| SDE | SFF | CDB 原始导出 | 描述 |
|---|---|---|---|
| STUDYID | 研究标签 | ||
| STUDYNAME | Study.Name | 研究名称 | |
| 国家/地区 | 国家/地区名称 | ||
| SITECOUNTRY | Site.Country | SFF 中的三位国家/地区代码缩写 | |
| SITENUM | SITENUM | Site.Number | 研究机构编号 |
| SUBJID | SUBJID | Subject.Name | 受试者 ID |
| EGROUP | 事件组定义标签 | ||
| EGROUPDEF | EGROUPNAME | EventGroup.Name | 事件组定义名称 |
| ESEQ | EGSEQ | EventGroup.SeqNbr | 事件组序列号 |
| EGROUPEID | 事件组定义外部 ID | ||
| 事件 | 事件定义标签 | ||
| EVENTDEF | EVENTNAME | Event.Name | 事件定义名称 |
| EVENTEID | 事件定义外部 ID | ||
| FORM | 表单定义标签 | ||
| FORMDEF | FORMNAME | Form.Name | 表单定义名称 |
| FORMEID | 表单定义外部 ID | ||
| FSEQ | FSEQ | Form.SeqNbr | 表单序列号 |
| IGROUP | 条目组定义标签 | ||
| IGROUPDEF | ItemGroup.Name | 条目组定义名称 | |
| IGROUPEID | 条目组定义外部 ID | ||
| IGSEQ | ItemGroup.SeqNbr | 项目组序列号 | |
| ITEM | 条目定义标签 | ||
| ITEMDEF | FormLink.Name | 条目定义名称 | |
| ITEMEID | 项目定义外部 ID | ||
| FORMCREATEDDT | 表单创建日期时间 | ||
| GUID | LINKID | Form.LinkID | 链接 ID |
| CREATEDB | LINKCREATEDBY | 链接表单创建者 | |
| LINKCREATEDDT | LINKCREATEDDT | Form.LinkCreatedDate | 链接创建日期时间 |
| FGUID | FORMID | Form.ID | 内部表单 ID |
| LASTRUN | SDE 的上次运行 | ||
| ROWWRITEDT | 将行写入文件的日期时间 | ||
| ROWID | 行的唯一 ID |
SYS_SUB / SYS_SUBJECTS
下表通过 SYS_SUB 和 SYS_SUBJECTS 数据集的可用列,对 SDE、SFF 和 CDB 原始导出进行了比较。列顺序与每种导出文件中的实际顺序并不完全一致。
| SDE | SFF | CDB 原始导出 | 描述 |
|---|---|---|---|
| CASEBDEF | CASEBOOKVER | 受试者病例手册版本 | |
| STUDYID | 研究标签 | ||
| STUDYNAME | Study.Name | 研究名称 | |
| 国家/地区 | 国家/地区名称 | ||
| SITECOUNTRY | Site.Country | SFF 中的三位国家/地区代码缩写 | |
| SITENUM | SITENUM | Site.Number | 研究机构编号 |
| SUBJID | SUBJID | Subject.Name | 受试者 ID |
| IXRSID | IXRSID | 受试者 IXRS ID | |
| 状态 | SUBSTATUS | Subject.Status | 受试者状态 |
| SUBRESTRICTED | 受限制的受试者 | ||
| SDVPLAN | SDVPLAN | SDV 计划 | |
| DMRPLAN | DMRPLAN | DMR 计划 | |
| FROZEN | FROZEN | 受试者已冻结 | |
| 已锁定 | 已锁定 | 受试者已锁定 | |
| SIGNED | SIGNED | 受试者已签名 | |
| LATESTARM | LATESTARM | 最新组 | |
| LATESTCOHORT | LATESTCOHORT | 最新群组 | |
| LATESTSUBSTUDY | LATESTSUBSTUDY | 最新子研究 | |
| CNSNTDT | CNSNTDT | 初始同意日期 | |
| SCRDDT | SCRDDT | 筛选日期 | |
| SCRFAILDT | SCRFAILDT | 筛查失败日期 | |
| ENRDDT | ENRDDT | 注册日期 | |
| RDMDDT | RDMDDT | 随机化日期 | |
| STARTTRTDT | STARTTRTDT | 开始治疗日期 | |
| ENDTRTDT | ENDTRTDT | 治疗结束日期 | |
| WTHDRWNDT | WTHDRWNDT | 退出日期 | |
| STARTFLLWUPDT | STARTFLLWUPDT | 开始跟进日期 | |
| LOSTFLLWUPDT | LOSTFLLWUPDT | 失去跟进日期 | |
| CMPLTDT | CMPLTDT | 研究结束日期 | |
| SUBLASTMODBY | 受试者上次修改者 | ||
| LASTMODDT | SUBLASTMODDT | 受试者上次修改日期时间 | |
| GUID | SYSID | Subject.ID | 内部受试者 ID |
| LASTRUN | SDE 的上次运行 | ||
| ROWWRITEDT | 将行写入文件的日期时间 | ||
| ROWID | 行的唯一 ID |
SYS_Q / QUERIES
下表通过 SYS_Q(质疑)数据集的可用列,对 SDE 和 SFF 进行了比较。列顺序与每种导出文件中的实际顺序并不完全一致。请注意,在 CDB 中,质疑可通过质疑列表获取,并可按来源或状态进行细分。
| SDE | SFF | CDB 原始导出 | 描述 |
|---|---|---|---|
| STUDYID | 研究标签 | 研究标签 | |
| STUDYNAME | 研究名称 | ||
| 国家/地区 | 国家/地区名称 | ||
| SITECOUNTRY | Site.Country | SFF 中的三位国家/地区代码缩写 | |
| SITENUM | SITENUM | Site.Number | 研究机构编号 |
| SUBJID | SUBJID | Subject.Name | 受试者 ID |
| Subject.Status | 受试者状态 | ||
| EGROUP | 事件组定义标签 | ||
| EGROUPDEF | EGROUPNAME | 事件组定义名称 | |
| EGROUPEID | 事件组定义外部 ID | ||
| ESEQ | EGSEQ | 事件组序列号 | |
| 事件 | 事件定义标签 | ||
| EVENTDEF | EVENTNAME | Event.Name | 事件定义名称 |
| EVENTEID | 事件定义外部 ID | ||
| EVENTDT | Event.Name | 事件日期 | |
| EVENTSTATUS | 会议状态 | ||
| FORM | 表单定义标签 | ||
| 源表单来源 | |||
| FORMDEF | FORMNAME | Form.Name | 表单定义名称 |
| FORMEID | 表单定义外部 ID | ||
| FSEQ | FSEQ | 表单序列号 | |
| IGROUP | 条目组定义标签 | ||
| IGROUPDEF | IGROUPNAME | 条目组定义名称 | |
| IGROUPEID | 条目组定义外部 ID | ||
| IGSEQ | IGSEQ | 项目组序列号 | |
| ITEM | 条目定义标签 | ||
| ITEMDEF | ITEMNAME | Item.Name | 条目定义名称 |
| ITEMEID | 项目定义外部 ID | ||
| QUERYID | QUERYNAME | Query.Name | 质疑名称 |
| GUID | QUERYID | Query.ID | 内部质疑 ID |
| SRCTYPE | 源类型 | ||
| SRCSYS | ORIGINSYS | Origin.Sys | 源系统名称 / 来源系统名称 |
| SRCID | ORIGINID | Origin.ID | 源 ID / 来源 ID |
| ORIGINNAME | 源名称 | ||
| SRCUSER | Origin.User | 源用户 | |
| 状态 | QUERYSTATUS | Query.Status | 查询状态 |
| QUERYTYPE | 查询类型 | ||
| RESTRICTED | QUERYRESTRICTED | 受限制的质疑 | |
| 手工 | MANUALQUERY | Query.Category | 手动查询 |
| RULEID | RULEDEF | Rule.Definition | 规则定义名称 |
| TRIGID | TRIGID | Trigger.ID | 触发器名称 |
| QTEXT | FIRSTQUERYMSG | Query.FirstMessage | 第一条质疑消息 |
| Query.LatestMessage | 最新质疑消息 | ||
| QTEXTBASE | 第一条质疑消息(基本语言) | ||
| QTEXTENG | 第一条质疑消息(英语) | ||
| OBSSOURCEVAL | 观察源值(用于快速质疑) | ||
| QUERYTEAM | QUERYTEAM | Query.Team | 查询团队 |
| QTFRESP | QUERYTFRESP | 开放回应 | 从创建日期到首次回复的质疑时长 |
| QAGE | QUERYAGE | Query.Age | 质疑年龄 |
| QCHGDATA | QUERYCHGDATA | 导致数据更改 | 质疑是否导致数据更改 |
| QOTOCL | QUERYOPENTOCLOSE | 查询打开到关闭的天数 | |
| QUERYROWEXTERNALID | Query.RowExternalID(仅适用于第三方质疑) | ||
| CREATEDB | QUERYCREATEDBY | Query.CreatedBy | 查询创建者 |
| CREATED | QUERYCREATEDDT | Query.CreatedOn | 质疑创建日期时间 |
| LASTCLOSEDDT | QUERYLASTCLOSEDDT | 质疑上次关闭日期时间 | |
| ROWWRITEDT | 将行写入文件的日期时间 | ||
| ROWID | SDE:内部质疑 ID / SFF:行的唯一 ID | ||
| Query.ClosedByCheck | |||
| LASTRUN | SDE 的上次运行 |
SYS_QT / QUERY_MSGS
下表通过 SYS_QT(质疑消息)数据集的可用列,对 SDE 和 SFF 进行了比较。列顺序与每种导出文件中的实际顺序并不完全一致。请注意,在 CDB 中,质疑消息可通过质疑列表获取,并可按来源或状态进行细分。
| SDE | SFF | CDB 原始导出 | 描述 |
|---|---|---|---|
| QRY.Status | 查询状态 | ||
| QRY.Age | 质疑年龄 | ||
| QRY.FormSource | 表单来源 | ||
| STUDYID | 研究标签 | 研究标签 | |
| STUDYNAME | 研究名称 | ||
| 国家/地区 | 国家/地区名称 | ||
| SITECOUNTRY | Site.Country | SFF 中的三位国家/地区代码缩写 | |
| SITENUM | SITENUM | 研究机构编号 | |
| 研究中心名称 | 机构名称 | ||
| Event.Name | 事件名称 | ||
| Event.Date | 事件日期 | ||
| SUBJID | SUBJID | 受试者 ID | |
| Subject.Status | 受试者状态 | ||
| QUERYID | QUERYNAME | QRY.Name | 质疑名称 |
| QUERYID | QRY.ID | 查询 ID | |
| 状态 | QUERYMSGSTATUS | QRYMSG.Status | 质疑消息状态 |
| QRY.FormName | 表单名称 | ||
| QRY.ItemName | 字段名称 | ||
| RESTRICTED | RESTRICTEDMSG | 受限制的质疑消息 | |
| QTEXT | QUERYMSG | QRYMSG.Text | 质疑消息 |
| QTEXTBASE | 质疑消息(基本语言) | ||
| QTEXTENG | 质疑消息(英语) | ||
| TEXTDT | QUERYMSGDT | QRYMSG.CreatedBy | 质疑消息日期时间 |
| TEXTBY | QUERYMSGBY | QRYMSG.CreatedDate | 质疑消息发送者 |
| QUERYTEAM | QUERYTEAM | 查询团队 | |
| QUICKACT | QRYMSG.Action | 快捷操作 | |
| QUICKACTTYPE | QRYMSG.ActionType | 快速操作类型(用于快速质疑) | |
| SRCTYPE | 源类型(用于快速质疑) | ||
| SRCSYS | QRYMSG.OriginSystem | 源系统名称 | |
| SRCUSER | QRYMSG.OriginUser | 源用户 | |
| SRCID | QRYMSG.OriginID | 源 ID | |
| QRY.RowExternalID | 原始外部 ID | ||
| ROWWRITEDT | 将行写入文件的日期时间 | ||
| GUID | ROWID | SDE:内部质疑消息 ID / SFF:行的唯一 ID | |
| LASTRUN | SDE 的上次运行 |
SYS_PD
下表通过 SYS_PD 数据集的可用列,对 SDE、SFF 和 CDB 原始导出进行了比较。列顺序与每种导出文件中的实际顺序并不完全一致。只有在 EDC 中为研究配置了方案偏离(PD)时,PD 运营文件才会在 SDE/SFF 文件夹中可见。
| SDE | SFF | CDB 原始导出 | 描述 |
|---|---|---|---|
| STUDYID | 研究标签 | ||
| STUDYNAME | Study.Name | 研究名称 | |
| 国家/地区 | Site.CountryName | 国家/地区名称 | |
| SITECOUNTRY | SFF 中的三位国家/地区代码缩写 | ||
| SITENUM | SITENUM | Site.Number | 研究机构编号 |
| SUBJID | SUBJID | Subject.Name | 受试者 ID |
| PDID | PDNAME | PD.ID | PD 标识符/名称 |
| PDTYPE | PD 类型 | ||
| PDSUM | PDSUM | PD.Summary | PD 摘要 |
| PDDAT | PDDT | PD.DeviationDate | PD 偏离日期 |
| PDDATID | PDDTID | PD.IdentifiedDate | PD 已识别日期 |
| PDCAT | PDCAT | PD.CategoryName | PD 类别 |
| PD.CategoryLabel | PD 类别标签 | ||
| PDSUBCAT | PDSUBCAT | PD.SubcategoryName | PD 子分类 |
| PD.SubcategoryLabel | PD 子类别标签 | ||
| PDSEV | PDSEV | PD.SeverityName | PD 严重性 |
| PD.SeverityLabel | PD 严重性标签 | ||
| PDDESC | PDDESC | PD.Description | PD 描述 |
| PDSTATUS | PDSTATUS | PD.Status | 试验方案偏离状态 |
| PDRES | PDRES | PD.Resolution | 方案偏离解决方法 |
| PDRULE | PDRULE | PD.Rule | PD 规则 |
| RESTRICTED | PDRESTRICTED | PD 受限 | |
| EGROUP | EventGroup.Label | 事件组定义标签 | |
| EventGroup.RepeatLabel | 事件组定义重复标签 | ||
| EGROUPDEF | EGROUPNAME | EventGroup.Name | 事件组定义名称 |
| EGROUPEID | EventGroup.ExternalID | 事件组定义外部 ID | |
| 事件 | Event.Label | 事件定义标签 | |
| EVENTDEF | EVENTNAME | Event.Name | 事件定义名称 |
| EVENTEID | Event.ExternalID | 事件定义外部 ID | |
| ESEQ | EGSEQ | EventGroup.SeqNbr | 事件组序列号 |
| FORM | Form.Label | 表单定义标签 | |
| FORMDEF | FORMNAME | Form.Name | 表单定义名称 |
| FORMEID | Form.ExternalID | 表单定义外部 ID | |
| FSEQ | FSEQ | Form.SeqNbr | 表单序列号 |
| IGROUP | ItemGroup.Label | 条目组定义标签 | |
| IGROUPDEF | IGROUPNAME | ItemGroup.Name | 条目组定义名称 |
| IGROUPEID | ItemGroup.ExternalID | 条目组定义外部 ID | |
| IGSEQ | IGSEQ | ItemGroup.SeqNbr | 项目组序列号 |
| ITEM | Item.Label | 条目定义标签 | |
| ITEMDEF | ITEMNAME | Item.Name | 条目定义名称 |
| ITEMEID | Item.ExternalID | 项目定义外部 ID | |
| CREATEDT | PDCREATEDDT | PD.CreatedDate | 创建日期/时间 |
| CREATEDB | PDCREATEDBY | PD.CreatedBy | 创建者 |
| LASTMODDT | PDLASTMODDT | PD.LastModifiedDate | 上次修改日期时间 |
| LASTMODB | PDLASTMODBY | PD.LastModifiedBy | 上次修改者 |
| USERMODDT | USERMODDT | PD.UserModifiedDate | 用户修改日期时间 |
| USERMODB | USERMODBY | PD.UserModifiedDate | 用户修改人 |
| LASTREAS | LASTREASON | PD.ChangeReason | 上次更改原因 |
| INACBYSYS | INACTBYSYS | PD.InactivatedBySystem | 被系统停用 |
| LASTINACDT | LASTINACTDT | PD.LastInactivatedDate | 上次停用日期 |
| FGUID | 内部表单 ID | ||
| PDGUID | SYSID | PD.PID | 内部 PD ID |
| LASTRUN | SDE 的上次运行 | ||
| SOURCE | PD 的来源(即 CDB、外部) | ||
| ORIGINSYS | PD 来源系统 | ||
| ORIGINID | PD 来源 ID | ||
| ORIGINNAME | PD 来源名称 | ||
| ROWWRITEDT | 将行写入文件的日期时间 | ||
| ROWID | 行的唯一 ID |
参考数据
参考数据是 SFF 独有的,有助于执行查找,并作为临床数据的补充数据。SFF 中的以下文件被视为参考数据:
| 文件名 | SFF 可用性 | 描述 |
|---|---|---|
| LABELS | 仅完整 SFF | 标签在此文件中导出。如果选择包含研究设计(Include Study Design)选项,SDE 会在 CSV 文件和 definitions 文件夹中包含标签。 |
| OVERRIDE_LABELS | 仅完整 SFF | 如果在 EDC 工作室中配置了显示覆盖标签,则在此文件中导出。 |
| LOCAL_LAB_UNITS | 完整和增量 SFF | 作为 EDC 本地实验室模块一部分定义的单位列表。 |
| LOCAL_LAB_CODELISTS | 完整和增量 SFF | 作为 EDC 本地实验室模块一部分定义的编码列表的列表。 |
| DELETES | 仅增量 SFF | 在行级别跟踪已删除的数据。 |
研究设计数据
SFF 主要在 manifest.json 文件的研究设计代码块中包含研究设计数据,该代码块包含最新研究设计版本的信息。
研究设计数据包含在各种导出格式中:
- 完整 SFF 在 LABELS CSV 文件中包含标签信息(参见参考数据)。
- 当用户选择包含研究设计选项时,SDE 在 Definitions 文件夹中包含研究设计信息。该文件夹包含所有病例手册版本的研究设计对象的 CSV 文件。
- CDB 原始导出在其 manifest.json 文件中包含有限的研究设计信息,例如数据类型、条目标签、编码以及当列引用代码列表条目定义时的解码值。
- 病例手册设计导出(CDE)以调度顺序和 JSON 格式包含有关研究设计属性的全面信息。
共享属性映射
此处展示 SDE、SFF、CDB 原始导出与 CDE 之间的共享属性映射。注意,SFF 在多个位置提供研究设计信息,但主要存储在清单文件中。
除非另有说明,以下映射指的是各自输出中的列或属性。
| SDE | SFF | CDB 原始导出 | CDE | 描述 |
|---|---|---|---|---|
| 清单文件:study | Study.Name | study\_name | 研究名称 | |
| STUDYID | LABELS.csv 文件 | study\_label | 研究标签 | |
| EGROUP | LABELS.csv 文件 | eventgroup\_def → label | 事件组定义标签 | |
| EGROUPDEF | EGROUPNAME 列或 清单文件:study\_design → eventgroups → name |
EventGroup.Name | eventgroup\_def → name | 事件组定义名称 |
| EGROUPEID | 清单文件:study\_design → eventgroups → external\_id | eventgroup\_def → external\_id | 事件组定义外部 ID | |
| 事件 | LABELS.csv 文件 | event\_def → label | 事件定义标签 | |
| EVENTDEF | EVENTNAME 列或 清单文件:study\_design → events → name |
Event.Name | event\_def → name | 事件定义名称 |
| EVENTEID | 清单文件:study\_design → events → external\_id | event\_def → external\_id | 事件定义外部 ID | |
| FORM | LABELS.csv 文件 | form\_def → label | 表单定义标签 | |
| FORMDEF | FORMNAME 列或 清单文件:study\_design → forms → name |
Form.Name | form\_def → name | 表单定义名称 |
| FORMEID | 清单文件:study\_design → forms → external\_id | form\_def → external\_id | 表单定义外部 ID | |
| IGROUP | LABELS.csv 文件 | ItemGroup.Label | itemgroup\_def → label | 条目组定义标签 |
| IGROUPDEF | IGROUPNAME 列或 清单文件:study\_design → itemgroups → name |
ItemGroup.Name | itemgroup\_def → name | 条目组定义名称 |
| IGROUPEID | 清单文件:study\_design → itemgroups → external\_id | ItemGroup.ExternalID | itemgroup\_def → external\_id | 条目组定义外部 ID |
| ITEM | LABELS.csv 文件 | Item.Label | item\_def → label | 条目定义标签 |
| ITEMDEF | ITEMNAME 列或 清单文件:clinical\_data → columns → lookup\_name |
Item.Name | item\_def → name | 条目定义名称 |
| ITEMEID | 清单文件:clinical\_data → columns → external\_id | Item.ExternalID | item\_def → external\_id | 项目定义外部 ID |