导出方法对比

本页概述了研究数据提取(SDE)、研究文件格式(SFF)和 CDB 原始导出类型之间的主要区别。

关键概念

以下部分提供了每种导出方法的关键概念。

研究文件格式 API

  • 一种自描述型 API,支持从特定研究中提取完整和增量的研究数据及研究设计数据。自描述意味着该 API 为用户提供了使用下游内容所需的所有信息。
  • manifest.json 文件提供了每个列的架构和描述,以及用户可用于理解 CSV 文件并确保其集成不会中断的额外元数据。
  • 同时适用于 EDC 和 CDB 客户。
  • 不支持自定义。

SFF API 提供两种检索模式:

  • 完整数据:完整数据指截至数据包生成时点的全部研究和研究设计数据。
  • 增量数据:增量数据指与上一研究数据包相比,记录的所有变更(新增、修改或删除)。

研究数据提取

  • 一种提取包,包含完整的研究和研究设计数据集,可以按计划运行或以作业形式按需运行。
  • 支持 CSV、SAS 和 XPT 文件格式。
  • 支持有限自定义。
  • 从 EDC 工具或通过 EDC REST API 运行。
  • 可交付至 FTP 或 AWS S3 位置。
  • 在 CDB 中非原生可用。

CDB 原始导出

  • 一种导出,包含列表并将列表转换为标准化格式。
  • 默认包含临床数据(核心列表)和运营数据(系统列表)。
  • 支持包含自定义列表、质疑、观察和方案偏离。
  • 可通过 CQL 列表自定义并包含在导出定义中。
  • 支持 CSV 和 SAS 文件格式。
  • 可通过导出用户界面(计划或按需)或通过 REST API 使用。
  • 可将用户界面作业交付至 FTP 位置。
  • 适用于 CDB 和临床报告用户。

主要区别

以下部分重点介绍 SFF API、SDE 和 CDB 原始导出之间的主要区别。

用例

每种导出方法服务于不同的需求。

研究文件格式

SFF 作为一个自描述型 API,面向集成、报告和分析场景,提供快速可靠的连接。它支持重复的快速数据加载,使目标系统保持同步。SFF 还提供增量数据,使用户无需依赖完整加载即可维护最新数据,从而提升性能。

用户以编程方式使用 SFF。它使用标准输出格式,该格式支持来自三个来源的数据:

  • EDC
  • CDB
  • 非 Veeva EDC 数据

研究数据提取

SDE 仅包含 Veeva EDC 数据。它通过 CSV 或 SAS 数据集交付数据,自定义能力有限。其目的是供用户用于完整研究数据的分析和下游处理。数据可由机器或人工摄取。

CDB 原始导出

CDB 原始导出的用例与 SDE 类似,但支持同时包含 EDC 和外部第三方数据。

交付方式

三种导出方法的交付机制各不相同。主要区别在于 API 检索和计划作业。

研究文件格式

可通过多个端点检索 SFF,系统在给定时间发布数据包(增量数据包为 15 分钟,完整数据包为 24 小时)。无需通过作业来“启动”SFF,而是直接通过 API 下载 SFF 数据包。此外,除了在 EDC 工具中启用该功能外,SFF 没有界面。

研究数据提取

SDE 是一个作业,可通过 EDC 工具的用户界面访问,或通过 API 按需启动。通过界面或 API 检索 ZIP 数据包。然而,该作业需要调度或启动,尽管调度仅通过界面进行。系统可以通过 FTPS 将其交付到外部目标。

CDB 原始导出

类似地,CDB 原始导出是一个作业,可以通过 CDB 或临床报告导出界面按计划或按需运行,并交付到类似于 SDE 的外部连接。也可以通过 API 端点运行。

版本控制

SDE 和 SFF 均使用版本控制。当列、数据类型或其他可能影响文件结构的更改发生时,SDE 会为正式版本添加一个新版本。SDE 维护所有版本,任何版本弃用都会提前通知,以便客户有时间升级。

作为自描述型 API 的 SFF 有两个版本控制概念,在正式发布周期中推出:

  • API 版本:当 API 请求或响应负载发生结构性更改时更新。
  • 数据包版本:当数据包架构发生可能具有破坏性的结构性更改时更新。

SFF 与 SDE 的区别在于,新增列不一定需要版本更新,因为 manifest.json 文件供用户以编程方式读取,因此它可以理解列添加等更改。如果 manifest.json 文件更改了现有属性(例如,可能导致使用时出现破坏性更改的属性),我们会考虑更新包版本。SFF 为其 API 和数据包分别仅维护两个活动版本(当前版本和先前版本)。

CDB 原始导出没有数据包版本控制的概念。然而,当系统从父列表向 CQL 结果集添加新列时,系统会为受影响的导出定义和导出列表检测到一个更改指示器,用户必须手动接受才能更改其导出结果的输出。

自定义

SDE 支持有限自定义,包括数据集选择、格式和文件名自定义。SFF 不支持自定义。SFF 旨在为用户提供标准统一的格式,预计他们将在下游应用任何自定义或数据转换。CDB 原始导出支持更多自定义,因为用户可以选择导出定义中包含哪些列表,并可以在输出中包含自定义 CQL 列表和由列表生成器创建的列表。

文件内容

SFF 的 ZIP 文件包含一个数据文件夹,用于存放所有 CSV 文件和一个 manifest.json 文件。manifest.json 文件实现了该功能的自描述特性,供用户以编程方式将 CSV 文件的内容摄取到他们的下游系统中。

SDE 的 ZIP 文件包含 CSV 文件、SAS 和/或 XPT 文件。CDB 原始导出的 ZIP 文件包含 CSV 文件和/或 SAS 文件。

所有 ZIP 文件都包含临床数据和运营或系统数据。SDE 在 definitions 文件夹中包含研究设计信息,便于人工阅读。相比之下,SFF 在 manifest.json 文件中包含必要的研究设计信息,该文件以编程方式描述来自临床数据文件的数据。当 EDC 中发生研究设计更改时,SFF 研究设计信息会随完整数据包提取而更新。

由于 SFF 包含受限数据,必须授予自定义用户研究文件格式访问权限,该权限默认包含“受限数据访问”。

临床数据

所有导出格式都按表单展示临床数据。这意味着每个文件代表一个表单定义,文件中的每一行代表一个表单的记录。系统将记录“扁平化”以表示临床数据研究层级,其中临床数据条目显示为列,单元格中的数据代表条目的值。

每个文件都包含标题列,以表示一行数据所属的关键概念,如研究研究中心国家/地区。这代表了 CRF 的临床数据研究层级。

格式差异

SDE、SFF 和 CDB 原始导出之间临床数据格式化的主要差异如下表所示。

数据字段 SFF SDE CDB 原始导出
表单状态 包括来自 eCRF 的“已提交”和“编辑中”数据。 包括所有表单状态,可选择排除空白表单数据。 在 CQL 投影中默认包含“已提交”数据。
日期 具有标准化日期和研究中心输入的“原始”日期。 具有标准化和格式化日期以及研究中心输入的“原始”日期。 具有标准化日期和研究中心输入的“原始”日期。
日期时间
  • 具有 UTC 时区的标准化日期时间和研究中心输入的保留格式的“原始”日期时间(未附加时区)。
  • 格式为 ISO 8601,包含秒。
日期时间有四列:
  • 研究中心的时区;
  • 标准化的 UTC 时区;
  • 运行作业的用户的时区;
  • 研究中心输入的保留格式的“原始”日期时间(未附加时区)。
可选择将日期时间拆分为各自的日期和时间部分。
具有标准化的日期时间和研究中心输入格式的“原始”日期时间(未附加时区)。
布尔值 表示为 true/false。 提供格式化布尔值的选择。 表示为 true/false。
动态列 额外列包括:
  • 解码、计量单位、翻译值和翻译计量单位。
  • 为配置了临床编码和本地实验室的表单提供动态列。
额外列包括:
  • 解码、计量单位、翻译值和翻译计量单位。
  • 为配置了临床编码和本地实验室的表单提供动态列。
额外列包括:
  • 解码、计量单位、翻译值和翻译计量单位。
  • 为配置了临床编码和本地实验室的表单提供动态列。
名称与标签 主要使用“名称”值。标签和显示覆盖标签存储在完整 SFF 数据包提取中的单独 CSV 文件中。 主要使用“标签”值。 主要包含“名称”值。一些系统列表包含标签。自定义列表可能包含标签,具体取决于 CQL。
外部 ID 存在于 study_design 块的 manifest.json 文件中。 存在于 CSV 文件中。 存在于某些系统列表中。
唯一标识符 SFF 具有行 ID(ROWID)的概念,对于给定的数据行是唯一的,是帮助跟踪数据包之间增量更改的基础。 SDE 使用全球唯一标识符(GUID)列帮助用户识别数据集的唯一键。 存在于某些系统列表中。
重复项组 SFF 不假设来自非重复条目组的数据应在重复条目组实例中重复。如果需要,可以通过编程方式转换和填充数据,并使用清单文件作为辅助。 SDE 将非重复条目组行的数据应用于重复条目组行,但紧凑格式(23R1 及更高版本)的本地实验室数据和编码请求数据除外。这有助于提升 SDE 的人工可读性。 CDB 原始导出不假设来自非重复条目组的数据应在重复条目组实例中重复。如果需要,可以通过编程方式转换和填充数据,并使用清单文件作为辅助。

标题

以下标题列在所有临床表单中保持静态,并出现在代表条目及其值的列之前。

注意,在 SFF 中,ROWWRITEDT 和 ROWID 列出现在每个文件的末尾。

数据字段 SDE SFF CDB 原始导出
研究 ID STUDYNAME Study.Name 研究名称
研究标签 研究标签
国家/地区名称 国家/地区 国家/地区名称
研究中心国家/地区代码 SITECOUNTRY Site.Country SFF 中的三位国家/地区代码缩写
研究机构编号 SITENUM SITENUM Site.Number
受试者 ID SUBJID SUBJID Subject.Name
事件组定义标签 EGROUP 事件组定义标签
事件组定义名称 EGROUPDEF EGROUPNAME EventGroup.Name
事件组定义外部 ID EGROUPEID 事件组定义外部 ID
事件定义标签 事件 事件定义标签
事件定义名称 EVENTDEF EVENTNAME Event.Name
事件定义外部 ID EVENTEID 事件定义外部 ID
事件日期 EVENTDT 事件日期
访视方法 VISMETHOD 访视方法
会议状态 会议状态
事件组序列号 ESEQ EGSEQ EventGroup.SeqNbr
表单定义标签 FORM 表单定义标签
表单定义名称 FORMDEF FORMNAME Form.Name
表单定义外部 ID FORMEID 表单定义外部 ID
表单序列号 FSEQ FSEQ Form.SeqNbr
表单状态 FORMSTATUS FORMSTATUS
表单创建日期时间 CREATEDT CREATEDDT
表单首次提交日期时间 FIRSTSUBMITDT FIRSTSUBMITDT
表单最后提交日期时间 LASTSUBMITDT LASTSUBMITDT
条目组定义标签 IGROUP 条目组定义标签
条目组定义名称 IGROUPDEF 条目组定义名称
条目组定义外部 ID IGROUPEID 条目组定义外部 ID
项目组序列号 IGSEQ IGSEQ ItemGroup.SeqNbr
表单上次修改的日期时间 DLASTMOD FORMLASTMODDT Form.LastModifiedDate
写入文件的日期时间行 ROWWRITEDT
行的唯一 ID ROWID
内部表单 ID FGUID
内部条目组 ID IGGUID
表单标记为故意留空 FORMILB
SDE 的上次运行 LASTRUN
表单链接条目定义名称 <Form Link ItemDef Name>_DEF
表单链接条目定义内部 ID <Form Link ItemDef Name>_LINKEDFORMID
表单链接条目定义链接 ID <Form Link ItemDef Name>_LINKID
链接到表单及其条目 LINKEDTO
条目链接到的表单和显示条目 ITEMLINKEDTO
链接的条目 LINKEDITEM

编码

在启用医学编码的 EDC 临床表单中,会显示以下列,这些列专门对应 MedDRA、WHODrug 和 JDrug 词典。

MedDRA 词典

SDE SFF CDB 原始导出
CRSTATUS CRSTATUS 编码状态
DICTTYPE DICTTYPE DictionaryType
DICTVER DICTVER 词典版本
SOC SOC SOC
SOCID SOCID SOCCD
HLGT HLGT HLGT
HLGTID HLGTID HLGTCD
HLT HLT HLT
HLTID HLTID HLTCD
PT PT PT
PTID PTID PTCD
LLT LLT LLT
LLTID LLTID LLTCD
PRIMPATH PRIMPATH 主路径
LASTCODEDAT LASTCODEDDT 上次编码日期
LASTCODEDBY LASTCODEDBY 上次编码者

WHODrug 词典

SDE SFF CDB 原始导出
CRSTATUS CRSTATUS 编码状态
DICTTYPE DICTTYPE DictionaryType
DICTVER DICTVER 词典版本
ATC1 ATC1 ATC1
ATC1CD ATC1CD ATC1CD
ATC2 ATC2 ATC2
ATC2CD ATC2CD ATC2CD
ATC3 ATC3 ATC3
ATC3CD ATC3CD ATC3CD
ATC4 ATC4 ATC4
ATC4CD ATC4CD ATC4CD
SUBSNAME PREFNAME 首选名称
SUBSCODE PREFCODE 首选 CD
SUBSBASE PREFBASE
SUBSLABEL PREFLABEL
DRUGNAME DRUGNAME 药物名称
DRUGCODE DRUGCODE 药物 CD
LASTCODEDBY LASTCODEDBY 上次编码者
LASTCODEDAT LASTCODEDDT 上次编码日期

JDrug 词典

SDE SFF CDB 原始导出
CRSTATUS CRSTATUS 编码状态
DICTTYPE DICTTYPE DictionaryType
DICTVER DICTVER 词典版本
DRUGCODE DRUGCODE 药物 CD
DRUGNAME DRUGNAME 药物名称
GDRUGNAME GDRUGNAME GenericDrugName
DRUGCODECAT1 DRUGCODECAT1 DrugCDCategory1
DRUGCODECAT2 DRUGCODECAT2 DrugCDCategory2
USECAT1 USECAT1 UseCategory1
USECAT2 USECAT2 UseCategory2
MANNAME MANNAME ManufacturerName
MANCODE MANCODE ManufacturerCD
MAINTFLG MAINTFLG MaintenanceFlag
MAINTDT MAINTDT MaintenanceDate
LASTCODEDBY LASTCODEDBY LASTCODEDBY
LASTCODEDAT LASTCODEDAT LASTCODEDAT

实验室

在 EDC 中启用了本地实验室的临床表单会显示以下列。

SDE SFF CDB 原始导出
LBDTC LBDTC LBDTC
LBDTC_UTC
LBDTC_USER
LBDTC_RAW LBDTC_RAW LBDTC_RAW
LBLOC LBLOC LBLOC
LBAGE LBAGE LBAGE
LBAGE_U LBAGE_UOM LBAGE_UOM
LBAGE_TRANS LBAGE_TRANSLATED LBAGE_TRANSLATED
LBAGE_TRANSU LBAGE_UOM_TRANSLATED LBAGE_UOM_TRANSLATED
LBFAST LBFAST LBFAST
LBFAST_D LBFAST_DECODE LBFAST_DECODE
LBFEMALECYCLE LBFEMALECYCLE LBFEMALECYCLE
LBFEMALECYCLE_D LBFEMALECYCLE_DECODE LBFEMALECYCLE_DECODE
LBTEST LBTEST LBTEST
LABMODIFIER LABMODIFIER LABMODIFIER
LABMODIFIER_D
LBORRES LBORRES LBORRES
LBORRES_U_D LBORRES_UOM_DECODE DECODE_LBORRES
LBORRES_TRANS LBORRES_TRANSLATED TRANSLATED_LBORRES
LBORRES_TRANSU LBORRES_UOM_TRANSLATED UOMTRANSLATED_LBORRES
LBORNRLO LBORNRLO LBORNRLO
LBORNRHI LBORNRHI LBORNRHI
LBORNRLO_UOM UOM_LBORNRLO
LBORNRLOHI_U LBORNRHI_UOM UOM_LBORNRHI
LBORNRLO_TRANS LBORNRLO_TRANSLATED TRANSLATED_LBORNRLO
LBORNRHI_TRANS LBORNRHI_TRANSLATED TRANSLATED_LBORNRHI
LBORNRLO_UOM_TRANSLATED UOMTRANSLATED_LBORNRLO
LBORNRLOHI_TRANSU LBORNRHI_UOM_TRANSLATED UOMTRANSLATED_LBORNRHI
LBOVRDNRLO LBOVRDNRLO LBOVRDNRLO
LBOVRDNRHI LBOVRDNRHI LBOVRDNRHI
LBOVRDNRLO_UOM UOM_LBOVRDNRLO
LBOVRDNRLOHI_U LBOVRDNRHI_UOM UOM_LBOVRDNRHI
LBOVRDNRLO_TRANS LBOVRDNRLO_TRANSLATED TRANSLATED_LBOVRDNRLO
LBOVRDNRHI_TRANS LBOVRDNRHI_TRANSLATED TRANSLATED_LBOVRDNRHI
LBOVRDNRLO_UOM_TRANSLATED UOMTRANSLATED_LBOVRDNRLO
LBOVRDNRLOHI_TRANSU LBOVRDNRHI_UOM_TRANSLATED UOMTRANSLATED_LBOVRDNRHI
LBSTNRC LBSTNRC LBSTNRC
LBSTNRC_D LBSTNRC_DECODE DECODE_LBSTNRC
LBOVRDNRC LBOVRDNRC LBOVRDNRC
LBOVRDNRC_D LBOVRDNRC_DECODE DECODE_LBOVRDNRC
LBNRIND LBNRIND LBNRIND
LBCLSIG LBCLSIG LBCLSIG

操作数据

SFF、SDE 和 CDB 原始导出中的运营数据用于追踪受试者在临床数据研究对象(例如表单、事件或质疑)上下文中的进度。

SFF 包含以下运营数据文件:

  • SYS_EVENTS
  • SYS_FORMS
  • SYS_SUBJECTS
  • QUERIES
  • QUERY_MSGS
  • SYS_ILB
  • SYS_LINKS
  • SYS_SITES
  • SYS_PD

CDB 原始导出包含以下运营数据文件:

  • Sys_Events
  • Sys_Forms
  • Sys_ILB
  • Sys_Links
  • Sys_PD
  • Sys_Sites
  • Sys_Subjects

SDE 包含以下运营数据文件:

  • SYS_EVT
  • SYS_FORM
  • SYS_SUB
  • SYS_Q
  • SYS_QT
  • SYS_ILB
  • SYS_LINKS
  • SYS_SITE
  • SYS_ASM
  • SYS_ASMR
  • SYS_ANALYTES
  • SYS_LABLOC
  • SYS_LABRANGES
  • SYS_PD
  • SYS_RAND
  • SYS_SAFC
  • SYS_SAFM

SYS_FORM & SYS_FORMS

下表通过 SYS_FORM 和 SYS_FORMS 数据集的可用列,对 SDE、SFF 和 CDB 原始导出进行了比较。列顺序与每种导出文件中的实际顺序并不完全一致。

SDE SFF CDB 原始导出 描述
STUDYID Study.Label 研究标签
STUDYNAME Study.Name 研究名称
国家/地区 Site.CountryName 国家/地区名称
SITECOUNTRY SITECOUNTRY Site.Country SFF 中的三位国家/地区代码缩写
SITENUM SITENUM Site.Number 研究机构编号
SUBJID SUBJID Subject.Name 受试者 ID
EGROUP EventGroup.Label 事件组定义标签
EventGroup.RepeatLabel 事件组定义重复标签
EGROUPDEF EGROUPNAME EventGroup.Name 事件组定义名称
事件组

SYS_EVT & SYS_EVENTS

下表通过 SYS_EVT 和 SYS_EVENTS 数据集的可用列,对 SDE、SFF 和 CDB 原始导出进行了比较。列顺序与每种导出文件中的实际顺序并不完全一致。

SDE SFF CDB 原始导出 描述
STUDYID Study.Label 研究标签
STUDYNAME Study.Name 研究名称
国家/地区 Site.CountryName 国家/地区名称
SITECOUNTRY SITECOUNTRY Site.Country SFF 中的三位国家/地区代码缩写
SITENUM SITENUM Site.Number 研究机构编号
SUBJID SUBJID Subject.Name 受试者 ID
EGROUP EventGroup.Label 事件组定义标签
EventGroup.RepeatLabel 事件组定义重复标签
EGROUPDEF EGROUPNAME EventGroup.Name 事件组定义名称
EGROUPORDER 事件组顺序
EGROUPEID EventGroup.ExternalID 事件组定义外部 ID
ESEQ EGSEQ EventGroup.SeqNbr 事件组序列号
事件 Event.Label 事件定义标签
EVENTDEF EVENTNAME Event.Name 事件定义名称
EVENTEID Event.ExternalID 事件定义外部 ID
EVENTORDER 事件顺序
EVENTDT EVENTDT Event.Date 事件日期
VISMETHOD VISMETHOD Event.VisitMethod 访视方法
PLANNEDDT PLANNEDDT Event.PlannedDate Event Planned Date
OVERDUEDT 事件逾期
状态 EVENTSTATUS Event.Status 会议状态

SYS_ILB

下表通过 SYS_ILB 数据集的可用列,对 SDE、SFF 和 CDB 原始导出进行了比较。列顺序与每种导出文件中的实际顺序并不完全一致。

SDE SFF CDB 原始导出 描述
STUDYID Study.Label 研究标签
STUDYNAME Study.Name 研究名称
国家/地区 Site.CountryName 国家/地区名称
SITECOUNTRY Site.Country SFF 中的三位国家/地区代码缩写
SITENUM SITENUM Site.Number 研究机构编号
SUBJID SUBJID Subject.Name 受试者 ID
EGROUP EventGroup.Label 事件组定义标签
EventGroup.RepeatLabel 事件组定义重复标签
EGROUPDEF EGROUPNAME EventGroup.Name 事件组定义名称
EGROUPEID EventGroup.ExternalID 事件组定义外部 ID
ESEQ EGSEQ EventGroup.SeqNbr 事件组序列号
事件 Event.Label 事件定义标签
EVENTDEF EVENTNAME Event.Name 事件定义名称
EVENTEID Event.ExternalID 事件定义外部 ID
FORM Form.Label 表单定义标签
FORMDEF FORMNAME Form.Name 表单定义名称
FORMEID Form.ExternalID 表单定义外部 ID
FSEQ FSEQ Form.SeqNbr 表单序列号
IGROUP ItemGroup.Label 条目组定义标签
IGROUPDEF IGROUPNAME ItemGroup.Name 条目组定义名称
IGROUPEID ItemGroup.ExternalID 条目组定义外部 ID
IGSEQ IGSEQ ItemGroup.SeqNbr 项目组序列号
ITEM Item.Label 条目定义标签
ITEMDEF ITEMNAME Item.Name 条目定义名称
ITEMEID Item.ExternalID 项目定义外部 ID
LABANALYTENAME LABANALYTENAME LABANALYTENAME 实验室分析物名称
ILBREAS ILBREASON ILBREASON 故意保留为空的原因
ROWWRITEDT 将行写入文件的日期时间
GUID ROWID SDE:内部条目 ID
SFF:行的唯一 ID
LASTRUN SDE 的上次运行

下表通过 SYS_LINKS 数据集的可用列,对 SDE、SFF 和 CDB 原始导出进行了比较。列顺序与每种导出文件中的实际顺序并不完全一致。

SDE SFF CDB 原始导出 描述
STUDYID 研究标签
STUDYNAME Study.Name 研究名称
国家/地区 国家/地区名称
SITECOUNTRY Site.Country SFF 中的三位国家/地区代码缩写
SITENUM SITENUM Site.Number 研究机构编号
SUBJID SUBJID Subject.Name 受试者 ID
EGROUP 事件组定义标签
EGROUPDEF EGROUPNAME EventGroup.Name 事件组定义名称
ESEQ EGSEQ EventGroup.SeqNbr 事件组序列号
EGROUPEID 事件组定义外部 ID
事件 事件定义标签
EVENTDEF EVENTNAME Event.Name 事件定义名称
EVENTEID 事件定义外部 ID
FORM 表单定义标签
FORMDEF FORMNAME Form.Name 表单定义名称
FORMEID 表单定义外部 ID
FSEQ FSEQ Form.SeqNbr 表单序列号
IGROUP 条目组定义标签
IGROUPDEF ItemGroup.Name 条目组定义名称
IGROUPEID 条目组定义外部 ID
IGSEQ ItemGroup.SeqNbr 项目组序列号
ITEM 条目定义标签
ITEMDEF FormLink.Name 条目定义名称
ITEMEID 项目定义外部 ID
FORMCREATEDDT 表单创建日期时间
GUID LINKID Form.LinkID 链接 ID
CREATEDB LINKCREATEDBY 链接表单创建者
LINKCREATEDDT LINKCREATEDDT Form.LinkCreatedDate 链接创建日期时间
FGUID FORMID Form.ID 内部表单 ID
LASTRUN SDE 的上次运行
ROWWRITEDT 将行写入文件的日期时间
ROWID 行的唯一 ID

SYS_SUB / SYS_SUBJECTS

下表通过 SYS_SUB 和 SYS_SUBJECTS 数据集的可用列,对 SDE、SFF 和 CDB 原始导出进行了比较。列顺序与每种导出文件中的实际顺序并不完全一致。

SDE SFF CDB 原始导出 描述
CASEBDEF CASEBOOKVER 受试者病例手册版本
STUDYID 研究标签
STUDYNAME Study.Name 研究名称
国家/地区 国家/地区名称
SITECOUNTRY Site.Country SFF 中的三位国家/地区代码缩写
SITENUM SITENUM Site.Number 研究机构编号
SUBJID SUBJID Subject.Name 受试者 ID
IXRSID IXRSID 受试者 IXRS ID
状态 SUBSTATUS Subject.Status 受试者状态
SUBRESTRICTED 受限制的受试者
SDVPLAN SDVPLAN SDV 计划
DMRPLAN DMRPLAN DMR 计划
FROZEN FROZEN 受试者已冻结
已锁定 已锁定 受试者已锁定
SIGNED SIGNED 受试者已签名
LATESTARM LATESTARM 最新组
LATESTCOHORT LATESTCOHORT 最新群组
LATESTSUBSTUDY LATESTSUBSTUDY 最新子研究
CNSNTDT CNSNTDT 初始同意日期
SCRDDT SCRDDT 筛选日期
SCRFAILDT SCRFAILDT 筛查失败日期
ENRDDT ENRDDT 注册日期
RDMDDT RDMDDT 随机化日期
STARTTRTDT STARTTRTDT 开始治疗日期
ENDTRTDT ENDTRTDT 治疗结束日期
WTHDRWNDT WTHDRWNDT 退出日期
STARTFLLWUPDT STARTFLLWUPDT 开始跟进日期
LOSTFLLWUPDT LOSTFLLWUPDT 失去跟进日期
CMPLTDT CMPLTDT 研究结束日期
SUBLASTMODBY 受试者上次修改者
LASTMODDT SUBLASTMODDT 受试者上次修改日期时间
GUID SYSID Subject.ID 内部受试者 ID
LASTRUN SDE 的上次运行
ROWWRITEDT 将行写入文件的日期时间
ROWID 行的唯一 ID

SYS_Q / QUERIES

下表通过 SYS_Q(质疑)数据集的可用列,对 SDE 和 SFF 进行了比较。列顺序与每种导出文件中的实际顺序并不完全一致。请注意,在 CDB 中,质疑可通过质疑列表获取,并可按来源或状态进行细分。

SDE SFF CDB 原始导出 描述
STUDYID 研究标签 研究标签
STUDYNAME 研究名称
国家/地区 国家/地区名称
SITECOUNTRY Site.Country SFF 中的三位国家/地区代码缩写
SITENUM SITENUM Site.Number 研究机构编号
SUBJID SUBJID Subject.Name 受试者 ID
Subject.Status 受试者状态
EGROUP 事件组定义标签
EGROUPDEF EGROUPNAME 事件组定义名称
EGROUPEID 事件组定义外部 ID
ESEQ EGSEQ 事件组序列号
事件 事件定义标签
EVENTDEF EVENTNAME Event.Name 事件定义名称
EVENTEID 事件定义外部 ID
EVENTDT Event.Name 事件日期
EVENTSTATUS 会议状态
FORM 表单定义标签
源表单来源
FORMDEF FORMNAME Form.Name 表单定义名称
FORMEID 表单定义外部 ID
FSEQ FSEQ 表单序列号
IGROUP 条目组定义标签
IGROUPDEF IGROUPNAME 条目组定义名称
IGROUPEID 条目组定义外部 ID
IGSEQ IGSEQ 项目组序列号
ITEM 条目定义标签
ITEMDEF ITEMNAME Item.Name 条目定义名称
ITEMEID 项目定义外部 ID
QUERYID QUERYNAME Query.Name 质疑名称
GUID QUERYID Query.ID 内部质疑 ID
SRCTYPE 源类型
SRCSYS ORIGINSYS Origin.Sys 源系统名称 / 来源系统名称
SRCID ORIGINID Origin.ID 源 ID / 来源 ID
ORIGINNAME 源名称
SRCUSER Origin.User 源用户
状态 QUERYSTATUS Query.Status 查询状态
QUERYTYPE 查询类型
RESTRICTED QUERYRESTRICTED 受限制的质疑
手工 MANUALQUERY Query.Category 手动查询
RULEID RULEDEF Rule.Definition 规则定义名称
TRIGID TRIGID Trigger.ID 触发器名称
QTEXT FIRSTQUERYMSG Query.FirstMessage 第一条质疑消息
Query.LatestMessage 最新质疑消息
QTEXTBASE 第一条质疑消息(基本语言)
QTEXTENG 第一条质疑消息(英语)
OBSSOURCEVAL 观察源值(用于快速质疑)
QUERYTEAM QUERYTEAM Query.Team 查询团队
QTFRESP QUERYTFRESP 开放回应 从创建日期到首次回复的质疑时长
QAGE QUERYAGE Query.Age 质疑年龄
QCHGDATA QUERYCHGDATA 导致数据更改 质疑是否导致数据更改
QOTOCL QUERYOPENTOCLOSE 查询打开到关闭的天数
QUERYROWEXTERNALID Query.RowExternalID(仅适用于第三方质疑)
CREATEDB QUERYCREATEDBY Query.CreatedBy 查询创建者
CREATED QUERYCREATEDDT Query.CreatedOn 质疑创建日期时间
LASTCLOSEDDT QUERYLASTCLOSEDDT 质疑上次关闭日期时间
ROWWRITEDT 将行写入文件的日期时间
ROWID SDE:内部质疑 ID / SFF:行的唯一 ID
Query.ClosedByCheck
LASTRUN SDE 的上次运行

SYS_QT / QUERY_MSGS

下表通过 SYS_QT(质疑消息)数据集的可用列,对 SDE 和 SFF 进行了比较。列顺序与每种导出文件中的实际顺序并不完全一致。请注意,在 CDB 中,质疑消息可通过质疑列表获取,并可按来源或状态进行细分。

SDE SFF CDB 原始导出 描述
QRY.Status 查询状态
QRY.Age 质疑年龄
QRY.FormSource 表单来源
STUDYID 研究标签 研究标签
STUDYNAME 研究名称
国家/地区 国家/地区名称
SITECOUNTRY Site.Country SFF 中的三位国家/地区代码缩写
SITENUM SITENUM 研究机构编号
研究中心名称 机构名称
Event.Name 事件名称
Event.Date 事件日期
SUBJID SUBJID 受试者 ID
Subject.Status 受试者状态
QUERYID QUERYNAME QRY.Name 质疑名称
QUERYID QRY.ID 查询 ID
状态 QUERYMSGSTATUS QRYMSG.Status 质疑消息状态
QRY.FormName 表单名称
QRY.ItemName 字段名称
RESTRICTED RESTRICTEDMSG 受限制的质疑消息
QTEXT QUERYMSG QRYMSG.Text 质疑消息
QTEXTBASE 质疑消息(基本语言)
QTEXTENG 质疑消息(英语)
TEXTDT QUERYMSGDT QRYMSG.CreatedBy 质疑消息日期时间
TEXTBY QUERYMSGBY QRYMSG.CreatedDate 质疑消息发送者
QUERYTEAM QUERYTEAM 查询团队
QUICKACT QRYMSG.Action 快捷操作
QUICKACTTYPE QRYMSG.ActionType 快速操作类型(用于快速质疑)
SRCTYPE 源类型(用于快速质疑)
SRCSYS QRYMSG.OriginSystem 源系统名称
SRCUSER QRYMSG.OriginUser 源用户
SRCID QRYMSG.OriginID 源 ID
QRY.RowExternalID 原始外部 ID
ROWWRITEDT 将行写入文件的日期时间
GUID ROWID SDE:内部质疑消息 ID / SFF:行的唯一 ID
LASTRUN SDE 的上次运行

SYS_PD

下表通过 SYS_PD 数据集的可用列,对 SDE、SFF 和 CDB 原始导出进行了比较。列顺序与每种导出文件中的实际顺序并不完全一致。只有在 EDC 中为研究配置了方案偏离(PD)时,PD 运营文件才会在 SDE/SFF 文件夹中可见。

SDE SFF CDB 原始导出 描述
STUDYID 研究标签
STUDYNAME Study.Name 研究名称
国家/地区 Site.CountryName 国家/地区名称
SITECOUNTRY SFF 中的三位国家/地区代码缩写
SITENUM SITENUM Site.Number 研究机构编号
SUBJID SUBJID Subject.Name 受试者 ID
PDID PDNAME PD.ID PD 标识符/名称
PDTYPE PD 类型
PDSUM PDSUM PD.Summary PD 摘要
PDDAT PDDT PD.DeviationDate PD 偏离日期
PDDATID PDDTID PD.IdentifiedDate PD 已识别日期
PDCAT PDCAT PD.CategoryName PD 类别
PD.CategoryLabel PD 类别标签
PDSUBCAT PDSUBCAT PD.SubcategoryName PD 子分类
PD.SubcategoryLabel PD 子类别标签
PDSEV PDSEV PD.SeverityName PD 严重性
PD.SeverityLabel PD 严重性标签
PDDESC PDDESC PD.Description PD 描述
PDSTATUS PDSTATUS PD.Status 试验方案偏离状态
PDRES PDRES PD.Resolution 方案偏离解决方法
PDRULE PDRULE PD.Rule PD 规则
RESTRICTED PDRESTRICTED PD 受限
EGROUP EventGroup.Label 事件组定义标签
EventGroup.RepeatLabel 事件组定义重复标签
EGROUPDEF EGROUPNAME EventGroup.Name 事件组定义名称
EGROUPEID EventGroup.ExternalID 事件组定义外部 ID
事件 Event.Label 事件定义标签
EVENTDEF EVENTNAME Event.Name 事件定义名称
EVENTEID Event.ExternalID 事件定义外部 ID
ESEQ EGSEQ EventGroup.SeqNbr 事件组序列号
FORM Form.Label 表单定义标签
FORMDEF FORMNAME Form.Name 表单定义名称
FORMEID Form.ExternalID 表单定义外部 ID
FSEQ FSEQ Form.SeqNbr 表单序列号
IGROUP ItemGroup.Label 条目组定义标签
IGROUPDEF IGROUPNAME ItemGroup.Name 条目组定义名称
IGROUPEID ItemGroup.ExternalID 条目组定义外部 ID
IGSEQ IGSEQ ItemGroup.SeqNbr 项目组序列号
ITEM Item.Label 条目定义标签
ITEMDEF ITEMNAME Item.Name 条目定义名称
ITEMEID Item.ExternalID 项目定义外部 ID
CREATEDT PDCREATEDDT PD.CreatedDate 创建日期/时间
CREATEDB PDCREATEDBY PD.CreatedBy 创建者
LASTMODDT PDLASTMODDT PD.LastModifiedDate 上次修改日期时间
LASTMODB PDLASTMODBY PD.LastModifiedBy 上次修改者
USERMODDT USERMODDT PD.UserModifiedDate 用户修改日期时间
USERMODB USERMODBY PD.UserModifiedDate 用户修改人
LASTREAS LASTREASON PD.ChangeReason 上次更改原因
INACBYSYS INACTBYSYS PD.InactivatedBySystem 被系统停用
LASTINACDT LASTINACTDT PD.LastInactivatedDate 上次停用日期
FGUID 内部表单 ID
PDGUID SYSID PD.PID 内部 PD ID
LASTRUN SDE 的上次运行
SOURCE PD 的来源(即 CDB、外部)
ORIGINSYS PD 来源系统
ORIGINID PD 来源 ID
ORIGINNAME PD 来源名称
ROWWRITEDT 将行写入文件的日期时间
ROWID 行的唯一 ID

参考数据

参考数据是 SFF 独有的,有助于执行查找,并作为临床数据的补充数据。SFF 中的以下文件被视为参考数据:

文件名 SFF 可用性 描述
LABELS 仅完整 SFF 标签在此文件中导出。如果选择包含研究设计(Include Study Design)选项,SDE 会在 CSV 文件和 definitions 文件夹中包含标签。
OVERRIDE_LABELS 仅完整 SFF 如果在 EDC 工作室中配置了显示覆盖标签,则在此文件中导出。
LOCAL_LAB_UNITS 完整和增量 SFF 作为 EDC 本地实验室模块一部分定义的单位列表。
LOCAL_LAB_CODELISTS 完整和增量 SFF 作为 EDC 本地实验室模块一部分定义的编码列表的列表。
DELETES 仅增量 SFF 在行级别跟踪已删除的数据。

研究设计数据

SFF 主要在 manifest.json 文件的研究设计代码块中包含研究设计数据,该代码块包含最新研究设计版本的信息。

研究设计数据包含在各种导出格式中:

  • 完整 SFF 在 LABELS CSV 文件中包含标签信息(参见参考数据)。
  • 当用户选择包含研究设计选项时,SDE 在 Definitions 文件夹中包含研究设计信息。该文件夹包含所有病例手册版本的研究设计对象的 CSV 文件。
  • CDB 原始导出在其 manifest.json 文件中包含有限的研究设计信息,例如数据类型、条目标签、编码以及当列引用代码列表条目定义时的解码值。
  • 病例手册设计导出(CDE)以调度顺序和 JSON 格式包含有关研究设计属性的全面信息。

共享属性映射

此处展示 SDE、SFF、CDB 原始导出与 CDE 之间的共享属性映射。注意,SFF 在多个位置提供研究设计信息,但主要存储在清单文件中。

除非另有说明,以下映射指的是各自输出中的列或属性。

SDE SFF CDB 原始导出 CDE 描述
清单文件:study Study.Name study\_name 研究名称
STUDYID LABELS.csv 文件 study\_label 研究标签
EGROUP LABELS.csv 文件 eventgroup\_def → label 事件组定义标签
EGROUPDEF EGROUPNAME 列或
清单文件:study\_design → eventgroups → name
EventGroup.Name eventgroup\_def → name 事件组定义名称
EGROUPEID 清单文件:study\_design → eventgroups → external\_id eventgroup\_def → external\_id 事件组定义外部 ID
事件 LABELS.csv 文件 event\_def → label 事件定义标签
EVENTDEF EVENTNAME 列或
清单文件:study\_design → events → name
Event.Name event\_def → name 事件定义名称
EVENTEID 清单文件:study\_design → events → external\_id event\_def → external\_id 事件定义外部 ID
FORM LABELS.csv 文件 form\_def → label 表单定义标签
FORMDEF FORMNAME 列或
清单文件:study\_design → forms → name
Form.Name form\_def → name 表单定义名称
FORMEID 清单文件:study\_design → forms → external\_id form\_def → external\_id 表单定义外部 ID
IGROUP LABELS.csv 文件 ItemGroup.Label itemgroup\_def → label 条目组定义标签
IGROUPDEF IGROUPNAME 列或
清单文件:study\_design → itemgroups → name
ItemGroup.Name itemgroup\_def → name 条目组定义名称
IGROUPEID 清单文件:study\_design → itemgroups → external\_id ItemGroup.ExternalID itemgroup\_def → external\_id 条目组定义外部 ID
ITEM LABELS.csv 文件 Item.Label item\_def → label 条目定义标签
ITEMDEF ITEMNAME 列或
清单文件:clinical\_data → columns → lookup\_name
Item.Name item\_def → name 条目定义名称
ITEMEID 清单文件:clinical\_data → columns → external\_id Item.ExternalID item\_def → external\_id 项目定义外部 ID