타사 데이터 가져오기
CDB를 사용하면 CDB 워크벤치 애플리케이션에서 정리 및 보고를 위해 타사 시스템에서 데이터를 가져올 수 있습니다. 이 작업은 Vault EDC의 대상자 사례집 외부에 존재하는 대상자 데이터(예: IRT 시스템의 대상자에 대한 데이터)를 가져오기 위한 것입니다.
가용성: 임상 데이터베이스(CDB)는 CDB 라이선스 보유자만 사용할 수 있습니다. 자세한 내용은 Veeva 서비스 담당자에게 문의하십시오.
사전 구성 요소
데이터를 CDB로 가져오려면 먼저 조직에서 다음 작업을 수행해야 합니다.
- 스터디, 스터디 국가 및 스터디 사이트를 생성합니다.
- Vault EDC Studio에서 사례집 정의, 전체 디자인 정의 레코드 세트 및 스터디 일정을 생성하고 게시합니다. 여기에서 자세한 내용을 참조하십시오.
- 각 대상자에 대한 사례집 레코드를 생성합니다.
CDMS Lead Data Manager(CDMS 책임 데이터 매니저) 표준 스터디 역할을 보유한 사용자는 기본적으로 아래 설명된 작업을 수행할 수 있습니다. 조직에서 사용자 정의 역할을 사용하는 경우 역할에서 다음 권한을 부여해야 합니다.
유형(Type) | 권한 레이블 | 컨트롤 |
---|---|---|
표준 탭 | 워크벤치(Workbench) 탭 | 워크벤치 탭을 통해 데이터 워크벤치 애플리케이션에 액세스하고 이를 사용할 수 있는 권한 |
기능적 권한 | 가져오기 보기 | 가져오기 페이지에 액세스할 수 있는 기능 |
기능적 권한 | API 액세스 | Vault CDMS API에 액세스하고 이를 사용할 수 있는 기능(CDB를 사용하기 위해서도 이 권한 필요) |
기능적 권한 | 가져오기 승인 | 구성 변경 사항이 포함된 가져오기 패키지를 승인하거나 거부할 수 있는 기능 |
기능적 권한 | 가져오기 패키지 다운로드 | 가져오기 패키지를 다운로드할 수 있는 기능 |
가져올 데이터 준비
데이터를 일련의 CSV 파일로 CDB Vault의 FTP 서버에 가져올 수 있습니다. 데이터를 가져오려면 먼저 임상 데이터가 나열된 CSV 파일과 데이터 및 CDB가 데이터를 처리하는 방법을 설명하는 매니페스트 파일(.json)을 생성해야 합니다. 그런 다음, CDB로 가져올 모든 파일이 포함된 ZIP 패키지(.zip)를 생성합니다.
매니페스트 빌더: CDB에는 파일을 쉽게 생성할 수 있도록 CDB 매니페스트 빌더가 포함되어 있습니다. CDB 매니페스트 빌더는 사용자 친화적인 인터페이스에서 모든 매니페스트 파일 구성 옵션을 안내하는 단계별 마법사입니다. CDB 매니페스트 빌더에서 CDB는 JSON을 이해하지 않고도 설정할 수 있는 모든 가져오기 옵션을 제공합니다.
데이터 CSV
EDC와 독립적인 스터디의 각 데이터 수집 폼에 대한 CSV를 생성합니다. 각 CSV에 대해 4개의 필수 열을 제공한 다음, 각 실행 데이터 항목에 대한 열을 제공해야 합니다. 4개의 필수 열에 대해 각 CSV의 매니페스트 파일에서 해당 이름을 정의하는 한 원하는 대로 이름을 지정할 수 있습니다. 해당 열 이름은 대소문자를 구분하며 매니페스트 파일에 제공된 값과 정확히 일치해야 합니다.
스터디, 사이트, 대상자, 이벤트 및 시퀀스 열을 제외하고 CDB는 모든 열을 데이터 항목으로 간주하여 데이터 항목으로 가져옵니다. 목록당 항목 열은 410개로 제한됩니다.
열 | 선택 | 매니페스트 파일 키 |
---|---|---|
스터디 |
이 열에 스터디 이름을 제공합니다. 스터디에서는 스터디 이름( "Studyname"을 이 열의 헤더로 사용하면 내보내기 패키지를 생성하는 동안 오류가 발생할 수 있으므로 사용하지 마십시오.
|
study |
사이트(Site) |
이 열에는 (Vault EDC의 사이트 레코드에서) 사이트 이름(사이트 번호)을 제공합니다. "Sitename"을 이 열의 헤더로 사용하면 내보내기 패키지를 생성하는 동안 오류가 발생할 수 있으므로 사용하지 마십시오.
매니페스트 파일에서 사이트 열을 정의하지 않고 CSV 파일에서 열을 제외하면 워크벤치에서 대상자 열을 기준으로 일치시킬 수 있습니다. 워크벤치는 해당 작업을 수행할 때 대상자 ID가 스터디 레벨에서 고유할 것으로 예상합니다. |
site |
대상자 |
이 열에는 (Vault EDC의 대상자 레코드 이름 필드에서) 대상자의 대상자 ID를 제공합니다. "Subjectname"을 이 열의 헤더로 사용하면 내보내기 패키지를 생성하는 동안 오류가 발생할 수 있으므로 사용하지 마십시오.
|
subject |
이벤트 | 이 열에는 데이터 행과 연결된 이벤트(방문)를 제공합니다. 매니페스트 파일의 edc_matching 구성에 따라 EDC 이벤트 정의의 이름 또는 외부 ID, EDC 이벤트의 이벤트 날짜를 사용하거나 이 열의 이벤트를 사용하여 워크벤치에서 EDC 일정과 별도로 이벤트를 생성하도록 할 수 있습니다. 또한 매니페스트 파일의 모든 행에 대해 기본 이벤트를 설정하고 이 열을 완전히 제외하여 모든 행을 해당 이벤트에 할당할 수 있습니다. 아래에서 이벤트 일치에 대해 자세히 알아보십시오. | event |
폼 *선택 사항 |
이 열에는 (Vault EDC의 폼 정의 레코드 이름에서) 데이터 행과 연결된 폼을 제공합니다. 이 열은 단일 CSV에서 여러 폼의 데이터를 가져오는 경우에만 필요합니다. 이 열을 포함하지 않으면 워크벤치는 각 데이터 행이 단일 폼의 발생 항목이라고 가정합니다. 아래에서 폼 매핑에 대해 자세히 알아보십시오. |
form |
폼 시퀀스 *반복 폼의 경우 필수, 반복되지 않는 폼의 경우 선택 사항 |
폼이 반복되는 경우 폼의 시퀀스 번호. 반복 폼은 단일 대상자의 단일 이벤트 동안 동일한 데이터를 두 번 이상 수집하는 것을 나타냅니다. 그런 다음, 시퀀스 번호는 데이터 행을 고유하게 식별합니다. 대상자 및 이벤트에 대한 행(폼)이 두 개 이상 있는 경우 워크벤치는 폼이 반복된다고 가정하고 이 열을 사용하여 시퀀스 번호를 설정합니다. 이 열은 폼이 반복되는 경우 필수이지만 폼이 반복되지 않는 경우에는 선택 사항입니다. 이 경우 워크벤치는 기본적으로 각 행의 시퀀스 번호를 "1"로 설정합니다. 반복 폼에 이 열을 포함하지 않으면 워크벤치는 기본적으로 시퀀스 번호를 "1"로 설정하여 동일한 대상자/사이트/폼/폼 시퀀스 번호 식별자가 있는 행이 생성되므로 데카르트 곱이 생성될 수 있습니다. 20R1 릴리스에서는 "sequence"의 이름이 "formsequence"로 바뀌었습니다. 20R2 릴리스(2020년 8월)까지 "sequence"를 사용하여 데이터를 계속 가져올 수 있습니다. |
formsequence |
항목 그룹 *선택 사항 |
이 열에는 (Vault EDC의 항목 그룹 정의 레코드 이름에서) 그 뒤에 있는 항목 열과 연결된 항목 그룹을 제공합니다. 이 열은 여러 항목 그룹이 있는 폼 데이터를 가져오는 경우에만 필요합니다. 이 열을 포함하지 않으면 워크벤치는 데이터 행의 모든 항목이 단일 항목 그룹에 있다고 가정합니다. 아래에서 항목 그룹 매핑에 대해 자세히 알아보십시오. |
itemgroup |
항목 그룹 시퀀스 *반복 항목 그룹의 경우 필수, 반복되지 않는 항목 그룹의 경우 선택 사항 |
항목 그룹이 반복되는 경우 항목 그룹의 시퀀스 번호. 반복 항목 그룹은 단일 대상자의 단일 폼 동안 동일한 데이터를 두 번 이상 수집하는 것을 나타냅니다. 그런 다음, 시퀀스 번호는 데이터 행을 고유하게 식별합니다. 대상자 및 이벤트에 대한 폼 행에 항목 세트가 두 개 이상 있는 경우 워크벤치는 폼이 반복된다고 가정하고 이 열을 사용하여 시퀀스 번호를 설정합니다. 반복 항목 그룹에 이 열을 포함하지 않으면 워크벤치는 기본적으로 시퀀스 번호를 "1"로 설정하여 동일한 대상자/사이트/폼/폼 시퀀스/항목 그룹/항목 그룹 시퀀스 번호 식별자가 있는 행이 생성되므로 데카르트 곱이 생성될 수 있습니다. 반복되지 않는 항목 그룹의 경우 이 열은 선택 사항이므로 비워 두거나 반복 항목 그룹이 없는 경우 제공하지 않을 수 있습니다. 이 경우 워크벤치는 기본적으로 각 행의 시퀀스 번호를 "1"로 설정합니다. |
itemgroupsequence |
행 ID *선택 사항 21R2 및 &이전 |
값이 결합될 때 워크벤치에서 행을 고유하게 식별하는 데 사용할 수 있는 열 목록을 제공합니다. 이 작업은 시퀀스를 식별할 숫자 키가 없는 경우에 유용합니다. 예를 들어 실험실 데이터를 가져올 때 스터디, 대상자 및 실험실 테스트를 사용하여 행을 고유하게 식별할 수 있습니다. rowid 열 매핑을 포함하면 워크벤치는 모든 시퀀스 값을 무시하고 자동으로 시퀀스를 "1"로 설정합니다. 생략하면 워크벤치는 기본 열 배열을 사용하여 행(study , subject , event , form , formsequence )을 식별합니다.rowid 에 대한 단일 열 목록을 제공하는 것은 여전히 지원되지만 향후 릴리스에서는 제거될 예정입니다. 대신 groupid 와 distinctid 를 rowid 에 대한 열 목록으로 정의하십시오. 아래 행을 참조하십시오. |
rowid |
행 ID *선택 사항 21R3 및 이후& |
그룹 ID: 값이 결합될 때 워크벤치에서 스터디, 사이트, 대상자, 이벤트 이외의 레코드를 그룹화하는 데 사용할 수 있는 열 목록을 제공합니다. 워크벤치는 고유 ID: 값이 결합될 때 워크벤치에서 그룹 컨텍스트 내에서 레코드를 고유하게 식별하는 데 사용할 수 있는 열 목록을 제공합니다( 행 외부 ID: EDC의 외부 ID와 같은 외부 ID를 데이터 행에 할당할 수 있습니다. 이에 따라 타사 데이터에 대한 쿼리 원본을 식별할 수 있습니다. |
groupid , distinctid 및 rowexternalid 가 있는 rowid |
다음은 예시 CSV 파일입니다.
STUDY_ID | SITE | SUBJECT_ID | VISIT | INITIALS | DOB | GENDER | RACE |
---|---|---|---|---|---|---|---|
S.Deetoza | 101 | 101-1001 | 선별 | CDA | 03-27-1991 | F | 히스패닉 |
이 예시에는 다음과 같은 열 매핑이 있습니다.
- 스터디: STUDY_ID
- 사이트: SITE
- 대상자: SUBJECT_ID
- 이벤트: VISIT
INITIALS, DOB, GENDER 및 RACE 열은 모두 데이터 항목입니다.
매니페스트 파일
매니페스트 파일은 CDB에 대한 스터디 및 원본을 제공하고 ZIP에 있는 파일을 나열하며 각 파일에 대해 필요한 데이터 포인트에 매핑되는 열을 나열합니다.
원본은 패키지 내용을 식별할 수 있는 사용자 정의 값입니다. 이 값은 워크벤치의 원본 필드에 저장되므로 CQL을 통해 워크벤치에서 이 패키지의 데이터를 식별하는 데 사용할 수 있습니다. 원본 값은 스터디 내에서 고유해야 합니다.
스터디에서는 스터디 이름(study__v
) 레코드를 제공합니다. 스터디에서는 스터디 이름(study__v
) 레코드를 제공합니다. 스터디 이름에 공백 문자가 포함되어 있으면 매니페스트 파일에서 공백이 있는 값을 사용해야 하지만 데이터 파일에서 공백을 밑줄(_)로 바꿔야 합니다.
원본에서는 데이터 원본을 지정합니다. Vault는 이 원본을 가져온 모든 데이터에 적용합니다. 그런 다음, 파일 이름(확장자 포함) 및 열 매핑을 포함한 각 CSV 파일을 배열로 "data" 값으로 나열합니다.
가져오기 파일의 각 데이터 항목에 대한 구성 메타데이터를 포함하도록 선택할 수 있습니다. 세부 사항은 아래에서 참조하십시오.
이 파일을 "manifest.json"으로 저장합니다.
워크벤치는 정확한 파일 이름(대소문자 구분) 및 확장자를 가진 매니페스트 파일만 허용합니다.
예시 매니페스트: 단일 폼
다음은 eCOA에서 설문조사 폼이 포함된 패키지를 가져오는 Deetoza 스터디용 예시 매니페스트 파일입니다.
{ "study": "Deetoza", "source": "eCOA", "data": [ { "filename": "Survey.csv", "study": "protocol_id", "site": "site_id", "subject": "patient", "event": "visit_name" } ] }
예시 매니페스트: 여러 폼
다음은 실험실 공급업체에서 화학 및 혈액학 폼이 포함된 패키지를 가져오는 Deetoza 스터디용 예시 매니페스트 파일입니다.
{ "study": "Deetoza", "source": "lab", "data": [ { "filename": "Chemistry.csv", "study": "STUDY_ID", "site": "SITE_ID", "subject": "SUBJECT_ID", "event": "VISIT", "formsequence": "LAB_SEQ" }, { "filename": "Hematology.csv", "study": "STUDY_ID", "site": "SITE_ID", "subject": "SUBJECT_ID", "event": "VISIT", "formsequence": "LAB_SEQ" } ] }
행 ID 매핑을 사용하고 단일 CSV 파일을 사용하여 화학 및 혈액학 실험실 데이터를 가져올 수도 있습니다. 해당 CSV 파일에서 실험실 테스트 세트 열을 사용하여 행에 화학 또는 혈액학을 나타낼 수 있습니다.
{ "study": "Deetoza", "source": "lab", "data": [ { "filename": "Labs.csv", "study": "STUDY_ID", "site": "SITE_ID", "subject": "SUBJECT_ID", "event": "VISIT", "rowid": ["LAB_TEST_SET", "LAB_TEST_SEQ"] } ] }
선택 사항: 이벤트 일치
기본적으로 워크벤치는 폼의 CSV 파일에 있는 이벤트를 Vault EDC의 일치하는 이벤트 정의 레코드 이름과 일치시킵니다. 워크벤치에서 이벤트 정의의 외부 ID를 기준으로 이벤트를 일치시키도록 선택할 수도 있습니다. 또한 매니페스트 파일에서 기본 이벤트를 정의하고 모든 행을 해당 이벤트에 자동으로 할당할 수 있습니다. 데이터가 EDC에 예약된 이벤트 외부에서 수집된 경우 EDC 이벤트에 매핑하지 않도록 선택하고 워크벤치에서 필요에 따라 가져오기 패키지의 이벤트와 일치하는 이벤트를 생성하도록 할 수 있습니다.
이벤트가 반복 이벤트 그룹 내에 있는 경우 워크벤치는 이벤트 정의의 외부 ID를 사용하고 일치시키기 위해 시퀀스 번호를 추가합니다. 시퀀스 번호는 파일의 각 고유 이벤트에 대해 증가합니다. 이벤트가 두 개 이상의 이벤트 그룹에서 재사용되는 경우 반복으로 간주되지 않습니다. 대신 워크벤치는 해당 이벤트를 EDC 일정에서 첫 번째로 일치하는 이벤트와 일치시킵니다.
기본 동작
매니페스트 파일에 이벤트 일치 구성을 포함하지 않으면 다음 기본값이 적용됩니다.
- 워크벤치는 이벤트 정의 이름을 사용하여 일치시킵니다.
- 워크벤치는 기존 EDC 이벤트와 일치시키려고 시도합니다. EDC에 일치하는 이벤트가 없는 경우 워크벤치는 새 이벤트를 생성합니다.
이 기본 동작은 아래 매니페스트 구성과 동일합니다.
{ "study": "Deetoza", "source": "Labs", "edc_matching": { "event": { "target": ["name"], "generate": true } } }
이름 일치(기본값)
매니페스트 파일에 edc_matching
을 포함하지 않으면 워크벤치는 이벤트 정의 이름을 사용하여 자동으로 일치시킵니다. 매니페스트 파일에서 이름 기반 일괄 처리를 지정할수도 있습니다.
{ "study": "Deetoza", "source": "Labs", "edc_matching": { "event": { "target": ["name"] } } }
외부 ID 일치
이벤트 정의의 외부 ID(이전의 OID)를 일치시키려면 edc_matching
을 포함하고 이벤트 대상을 external_id
로 설정해야 합니다. 아래 예시 발췌를 참조하십시오.
{ "study": "Deetoza", "source": "Labs", "edc_matching": { "event": { "target": ["external_id"] } } }
기본 이벤트 설정
CSV에 이벤트를 나열하는 대신 매니페스트 파일에서 이벤트를 기본 이벤트로 선택할 수 있습니다. 그러면 워크벤치에서 해당 CSV 파일의 모든 행을 해당 이벤트에 자동으로 할당합니다. 이 작업은 default
키로 제어됩니다. default
에 이벤트 정의 이름을 사용합니다. 특정 데이터 파일에 대한 기본값을 설정하거나 패키지 레벨에서 기본값을 설정할 수 있습니다.
예시: 패키지 레벨 기본 이벤트
{ "study": "Deetoza", "source": "lab", "edc_matching": { "event": { "default": "treatment_visit" } }, "data": [ { "filename": "Labs.csv", "study": "STUDY_ID", "site": "SITE_ID", "subject": "SUBJECT_ID", "event": "VISIT", "rowid": ["LAB_TEST_SET", "LAB_TEST_SEQ"] } ] }
예시: 파일 레벨 기본 이벤트
{ "study": "Deetoza", "source": "Labs", "edc_matching": { "event": { "default": "treatment_visit", } } }
일치하지 않는 이벤트 처리
기본적으로 워크벤치에서 이름 또는 외부 ID를 기준으로 이벤트를 EDC의 이벤트와 일치시킬 수 없는 경우 원본과 관련된 비EDC 이벤트에 대해 새 이벤트를 생성합니다. 이러한 새 이벤트는 전체 워크벤치 헤더 이벤트 레코드(@HDR.Event
에서 CQL을 통해 액세스 가능)의 일부가 됩니다. 이 작업은 generate
키로 제어됩니다. 기본 동작의 매니페스트 구성은 generate: true
입니다. 데이터가 EDC 이벤트 일정 외부에서 수집된 경우 generate
를 false
로 설정하여 EDC 이벤트와 일치시키지 않도록 선택할 수 있습니다. generate
를 false
로 설정하면 워크벤치에서 새 이벤트 정의를 생성하지 않습니다. 대신 EDC 이벤트와 일치하지 않는 모든 행에 대해서는 가져오기가 실패합니다.
예시: 외부 ID 일치 및 일치하지 않는 이벤트 무시
{ "study": "Deetoza", "source": "Labs", "edc_matching": { "event": { "target": ["external_id"], "generate": false } } }
데이터가 완전히 EDC 일정 외부에서 수집된 경우 EDC 이벤트와 일치시키지 않고 워크벤치에서 각 이벤트에 대해 새 이벤트를 생성하도록 선택할 수 있습니다. 이렇게 하려면 아래 예시와 같이 event
를 false
로 설정합니다.
{ "study": "Deetoza", "source": "Labs", "edc_matching": { "event": false } }
선택 사항: 폼 및 항목 그룹 매핑&
워크벤치에서 데이터 세트 내의 반복 폼 및 항목 그룹을 해석하는 방법을 정의하는 것을 포함하여 CSV의 행을 다른 폼 및 항목 그룹에 매핑하도록 선택할 수 있습니다. 이렇게 하면 워크벤치에서 단일 CSV를 단일 폼 및 단일 항목 그룹 대신 여러 폼 및 항목 그룹으로 변환할 수 있습니다.
예를 들어 실험실 폼에는 각 실험실 테스트 범주당 하나의 항목 그룹으로 여러 항목 그룹이 포함될 수 있습니다. itemgroup
열을 사용하여 행의 데이터 항목이 속한 항목 그룹을 나타낼 수 있습니다. 워크벤치는 행의 매핑되지 않은 모든 열을 items
로 처리합니다. 워크벤치는 행의 지정된 항목 그룹 내에서 해당 항목을 가져옵니다. 항목 구성에서 해당 열에 대한 추가 메타데이터를 지정할 수 있습니다. 세부 사항은 아래에서 참조하십시오.
아래 표를 참조하면 워크벤치가 다양한 폼 및 항목 그룹 구성 시나리오에서 데이터를 처리하는 방법을 이해할 수 있습니다.
폼 정의됨 | 항목 그룹 정의됨 | 결과 |
---|---|---|
아니요(No) | 아니요(No) | 워크벤치는 각 행을 단일 폼의 한 발생 항목으로 처리합니다. |
예(Yes) | 아니요(No) | 워크벤치는 각 행을 다른 폼으로 처리하여 form 열에서 폼을 식별합니다. form 열의 각 고유 값은 다른 폼으로 처리됩니다. |
아니요(No) | 예(Yes) | 워크벤치는 각 행을 항목 그룹(itemgroup 열에 정의됨)의 인스턴스로 처리하고 해당 행을 대상자 및 폼별로 그룹화합니다. 각 항목 그룹을 반복 항목 그룹으로 처리하려면 itemgroupsequence 열을 사용합니다. |
예(Yes) | 예(Yes) | 워크벤치는 대상자, form 및 itemgroup 별로 행을 그룹화합니다. form 열의 각 고유 값은 다른 폼으로 처리되며 itemgroup 열의 각 고유 값은 항목 그룹입니다. |
예시 매니페스트: 여러 폼
아래 예시에서 "Labs.csv" 파일에는 여러 폼이 포함되어 있습니다. 해당 폼은 "Labs.csv" 파일의 form
열에서 식별됩니다.
{ "study": "Deetoza", "source": "lab", "data": [ { "filename": "Labs.csv", "study": "protocol_id", "site": "site_id", "subject": "subject_id", "event": "visit", "form": "form" } ] }
예시 매니페스트: 여러 항목 그룹
아래 예시 매니페스트 파일에서 실험실 폼에는 여러 항목 그룹이 있습니다. 해당 폼은 "Labs.csv" 파일의 lab_category
열에서 식별됩니다.
{ "study": "Deetoza", "source": "lab", "data": [ { "filename": "Labs.csv", "study": "protocol_id", "site": "site_id", "subject": "subject_id", "event": "visit", "item_group": "lab_category" } ] }
선택 사항: 항목 구성
매니페스트 파일 내에 항목 메타데이터를 포함하여 CDB 워크벤치가 데이터 항목을 처리하는 방법을 알릴 수 있습니다. 각 항목에 대한 데이터 형식을 지정할 수 있을 뿐만 아니라 데이터 형식 선택에 따라 추가 속성도 지정할 수 있습니다.
항목 구성을 생략하면 CDB 워크벤치에서 모든 항목을 텍스트로 처리합니다.
단순 구성 및 고급 구성 비교
"config" 개체 항목에는 단순 및 고급의 두 가지 구성 형식이 있습니다. 단순 구성의 경우 항목의 데이터 형식만 지정합니다. 항목 속성은 기본값을 사용합니다. 고급 구성의 경우 데이터 형식과 속성을 지정합니다.
데이터 형식별로 사용 가능한 속성
각 데이터 형식에 사용할 수 있는 다양한 구성 속성이 있습니다.
Data Type | 예시 구성 | 속성 | 속성 설명 |
---|---|---|---|
텍스트 | 길이 | 허용되는 문자 수. 기본 길이는 1,500자입니다. | |
정수 | Min | 허용되는 최소(가장 낮은)값. 기본값은 -4,294,967,295입니다. | |
Max | 허용되는 최대(가장 높은)값. 기본값은 4,294,967,295입니다. | ||
부동 소수점 | 길이 |
소수점의 왼쪽과 오른쪽 모두에 허용되는 최대 자릿수 최대값의 자릿수가 이 속성보다 많은 경우 워크벤치는 해당 숫자를 대신 사용합니다. |
|
Precision |
허용되는 소수 자릿수. 기본값은 5입니다. 최대값의 소수 자릿수가 이 속성보다 많은 경우 워크벤치는 해당 숫자를 대신 사용합니다. |
||
Min | 허용되는 최소(가장 낮은)값. 기본값은 -4,294,967,295입니다. | ||
Max | 허용되는 최대(가장 높은)값. 기본값은 4,294,967,295입니다. | ||
날짜 | 형식 |
날짜 값을 구문 분석하는 데 사용할 형식 패턴. 아래에서 지원되는 날짜 형식 목록을 참조하십시오. 기본값은 "yyyy-MM-dd"입니다. |
|
날짜/시간 | 형식 |
날짜/시간 값을 구문 분석하는 데 사용할 형식 패턴. 아래에서 지원되는 날짜 및 시간 형식 목록을 참조하십시오. 기본값은 "yyyy-MM-dd HH:mm"입니다. |
|
시간 | 형식 |
시간 값을 구문 분석하는 데 사용할 형식 패턴. 아래에서 지원되는 시간 형식 목록을 참조하십시오. 기본값은 "HH:mm"입니다. |
|
불린 | 해당 없음 | 불린 데이터 형식에는 구성 속성이 없습니다. 워크벤치는 불린 값에 대해 "true"/"false", "yes"/"no" 및 "1"/"0"을 허용합니다. |
지원되는 날짜 및 시간 형식 패턴&
아래 나열된 형식 패턴은 날짜, 날짜/시간 및 시간 항목에 사용할 수 있습니다. 날짜/시간 항목의 경우 날짜 및 시간 패턴을 결합합니다(예: "yy-MM-dd HH:mm"). 날짜에 시간 형식 패턴을 사용하거나 그 반대의 경우 오류(D-012)가 발생하면서 가져오기에 실패합니다.
형식 패턴 | 예시 | 선택 |
---|---|---|
dd MM yy | 02 18 20 | 2자리 일, 2자리 월, 2자리 연도, 공백( ) 구분 기호 사용 |
dd MM yyyy | 02 18 2020 | 2자리 일, 2자리 월, 전체 연도, 공백( ) 구분 기호 사용 |
dd MMM yyyy | 02 Feb 2020 | 2자리 일, 축약형 월(텍스트), 전체 연도, 공백( ) 구분 기호 사용 |
dd-MM-yy | 18-02-20 | 2자리 일, 2자리 월, 2자리 연도, 대시(-) 구분 기호 사용 |
dd-MM-yyyy | 18-02-2020 | 2자리 일, 2자리 월, 전체 연도, 대시(-) 구분 기호 사용 |
dd-MMM-yyyy | 18-Feb-2020 | 2자리 일, 축약형 월(텍스트), 전체 연도, 대시(-) 구분 기호 사용 |
dd-MMM-yyyy HH:mm:ss | 18-Feb-2020 12:10:50 | 2자리 일, 축약형 월(텍스트), 전체 연도, 대시(-) 구분 기호 사용, 시간(초 포함) |
dd/MMM/yy | 18/Feb/20 | 2자리 일, 축약형 월(텍스트), 2자리 연도, 슬래시(/) 구분 기호 사용 |
dd-MMM-yy | 18-Feb-20 | 2자리 일, 축약형 월(텍스트), 2자리 연도, 대시(-) 구분 기호 사용 |
ddMMMyy | 18Feb20 | 2자리 일, 축약형 월(텍스트), 2자리 연도(구분 기호 없음) |
dd MMM yy | 18 Feb 20 | 2자리 일, 축약형 월(텍스트), 2자리 연도, 공백( ) 구분 기호 사용 |
dd.MM.yy | 18.02.20 | 2자리 일, 2자리 월, 2자리 연도, 마침표(.) 구분 기호 사용 |
dd.MM.yyyy | 18.02.2020 | 2자리 일, 2자리 월, 전체 연도, 마침표(.) 구분 기호 사용 |
dd/MM/yy | 18/02/20 | 2자리 일, 2자리 월, 2자리 연도, 슬래시(/) 구분 기호 사용 |
dd/MM/yyyy | 18/02/2020 | 2자리 일, 2자리 월, 전체 연도, 슬래시(/) 구분 기호 사용 |
ddMMMyyyy | 18Feb2020 | 2자리 일, 축약형 월(텍스트), 전체 연도(구분 기호 없음) |
ddMMyy | 180220 | 2자리 일, 2자리 월, 2자리 연도(구분 기호 없음) |
ddMMyyyy | 18022020 | 2자리 일, 2자리 월, 전체 연도(구분 기호 없음) |
MM/dd/yy | 02/18/20 | 2자리 월, 2자리 일, 2자리 연도, 슬래시(/) 구분 기호 사용 |
MM/dd/yyyy | 02/18/2020 | 2자리 월, 2자리 일, 전체 연도, 슬래시(/) 구분 기호 사용 |
MMddyy | 021820 | 2자리 월, 2자리 일, 2자리 연도(구분 기호 없음) |
MMddyyyy | 02182020 | 2자리 월, 2자리 일, 전체 연도(구분 기호 없음) |
MMM dd yyyy | Feb 18 2020 | 축약형 월(텍스트), 2자리 일, 전체 연도, 공백( ) 구분 기호 사용 |
MMM/dd/yyyy | Feb/18/2020 | 전체 월(텍스트), 2자리 일, 4자리 연도, 슬래시(/) 구분 기호 사용 |
MMMddyyyy | Feb182020 | 전체 월(텍스트), 2자리 일, 4자리 연도(구분 기호 없음) |
yy-MM-dd | 20-02-18 | 2자리 연도, 2자리 월, 2자리 일, 대시(-) 구분 기호 사용 |
yy/MM/dd | 20/02/18 | 2자리 연도, 2자리 월, 2자리 일, 슬래시(/) 구분 기호 사용 |
yyyy MM dd | 2020 02 18 | 전체 연도, 2자리 월, 2자리 일, 공백( )을 구분 기호로 사용 |
yyyy-MM-dd | 2020-02-18 | 전체 연도, 2자리 월, 2자리 일, 대시(-)를 구분 기호로 사용 |
yyyy-MM-dd'T'HH:mm | 2020-02-18T12:10 | 전체 연도, 2자리 월, 2자리 일, 대시(-)를 구분 기호로 사용, 시간 |
yyyy.dd.MM | 2020.18.02 | 전체 연도, 2자리 일, 2자리 월, 마침표(.)를 구분 기호로 사용 |
yyyy.MM.dd | 2020.02.18 | 전체 연도, 2자리 월, 2자리 일, 마침표(.)를 구분 기호로 사용 |
yyyy/MM/dd | 2020/02/18 | 전체 연도, 2자리 월, 2자리 일, 슬래시(/) 구분 기호 사용 |
yyyyMMdd | 20200218 | 전체 연도, 2자리 월, 2자리 일(구분 기호 없음) |
yyyyMMdd'T'HH:mm | 2020218T12:10 | 전체 연도, 2자리 월, 2자리 일(구분 기호 없음), 시간 |
dd/MM/yyyy HH:mm | 18/02/2020 18:30 | 2자리 일, 2자리 월, 4자리 연도, 슬래시(/)를 구분 기호로 사용, 24시간제 |
MM/dd/yyyy HH:mm | 02/18/2020 18:30 | 2자리 월, 2자리 일, 4자리 연도, 슬래시(/)를 구분 기호로 사용, 24시간제 |
yyyy-MM-dd'T'HH:mm:ss+HH:mm | 2020-02-18T18:30:22+00:00 | 4자리 연도, 2자리 월, 2자리 일, 대시(-)를 구분 기호로 사용, 24시간제(초 포함), UTC의 시간 오프셋(+HH:mm) 포함 참고: 매니페스트 파일은 T를 작은따옴표(')로 묶어야 하지만 CSV 파일에는 이러한 작은따옴표를 포함하지 마십시오. |
yyyy-MM-dd'T'HH:mm:ssZ | 2020-02-18T18:30:22Z | 4자리 연도, 2자리 월, 2자리 일, 대시(-)를 구분 기호로 사용, UTC 시간 기준 24시간제(초 포함) 참고: 매니페스트 파일은 T를 작은따옴표(')로 묶어야 하지만 CSV 파일에는 이러한 작은따옴표를 포함하지 마십시오. |
yyyyMMdd'T'HH:mm:ssZ | 20200218T18:30:22Z | 4자리 연도, 2자리 월, 2자리 일, UTC 시간 기준 24시간제(초 포함) 참고: 매니페스트 파일은 T를 작은따옴표(')로 묶어야 하지만 CSV 파일에는 이러한 작은따옴표를 포함하지 마십시오. |
yyy-MM-dd'T'HH:mm:ss | 2020-2-18T12:10:41 | 전체 연도, 2자리 월, 2자리 일, 대시(-)를 구분 기호로 사용, 시간(초 포함) 참고: 매니페스트 파일은 T를 작은따옴표(')로 묶어야 하지만 CSV 파일에는 이러한 작은따옴표를 포함하지 마십시오. |
ddMMyyyy'T'HH:mm:ss | 10122024T16:15:30 | 2자리 일, 2자리 월, 4자리 연도, 구분 기호 없음, 24시간제 참고: 매니페스트 파일은 T를 작은따옴표(')로 묶어야 하지만 CSV 파일에는 이러한 작은따옴표를 포함하지 마십시오. |
yyyyMMdd HH:mm:ss | 20241210 16:15:30 | 4자리 연도, 2자리 월, 2자리 일, 구분 기호 없음, 24시간제(초 포함) |
MM/dd/yyyy HH:mm:ss | 12/10/2024 16:15:30 | 2자리 월, 2자리 일, 4자리 연도, 슬래시(/) 구분 기호, 24시간제(초 포함) |
yyyy-MM-dd'T'HH:mm:ss | 2024-12-10T16:15:30 | 4자리 연도, 2자리 월, 2자리 일, 대시(-) 구분 기호, 24시간제 참고: 매니페스트 파일은 T를 작은따옴표(')로 묶어야 하지만 CSV 파일에는 이러한 작은따옴표를 포함하지 마십시오. |
HH:mm | 18:30 | 24시간제 |
HH:mm:ss | 18:30:15 | 24시간제(초 포함) |
예시 패키지: 단일 폼, 항목 메타데이터
다음은 Verteo Pharma의 무작위 배정 공급업체의 예시 가져오기 패키지로, 항목 메타데이터가 있는 무작위 배정 폼이 포함되어 있습니다.
manifest.json:
{ "study": "Cholecap", "source": "IRT", "data": [{ "filename": "Randomization.csv", "study": "protocol_id", "site": "site_id", "subject": "patient", "event": "visit_name", "items": { "randomization_number": { "type": "integer", "length": "14" }, "date_of_randomization": { "type": "date", "format": "yyyy-MM-dd" } } }] }
Randomization.csv:
엄격한 가져오기
매니페스트 파일의 엄격한 가져오기 매개 변수를 사용하면 데이터 CSV 파일의 모든 항목 열 대신 매니페스트에 정의된 항목으로만 데이터 수집을 제한할 수 있습니다. 이 옵션을 전체 패키지 또는 개별 파일에 적용할 수 있습니다. 파일 레벨 설정은 패키지 레벨 설정을 오버라이드합니다.
"strict_import"
매개 변수는 true
또는 false
를 허용합니다. 엄격한 가져오기를 활성화하려면 이 매개 변수를 true
로 설정합니다.
선택 사항: 데이터 제한(눈가림)
항목, 행, 목록 데이터 파일 및 원본 레벨에서 데이터를 제한(눈가림)하여 제한된 데이터에 액세스할 수 있는 권한이 없는 사용자에게 데이터를 숨길 수 있습니다. 예를 들어 스터디에서 스터디 약물을 사용하는 대상자에 대해서만 특정 실험실을 지시할 수 있습니다. 대상자가 어떤 실험실에 있는지 알게 되면 대상자의 눈가림이 해제됩니다. 눈가림된 사용자가 해당 대상자를 식별하지 못하도록 이 정보를 제한할 수 있습니다.
제한 레벨 | 매니페스트 파일 구성 |
---|---|
항목 | |
폼 레코드 *가져오는 특정 폼 레코드에 대한 데이터를 제한합니다. 해당 행의 눈가림 여부를 설명하는 열을 사용합니다. | |
목록 데이터 파일 | |
원본 패키지 |
제한된 데이터에 액세스할 수 있는 사용자(일반적으로 책임 데이터 매니저)의 경우 제한된 데이터는 무제한 데이터와 동일한 방식으로 작동합니다. 눈가림된 사용자(제한된 데이터 액세스 권한이 없는 사용자)의 경우 가져온 제한된 데이터에 다음 동작 규칙이 적용됩니다.
- 항목(열)이 제한된 경우:
- CQL 프로젝션은 제한된 항목의 열을 반환하지 않습니다.
- CQL 프로젝션은 제한된 항목을 참조하는 파생 열을 반환하지 않습니다.
- 눈가림된 사용자가 CQL 문에서 제한된 항목을 참조하는 경우 CQL은 여전히 열을 반환하지 않습니다.
SHOW
및DESCRIBE
는 제한된 항목을 반환하지 않습니다.
- 행이 제한된 경우:
- 결과 세트는 폼 또는 항목 그룹의 행을 반환하지 않습니다.
- 목록 파일(csv)이 제한된 경우:
- 기본
@HDR
열은 목록에 포함되지만 항목 열은 포함되지 않습니다.
- 기본
- 원본(패키지)이 제한된 경우:
- CQL은 어떤 목록에서도 제한된 원본의 항목 또는 열 결과를 반환하지 않습니다.
- CDB는 원본 내의 모든 항목 정의, 항목 그룹 정의 및 폼 정의를 제한됨으로 표시합니다.
- 모든 데이터 행은 제한됨으로 표시됩니다.
- 기본 @HDR 열은 코어 목록에 계속 표시됩니다.
ZIP 패키지
매니페스트 파일과 CSV 생성이 완료되면 파일을 함께 압축합니다. 해당 파일을 압축하기 전에 폴더에 넣지 마십시오. 이 ZIP 폴더의 이름을 원하는 대로 지정할 수 있습니다. 그러나 "Study-Name_Source_datetime.zip"과 같이 고유 식별자를 사용하여 이름을 지정하는 것이 좋습니다. ZIP 폴더에 폴더를 포함하지 마십시오. 모든 CSV 파일과 매니페스트 파일은 동일한 레벨에 있어야 합니다.
Vault의 FTP 서버 액세스
도메인의 각 Vault에는 자체 FTP 스테이징 서버가 있습니다. FTP 서버는 Vault에 업로드하거나 Vault에서 추출하는 파일을 위한 임시 저장 영역입니다.
서버 URL
각 스테이징 서버의 URL은 해당 Vault와 동일합니다(예: veepharm.veevavault.com).
FTP 서버에 액세스하는 방법
자주 사용하는 FTP 클라이언트 또는 명령줄을 통해 스테이징 서버에 액세스할 수 있습니다.
FTP 클라이언트에서 다음 설정 사용:
- 프로토콜(Protocol): FTP(파일 전송 프로토콜)
- 암호화(Encryption): 명시적 FTPS(FTP over TLS)가 필요합니다. 이는 보안 요구 사항입니다. 네트워크 인프라는 FTPS 트래픽을 지원해야 합니다.
- 포트(Port): 일반적으로 추가할 필요가 없으며 기본적으로 포트 21로 설정됩니다.
- 호스트(Host): {DNS}.veevavault.com. 예를 들면 "veepharm"은 veepharm.veevavault.com의 DNS입니다.
- 사용자(User): {DNS}.veevavault.com+{USERNAME}. 로그인할 때 사용하는 것과 동일한 사용자 이름을 사용합니다. 예: veepharm.veevavault.com+tchung@veepharm.com.
- 암호(Password): 이 Vault의 로그인 암호. 표준 로그인에 사용된 것과 동일한 암호입니다.
- 로그인 유형(Login Type): 기본
- 전송 파일 유형(Transfer File Type): 이진으로 파일 전송
대용량 파일을 업로드하는 데 문제가 있는 경우 FTP 클라이언트 시간 초과 설정을 180초로 늘립니다.
프록시 또는 방화벽에서 원격 검증을 활성화한 경우 네트워크의 컴퓨터에서 Veeva FTP 서버로의 FTP 트래픽이 거부될 수 있습니다. 가능한 경우 IT 부서와 협력하여 원격 확인을 사용하지 않도록 설정하십시오. 비활성화할 수 없는 경우 Veeva 지원에 문의하십시오.
FTP 디렉터리 구조
사용자 디렉터리 내부에는 "workbench" 디렉터리가 있습니다. 여기에서 타사 데이터를 업로드할 수 있습니다. CDB는 여기에 넣은 모든 파일을 자동으로 인식합니다.
CDB는 가져온 파일을 "workbench/_processed"로 이동합니다. 세부 사항은 아래에서 참조하십시오.
데이터 가져오기
데이터를 가져오려면 선택한 FTP 클라이언트를 사용하여 ZIP 파일을 FTP 스테이징 서버의 "워크벤치" 디렉터리에 업로드합니다. ZIP을 FTP 스테이징 서버에 업로드하면 CDB에서 ZIP을 가져와서 데이터를 변환합니다.
가져오기가 완료되면 워크벤치에서 사용자와 원본을 구독한 다른 모든 사용자에게 이메일 알림을 보냅니다. 패키지를 재처리하여 이전 로드가 변경되는 경우 워크벤치는 사용자와 해당 원본을 구독한 사용자에게도 알림을 보냅니다.
가져오기 완료
가져오기가 완료되면 다음 작업이 수행됩니다.
- CDB는 모든 정의 레코드와 해당 레코드 간의 관계를 생성합니다.
- CDB는 가져온 모든 레코드의 매니페스트에 제공된 값으로 원본 필드를 자동으로 설정하여 데이터 원본을 고유하게 식별합니다. (Vault EDC에서 가져온 모든 폼에서는 이 값이 자동으로 "EDC"로 설정됩니다.)
- CDB는 가져오기 패키지의 각 고유 폼에 대한 코어 목록을 생성합니다. 세부 사항은 아래에서 참조하십시오.
- CDB는 가져오기 ZIP 파일을 "워크벤치"에서 "workbench/_processed/{study}/{source}"로 이동합니다(가져오기에 실패한 경우 ZIP 파일은 "워크벤치" 디렉터리의 루트에 남아 있음). 또한 CDB는 파일 이름에 가져온 날짜와 시간을 추가합니다.
이제 워크벤치에서 목록을 볼 수 있습니다. 현재 릴리스에서는 워크벤치에 새 목록이 즉시 표시되지 않습니다. 먼저 스터디의 목록(Listings) 페이지로 이동하여 다른 코어 목록을 클릭해서 연 다음, 목록(Listings) 페이지로 돌아갑니다. 그러면 새 데이터 목록이 목록에 표시됩니다. 이제 목록 중 하나의 이름(Name)을 클릭하여 열 수 있습니다.
가져오기 실패
가져오기 실패 시:
- CDB는 가져오기를 시도한 날짜와 시간을 ZIP 파일의 파일 이름에 추가하지만 ZIP 파일을 "workbench" 디렉터리의 루트에 유지합니다.
- CDB는 오류 로그("<import datetime>_<package name>_errors.csv")를 생성합니다.
가능한 오류 목록과 해결 방법을 참조하십시오.
오류 제한: 가져오기 로그는 최대 10,000개의 오류 및 경고만 캡처하며, 이 임계값을 충족하면 기록이 중지됩니다.
변경 사항이 있는 가져오기 검토 및 승인&
CDB로 가져오는 데이터가 승인된 형식 및 구조에서 변경되지 않도록 하기 위해 CDB는 각 타사 원본에 대해 로드마다 패키지 구성의 변경 사항을 감지합니다.
시스템이 패키지, 파일 또는 눈가림 레벨에서 구성 변경 사항이나 CSV 파일 구조의 변경 사항을 감지하면 CDB는 가져오기 프로세스를 일시 중지합니다. 패키지는 처리되지 않으며 승인 권한이 있는 사용자가 패키지를 승인하거나 거부할 때까지 일시 중지됨 상태로 전환됩니다. 사용자가 패키지를 승인하면 CDB는 승인 이유를 기록하고 데이터 패키지를 가져옵니다. 패키지가 승인되면 CDB는 이메일을 통해 승인된 변경 사항을 구독자에게 알립니다. CDB는 모든 관련 목록 및 보기에 변경 표시기를 표시합니다. 사용자는 이 표시기를 해제하고 모든 목록 또는 보기에 대한 폼 변경 로그를 다운로드할 수 있습니다. 사용자가 패키지를 거부하는 경우 CDB는 거부 이유를 기록하고 패키지를 거부됨으로 표시한 후 가져오지 않음 상태를 할당합니다. 그런 다음, CDB는 원본에 대해 마지막으로 가져온 데이터 패키지로 되돌립니다.
패키지가 일시 중지됨 상태이면 동일한 원본에 대해 업로드된 다른 모든 패키지가 대기열에 들어가고 일시 중지된 패키지가 승인되거나 거부될 때까지 대기합니다. 일시 중지된 패키지가 승인되거나 거부되면 CDB는 처리를 위해 마지막으로 대기 중인 패키지로 건너뜁니다. 마지막으로 일시 중지된 패키지와 대기열의 마지막 패키지 사이에 있는 모든 패키지는 처리되지 않습니다. 예를 들어 "패키지 1"이 업로드되고 일시 중지된 후 "패키지 1"이 여전히 일시 중지됨 상태일 때 패키지 2~5가 업로드된 경우 "패키지 1"이 승인되거나 거부되면 CDB는 "패키지 5"로 건너뛰고 패키지 2~4는 처리되지 않은 상태로 둡니다.
새 원본에 업로드된 첫 번째 패키지의 경우 CDB는 자동으로 일시 중지됨 상태를 적용하며 사용자는 해당 원본의 데이터가 시스템에 표시되기 전에 첫 번째 패키지를 승인하거나 거부해야 합니다.
승인이 필요한 패키지의 경우 이제 워크벤치에 차이점(Differences) 및 연결된 개체(Associated Objects) 탭이 있는 패키지 세부 사항(Package Detail) 패널이 포함됩니다. 차이점(Differences) 탭에는 현재 패키지와 이전 패키지 간의 매니페스트 변경 사항이 표시됩니다. 사용자는 승인하는 변경 사항의 이전 및 현재 값을 검토할 수 있습니다. 연결된 개체(Associated Objects) 탭에는 패키지의 변경 사항이 잠재적으로 영향을 미칠 수 있는 내보내기 정의, 목록 및 보기가 표시됩니다.
가져오기 패키지를 승인하거나 거부하려면 가져오기 승인 권한이 필요하며, 이 권한은 기본적으로 표준 CDMS Super User(CDMS 슈퍼 사용자) 및 CDMS Lead Data Manager(CDMS 책임 데이터 매니저) 스터디 역할에 할당됩니다.
가져오기 승인
가져오기를 승인하는 방법은 다음과 같습니다.
- 스터디의 가져오기(Import) > 패키지(Packages)로 이동합니다.
- 승인 보류 중(Pending Approvals)을 기준으로 가져오기 패키지 목록을 필터링합니다.
-
패키지(Package) 메뉴()에서 패키지 세부 사항 보기(View Package Details)를 선택합니다.
- 패키지 세부 사항(Package Details) 패널에서 차이점(Differences)을 클릭하여 변경 사항을 표시합니다.
- 변경 사항을 검토합니다.
- 패키지 승인(Approve Package)을 클릭합니다.
- 선택 사항: 이유(Reason)를 입력합니다.
- 승인을 클릭합니다.
패키지가 승인되고 이제 처리를 위해 대기열에 들어갑니다.
가져오기 거부
가져오기를 거부하는 방법은 다음과 같습니다.
- 스터디의 가져오기(Import) > 패키지(Packages)로 이동합니다.
- 승인 보류 중(Pending Approvals)을 기준으로 가져오기 패키지 목록을 필터링합니다.
-
패키지(Package) 메뉴()에서 패키지 세부 사항 보기(View Package Details)를 선택합니다.
- 패키지 세부 사항(Package Details) 패널에서 차이점(Differences)을 클릭하여 변경 사항을 표시합니다.
- 변경 사항을 검토합니다.
- 패키지 거부(Reject Package)를 클릭합니다.
- 선택 사항: 이유(Reason)를 입력합니다.
- 거부를 클릭합니다.
- 패키지 거부(Reject Package) 확인 대화 상자에서 확인(Confirm)을 클릭합니다.
연결된 개체 검토
패키지 세부 사항(Package Details) 패널의 연결된 개체(Associated Objects) 탭에서 가져오기 패키지의 연결된 개체를 검토할 수 있습니다. 이 탭에는 패키지의 변경 사항이 잠재적으로 영향을 미칠 수 있는 내보내기 정의, 목록 및 보기가 나열됩니다.
이 탭에 액세스하려면 패키지 세부 사항(Package Details) 패널을 열고 연결된 개체(Associated Objects) 탭을 클릭하여 엽니다.
워크벤치는 변경된 각 폼의 폼 필에 변경 아이콘(주황색 원) 배지를 표시합니다.
매니페스트 파일의 "form" 특성에 매핑된 파일의 경우 연결된 개체(Associated Objects) 탭에는 가져온 파일에서 잠재적으로 영향을 받을 수 있는 개체가 표시되지 않습니다.
가져오기 상태 보기
가져오기(Import) > 패키지(Packages)에서 가져오기 패키지 상태를 확인할 수 있습니다. 이 페이지에는 Vault EDC 및 타사 툴의 모든 가져오기 패키지 상태가 나열되어 있습니다. 이 페이지에서 가져오기 패키지 및 문제 로그(오류 및 경고)를 다운로드할 수도 있습니다.
완료 상태: 가져오기 패키지가 가져오기 완료 상태로 이동하려면 스터디의 워크벤치 사용자가 목록을 열어야 합니다. 그렇지 않으면 가져오기가 진행 중 상태로 유지됩니다. 스터디에 자동 전환 기능이 활성화되어 있으면 이 작업이 필요하지 않습니다.
제한된 데이터 액세스 권한이 없는 사용자는 가져오기 패키지 로그를 다운로드할 수 있지만 데이터 파일은 다운로드할 수 없습니다. 제한된 데이터 액세스 권한이 있는 사용자는 눈가림된 데이터가 포함된 패키지를 다운로드할 수 있습니다.
패키지를 워크벤치로 가져올 때마다 워크벤치는 다른 모든 원본에 대해 가장 최근 패키지를 자동으로 재처리합니다. 예를 들어 야간 워크벤치 내보내기 EDC 작업이 실행된 후 워크벤치로 가져오면 워크벤치는 가장 최근 실험실 데이터 및 이미징 패키지도 재처리합니다. 동일한 원본의 이전 패키지에 대해 워크벤치는 해당 패키지를 최신 패키지로 교체됨으로 표시합니다.
가져오기 상태 필터를 사용하여 완료되거나 실패한 가져오기만 표시하도록 목록을 쉽게 필터링할 수 있습니다. 오류(Error)를 클릭하여 실패한 가져오기만 표시하거나 완료(Complete)를 클릭하여 완료된 가져오기를 표시합니다.
워크벤치 가져오기 상태
가져오기 패키지가 경고가 포함된 상태로만 가져올 수 있는 경우 워크벤치는 상태를 주황색으로 강조 표시하여 경고가 있음을 나타냅니다. 가져오기가 완료되면 문제 로그를 다운로드하여 경고를 검토할 수 있습니다.
상태(Status) | 선택 |
---|---|
대기열에 포함 | 패키지가 처리 대기열에 있습니다. 이 패키지 앞에는 변경 사항도 포함된 패키지가 있으며, 이 패키지는 일시 중지된 패키지가 승인되거나 거부되기를 기다리고 있습니다. |
일시 중지됨 | CDB가 매니페스트에서 변경 사항을 감지했으므로 사용자가 패키지를 승인하거나 거부할 때까지 가져오기가 일시 중지됩니다. |
승인됨 | 매니페스트의 변경 사항이 승인되었습니다. 이제 CDB가 패키지를 가져옵니다. |
거부됨(Rejected) | 매니페스트의 변경 사항이 거부되었습니다. |
건너뜀(Skipped) | 패키지를 건너뛰었고 가져오지 않았습니다. 이 패키지가 처리되기 전에 원본에 대해 다른 패키지를 가져왔습니다. 이 상태는 타사 패키지에만 적용될 수 있습니다. |
진행 중 | 이 패키지에 대한 가져오기 프로세스가 시작되었으며 워크벤치에서 오류나 경고를 식별하지 못했습니다. |
진행 중(경고 포함)(In Progress (with warnings)) | 가져오기 프로세스가 진행 중이지만 워크벤치에서 경고를 확인했습니다. |
오류(Error) | 가져오기 패키지에 하나 이상의 오류가 있어 가져오기에 실패했습니다. 문제 로그를 다운로드하여 오류를 검토하십시오. |
완료(Complete) | 워크벤치에서 오류나 경고 없이 패키지를 성공적으로 가져왔습니다. |
완료(경고 포함)(Complete (with warnings)) | 워크벤치에서 패키지를 성공적으로 가져왔지만 하나 이상의 경고가 있습니다. 문제 로그를 다운로드하여 경고를 검토하십시오. |
가져오지 않음 | 처리가 시작되기 전에 동일한 원본에 대한 최신 패키지가 업로드되었기 때문에 워크벤치에서 이 패키지를 건너뛰었습니다. 패키지가 가져오지 않음 상태가 되면 워크벤치는 처리 날짜도 "교체됨"으로 바꿉니다. |
재처리 진행 중 | 다른 원본에서 새 패키지를 가져왔기 때문에 워크벤치에서 이 패키지를 재처리하기 시작했습니다. |
재처리 완료 | 워크벤치에서 오류나 경고 없이 이 패키지 재처리를 완료했습니다. |
재처리 완료(경고 포함) | 워크벤치에서 이 패키지 재처리를 완료했지만 하나 이상의 경고가 있습니다. 문제 로그를 다운로드하여 경고를 검토하십시오. |
재처리 오류 | 가져오기 패키지에 하나 이상의 오류가 있어 재처리에 실패했습니다. 문제 로그를 다운로드하여 오류를 검토하십시오. |
가져오기 패키지 다운로드
가져오기 패키지를 다운로드하는 방법은 다음과 같습니다.
로그 다운로드
가져오기에 대한 가져오기 로그(CSV)와 실패한 가져오기에 대한 문제 로그(CSV)를 다운로드할 수 있습니다. 가져오기 로그에는 가져오기 작업 및 워크벤치로의 데이터 수집에 대한 세부 정보가 나열됩니다.
가져오기 로그에는 다음이 나열됩니다.
- 변환 시작 시간
- 변환 완료 시간
- 변환 기간
- 가져오기 시작 시간
- 가져오기 완료 시간
- 가져오기 기간
가져오기 로그를 다운로드하는 방법은 다음과 같습니다.
- 가져오기 > 패키지로 이동합니다.
- 리스팅에서 가져오기 패키지를 찾습니다.
- 패키지() 메뉴에서 패키지 세부 사항 보기(View Package Details)를 선택합니다.
- 패키지 세부 사항 패널에서 문제(Issues)를 클릭합니다.
- 선택 사항: 문제(Issues) 탭에서 다운로드(Download)()를 클릭하여 문제 로그의 CSV를 다운로드합니다.
문제 로그
문제 로그에는 패키지를 가져오는 동안 워크벤치에서 발생한 모든 오류 및 경고가 나열됩니다. 여기에서 가능한 오류 및 경고 목록을 참조하십시오.
문제 로그를 보는 방법은 다음과 같습니다.
- 가져오기 > 패키지로 이동합니다.
- 리스팅에서 가져오기 패키지를 찾습니다.
- 패키지() 메뉴에서 패키지 세부 사항 보기(View Package Details)를 선택합니다.
- 패키지 세부 사항 패널에서 문제(Issues)를 클릭합니다.
- 선택 사항: 문제 로그(Issue Log) 패널에서 다운로드()를 클릭하여 로그의 CSV를 다운로드합니다.
애플리케이션에서 먼저 문제 로그를 보지 않고 다운로드하는 방법은 다음과 같습니다.
- 가져오기 > 패키지로 이동합니다.
- 리스팅에서 가져오기 패키지를 찾습니다.
- 패키지() 메뉴에서 문제 로그 다운로드(Download Issue Log)를 선택합니다.
가져온 데이터 보기
업로드 시 워크벤치는 가져오기 패키지의 각 고유 파일에 대한 폼을 생성합니다. 워크벤치는 폼을 Vault EDC에서 가져오거나 타사 시스템에서 가져오는지에 관계없이 스터디의 각 고유 폼에 대한 코어 목록을 자동으로 생성합니다.
해당 코어 목록의 기본 CQL 쿼리는 다음과 같습니다.
SELECT @HDR, * from source.filename
위에 나온 실험실 가져오기 예시에서 CDB는 다음 쿼리를 사용하여 화학 및 혈액학(각 CSV 파일당 하나씩)이라는 두 개의 코어 목록을 생성합니다.
화학 |
|
혈액학 |
|
정의
CDB는 각 CSV 파일에 대한 폼 정의를 생성하여 가져온 데이터를 CDB 워크벤치 애플리케이션 내에서 "폼"으로 정의합니다. 해당 레코드는 CSV 파일 이름(확장자 없음)을 이름으로 사용합니다(예: "hematology"). 또한 CDB는 항목 그룹 정의를 생성하여 폼 내에서 데이터 항목을 함께 그룹화합니다. CDB는 CSV 파일 이름(확장자 없음) 앞에 "ig_"를 추가하여 이름을 지정합니다(예: "ig_hematology").
이 두 가지 정의는 모두 목록 내의 열(form_name
및 ig_name
)로 표시됩니다. 목록의 CQL 쿼리를 편집하여 해당 열을 숨길 수 있습니다.