데이터의 조작과 같은 데이터 완전성(DI) 이슈는 최근들어 더욱 크게 다뤄지고 있지만, 새로운 개념은 아닙니다.
FDA에 의한 데이터 완전성(DI) 관련 주요 지적 사항은 다음과 같습니다.(ref. Pharmaceutical Engineering, ISPE)
- 기록 누락, 완벽하지 않은 기록
- 부적절한 시스템 접근관리(e.g. ID 공유)
- 크로마토그래피 검체와 데이터의 부적절한 처리
* 적절한 절차없이 재적분, 수동적분
- 원본 기록 삭제 및 폐기
- 감사 추적(audit trail)
데이터 완전성(DI)을 이해하기 위해서는 데이터의 범위를 정의해야 하는데, 데이터는 raw data, audit trail, meta data를 포함합니다.
- raw data
* 특정 분석기기 등에 의해 생성된 데이터, 기초 데이터
- audit trail
* 전자 시스템에서의 자동 추적만을 의미하는 것은 아니며, 수동 또는 자동 추적 모두에게 적용할 수 있습니다.
* 소프트웨어에 특정 audit trail 기능이 있고, 이를 통해 누가, 언제, 어디서, 무엇을, 왜 변경했는지 정보를 수집할 수 있다면 audit trail 요구 조건에 부합됩니다.
* 모든 데이터 생성의 검토 과정에 이를 적용함으로써 수동 audit trail 또한 확보할 수 있습니다.
- meta data
* 일반적으로 다른 데이터에 대한 정보를 제공하고 설명하는 데이터의 집합, 일정한 규칙에 의거하여 컨텐츠에 부여해주는 데이터, '어떤 목적을 가지고 만들어진 데이터, Karen Coyle'
예를 들어 분석 장비에서 raw data가 생성되고, '특정 목적으로 활용가능한 결과'로 분석될 수 있게 처리됩니다. 여기서 DI 요구사항은 처리된 데이터(meta data)에서 raw data를 추적할 수 있어야 하는 것입니다. audit trail은 데이터가 다뤄지는 모든 과정에서, 특정 작업을 했다면 추적할 수 있어야 합니다.
데이터 완전성(DI)은 데이터의 신뢰성을 의미합니다. 신뢰성은 데이터의 정확성, 추적성 등이 확보되어야 한다는 개념이며, 보통 ALCOA+로 알려져 있습니다.
- Attributable (추적성)
- Legible (가독성)
- Contemporaneous (동시성)
- Original (원본성)
- Accurate (정확성)
- +: complete (완벽성)
- +: consistent (일관성)
- +: enduring (내구성)
Back up의 요구사항, 주기 및 데이터 보존 기간은 아래와 같습니다.
- 요구사항
* 원본 문서와 동일해야 합니다. 전자문서로의 변환 시 완벽하게 변환되었다는 것을 보증하는 절차와 검증 기록이 있어야 합니다.
* 백업파일이 손상되지 않게 보호해야 합니다.
* 백업파일이 조작되지 않게 해야 합니다. (실시간 연동 네트워크 등)
* 복원할 경우 데이터가 동일해야 합니다.
- 주기: 누가 백업을 수행했고, 어떤 시스템이 백업되었는지, 무슨 데이터 파일이 백업되었으며, 언제 시작하고 완료 되었는지, 백업 방법은 무엇인지 투명하게 기록해야 합니다.
* 매달 실시해야 합니다.
* 생성되는 데이터의 양에 따라 시스템 소유자는 데이터 손실 위험성을 QA에 전달하고, QA는 백업 주기를 1개월 이하로 줄일지 결정해야 합니다.
* 백업 기간을 연장하면 안되지만, 마지막 백업 이후 데이터 환경이 동일하고 추가적인 데이터의 생성이 없다는 것이 명백하다면 생략할 수 있습니다. 단, 절차가 있어야 하고 QA의 승인을 받아야 합니다.
- 보존기간
* 백업된 전자데이터는 백업된 데이터 손실에 대한 비상계획을 포함하여 최소 30년간 보존되어야 합니다. 데이터를 포함한 종이 문서는 최소 10년간 보존되어야 하고, 이후 이를 전자 문서로 변환하여 원본으로 20년간 보존해야 합니다.
DI의 위반(기록의 조작)은 그 업체의 CoA (제조원 성적서) 를 믿지 못하게 합니다. 컴퓨터 시스템을 사용하는 한 강화될 수 밖에 없는 분야라고 생각합니다.
감사합니다!