가명화될 데이터 필드의 선택은 부분적으로 주관적이다. 생년월일 또는 우편 번호와 같은 덜 선택적 필드는 일반적으로 다른 소스에서 사용할 수 있으므로 레코드를 쉽게 식별 할 수 있기 때문에 종종 포함됩니다. 이러한 식별이 적은 필드를 가명하면 대부분의 분석 값이 제거되므로 일반적으로 출생 연도 또는 더 큰 우편 번호 지역과 같은 새로운 파생 및 덜 식별 형식이 도입됩니다.
출석 날짜와 같이 식별이 적은 데이터 필드는 일반적으로 가명으로 지정되지 않습니다. 데이터를 식별 할 수 없기 때문에가 아니라 너무 많은 통계 유틸리티가 손실되기 때문입니다. 예를 들어,몇 가지 참석 날짜에 대한 사전 지식이 주어지면 해당 날짜 패턴을 가진 사람 만 선택하여 가명 데이터 집합에서 다른 사람의 데이터를 쉽게 식별 할 수 있습니다. 이것은 추론 공격의 예입니다.
추론적 공격에 대한 사전 데이터 가명화의 약점은 일반적으로 간과되고 있다. 유명한 예는 검색 데이터 스캔들입니다. 데이터 컨트롤러의 통제하에 있는 별도로 보관된”추가 정보”에 대한 액세스가 필요하지 않았습니다. 아래의 가명 화에 대한 새로운 정의를 참조하십시오.
통계적으로 유용한 가명 데이터를 재확인으로부터 보호하려면 다음이 필요합니다:
- 건전한 정보 보안 기반
- 분석가,연구자 또는 기타 데이터 근로자가 개인 정보 침해를 일으킬 위험을 통제
가명은 데이터의 출처까지 추적 할 수 있으며,이는 가명화와 익명화를 구별하며,역 추적을 허용 할 수있는 모든 개인 관련 데이터가 제거되었습니다. 가명화는 예를 들어,임상 센터 간에 안전하게 전달되어야 하는 환자 관련 데이터의 문제입니다.
전자 건강에 대한 가명 화의 적용은 환자의 개인 정보 보호 및 데이터 기밀성을 보존하고자합니다. 그것은 연구자에 의해 보조 사용을 보존 공인 의료 서비스 제공자 및 개인 정보 보호에 의해 의료 기록의 기본 사용을 할 수 있습니다. 미국 내에서는 의료 데이터를 어떻게 처리해야 하는지에 대한 가이드라인을 제공하고 있으며,데이터 식별 해제 또는 가명화는 의료 데이터 준수를 단순화하는 한 가지 방법입니다. 그러나 개인 정보 보호 보존에 대한 일반 가명은 유전자 데이터가 관련 될 때 종종 한계에 도달합니다(유전 적 개인 정보 보호 참조). 유전자 데이터의 식별 특성으로 인해,비 개인화는 종종 해당 사람을 숨기기에 충분하지 않습니다. 잠재적 인 솔루션은 가명화와 조각화 및 암호화의 조합입니다.
가명화 절차의 적용의 예는 식별 단어를 동일한 범주의 단어로 대체(예:이름 사전의 임의의 이름으로 이름 바꾸기)하여 식별 해제 연구를 위한 데이터 세트를 만드는 것이지만,이 경우 일반적으로 데이터를 그 원점으로 다시 추적 할 수 없습니다.
가명화에 대한 새로운 정의
2018 년 5 월 25 일부터 유럽연합 일반 데이터 보호 규정은 제 4 조(5)의 유럽연합 수준에서 처음으로 가명화를 정의합니다. 제 4 조(5)의 정의 요구 사항에 따라 데이터는 별도로 보관 된”추가 정보”를 사용하지 않고 특정 데이터 주체에 귀속 될 수없는 경우 가명으로 처리됩니다.”가명 데이터는 직접 및 간접 식별자(직접뿐만 아니라)의 보호가 필요하기 때문에 설계 및 기본적으로 데이터 보호 분야에서 최첨단 기술을 구현합니다. 개인 데이터는 컨트롤러에 의해 별도로 보관되는”추가 정보”에 대한 액세스없이”모자이크 효과”를 통해 상호 참조 할 수(또는 재 식별)되지 않도록 설계 및 가명에 구현 된 기본 원칙에 의해 개인 데이터 보호 직접 및 간접 식별자 모두의 보호를 필요로한다. 별도로 보관 된”추가 정보”에 대한 액세스는 재 식별을 위해 필요하기 때문에 특정 데이터 주체에 대한 데이터의 귀속은 컨트롤러에 의해 합법적 인 목적 만 지원하도록 제한 될 수 있습니다.
제 25 조(1)는 가명을”적절한 기술적 및 조직적 조치”로 규정하고,제 25 조(2)는 컨트롤러에게 다음을 요구한다:
“…기본적으로 각 특정 처리 목적에 필요한 개인 데이터만 처리되도록 하기 위한 적절한 기술적 및 조직적 조치를 이행한다. 이러한 의무는 수집된 개인 데이터의 양,처리 범위,보관 기간 및 접근성에 적용됩니다. 특히,이러한 조치는 기본적으로 개인 데이터가 무기한 자연인에 대한 개인의 개입 없이는 접근 할 수 없도록해야한다.”
데이터 보호 제 25 조에 따라 설계 및 기본적으로 데이터 보호의 핵심 핵심은 적절한 사용을 지원하는 기술 통제와 실제로 약속을 지킬 수 있음을 입증하는 능력을 집행하는 것입니다. 디자인 및 기본적으로 데이터 보호를 시행 가명 같은 기술은 데이터에서 가치를 도출 할 수있는 새로운 방법을 마련뿐만 아니라,조직은 데이터 개인 정보를 보호하기 위해 동등하게 혁신적인 기술적 접근 방식을 추구하고 있음을 개별 데이터 주체를 보여—특히 민감하고 시사 문제는 전 세계의 데이터 보안 침해의 전염병 주어진.
“신뢰 경제”,생명 과학 연구,개인화 된 의학/교육,사물 인터넷,재화와 서비스의 개인화 등 활기차고 성장하는 경제 활동 영역은 자신의 데이터가 사적이며 보호되며 자신과 사회에 최대한의 가치를 제공하는 적절한 목적으로만 사용된다고 신뢰하는 개인을 기반으로합니다. 이 신뢰는 데이터 보호에 대한 오래된 접근 방식을 사용하여 유지 관리 할 수 없습니다. 가명화는 데이터 보호를 설계 및 기본적으로 달성하여 신뢰를 얻고 유지하며 기업,연구원,의료 서비스 제공자 및 데이터의 무결성에 의존하는 모든 사람에게 보다 효과적으로 서비스를 제공하는 데 도움이 되는 수단입니다.
개인정보보호 규정을 준수하는 가명화는 오늘날의”빅데이터”데이터 공유 및 결합 세계에서 개인정보 보호를 존중하는 데이터를 더 많이 사용할 수 있을 뿐만 아니라,데이터 컨트롤러와 프로세서가 올바르게 가명화된 데이터에 대한 명시적 혜택을 누릴 수 있도록 합니다.제대로 가명 데이터의 장점은 다음과 같은 여러 개인 정보 보호 문서에서 강조 표시됩니다:
- 제 6 조(4)새로운 데이터 처리의 호환성을 보장하기 위해 보호로서.
- 제 25 조 설계 및 기본 의무에 의한 데이터 최소화 원칙과 데이터 보호 준수를 적용하는 데 도움이되는 기술 및 조직적 조치.
- 제 32 조,제 33 조 및 제 34 조는 데이터 침해를”자연인의 권리와 자유에 위험을 초래할 가능성”이 없도록 함으로써 데이터 침해에 대한 책임과 통지 의무를 줄이는 데 도움이 되는 보안 조치로서.
- 제 89 조 제 1 항 공익을 위한 보관 목적을 위한 처리와 관련된 보호조치로서,과학적 또는 역사적 연구 목적,또는 통계적 목적,더욱이,제 89 조제 1 항에 따른 가명의 이점은 또한 다음의 경우에 더 큰 유연성을 제공한다.
- ;
- 제 5 조(1)마.저장 제한에 관한 사항 및
- 제 9 조(2)제이.
- 또한,적절하게 가명 된 데이터는 제 29 조 작업당 의견 06/2014 에서”데이터 주체에 대한 처리의 잠재적 영향 평가에 관한 역할”으로 인식됩니다…제 6 조(1)(에프)의 법적 근거로 적법한 이익 처리를 지원하기 위해”컨트롤러에 유리한 균형 팁”. 제 17 조(1)(다)에 따라,데이터 컨트롤러가 이자 균형 테스트를 만족시키기 위한 기술적 및 조직적 조치에 의해 뒷받침되는”처리에 대한 합법적인 근거를 무시했다”는 것을 보여준다면,그들은 잊혀 질 수 있는 요청에 대한 권리를 더 유연하게 준수할 수 있다.
- 제 18 조 제 1 항 라호에 따라,데이터 컨트롤러는 데이터 주체의 권리가 보호되기 때문에 데이터 컨트롤러의 권리가 데이터 주체의 권리보다 적절하게 우선하도록 기술적 및 조직적 조치가 마련되어 있음을 보여줄 수 있는 경우 개인 데이터의 처리를 제한하는 청구를 유연하게 준수합니다.
- 제 20 조 제 1 항에서,합법적인 이익 처리를 사용하는 데이터 컨트롤러는 동의 기반 처리에만 적용되는 이식성의 권리를 받지 않는다.
- 제 21 조 제 1 항에 따라,정당한 이익 처리를 사용하는 데이터 컨트롤러는 데이터 주체의 권리가 보호되기 때문에 데이터 컨트롤러의 권리가 데이터 주체의 권리보다 적절하게 우선되도록 적절한 기술적 및 조직적 조치를 취할 수 있음을 보여줄 수 있지만,데이터 주체는 항상 제 21 조 제 3 항에 따라 그러한 처리의 결과로 직접 마케팅 홍보를받지 않을 권리가 있습니다.