컨텐츠로 건너뛰기
뉴스
서울
맑음 / -3.9 °
머니투데이 언론사 이미지

사생활 지키는 비식별조치, 안전성 vs. 활용성 해답은…

머니투데이 정영일 기자
원문보기
[[the300][런치리포트-비식별 조치, 빅데이터 시대 방아쇠]②]


빅데이터(Big Data)는 흔히 '21세기의 원유'로 불린다. 20세기의 원유가 그랬던 것처럼 방대하고 다양한 규모의 데이터가 미래산업의 경쟁력을 좌우하는 중요한 자원이 될 것이라는 점에서다. 정치 경제 사회 문화 과학기술 등 거의 모든 영역에서 인류에게 가치있는 정보를 제공해줄 것이라는 기대도 받고 있다.

빅데이터가 풀고 가야할 가장 큰 문제는 사생활 침해 논란이다. 개인정보를 이용해 빅데이터를 만드는 과정에서 특정 개인의 내밀한 정보가 공개될 수 있다는 것이다. 이 때문에 특정 개인을 알아볼 수 없도록 이름을 지우거나 다른 변수로 대체하는 이른바 '비식별화 조치'를 통해 가공하는 과정을 거치게 된다.

정부가 지난 6월 내놓은 개인정보 비식별 조치 가이드라인에 따르면 비식별화 기술은 크게 △가명처리 △총계처리 △데이터삭제 △데이터범주화 △데이터 마스킹 등의 범주로 나눠진다. 이름이나 주민번호, 나이, 주소, 우편번호, 소속, 휴대전화 번호 등이 주요 비식별조치의 대상이 된다.

가명처리는 개인을 알아볼 수 있는 정보(식별자)를 다른 정보로 채워넣는 것을 말한다. 총계처리는 데이터의 총합이나 평균 등으로 개인의 실제정보를 숨기는 기술이다. 데이터삭제와 범주화, 마스킹은 정보 소유자가 누구인지 특정이 되지 않도록 주요 정보를 삭제, 대체하는 방법이다.(시각물 참조)

문제는 개인 정보를 어느 정도까지 비식별화 조치를 하느냐다. 완벽하게 개인과 연결되지 않은 데이터는 사생활 보호에는 유용하지만 산업적 가치가 떨어지는 단점이 있다. 빅데이터 정보를 만들거나 활용하는 업체들은 끊임없이 정보의 안전성과 활용성 사이에서 고민할 수 밖에 없는 상황이다.


비식별화 조치를 마친 데이터라고 해도 다른 자료와 결합해 재식별화될 가능성도 존재한다. 현행 개인정보보호법상에는 다른 정보와 쉽게 결합해 식별이 가능하게 될 경우도 개인정보로 인정한다. 비식별화기술의 적용 만으로 개인정보보호법 위반이 아니라고 단정할 수 없는 이유다.

재식별화가 실제 발생한 1997년 미국 매사추세츠 주 사례가 대표적이다. 매사추세츠주는 연구 목적으로 비식별화된 공무원 병원 진료기록을 공개했다. 하지만 케임브리지시 선거인명부와 비교 분석을 통해 주지사 등의 개인정보가 재식별화되는 사고가 발생한 바 있다.

기술별로 보면 가명처리 기술의 경우 다른 정보와의 결합을 통해 재식별화될 가능성이 비교적 높은 반면 총계처리나 데이터 삭제와 범주화, 마스킹 기술은 상대적으로 위험이 낮은 것으로 알려졌다. 이에 따라 비식별화시 한 기술만 이용할 경우 재식별화 위험이 있는만큼 여러 비식별화 기술을 조합해 사용할 것을 전문가들은 권고하고 있다.

정영일 기자 bawu@mt.co.kr

<저작권자 ⓒ '돈이 보이는 리얼타임 뉴스' 머니투데이, 무단전재 및 재배포 금지>

info icon이 기사의 카테고리는 언론사의 분류를 따릅니다.

AI 이슈 트렌드

실시간
  1. 1안세영 말레이시아 오픈 3연패
    안세영 말레이시아 오픈 3연패
  2. 2비예나 트리플크라운
    비예나 트리플크라운
  3. 3민주당 원내대표 선거
    민주당 원내대표 선거
  4. 4지성 판사 이한영
    지성 판사 이한영
  5. 5안양 임완섭 권우경
    안양 임완섭 권우경

머니투데이 하이라이트

파워링크

광고
링크등록

당신만의 뉴스 Pick

쇼핑 핫아이템

AD