Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
감기인 줄 알았다. 그런데 병원에 한 번 다녀온 그날 밤, 그의 혈액검사 수치와 진료 기록, 심지어 CT 이미지까지 어느새 ‘데이터’라는 이름으로 떠다니고 있었다. 더 소름 끼치는 건, 그는 아직 이 사실을 모른다는 거다.

만약 내일, 당신이 응급실에 실려 갔다고 치자. 의사가 당신 이름을 묻기도 전에, 화면에는 이미 당신의 과거 병력, 가족력, 복용 약, 건강검진 기록이 쫙 깔려 있다. 그리고 오른쪽 구석엔, 이렇게 쓰여 있다.
“심근경색 위험: 87% (AI 예측)”
이 숫자, 누가 계산했을까? 더 중요한 질문은 이거다. 누가 이 계산을 ‘허락했나?
Content
12월 10일, 보건복지부가 조용히 한 선언을 던졌다. 이름은 점잖다. “AI 시대 의료 혁신을 위한 보건의료데이터 활용 활성화 방안.” 하지만 내용을 뜯어보는 순간, 느낌이 확 달라진다.
내년부터 국립대병원 3곳의 임상데이터가 보건의료 빅데이터 플랫폼에 연계된다. 2028년까지는 77만 명 분량의 ‘국가통합바이오빅데이터’가 구축된다. 건강보험공단, 질병관리청, 국립암센터 같은 곳들이 쥐고 있던 데이터도, 원격 분석이라는 이름으로 연구자와 기업들 손에 들어간다.
여기서 중요한 포인트는 하나다. 이 77만 명, 이 플랫폼 안에 들어가는 사람들. 그게 ‘남 이야기’라고, 정말 확신할 수 있겠냐는 거다.
정부의 설명은 단순하다. “AI 전환 시대, 의료 혁신을 위해 의료 빅데이터는 필수다.” 맞는 말이다. AI 의료는 데이터가 없으면 그냥 허공에 떠 있는 수학 공식에 불과하다. 하지만, 문제는 그 다음이다.
“개인정보 보호를 전제로 안전하게 활용하겠다.”
여기서부터가 진짜 이야기의 시작이다.

당신이 병원에 남긴 건 진료 기록만이 아니다. 혈액, 영상, 생체 신호, 유전자 정보까지, 통틀어 ‘보건의료데이터’라 부른다. 이번 방안은 행정 데이터 수준을 넘어서, 실제 임상데이터, 바이오데이터까지 싹 다 모아 ‘데이터 전주기’ 생태계를 만들겠다는 선언이다.
이걸 모르면, 당신은 한 가지 착각에 빠지게 된다. “의료 빅데이터? 그거 연구자들이나 기업들이 쓰는 거지, 나랑은 상관 없잖아.”
하지만 숫자는 이렇게 말한다. 77만 명. 국립대병원. 건강보험. 이 조합에서, 당신이 빠질 확률은… 생각보다 처참하다.
대부분 사람들은 이렇게 생각한다. “AI 의료 = 나를 더 잘 치료해주는 착한 기술.” 틀린 말은 아니다. 하지만 절반은 버려야 한다.
사실은 이렇다. “AI 의료 = 누군가의 몸과 질병을 끝까지 파고들수록 더 똑똑해지는, 데이터 중독 머신.”
정부의 목표는 분명하다. 데이터 개방 → AI 의료 기술 개발 → 실증 → 현장 적용. 깔끔하다. 의료 혁신, 신약 개발, 맞춤형 치료, 지역 의료 공백 해소. 전부 멋진 단어들이다. 기업들은 환호하고, 스타트업은 투자 프레젠테이션 슬라이드에 ‘보건복지부’, ‘실증’, ‘데이터 개방’ 같은 단어를 박아 넣기 바쁘다.
그런데 여기서부터가 진짜 충격이다.
사람들은 AI 의료를 ‘서비스’로만 본다. “AI가 암을 더 빨리 찾아준다”, “내 건강검진 결과를 분석해준다.” 이런 식이다. 하지만 의료 빅데이터의 본질은 서비스가 아니라 ‘권력’에 가깝다. 누가 데이터를 쥐고 있느냐에 따라, 누가 치료를 더 빨리 받고, 누가 신약 개발의 대상이 되고, 어떤 질병이 ‘먼저’ 연구되는지가 갈린다.
보건의료데이터 플랫폼에 연결되는 국립대병원 3곳의 임상데이터. 이건 단순한 파일 묶음이 아니다. 의료 AI의 뇌를 만드는 재료다. 국가통합바이오빅데이터 77만 명 분량은? 향후 10년, 20년 동안 신약, 진단, 예방의학의 방향을 사실상 ‘프리패스’로 정해버릴 수 있는 힘이다.
대부분의 사람들이 여기서 오해한다.
“어차피 익명화해서 쓰는 거 아닌가요?”
맞다, 익명화한다. 그런데, ‘완벽한 익명화’라는 게 이 세계에 존재한다고 진심으로 믿나?

유전자 정보 + 진료 기록 + 거주 지역 + 나이 + 성별. 이 정도 조합이면, 통계상 한 사람을 다시 특정하는 건 생각보다 어렵지 않다. 그래서 전 세계가 머리 싸매고 있는 키워드가 바로 이거다. “안전한 활용.”
정부도 그걸 안다. 그래서 법·제도적 기반, 보안 체계, 비식별화, 원격 분석, 이런 단어들을 줄줄이 꺼낸다. 하지만, 여기서 놓치면 안 되는 포인트 하나.
‘안전하다’는 말을 누가 정의하느냐에 따라, 게임의 룰이 통째로 바뀐다.
상상해보자. 어느 날, 한 보험사가 ‘우연히’ 손에 넣은 분석 리포트 하나. 제목은 이렇다.
“A지역 30~40대 남성, 향후 5년 내 뇌졸중 위험군 프로파일링 결과”
이 리포트는 어디서 왔을까? 누군가는 “에이, 공공 보건의료데이터는 그런 용도로 못 쓰게 막아놨다”고 말한다. 법적으로는 맞다. 하지만, 법과 현실 사이에는 항상 틈이 있다. 그 틈으로 새어 나가는 게, 언제나 ‘데이터’다.
보건의료데이터가 여러 기관의 플랫폼 위에서, 원격 분석과 연계 서비스를 통해 오가게 되는 순간. 보안 체계는 한 곳만 뚫리면 끝이 아니다. “연결된 모든 곳이 동시에 약해진다”는, 가장 끔찍한 네트워크 효과가 발생한다.
한 번만 더 상상해보자.
– 당신이 과거에 겪었던 우울증 기록이, 어느 순간 HR 시스템 어딘가의 리스크 평가 항목으로 올라온다면?
– 당신 가족의 유전적 질병 소인이, 어딘가에서 보험 언더라이팅 알고리즘의 입력값으로 들어간다면?
– 특정 암 고위험군 리스트가, 의사가 아닌 ‘마케팅 부서’의 손에 쥐어진다면?
“설마 그렇게까지…”라고 생각하는 순간, 이미 늦는다. 데이터는 한 번 새어나가면, 다시 거둘 수 없다. 병원에 한 번 더 가서 “저기요, 제 혈액검사 데이터 돌려주세요”라고 말해도, 돌아오는 건 딱 하나다. “그건 이미 시스템에 저장되어 있습니다.”

정부는 말한다. “우리는 안전하게 쓴다. 법을 만들고, 제도를 정비하고, 보안을 강화하겠다.” 실제로 그렇게 하려고도 할 것이다. 하지만, 역사는 늘 같은 패턴을 보여준다.
1단계: ‘혁신’이라는 이름으로 속도를 올린다.
2단계: 산업계가 환호한다. “규제를 풀어달라”고 외친다.
3단계: 어느 날, 예상 못 한 구멍에서 터진다.
그리고 그때가 되면, 뉴스를 장식하는 문장은 늘 똑같다.
“개인정보는 이미 대규모로 유출된 것으로 추정됩니다.”
검사 결과가 나온 순간, 의사는 말을 잇지 못했다…가 아니라, 시스템 로그를 본 보안 담당자가 말을 잇지 못하는 거다.
여기까지 읽고도 이렇게 생각한다면, 솔직히 운이 좋길 바라는 수밖에 없다. “그래도 의료 혁신은 필요하잖아. 어떻게든 되겠지.”
하지만, 당신이 ‘데이터의 주인’이라는 사실을 진짜로 인정하는 순간, 행동 방식이 달라진다.
지금 당장 해야 할 단 한 가지는, 거창한 기술 공부가 아니다. “내 의료 정보가 어디에, 어떤 형식으로, 어떤 근거로 쓰이고 있는지”를 집요하게 묻는 것이다.
구체적으로 말하자.

왜 이렇게까지 해야 할까?
의료 빅데이터, 국가통합바이오빅데이터, AI 의료, 데이터 전주기, 실증… 이 모든 키워드 뒤에는 공통된 전제가 숨어 있다. “국민은 어차피 잘 모르니까, 우리가 알아서 잘 쓴다.”
당신이 해야 할 단 한 가지는, 이 전제를 뒤집는 거다.
“아뇨, 저는 압니다. 그리고, 지켜보고 있습니다.”
Q1. 내 의료 정보, 정부가 마음대로 AI 학습에 쓰는 건가요?
A. “마음대로”는 아니다. 법적 근거와 절차, 비식별화, 동의 등 여러 장치가 있다. 문제는 ‘절차가 있다’와 ‘실제로 안전하다’ 사이에 항상 간극이 있다는 점이다. 그래서 당신이 해야 할 건, 절차를 이해하고, 동의서와 설명을 “진짜로” 읽는 것이다.
Q2. 익명화됐다면, 어차피 나라는 걸 모르는 거 아닌가요?
A. 부분적으로만 맞다. 단일 데이터셋 안에서는 그럴 수 있다. 하지만 여러 데이터셋이 결합될수록, 재식별 가능성은 올라간다. 유전자, 희귀 질환, 특정 지역, 나이·성별 등이 결합되면, 사실상 “당신만이 가질 수 있는 조합”이 된다. 그래서 재식별 방지를 위한 법·기술 기준이 그렇게 중요한데, 그걸 누가, 어디까지, 어떻게 적용하는지 따져야 한다.
Q3. 의료 빅데이터 덕분에 내가 실제로 얻는 이득은 뭔가요?
A. 제대로 작동하면, 이득은 분명하다. 더 빠른 진단, 나에게 맞는 맞춤형 치료, 희귀질환·암·만성질환 연구 가속, 신약과 AI 기기의 빠른 개발. 특히 지방·고령층에게는 의료 공백을 메워줄 무기가 될 수 있다. 문제는, 이 이득이 “데이터 제공에 대한 당신의 리스크”와 균형이 맞느냐는 거다.
Q4. 그럼 의료 빅데이터 확대 자체를 막아야 하나요?
A. 그건 현실적으로도, 미래 의료를 생각해봐도 답이 아니다. 진짜 싸움은 “하느냐, 마느냐”가 아니라 “어떤 조건과 통제 장치 아래에서 하느냐”다. 투명한 거버넌스, 독립적인 감시, 국민이 참여하는 의사결정 구조가 핵심이다.
Q5. 개인이 할 수 있는 건 도대체 뭐가 있나요?
A. 생각보다 많다. 병원·기관에서 받는 동의서에 질문 던지기, 관련 법·제도 입법예고에 의견 제출하기, 보건복지부·질병관리청 같은 곳의 정책 설명 자료를 읽고 문제 지적하기, 시민단체·전문가들이 여는 토론회에 목소리 보태기. 이 모든 사소한 행동이, 나중에 “이건 국민과 논의해서 정한 원칙입니다”라는 한 줄을 바꾼다.
다시, 도입부의 남자로 돌아가보자. 그는 감기인 줄 알고 병원에 갔다. 피 한 번 뽑았고, X-ray 한 장 찍었다. 그리고 돌아왔다. 그의 하루는 그대로 흘러간다. 하지만 시스템 안에서는, 그의 몸과 질병의 정보가 의료 빅데이터라는 이름으로 조용히 쌓이기 시작했다.
몇 년 뒤, 어쩌면 그 데이터 덕분에, 누군가의 심근경색이 미리 막힐지 모른다. 누군가는 신약의 임상시험에서 살 길을 찾을 수도 있다. 그리고 아이러니하게도, 그 누군가가 바로 그 자신일 수도 있다.
하지만 반대로, 그 데이터가 허술하게 다뤄진다면? 보험, 취업, 대출, 사회적 낙인 같은 전혀 다른 방향으로, 그의 삶을 옥죄는 족쇄가 될 수도 있다.
정부는 말한다. “AI 의료 혁신을 위해, 의료 빅데이터를 제대로 쓰겠다.” 기업은 말한다. “우리가 세계 최고 기술을 만들겠다.”
그런데 정작, 가장 중요한 목소리는 아직 조용하다.
“그 데이터의 진짜 주인, 나는 뭐라고 말할 것인가?”
이 질문에 대답하지 않는 한, 우리는 계속해서 ‘남의 이야기’처럼 뉴스를 스크롤 내리게 될 것이다. 하지만 어느 날, 아주 평범한 감기 진료 하나가, 당신을 이 게임의 ‘실제 플레이어’로 끌어올 것이다.
그날이 오기 전에, 최소한 이것만은 기억해라.
의료 빅데이터, 멀리 있는 거 아니다. 이미 당신 몸속에서, 오늘도 조용히 캐시되고 있다.