default_top_notch
default_setNet1_2

복잡한 진단 능력 확보 급선무

기사승인 [141호] 2022.01.01  

공유
default_news_ad1

- [집중기획] 의료 인공지능 ② 과제

허수징 何書靜 쑨옌란 孫嫣然 <차이신주간> 기자

   
▲ 2021년 11월5일 중국 인공지능(AI) 의료기기 업체 잉퉁과학기술이 홍콩증시에 상장했다. 잉퉁은 홍콩증시에서 주식이 거래되는 첫 번째 의료 AI 기업이다. 잉퉁과학기술 누리집

2018년 박사학위를 받은 뒤 리커는 저장성의 3급 갑등 병원(3차 의료급여기관)에서 의료영상학과 의사로 근무했다. 3년 동안 그는 인공지능(AI)으로 폐결절을 찾는 데 익숙해졌다. 흉부 컴퓨터단층촬영(CT)은 각종 폐질환 환자가 가장 많이 받는 검사다. 3급 갑등 병원 영상의학과 의사 한 명이 매일 수십 장에서 100장에 이르는 흉부 CT를 판독해야 한다. 폐 부위에서 결절이 발견되면 의사는 성질과 형상을 기준으로 양성과 악성 여부를 판정하고 환자가 다른 검사를 받아야 할지도 결정한다.
리커는 “폐결절은 대부분 크기가 1㎝ 이하여서 맨눈으로 찾으려면 시간이 오래 걸리고 빠뜨리기 쉽다. 빠뜨린 작은 결절 하나가 2~3년 뒤 폐암으로 발전할 수도 있어 매우 심각한 사고다”라고 말했다. “동료들끼리 소프트웨어가 결절을 빠뜨리거나 너무 민감하다고 불평을 늘어놓지만 이런 도구가 없으면 근무하기 힘들다. AI가 없었을 때는 의사 한 명이 하루에 흉부 CT 결과보고서를 최대 30건까지 작성할 수 있었다. 하지만 지금은 하루 100건도 쓸 수 있다.”

풀밭에서 바늘 찾기
폐결절 검사보조는 의료 AI가 진출한 주요 분야다. 지금까지 발급받은 3등급 허가증 17건 가운데 폐결절 CT 영상 검사보조 소프트웨어는 3건으로 각종 소프트웨어 가운데 가장 비중이 크다. 업계 관계자는 “초음파나 PET/CT(양전자방출단층촬영) 영상에 비해 AI가 폐결절을 판별하는 과정이 체계적이고 데이터도 충분해 가장 성숙한 응용 분야가 됐다”고 설명했다.
리커는 폐결절 외에도 AI 도구를 이용해 심장 관상동맥 혈관을 재구성한다. “정말 유용하다”고 그는 말했다. 심장 관상동맥 CT 영상의 결과보고서를 작성하려면 의사가 혈관을 재구성해야 하는데 이 과정이 아주 복잡하다. 심장과 혈관을 분할하고 혈관에 주석을 달고 혈관의 단면도를 촬영해야 한다.
“이런 과정은 기계적이어서 AI에 적합하고 결과물도 사람이 직접 한 것보다 좋다. 시간을 많이 절약할 수 있다. 이전에는 영상을 재구성할 때 마우스를 100번 눌러야 했다면 지금은 4번이면 된다. 화면을 재구성하는 데 시간이 오래 걸린다. 하지만 재구성만 끝나면 결과보고서를 빨리 쓸 수 있다.”
인공지능 기술은 기계적이고 세밀한 판별 작업을 비교적 훌륭하게 수행할 수 있다. 업계에선 이를 두고 ‘풀밭에서 바늘 찾기’라고 표현한다. 저우샹 롄잉즈넝(聯影智能·United Imaging) 공동 최고경영자는 “이런 일이 가장 빨리 실현할 수 있는 응용 분야”라고 설명했다.
지금도 눈으로 판별할 때 놓치기 쉬운 폐와 늑골의 골절 등에선 의사들이 AI 기술에 의존하고 있다. 사람의 눈을 대신해 정밀한 3차원 검사를 진행하거나 환자의 질병 진행 상태를 대조할 때도 AI 기술을 도입하고 있다. 예를 들어 뇌 영상을 기반으로 출혈량을 측정하면 의사가 병소의 부피를 측정하는 시간과 오차를 줄일 수 있다.

   
▲ 2021년 9월 중국 AI 의료기기 업체 안더이즈와 베이징톈탄병원은 AI 기술을 활용한 신경질환 치료법을 공동 연구하기로 협약을 맺었다. 양쪽은 2017년 신경질환 AI 진단보조 시스템을 공동 개발했다. 안더이즈 누리집

정성적 판단력 부족
그러나 도구는 대부분 정성적으로 판단하는 능력이 없다. 리커는 말했다. “폐결절을 ‘고위험’과 ‘저위험’으로 나눌 때는 (소프트웨어가) 별로 쓸모없다. 정확성을 믿을 수 없다. 의사가 직접 판단해야 한다.” 심장관상동맥 재구성 소프트웨어가 제시하는 정성적 판단은 틀릴 때가 많아 의사들이 참고하지 않는다. 지금도 결과보고서 1건을 의사 2명이 심사한다. 연차가 낮은 의사가 보고서를 쓰면 연차가 높은 의사가 심사하는 형식이다.
“AI가 일부 분야에서는 전문가보다 빠르고 정확하지만 복잡한 결정을 할 때는 중학생 지능보다 못할 때가 있다.” 저우샹 최고경영자는 “복잡한 질병의 진단은 다소 모호한 결정이어서 병력 등 여러 정보를 종합해야 하는데 AI는 이런 판단력이 없다”고 설명했다. AI에 대한 합리적인 기대치는 의사가 누락과 오진 비율을 낮추고 진료 효율을 높이도록 돕는 것이다. 독립적으로 높은 수준의 결정을 내리는 것이 아니다.
데이터 품질이 천차만별인 점도 AI 소프트웨어의 판단력 수준을 낮추는 원인이다. 업계 관계자는 말했다. “폐결절 영상을 많이 찍지만 정확하고 다양한 영상을 찍기는 쉽지 않다. 이것이 AI 모델의 판단능력을 제고하기 위한 관건이다.” 대다수 소프트웨어가 영상의학과 의사의 주석을 훈련 표본으로 사용한다. 이런 주석이 ‘황금 기준’은 아니어서 병리학적 데이터(병소 조직 표본)를 동시에 참고해야 판단이 정확해진다. 다양한 크기의 결절, 양성 결절까지 충분한 병리학적 데이터도 찾아야 한다면 더욱 힘들어질 것이다.
AI의 진단능력은 여전히 부족하지만 그 효율을 높이는 것만으로도 매우 유용하다. 3급 갑등 병원 의사는 말했다. “영상의학과는 지원부서다. 임상학과에서 결과보고서 제출 기한을 설정하고 너무 늦어지면 불만을 제기하기 때문에 영상의학과 의사의 부담이 크다. 이 밖에도 검사의 문턱이 낮기 때문에 의사들은 진단 리스크를 줄이기 위해 영상검사 등 보조 검사를 요구한다. 특히 코로나19가 기승을 부릴 때 이런 이유로 영상의학과 의료진이 새벽까지 야근해야 했다.”
“3급 갑등 병원은 도구형 제품이 비교적 쉽게 들어가서 의사의 업무 효율을 개선할 수 있다.” 선위샤오 집행이사는 “3급 갑등 병원에서 진단능력을 높이는 제품을 도입하려면 더 많은 시장교육과 조율이 필요하겠지만 일단 사용하기 시작하면 큰 가치를 발휘할 수 있다”고 말했다.
흉부 영상 제품을 주력으로 하는 투이샹과학기술은 투자설명서에서 “현재 세계 400개가 넘는 병원에 진출했고, 매출액에서 중국 시장의 비중이 80% 이상”이라고 밝혔다. 회사 주력 제품이 2020년 말 3등급 허가를 받은 뒤 상업화를 추진했다. 2021년 1분기 매출액이 전년 동기 대비 3배 이상 늘어 2213만위안을 기록했다. 90%가 의료제품 판매였고 나머지는 서비스 매출이었다.

   
▲ 2020년 10월 중국 상하이에서 열린 국제의료장비전시회(CMEF 2020) 방문객들이 AI 의료기기 업체 롄잉즈넝의 최신 자기공명영상(MRI) 장비를 구경하고 있다. 롄잉즈넝 누리집

AI 사용률 20%
2019년 출간한 <중국 영상 AI 백서>에 따르면, 조사에 응한 2·3급 병원 의사 가운데 20%가 ‘AI 제품을 사용한 경험이 있다’고 대답했다. 이 가운데 88%가 폐결절 검사, 6%가 심장관상동맥 분석 제품이었다. 하지만 현행 의료체계에서 도구형 제품의 상용화는 해결하지 못한 문제가 있다.
업계 관계자는 “도구형 제품이 의사의 업무 효율을 높여주지만 환자에게 직접적 가치를 제공하지 않는다”고 지적했다. 이런 이유로 환자에게 그 비용을 직접 청구할 수 없다. 병원에 구매를 설득하기도 쉽지 않다. “환자에게 비용을 받을 수 없는 의료기기는 순수한 투자다. 병원장 입장에서는 차라리 CT 장비를 한 대 더 구입하고 싶을 거다. 그런 장비는 몇 차례 촬영해야 원가를 회수할지 계산할 수 있다.”
환자에게 비용을 받을 수 없는 의료기기는 순수한 투자이므로 병원장의 관점에서는 우선순위가 높지 않다. 보통 CT 기기 1대를 구매하더라도 몇 차례 촬영해야 비용을 회수할 수 있는지 계산한다.
선위샤오 집행이사는 “AI가 단순히 의사의 업무 효율을 개선하는 데 그친다면 시장잠재력에 한계가 있고 AI의 가치를 충분하게 이용할 수 없다”고 말했다. 제품이 진단능력을 갖춰야 (동네병원 같은) 넓은 기층의료시장에 진입할 수 있다. “지금 대다수 폐결절 제품은 폐결절을 찾아내기만 한다. 정성적, 정량적으로 종양의 악성 여부를 판단할 수 있어야 더 큰 가치가 생긴다.”
의학을 전공한 안더이즈의 량웨이민 회장이 의료 AI 제품의 가치를 평가할 때는 의사의 업무 효율이 얼마나 개선됐는지는 물론 의사의 진단 수준이 어느 정도 향상됐는지를 본다. 2017년 안더이즈를 설립한 목적도 의료 AI를 통해 “대형 3급 갑등 병원 주임 의사의 임상진료 능력을 기층의료체계에 제공해 의사의 진료 수준을 높이는 것”이었다.
“중국의 기층의료기관과 3급 갑등 병원의 진료 수준 격차는 매우 크다. 의료 AI 제품에 도구형 기능만 있어 의사가 모든 양성 폐결절을 찾아내도록 돕고 더욱 선명하게 보여주기만 하는 것으로는 부족하다. 폐결절이 양성인지 악성인지를 가려내는 것이 도전이다. 기층의료기관에 필요한 것은 진단 역량을 최정상급 병원과 같은 수준으로 끌어올리는 것이다.” 량웨이민 회장은 이렇게 말했다.
서남부 지역 전문병원 의사에 따르면 기층의료기관 의사는 3급 갑등 병원에 비해 진료하는 환자가 적다. 의사의 수준에 한계가 있고 설비가 낙후돼 오진 가능성이 큰 것이 문제다. “출산 전 태아의 기형아 진단은 어렵다. 오진하면 사회에 큰 부담을 가져온다. AI가 사람보다 더 정확하게 판단한다면 유용할 것이다.”

격차 메우기
안더이즈는 2017년 베이징톈탄병원(北京天壇醫院)과 공동으로 신경질환 AI 진단보조 시스템을 개발했다. 이 시스템의 목표는 톈탄병원 전문가의 능력을 담아내는 것이다. 뇌종양의 발병 기제는 매우 복잡하고 치료 방안도 다양하다. 량웨이민 회장은 “수준 높은 의사는 발병 기제와 원인을 정확하게 판단하고 상응하는 치료를 한다”고 말했다. 이것이 의사의 수준을 나누는 기준이다. “AI가 사전에 명확하게 분석해 의사가 더욱 적합한 방식을 찾도록 돕는다면 환자의 손실을 줄일 수 있다.”
“물론 AI 모델이 임상판단 능력을 갖추기는 쉽지 않다. 첫 번째 문턱은 데이터다.” 량웨이민 회장은 “어떤 데이터를 사용해 모델을 훈련하는지에 따라 최종 결과가 결정된다”고 말했다. 그래서 최정상 수준의 의사가 주석을 달아준 데이터로 훈련해야 한다. 또 임상의사의 분석은 다양한 각도에서 판단한 결과다. 수술 결과 등 데이터의 뒷받침이 필요하다. 이는 의료 AI 회사가 병원과 업무협력을 맺고 영상의학과 이외의 자료를 활용해야 한다는 의미다.
2020년 6월 안더이즈의 뇌종양 자기공명영상(MRI) 진단보조 소프트웨어가 3등급 허가증을 받았다. 국가식약총국은 해당 제품이 영상의학과 의사에게 7가지 암을 분류하는 훈련을 도울 수 있다고 평가했다. 하지만 앞으로 발병률이 낮은 암과 2·3선 지방도시의 사용 현황 등 여섯 사항을 고려해 임상연구를 지속해야 한다고 지적했다.
안더이즈 제품은 이미 수백 개 병원에 진출했다. 량웨이민 회장은 “중국 기층의료의 수준을 높이는 것이 ‘장정’(長征)이라고 한다면 우리는 아주 멀리 떨어져 있다”고 말했다. 중국에는 3만 개 넘는 병원이 있다. 기층의료 수준을 높이려면 다양한 질병의 진단 수준을 높여야 한다. 앞으로 갈 길이 멀다.
안저(눈의 안쪽) 영상 진단보조 기술이 주력인 기업도 기층시장에 주목했다. 최근 안저 사진으로 전신 질병을 진단하는 방법이 업계의 인정을 받았다. 특히 안저 사진을 통해 당뇨병 시망막 병변을 판단하는 기술이 매우 발달했다. 지금까지 이 분야에서 3등급 허가증 3장이 발급됐다.
쑨위후이 최고경영자는 “안저 사진 진단보조 제품을 출시하기 전까지 중국에서 안저촬영기 판매량이 많지 않았다”고 말했다. “판매량이 적은 것은 가격이 비싸기 때문이 아니라 사진을 판독할 사람이 없어서였다.” 중국에는 안과 의사가 부족하고, 일부 2급 병원에는 안과 전공의가 없다. AI가 안저 사진을 분석하는 능력을 갖춘다면 기층의료기관의 능력을 확대할 수 있고, 안저촬영기 판매량도 늘어날 것이다.

   
▲ 2020년 7월 중국 상하이 세계인공지능대회에서 리창 상하이시 당서기가 개막 연설을 하고 있다. REUTERS

건강검진센터 공략
천위중 최고의료책임자는 “우리는 기존 안저촬영기 시장이 아니라 중대형 병원 내분비과나 건강검진센터 등 수요를 만족시키지 못했던 시장에 집중하고 있다”고 말했다. 잉퉁과학기술이 공략하는 시장 중 하나가 건강검진센터다. 이곳에는 대부분 안과 전공의가 부족하다. 현재 아이캉궈빈(愛康國賓) 건강검진센터와 협력해 환자에게 시망막영상 AI 평가서비스를 유료로 제공하고 있다. 투자설명서를 보면 건강검진센터 한 곳에서 2년 연속 40% 넘는 매출이 발생했고, 이 고객사가 2020년 구매한 금액은 2천만위안(약 37억원)이 넘었다.
기층의료시장에 적응하려면 AI 의료 제품을 여러 차원에서 조정해야 한다. 천위중 최고의료책임자는 “기층의료기관이 수집한 영상자료가 표준에 어긋나고 규정을 지키지 않을 확률이 높다”고 지적했다. 이 때문에 제품에 인공지능 품질통제시스템을 추가해 사용자가 유용한 사진을 촬영하도록 유도해야 한다. 또 알고리즘 이외의 요인을 고려할 필요가 있다. 그는 최근 쑤저우에서 진행한 사업을 예로 들어 설명했다. “현지 노인들은 쑤저우 말만 알아들어서 쑤저우 사투리 버전을 개발해달라는 강력한 요구가 있었다.”
기층의료시장은 AI 모델의 일반화 능력을 시험한다. 쑨위후이 최고경영자는 녹내장 제품을 예로 들었다. 개발 초기에 3급 갑등 병원의 데이터를 사용해 훈련했는데 기층의료기관에 적용했더니 성능이 많이 떨어졌다. 원인을 분석한 결과 이 데이터는 녹내장 여부만 조사한 것일 뿐 다른 합병증은 거의 반영하지 않았다.
기층의료는 광대한 시장이다. 국가위생건강위원회가 발표한 2020년 중국위생건강사업발전통계를 보면 전국에 3만5천 개 병원과 97만 개 기층의료위생기관이 있다. 진료 건수를 보면 기층의료기관의 비중이 50%가 넘는다. 3급 병원이 23%, 1급과 2급 병원이 18%였다. 하지만 의사 수는 각급 병원의 비중이 60%, 기층의료기관은 30% 미만이었다.
선위샤오 집행이사는 “진단능력을 갖춘 제품에 대한 기층시장의 수요가 크다”며 “초기에는 제품 보급을 위해 의사와 장기간 조율하는 과정이 필요할 것”이라고 말했다. 의사가 자신의 진단능력이 AI만 못하다는 사실을 인정하기까지 과정이 필요하기 때문이다. 하지만 일단 이 사실을 인정하면 이런 제품이 도구류 제품보다 고객 충성도가 높고 더 큰 가치를 발휘할 수 있다.
지방 전문병원 의사는 “솔직하게 말해 AI의 효용을 부정하지 않지만 비용을 고려해야 한다”고 말했다. 그는 의료기기를 사들일 때는 수익성을 평가해야 하고 코로나19 사태 이후 진료 건수가 줄어 병원의 매출 현황이 좋지 않다면서 “AI 기기의 가격이 너무 비싸면 도입하기 힘들 것”이라고 말했다.
쑨위후이 최고경영자는 “여러 이유로 혁신적인 의료기기와 서비스 비용을 환자에게 직접 청구하지 못하고 병원 비용으로 처리한다”고 말했다. “3급 갑등 병원은 그런대로 괜찮지만 기층의료기관에는 부담이 너무 크다. 관련 제품이나 서비스 비용을 환자가 직접 부담하거나 의료보험 보장 대상에 포함하면 정말 적합한 제품을 기층의료에서 사용하고 더욱 훌륭한 서비스를 제공할 수 있을 것이다.”

ⓒ 財新週刊 2021년 제39호
醫療AI“拿證”之後
번역 유인영 위원

허수징 economyinsight@hani.co.kr

<저작권자 © 이코노미인사이트 무단전재 및 재배포금지>
default_news_ad4
default_side_ad1

인기기사

default_side_ad2

포토

1 2 3
set_P1
default_side_ad3

섹션별 인기기사 및 최근기사

default_setNet2
default_bottom
#top
default_bottom_notch