2일동안 진행한 행사.
첫날은 회사에 있어서 듣지 못했고, 주말에 유튜브로 들었다.
First day
서울대병원 + NVIDIA에서 주최한 Healthcare + AI 세미나 .
들은 것 대략 정리한 내용 ( 내가 관심있는 분야만 정리해봄. )
Medical AI 가 어디로 향하는가?
Medical AI 분야의 trend : 3가지 정도.
- Clinical trial 을 통한 validation 이 이루어지고 있음 : 상용화를 염두에 둔 모델들이 개발되고 있음
- 사람이 하던 형태와 다른 practice 를 개발하려는 process 들이 이루어지고 있음.
- Biomarker.
** Clinical validation 이 훨씬 더 중요하다. 이것이 AI 가 의료 영역에 쓰이게 될 때, 중요할 것임.
Drug development : 확실한 효능을 내는 경우에만 clinic 분야에 들어올 수 있음. Clinical trial 들은 이것들을 걸러주는 역할을 하게 된다.
Test set -> clinical Trial ( 기존의 management plan 이 어떻게 바뀔 수 있는가 ? )
특정 조건에서 사용했더니, clinical practice 가 바뀐다.
AI development : commercial level 을 고려할 수 밖에 없음.
Image 데이터를 가지고 transcriptome prediction -> 이미지 데이터만 가지고 cell, 등을 예측할 수 있다 ?
AI 모델을 어떻게 만들 것인가 ? distribution 을 보면서 만들면 좋지 않을까.
Self-supervised learning ?
- 일반적으로는, 단일 기관에서 수집된 데이터로 모델이 개발될 것 같은데, 이 모델이 다른 기관에서 쓰이려면 어떤 방법이 있을까 ?
-- Data Batch effect? 데이터가 많이 다르면 AI 모델이 해결하거나 정규화, 표준화 하는 방향으로 진행이 될 것 같음.
-- 환자군의 group 의 indication 이 다르거나 할 때도.
- AI 를 통해 진단이나 임상 고션의 정확도를 높이게 도움을 받을 수 있을 것으로 기대되지만, 판단 실수로 인한 사고를 대비하기 위해 의사의 판단에 도움을 주는 프로세스의 보완이 어떨 수 있을까?
- 의료행위 자체는 단계적으로 이루어진다. 바로 감별 진단을 한다기보다, 최악의 판단을 배제하기 위한 방법들을 거친다.
Second day
클라우드 기반으로 실습 진행했는데, 너무너무 열심히 알려 주셨다.
pyTorch 기반으로 여러가지 AI modeling 이 되어있는 MONAI 를 사용하여 실습했고, 직접 구현하는 부분도 있었다.
딥러닝 라이브러리에 친숙하지 않거나, 쉽게 돌릴 수 있는 모델을 선호하는 사람들에게 좋은 모델인듯.
몇가지 실습이 있었는데, 주로 의료 이미지를 이용해 분석하는 것들이었다.
Sunnybrook Cardiac Data – Cardiac Atlas Project
사용한 데이터.
Sunnybrook Cardiac Data.
Cardiac Atlas Project 에 의료영상 데이터가 있고, 논문에서도 validation 용으로도 사용되고 있는 것 같다. 이것도 나중에 사용해보면 좋을 듯.
UNet, Autoencoder 모델 사용해서 실습 진행했고, spleen segmentation task 를 진행함.
Image modeling 에서 사용하는 score 인 Dice score 를 사용해서 model 성능 체크했는데, 성능 올리기 조금 어려웠다.
로컬 컴 성능이 애매해서 에폭을 계속 나눠가면서 돌렸는데,
loss 는 많이 안줄어드는데 DICE 스코어는 조금씩 높아지는 듯.
생각엔 optimizer 를 바꿔보거나, learning rate 를 0.001정도로 해봤으면 더 올랐을 듯.
에폭도 1000 정도.
댓글