|
예를 들어, 아래(첨부사진 1)와 같은 흉부 X-ray 영상과 임상의가 작성한 검사소견("Findings")을 기반으로 최종 결론에 해당하는 추정진단 ("Impression")을 생성해야 한다.
대부분의 참가팀들이 ChatGPT의 뿌리 기술인 Transformer 구조의 언어모델을 사용해 텍스트 형태의 검사소견만을 입력으로 받아 진단을 생성한 반면, 강재우 교수팀은 X-ray 영상의 시각정보와 검사소견의 언어정보를 동시에 활용하는 시각언어모델 CheXOFA를 개발해 대회에 참가했다.
CheXOFA는 약 23만 장의 흉부 X-ray 영상과 임상의들이 작성한 약 12만 건의 검사결과를 사전학습했으며, 입력된 영상과 소견으로부터 진단을 생성하는 본 대회에서 활용됐던 기능 이외에도 X-ray 영상만을 입력으로 받아 영상에 대한 검사소견을 생성하는 등 다양한 태스크를 수행할 수 있다.
RadSum 대회는 2023년 1월에 학습 데이터를 공개했고 이후 3개월간 참가팀들이 각자의 방식으로 인공지능 모델을 개발해 학습시켰다.
4월 6일 테스트 데이터가 공개된 이후 4월 28일까지 리더보드가 운영되며 각 참가팀들의 인공지능 모델의 성능 경합이 이루어졌다.
대회 최종 순위와 우승팀은 현재 캐나다 토론토에서 개최 중인 세계 최고 권위 인공언어지능 학회인 ACL(Association for Computational Linguistics)의 BioNLP 2023 워크샵에서 현지시각 7월 13일에 발표됐다.
이번 대회는 고려대학교 연구팀을 중심으로 마이크로소프트 연구소 아시아 (Microsoft Research Asia), 아이젠사이언스, 카이스트, 베이징 항공항천대학 (Beihang University)의 연구원들이 힘을 보태 다국적팀을 구성해 참가했다.
(편집자주 : 이 보도자료는 연합뉴스 기사가 아니며 고객들의 편의를 위해 연합뉴스가 원문 그대로 서비스하는 것입니다. 연합뉴스 편집방향과는 무관함을 주지해 주시기 바랍니다)
<연합뉴스>