기사상세페이지
순천향대 박진혁 교수, 국내 의료분야 면허 시험에 ChatGPT 적용 '미래 학습교구 개발' 박차
기사입력 2024.03.13 10:22- 국제학술지 Digital Health 2월호 게재
거대언어모델(Large Language Model)은 인간 언어를 이해하고 생성하도록 훈련된 인공지능을 통칭하며, 대표적인 모델로 ChatGPT가 널리 사용되고 있다. 특히, ChatGPT는 딥러닝 알고리즘과 통계 모델을 통해 자연어 처리에 특화되어 다양한 분야에 적용되고 있다.
최근에는 ChatGPT를 다양한 면허 시험에 적용하고 있어 눈길을 끈다. 특히, ChatGPT가 생의학 및 임상 과학에 대한 폭 넓은 이해를 요구하는 엄격한 시험인 미국 의사면허 시험(United States Medical Licensing Examination)에서 90% 이상의 높은 점수를 기록해, AI를 활용한 학습교구가 의학 개념을 이해하고 적용하는 데 있어 큰 역할을 수행할 수 있는 점을 확인했다.
이처럼 ChatGPT를 필두로 한 거대언어모델을 의료분야 내에서 활용할 수 있는 방안에 대해 활발한 연구가 진행되고 있지만, 국내 의료분야의 면허 시험에 ChatGPT를 활용한 사례는 극히 제한적이었다.
이를 해결하기 위해 박진혁 교수 연구팀은 한국보건의료인국가시험원(국시원)에서 공개한 최근 5개년도의 한국 작업치료사면허 시험 문항(2018~2022년)에 ChatGPT3.5를 적용하여 그 성능을 확인했다. ChatGPT3.5에 5개년도의 시험 문항을 한글 그대로 입력하였고 국시원에서 공개한 정답과 비교하여 ChatGPT의 성능을 확인한 것이다.
그 결과, 면허 시험 합격 기준인 정확도 60%는 달성하지 못하였지만, 문화권에 영향을 받는 의료법규 관련 문항을 제외한 전공 지식 관련 문항에 대해서는 합격권을 넘는 정확도를 보여주었다. 또한, 세 명의 평가자가 기록한 ChatGPT의 정답의 일치도가 높아 신뢰도가 높음을 확인했다.
교신저자인 박진혁 교수는 "아직 ChatGPT를 비롯한 거대언어모델의 학습 데이터가 대부분 영어 중심의 문화권에 기초하고 있어 한국 작업치료사면허 시험 문항에 적용하는 것은 제약이 있지만 문화권에 영향을 받지 않는 전공 지식의 경우 충분히 높은 정확도와 함께 신뢰도를 보여줘 작업치료를 전공하는 학생들이 ChatGPT를 학습의 도구로써 활용할 수 있는 점을 확인했다.”라고 말했다.
한편, 이번 연구 결과는 최근 ‘한국 작업치료사면허 시험에서의 ChatGPT의 성능(Performance of ChatGPT on the National Korean Occupational Therapy Licensing Examination)’이라는 제목으로 국제학술지 Digital Health (IF: 3.9, Health Policy & Service 분야 Q1, 2022 JCR 기준) 2월호에 게재됐다.
많이본뉴스
많이 본 뉴스
- 1이현숙 충남도의원, 저출산‧고령화 시대 문화예술의 역할은 부엇인가?
- 2충남문화관광재단, 보령 천북 굴 축제 ‘문화누리카드’로 가을의 맛 즐기세요!
- 3세종시, 8세대 OLED 식각공장 준공
- 4충남경제진흥원, 희망리턴패키지 성과공유회 개최
- 5최민호 시장, 세종애국선열 잊지않고 기억하겠습니다
- 6세종시, 지역구 의원과 협력 강화…국비 확보 총력
- 7충남경제진흥원, “제3회 희망드림 판매전” 성료
- 8세종시교육청, 독립운동의 현장으로 가다
- 9이재관 국회의원, “충남, 국가산업발전 희생…소외돼서는 안된다”
- 10최민호 시장, '세계 속 한글문화수도 세종' 홍보
게시물 댓글 0개