스탠포드 고교생 김가은, “머신러닝으로 의학 연구해요”
http://www.bloter.net/archives/274798
최근 전세계적으로 프로그래밍 교육이 확산되고 있지만 ‘프로그래밍을 과연 아이들에게 가르쳐야 하는가’라는 반론과 이에 대한 과정도 존재한다. 과연 초·중·고교생에게 프로그래밍을 알려주면 어떤 결과가 생길까? 이러한 논란 속에 직접 프로그래밍을 독학하고 새로운 실험을 진행하고 있는 17살 고등학생인 김가은 양을 만나보았다. 현재 김가은 양에게 프로그래밍이란 꿈을 이루기 위한 중요한 수단으로 자리잡고 있다고 한다.
17살 학생의 머신러닝 연구
김가은 학생은 3월18일 싱가포르에서 열린 오픈소스 아시아 서밋 ‘포스아시아’ 발표자로 나섰다. 주제는 ‘머신러닝과 메디컬 이미징 : 암 조기 진단의 미래’였다. 20-30명이 모인 강당에서 김가은 학생은 유창한 영어로 발표를 20분간 이어나갔다. 몇몇 청중은 김가은 학생의 프로필을 보고 웅성거렸는데, 특히 그녀의 나이를 확인하곤 매우 놀라워했다. 발표 내용도 이제 고등학생이라고 하기엔 굉장히 깊은 내용이었다. 발표 끝나고 청중들은 큰 박수를 보냈고, ‘대단하다’라는 격려를 김가은 학생에게 직접 건내기도 했다.
김가은 학생은 현재 스탠포드 온라인고등학교에 재학중이다. 스탠포드 온라인 고등학교는 스탠포드대학이 2006년에 설립한 정식 고등학교로, 모든 수업과 활동을 온라인으로 진행하고 있다. 김가은 학생은 초등학교 5학년까지 한국에서 학교를 다니다가 바로 스탠포드 온라인 고등학교로 옮겨 중학교 생활을 보냈다. 그렇다고 따로 미국으로 거주지를 옮긴 것은 아니다. 현재 3년 넘게 한국에서 스탠포드 온라인 고등학교를 다니고 있으며, 미국 현지 시간에 맞춰 수업은 새벽에 듣고 있다.
김가은 학생은 스탠포드대학에서 개최한 여름캠프를 통해 스탠포드 온라인 고등학교를 알게 됐다고 한다. 홈페이지를 통해 우연히 발견하고 스스로 지원했다.
“초등학교때 잠시 국제학교에 다녔어요. 근데 제가 미국 국적이 없다보니 한국인들이 주로 있는 국제학교에 갔어요. 그곳에선 영어로 소통하기도 힘들고 수업 분위기도 제가 생각하던 것과 다르더라고요. 근데 스탠포드 온라인 고등학교는 수업이 학생들의 참여 위주였어요. 배울 수 있는 과목의 깊이도 조금 더 높았고요. 그래서 지원했어요. 영어는 5살 무렵부터 배웠어요. 부모님이 강제로 시키신 건 아니고, 그냥 영어가 좋아서 한국에서 계속 공부했어요. 부모님은 IT와 무관한 일을 하세요. 하지만 지금 하는 일의 대부분은 부모님께서 많이 응원해주시고 계세요. 또 지금 하는 일은 좋아서 하는 일이니 스스로 알아서 하게 되는 것 같아요.(웃음)”
김가은 학생은 최근 미국 스탠포드대학에 가서 연구원 생활을 하고 있다. 이번에 처음으로 6개월 동안 미국에서 거주하는 것이라고 한다. 어떻게 대학교에서 고등학생을 연구원으로 받아들였는지 물어보니 지난해 스탠포드에 있는 교수님 200명에게 이메일을 보내서 얻은 결과라고 한다. 김가은 학생은 “이력서랑 관심있는 주제에 대해 작성해서 연구실에서 일하고 싶다고 적었다”라며 “그 중 2명의 교수님께서 허락해주셨고, 한 분의 연구실에서 6개월 동안 있기로 했다”라고 설명했다.
김가은 양이 연구실에서 일하고 싶었던 이유는 소위 말하는 ‘스펙’을 쌓기 위해서가 아니었다. 이미 스탠포드대학에 이메일을 보낼 때 오로지 ‘의료 이미지’와 관련된 연구실에만 연락했다고 한다. 그만큼 관련 연구를 꼭 하고 싶었다고 한다.
“이전부터 연구자로 일해보고 싶다는 생각이 있었어요. 어떤 연구를 할지는 구체적으로 정하진 않았고요. 그러던 중 암 진단과 관련된 다큐멘터리를 보았는데, 굉장히 의미있고 세상에 이로운 일 같더군요. 근데 저는 나이가 어리니 바로 실험실에 들어갈 수는 없잖아요. 그래서 뭔가 실험실 밖에서 컴퓨터를 통해서 할 수 있는게 없을까 하는 생각이 들었어요. 마침 제가 코딩을 시작했거든요. 찾아보니 관련된 오픈소스나 웹사이트가 많이 공개돼 있어서 제가 할 수 있는 게 많이 있더군요.”
오픈소스 기술로 배운 머신러닝
현재 김가은 학생이 진행하는 연구 주제는 ‘암 진단 이미지의 정확도를 늘리는 기술’이다. 예를 들어 초음파 사진을 찍을 때 환자가 숨을 쉬면 사진의 정확도가 떨어진다. 김가은 학생의 기술은 이미지 프로세싱과 머신러닝을 기반으로 암덩어리를 보다 뚜렷하고 명확하게 볼 수 있게 돕는다. 이 과정에서 다양한 오픈소스 소프트웨어와 캔서이미지아카이브나 캔서베이스 같은 오픈 데이터를 활용했다.
“코딩의 경우, 처음에는 주변 친구들이 코딩을 하길래 저도 한번 찾아봤어요. 먼저 iOS 앱 개발부터 시작했어요. 파이썬, 매트랩, R언어 등으로 확장하면서 머신러닝쪽에 관심이 생겼어요. 공부 방법이나 자료들은 누가 알려준 건 아니고, 대부분 인터넷 검색을 통해 알았어요. 다행히 머신러닝은 홍콩과학기술대학교 김성훈 교수님이 무료로 올려둔 강의가 있더라고요. 그걸 보면서 배웠고요. 요즘에는 다른 친구들과 1주일에 한 번씩 스카이프로 채팅하면서 머신러닝 공부도 같이 하고 있어요.”
김가은 학생은 처음부터 오픈소스 기술을 알고 있었던 건 아니다. 깃허브에 많은 소스코드가 올라온 것을 보고 깃허브에 관심을 두었다. 이후 ‘구글 코드인‘(전세계 중고등학교 학생들이 온라인으로 오픈소스 프로젝트에 기여하면서 경쟁하는 대회)이라는 오픈소스 프로그램에 참여했고, 구글 코드인을 통해 포스아시아 행사를 알았다고 한다. 이번 발표 역시 코드인 커뮤니티에서 올린 서류를 보고 참여하게 됐다.
김가은 학생은 “오픈소스 기술이 아니었으면 메디컬 이미지를 공부하기 힘들었을 것”이라며 “나중에 대학에 가면 연구 내용을 오픈소스 기술로 공개하고, 다시 커뮤니티에 돌려주고 싶다”라고 말했다. 처음 오픈소스 기술을 시작하는 또래 친구들이 알면 좋은 몇 가지 팁도 알려줬다.
“꼭 보여주기 위한 오픈소스 프로젝트가 아니라도 이미 있는 작은 프로젝트를 직접 이것저것 변경해보면서 시작하면 좋을 것 같아요. 오픈소스 데이터도 많으니 이걸 활용하는 것도 좋은 방법이고요. 깃허브는 초보자에게 조금 어려울 수 있다는 생각이 들더군요. 소스코드를 제안하면 그게 승인될 때까지 오래 걸리곤 하거든요. 영어는 꼭 필수적인 건 아닌 것 같아요. 요즘은 한국 커뮤니티도 활발하고, 코드를 읽으면서 원리를 따라갈 수 있으니까요.”
올해 9월부터 김가은 학생은 대학입시 준비를 시작한다. 앞으로도 프로그래밍과 의료를 결합한 분야에서 계속 남고 싶다고 한다.
“‘내가 좋아하는 것, 남들이 필요한 것, 내가 즐길 수 있는 것, 수익을 만들 수 있는 것’을 융합한 일을 하면 좋다는 식의 명언을 들었어요. 지금 하는 일은 어느 정도 그 범주 안에 들었다고 생각해요. 학교 숙제도 많고, 공부할 것도 많아서 잠을 많이 못자는데요. (웃음) 그래도 매일 연구실에서 일하는게 너무 즐거워요. 딥러닝 공부를 교수님께 직접 배우는 것도 재밌고요.”
.