네이버 하이퍼클로바X 멀티모달로 진화…“AI 경쟁 핵 경쟁 닮아”
https://www.mk.co.kr/news/it/10955226
클로바X 이끄는 네이버 클라우드
성낙호 하이퍼스케일AI 기술 총괄
한국의 대표 인공지능(AI) 에이전트인 네이버 ‘클로바X’가 텍스트뿐 아니라 음성 이미지 코딩까지 생성하는 멀티모달로 본격 진화한다. 멀티모달은 텍스트, 이미지, 영상, 음성 등 다양한 시청각 요소를 종합적으로 판단해, 의사결정을 내리는 AI 비서다. 말을 하면 그림을 그려주고, 질문을 텍스트로 입력하면 음성으로 설명한다.
성낙호 네이버 클라우드 하이퍼스케일(Hyperscale) AI 기술총괄은 경기도 분당에 있는 ‘네이버 1784’에서 기자와 만나 “조만간 클로바X에 눈이 생기고 귀가 생길 것”이라고 강조했다. 그러면서 그는 “현재 심혈을 기울이고 있는 것은 멀티모달로 확장”이라며 “이와 함께 클로바X의 토대인 초거대AI 하이퍼클로바X를 업데이트하고 있다”고 설명했다. (이하 일문일답)
▶ AI를 배운 계기가 궁금하다.
- 고등학교(서울과학고) 재학 중에 OCR(아르미 등장할 무렵) 만들다 실패한 적이 있다. 당시 자율주행 로봇을 만들기도 했는데, 비디오 카메라 두 개 꽂아 놓고 양안 매핑하는 원시적 로봇이었다. (고교 동창인 서성훈 KDB 실리콘밸리 대표는 성 총괄을 코딩 천재로 기억했다.)
▶ 대학때 AI를 배우지는 않았나.
-학부때 창업했고 졸업을 10년만에 했다. 당시 제프리 힌턴과 같은 교수도 몰랐다. 아마 영향을 준 사람이라면 존 카맥정도 아닐까한다. (주: 존 카맥은 GPU가 물리 연산 가속 카드에 더 적합하다고 주장한 인물로 가상현실(VR) 개척자로 꼽히는 인물)
▶ 어떤 창업을 했나.
-1999년 헥스플렉스라는 패키지 게임 엔진 스타트업을 창업했다. 2004년 네오위즈에 매각을 했다. (큰 돈을 만졌겠겠다.) 그렇진 않다. 이후 네오위즈에서 스핀오프된 자회사에서 일했다. 모바일로 전환을 하지 못했고, 사세가 많이 꺾였다.
▶ 이후 엔씨소프트에 입사했다.
-엔씨소프트에서 아이온2팀에서 개발을 담당했다. 당시 주 업무는 게임 개발도구가 무거워 이를 경량화하는 일을 했다. 게임 수정하는데 5시간 걸리더라. 이를 5초만에 해결할 수 있도록 했다. 이후 강화학습 기반 게임 에이전트를 개발했다. 딥마인드가 막 아타리를 상대로 AI가 대결을 할 때였다. 우리가 오픈AI 보다 3년 빨랐다.
▶ 네이버는 어떤 계기로 합류했나
-판교 AI 모임에 갔더니 대학 동기 동창인 하정우 네이버클라우드 AI이노베이션센터장이 있더라. 하 센터장은 학창시절 군대에 갔고, 난 창업을 해서 겹치는 시간이 많지는 않았다. 하 센터장 뿐 아니라 다른 분 역시 권유를 해서 네이버에 합류했다.
▶ 어떤 일을 했나.
-2017년에는 네이버에도 상당히 많은 AI팀이 있었다. 우리 팀도 무엇인가를 해야 했는데, 이미 전부 프로젝트가 있더라. 그래서 한 것이 퀀트 트레이딩이었다. 1년 정도 했는데, 수익이 맞지 않았다. 르네상스 테크놀로지 수익률이 20%인데, IT는 20%가 훨씬 넘는다. 효율이 높지 않았다. 이후 AI 콜센터를 개발했다. 전화 받는 AI 상담원은 아마 우리가 전 세계 최초일 것이다. 현재도 독거노인 안부를 묻는데 잘쓰고 있어서 뿌듯하다.
▶ 초거대AI는 어떤 계기로 개발했나
-2019년엔 논문을 하루에 수십편씩 봤다. 트랜스포머모델이 등장했고, 2020년 GPT-3.0이 등장했다. 이 방향이 아니면 승산이 없다고 판단했다. 이후 나온 것이 하이퍼클로바다. 네이버 데이터를 트랜스포머모델로 학습한 것이다. 당시 구글 아마존은 트랜스포머 기반의 LLM을 서비스에 적용하지 않았다.
▶ 이후 챗GPT가 등장해 ‘와우 포인트’를 넘었다
-챗GPT가 등장한 뒤 로보틱스 자율주행도 LLM 기반이라는 사실을 회사 내외부에서 인지하기 시작했다. 작년에는 하이퍼클로바X를 기반으로 한 AI 에이전트인 클로바X를 내놓았다.
▶ 오픈AI, 구글이 개발한 AI 발전 속도가 매섭다
-GPT-5가 나오면 기술격차가 더 있을 텐데, 현재 관건은 추론 비용이다. 아마 시장에서 수용할 수 있는 지점이 제미나이 프로 정도가 아닐까 한다. 추론 비용이 많이 들면 수익이 나지 않는다.
▶ 클로바X만의 장점이 있나
-LLM은 사이즈가 크면 당연히 성능이 좋다. 모델이 크면 추론 비용이 많이 든다. 만능 소스보다는 간장이면 간장, 고추장이면 고추장이 비즈니스모델상 좋다. 한국은 작은 시장이라 글로벌 빅테크기업이 정조준하기 어렵다. 우리는 한국어 비중이 높다. 한국 일본 시장 전용 AI가 경제적으로도 유리하다.
▶ 네이버는 AI 주권을 늘 강조한다
-AI에는 가치관이 투영된다. 나라나 종교에 따라 합의할 수 없는 가치관이 있다. 미국 모델대로 가면 미국 가치관이 주입된다. 다른 AI에 독도 영유권을 물어보면, 분쟁지역이라고 답할 것이다.
▶올트먼은 향후 AI는 맞춤화될 것이라고 봤다
-맞는 말이다. 국가마다 AI 따로 만드는 이유가 그것이다.
▶향후 네이버의 전략은 무엇인가.
-하나로 가야 한다. 멀티모달 확장이다. 글로벌 생성AI 번역기인 L사 모델보다 하이퍼클로바X 번역 성능이 우수하다. 기술 방향이 그렇다. 멀티모달이 되고 오토메이션이 되고 로봇 컨트롤러가 붙을 것이다.
▶멀티모달은 어떤 방향인가
-눈이 생기고 귀가 생길 것이다. 오디오에 해당하는 것을 내놓을 것이다. 코딩 강화 버전 역시 상반기 중에 나올 것이다.
▶다른 질문을 하겠다. 인공일반지능(AGI)에 대해선 어떻게 생각하나
-AI가 어느 정도 단계를 넘어서면 알파제로처럼 학습 없이도 스스로 터득하는 단계가 될 수 있다. 1만 IQ를 넘는 AI가 나올 수 있다. AI 능력이 ‘만랩’이 되면 어떤 일이 일어날지 모른다.
▶AI에 자의식이 있다고 생각하나
-자의식에 대한 명쾌한 정의가 없어서 어떻게 정의해야할지 모르겠다. 하지만 현재 수준에서는 코딩해서 넣지 않으면 발생하기 어렵다. AI가 현재 방향대로만 간다면, 우리가 생각하는 자의식은 없을 것이다.
▶오픈AI 수석과학자 일리야 슈츠케버는 윤리를 강조한다
-얼라이언먼트(정렬)로 선한 AI를 만들겠다는 것은 독선적이다. 너는 나쁘고 나는 옳고 해서는 안 되지 않나. 우리만 옳으니 우리만 AI를 만들어야한다는 논리는 동의하기 어렵다.
▶AI 경쟁은 어떻게 될 것 같나
-AI는 핵경쟁이다. 핵을 우리도 기술적으로는 만들 수 있는데, 못 만들지 않나. 한국은 몇 안 되는 LLM 개발 국가다. 최대한 레버리지를 일으킬 수 있도록 도와줘야한다. 규제보다는 지원을 해야한다.
▶미·중 갈등은 AI에 어떤 영향을 줄까
-미국이 중국에 GPU 수출을 금지해 타격이 있을 것으로 본다. 중국이 자체 기술보단 미국에서 GPU를 수입하고 있어 힘들 것으로 보인다.
▶비용 탓에 반도체 개발이 열기가 후끈하다
- 우리도 이동수 디렉터님이 열심히 하고 있다. 특정 기업에 붙어 있으면 가격 협상력이 없다. 그래픽처리장치(GPU)는 학습에 필요하고, 인공신경망(NPU)은 추론에 필요하다. 현재 NPU 부문에서는 삼성전자 인텔과 협업하고 있다. 인퍼런스 시장을 놓치면 클라우드 기업으로서는 힘들 것이다.
△1979년 서울출생 △서울과학고등학교 △서울대학교 컴퓨터공학 학사 △헥스플렉스 창립 1999~2004년 △레드덕 디렉터 2004~2014년 △ 엔씨소프트 2014~2017년 △ 네이버 책임리더 △ 네이버 클라우드 하이퍼스케일AI 기술총괄
'프로그래밍 > AI_DeepLearning' 카테고리의 다른 글
문학/예술 업계 현직자의 AI에 대한 솔직한 이야기 || 시인 '하상욱' 초대석 2부 (0) | 2024.03.13 |
---|---|
‘굶주린 짐승’처럼 물·전기 퍼먹는 이것, 전세계 골머리 (0) | 2024.03.08 |
EU·미국, 공동으로 AI 행동지침 만든다 "AI 법 제정까지의 공백 메울 것" (0) | 2023.06.07 |
구글, 한국어로 묻고 답하는 AI 챗봇 '바드' 공개…챗GPT와 본격 경쟁 (0) | 2023.05.11 |
생성 AI 앱이 B2B 시장에서 통하기 위한 조건 (0) | 2023.04.12 |