대학생
Bottom Fishing 2편 플리토
건국대학교_건국금융연구회
2023.09.06
※ 감수인
- 시가총액 1745억 원, 23년 주가상승 30%.
- 분기기준 거래량 회전일수 30일임 (대주주 지분 34% 제외). 거래가 많은 편임.
- 현재 밸류에이션 수준이 낮지 않음.
- 매출액은 폭발적으로 성장중임.
|
1. 산업분석
1.1 Why AI ?
1.1.1 AI산업의 핵심 AI비서
빌 게이츠 “AI 비서, 구글&아마존 대체한다”
Open-AI의 Chat-GPT와 MS의 Copilot과 같은 LLM 기반 Generative-AI에 빅 테크가 투자하는 이유를 알기 위해선, 이를 개발한 사람의 생각을 파악해야 한다. ‘AI 포워드 2023’에서 빌 게이츠는 “AI 비서를 통한 독점 구조강화”를 위해 AI에 투자한다고 소견을 밝혔다. 즉 AI 비서가 보편화되면 검색 사이트와 쇼핑 사이트를 방문하지 않아도, 웹서핑이 가능하기 때문에 유저들은 더 이상 구글과 아마존을 이용하지 않게 된다.
과거 스마트폰 OS (운영 체계) 시장을 살펴보자. Windows Mobile, MeeGo, ios 스마트폰의 개화와 동시에 수많은 OS가 출현하였지만, 결국 남아있는 OS는 ios와 Android 두 개뿐이다. 15년 전 OS 전쟁이 정확히 동일하게 23년 AI 비서에서 발생하고 있다. 올해 뉴욕 증시 강세장을 이끈 ‘매그니피센트(magnificent) 7’ 기업들 모두가 컨퍼런스 콜에서 AI를 언급하며 마지막 애플마저 AI 에 참전하겠다고 선언하였다. ‘매그니피센트 7’ 들의 투자는 거짓말을 하지 않는다. 하나의 산업에 7개의 기업이 투자한다면 만일 그 산업이 버블이라 하더라도, 반드시 시장의 파이는 커진다. 그러므로 우린 매그니피센트 7의 투자 자금을 트래킹 해야 하며 23년 그리고 향후 10년간 AI 비서에 집중해야 한다.
1.1.2 AI와 자연어처리 기술
AI 기술의 한계점이 대두되는 가장 큰 이유는 자연어 처리(NLP) 때문이다. 자연어 처리는 인간이 AI에게 질문, 명령하면 AI는 인간에게 그에 맞는 결과물을 전달하는 방식으로 사용된다. 이 과정에서 AI는 인간의 언어인 자연어를 이해하는 자연어 이해(NLU)와 AI의 언어인 인공어를 인간이 이해할 수 있는 자연어로 바꾸는 자연어 생성(NLU)이 필수적이다. 이 두 가지를 모두 일컫는 것이 바로 자연어 처리(NLP)이다.
1.1.3 자연어처리 기술의 중요성
인간이 대화, 말을 할 때 같은 단어 여도 다른 의미로 쓰이는 경우도 있고 같은 문장이지만 상황에 따라 다른 의미로 사용되는 경우도 있다. 또한 나이, 성별, 문화, 지역, 감정, 말투 등에 따라도 의미가 달라질 수도 있다. 따라서 이러한 ‘비 정형적인’ 언어를 ‘정형적이고 논리적인’ AI에게 학습시키기 어렵기 때문에 자연어 처리 기술 개발이 주목 받는 이유이다. 이로 인해, 현재 기업들은 데이터 수집, 처리 등과 같은 물리적 프로세스의 자동화 및 효율성 증대를 위해 클라우드 기반 NLP 시스템을 도입하고 있다.
1.2 Why 번역산업 ?
자연어 처리 기술에 능통한 산업이 바로 번역 산업이다. 입력된 언어(Input)를 원하는 언어(Output)로 처리하는 과정에서 자연어 처리 기술이 사용되기 때문이다. 특히 상황에 따라 다르게 번역되는 단어와 문장을 정확하게 번역하기 위해선, 방대한 양의 언어 데이터 또한 번역 기업들에겐 필수적이다. 자연어 처리 기술과 언어 데이터를 미리 선점하고 있는 번역 기업들에게 주목해야 하는 이유가 바로 이것이다.
AI 산업에 출발점에 서있는 번역 업체들이 AI라는 Big Theme에 얼마나 큰 수혜를 받을지 주목하자.
1.2.1 기계 번역 시장 [AI 번역시장]
기계 번역기 개발은 워렌 위버 (Warren Weaver) 발자취에서 시작된다. 워렌 위버는 기계번역의 창시자로써 1951년에 MIT에서 첫 연구가 진행된 뒤, 1954년 조지타운대학과 IBM이 합작하여 세계 최초로 러시아어를 영어로 번역하였다. 하지만 그 뒤 약 40년간 기대에 미치지 못한 기계번역의 성능으로 진전 없이 실패로 끝나고 말았다
1.2.2 2,3세대 번역시장
1990년 전후로 통계적 방법을 기계번역에 접근한 SMT(statistical machine translation)라는 2세대 번역 시장이 탄생했다. SMT는 문장을 통째로 번역하지 않고 ‘말뭉치’ 단위로 쪼개서 번역해, 문장을 번역하기보단 퍼즐 맞추기에 가까워, 정확성이 떨어졌다.
그럼에도 불구하고, TM(Translation Model)과 LM(Language Model)으로 구성된 SMT는 지금의 LLM의 시초가 되었다는 점에서는 번역 시장에서 매우 큰 시사점을 지닌다.
기존 2세대 기계 번역의 한계점을 보완하기 위해 NMT (Neural Machine Translation)라는 3세대 신경망 기계 번역이 등장하였다. NMT 신경망 기계 번역(3세대 기계번역)은 딥러닝 기술이 적용된 엔진을 통해 전체 문맥을 파악한 뒤, 단어의 의미 차이를 반영한다.
구체적으론, 트레이닝 된 데이터 문장을 딥러닝 알고리즘에 넣은 뒤, 번역 알고리즘이 한국어 문장을 코드화 후 영어 문장을 생성한다. 그 뒤 영어 문장과 올바른 해석 문장을 비교하며 오답의 거리를 좁혀나가 알고리즘이 스스로 영어와 한국어 사이의 규칙을 파악하고 학습하게 된다.
2016년, 구글 번역에 NMT의 도입으로, 오류는 55%->85%로 감소하는 결과를 보였으며 MS, NAVER, 바이두 등 자체 기계번역기들이 탄생하는 되어 16년을 기점으로 번역 시장이 빠르게 성장했다.
1.2.3 역사를 써내는 LLM 그리고 언어 모델의 뿌리인 번역
빅 데이터를 기반으로 다양한 콘텐츠를 예측, 생성, 번역할 수 있는 딥 러닝 알고리즘인 LLM (Large Language Model)은 번역 시장 내 언어 모델에 뿌리를 두고 있다.
LLM은 SLM – NLM – PLM – LLM이라는 언어 모델의 역사적 흐름에서 PLM의 크기와 데이터 크기를 확장한 개념이다. (LLM= 매우 큰 PLM)
(SLM: 통계적 언어 모델, NLM: 신경 언어 모델, PLM:사전 학습된 언어 모델, LLM : 대규모 언어 모델)
PLM(Pre-trained Language Model)은 텍스트 말뭉치를 자기 감독 학습을 통해 모델에 사전 훈련 후, downstream을 통해 미세조정이 된다. 이러한 훈련으로 인해, 많은 매겨 변수로 인코딩하여 언어 이해를 향상시키고 생성 품질을 개선할 수 있었다.
하지만 PLM과 다르게 LLM은 계산 리소스에 대한 막대한 수요로 인해 사전 학습을 여러 번 반복하는 것은 실현 불가능하다. 따라서 LLM을 학습시키기 전에 잘 준비된 사전 학습 코퍼스를 구축하는 것이 매우 중요하다.
그렇다면 LLM이라는 거대한 파도에 올라타기 위해선 1. LLM의 기반이 되는 번역 산업의 이해 2. 수준 높은 코퍼스 보유 3. 자연어 처리 기술을 보유한 회사를 찾아야 한다.
2. 기업분석
플리토는 자사 번역 플랫폼을 활용한 번역 서비스 및 관련 컨텐츠 사업을 영위하며, 이를 통해 수집된 언어 데이터를 판매하고 있다. 플리토의 매출 비중은 데이터 판매의 매출 비중 68%, 플랫폼 서비스 매출 비중 32% 이다. 이를 고려하면 플리토의 번역 플랫폼은 번역 서비스뿐만 아니라 언어 데이터를 수집하는 수단이 된다. 따라서 본 리포트에서는 언어 데이터 수집, 판매 측면에 더욱 초점을 맞춰서 플리토의 서비스를 소개하고 있다.
2.1 번역 플랫폼 서비스
1) 집단지성 번역 서비스
방대한 양의 언어 데이터를 수집하기 위해서는 많은 언어 생산자와 수요자가 필요하다. 이를 위해선 언어 생산자들에게 지속적인 참여를 유발할 동기를 부여해야 했고 플리토는 그들에게 금전적인 보상과 학습이라는 욕구를 충족시켜줄 수 있는 서비스를 고안했다. 이러한 측면에서 가장 중요한 서비스가 바로 집단지성 번역 서비스이다.
집단지성 번역 서비스는 플리토 자체 번역가 테스트를 통과한 100만 명의 번역가에게 텍스트, 음성, 이미지 형식의 번역을 요청할 수 있다. 특히, 해외 비즈니스 메일 작성, 유행어나 밈(Meme)을 이용한 Catchphrase 등에 탁월하여 YOY 대비 유저 수가 50% 이상 증가세를 보이고 있다. 원하는 번역 문장을 여러명의 전문가가 번역을 해주며, 국내 인공지능 번역 결과를 모두 비교하여 보여주고 있어, 가장 정확한 번역을 만나 볼 수 있다는 점이 특징이다.
집단지성 번역 서비스의 플랫폼 P, C 구조는 다음과 같다.
플리토 번역 문장 당 평균 단어는 18단어로 추정된다. 유저들은 한 문장 번역을 위해 300P (300원)를 지불해야 하며, 플리토는 번역가에게 문장 당 250원의 커미션을 지불해야 한다. (독일어, 프랑스어, 스페인어 기준)
영어의 경우엔 이보다 저렴한 200원 정도의 커미션을 지불하기 때문에 가중 평균하여 플리토가 수취하는 플랫폼 수수료는 문장당 75원이다.
2) 번역 플랫폼 서비스
플리토의 AI+는 양질의 최신 언어 데이터를 학습한 자체 AI 번역기에 생성형 AI를 결합한 서비스 설계로, 번역 요청 시 학술, 비즈니스, 일반 정보, 뉴스, 마케팅 등 원문의 ‘분야’를 선택해 원문을 보다 정확하고 적합하게 번역해 준다. AI+는 1,300만 유저들이 이용하고 있으며, 플리토는 173개국 25개의 언어 데이터 구축이 가능하다
또한 플리토는 전문 번역 서비스를 통해 유저와 번역가를 확보한다. 전문 번역가와 유저를 1:1로 매칭하는 서비스로, 이용자는 등록된 번역가의 프로필을 보고 원하는 번역가에게 번역을 요청할 수 있다. 번역가에게 직접 견적을 의뢰하여 매칭이 이루어지기 때문에 전문 번역 서비스를 이용하면 높은 퀄리티의 번역 결과물을 얻을 수 있다는 장점이 있다.
3) 번역 B2C 서비스
플리토의 B2C 향 기계번역 또한 주목해야 한다. 이미지, 음성, 영상 등의 데이터를 기반으로 실시간 이미지 번역, QR Place· 메뉴 번역, 비디오(유튜브) 자막 번역을 실시하여 빅데이터를 구축하고 있다.
특히 QR Place· 메뉴 번역은 사용자가 QR이 설치된 장소의 이미지를 촬영하여 번역을 요청하면 마찬가지로 번역된 데이터를 저장한다. 이때 카메라의 GPS 위치 정보 함께 저장하여 추후에 같은 위치에서 QR을 찍어 번역을 요청하면 저장된 번역 결과를 함께 보여주어 보다 정확한 결과를 얻을 수 있다. 플리토는 22년 QR 메뉴 번역의 서비스 조회수 500만 회 돌파를 이루어 냈다.
비디오 자막 번역은 영상 데이터의 자막을 생성하고 이를 다국어로 번역하는 서비스인데, 영상 번역 전문가가 고품질의 번역 서비스를 제공해 준다. 유튜브는 전 세계인이 사용하는 플랫폼이기에 다양한 종류, 언어, 문화의 영상 데이터를 얻을 수 있게 해준다.
4) 아케이드
위의 서비스를 통해 데이터를 수집한 플리토는 언어 데이터 판매 전 데이터의 가공, 정제 과정에서 검수를 하기 위한 서비스를 만들었다.
아케이드 서비스는 생성된 언어 데이터들을 사용자들에게 번역된 내용이 적합한지, 문맥이 적절한지, 오타 및 문법상 오류 등은 없는지 검수하게 하고 사용자들에게 소정의 보상을 주는 서비스이다. 즉 사용자 입장에서는 다양한 형태의 문제를 통해 효과적인 외국어 학습이 가능하고 획득한 포인트를 현금화할 수 있는 장점이 있다. 이러한 집단지성 참여 방식 과정을 통해 검수된 언어 데이터들은 플리토의 Corpus Management System에 저장된다. 그 후 저장된 데이터를 Open API 형식으로 B2B 클라이언트 서버에 커스터마이징하여 제공하고 있다.
2.2 언어 데이터 판매 서비스
2.2.1 언어 데이터 판매 시장현황
최근 언어 인공지능 개발을 진행하는 다수의 기업들은 1. 신경망 번역(NMT)에서 사용되는 딥러닝 기술, 2. 정확한 음성만을 반영하는 음성 인식 3. 자연어 처리 개발을 진행 중이다. 이를 위해서는 양과 질 모두를 갖춘 병렬 Corpus와 음성 데이터가 필요하다.
고객사의 요구에 부합되는 언어 데이터를 구축하기 위해서는 기본적으로 많은 어려움이 존재한다. 각 언어별로 언어 데이터를 일정 기간 내에 생산 가능한 사람을 적절히 확보하는 것이 우선이며, 확보된 사람 별로 일관된 품질을 유지하는 것 또한 매우 중요하다.
특히 음성데이터의 경우, 사람들의 다양한 언어 스타일의 차이를 최소화 한 공통적인 음성 파형을 추출하는 것이 주요 쟁점이다. 이를 위해서는 가급적 많은 사람들이 동일한 조건에서 생산한 음성데이터를 구축해야 한다.
이러한 어려움으로 인하여 양질의 언어 데이터를 대량으로 구축하기가 현실적으로 불가능하며, 언어 데이터 구축사업에 진입하려는 신규 경쟁자에게 진입장벽으로 작용하고 있다.
현재 언어 데이터를 공급하는 대부분의 공급처는 전문가 생산방식을 통하여 언어 데이터를 구축하고 있다. 언어데이터를 취급할 수 있는 소수의 전문가를 고용하여 제한된 일정과 예산 하에서 언어 데이터를 생산해 내고 있다. 이러한 방식은 품질이 일관되지 않을 뿐만 아니라 언어 데이터 구축에 상당히 오랜 기간이 소요된다.
뿐만 아니라 전문가를 고용하는 과정에서 비교적 높은 비용이 발생하는 한편 소수의 전문가 확보에 실패하는 경우 언어 데이터의 구축 자체가 불가능한 한계가 존재한다.
이와 달리 당사는 플랫폼 내 집단지성을 활용한 생산방식으로 언어 데이터를 구축하고 있다. 1천만 명 이상의 플랫폼 유저들을 통해 상시 생산되어 구축되는 당사의 집단지성 방식은 전문가 생산방식 대비 낮은 비용에도 빠르고 정확한 언어 데이터 구축을 가능케 한다.
다수의 참여자가 생산 및 상호 검증을 거쳐 더욱 정교화된 언어 데이터의 생산이 이루어지는데, 당사는 이러한 집단지성 방식의 장점을 기반으로 당사는 매년 언어 데이터의 공급량을 증가시키고 있으며, 거래를 시작하는 업체 수 또한 증가 추세를 보인다. 이러한 집단지성 방식의 언어 데이터 생산은 최대한 많은 데이터를 빠르고 정확하게 제공하는 인공지능 기술 개발의 핵심을 충족시키기에, 고객사의 언어 데이터 수요를 지속적으로 충족시킬 수 있다.
1. 다국어 병렬 코퍼스 판매
기존 언어 데이터를 유지하며 추가 수정 반영하지 않는다면 언어 데이터로서의 가치가 감소할 수밖에 없다. 그러므로 LLM 기반 Generative-AI, Chat-bot, 자연어 처리 시장이 커질수록 언어 데이터의 수요 또한 동행하며 성장하는 구조가 형성된다. 추가적으로, 국립국어원과 글로벌 IT기업 등 동일한 클라이언트들이 반복적으로 플리토의 코퍼스를 구매하는 이유 또한 언어 데이터 업데이트 성격이 크다. 이는 주요 IT기업들이 인공지능 기술 개발 자체에 초점을 두고 막상 인공지능을 학습시키기 위한 데이터 수집에는 상대적으로 소홀히 했기 때문이다.
언어 데이터양은 인공지능 개발을 위한 수요 대비 매우 부족했음에도 희소한 언어 데이터를 공급 가능한 업체가 한정적이다 보니 주요 IT기업들과 계약이 이루어졌고, 이를 통해 공급처들에게 새로운 수익을 제공하기 시작했다. 특히 공급처들의 낮은 경쟁력과 낮은 품질의 언어 데이터임에도 시장 내 초과수요로 인하여 관련 매출이 증가하고 있는 상황이다.
플리토의 코퍼스(말뭉치)는 25개의 언어로 경제, 예술, 역사 등 모든 주제별 구어제 및 문어체 데이터를 소유하고 있다. 이는 Chat-GPT, Bing Copilot 등의 AI 비서 비즈니스에 적합하기에 글로벌 IT향 거래상대방 또한 이러한 성격으로 추측된다. 수주금액 또한 23년 초 건당 20억 단위에서, 글로벌 IT기업들의 투자 확대로 24년부터는 100억 단위 계약이 체결될 것으로 예측된다.
2. 다국어 음성 및 이미지 데이터 판매
AI 스피커의 보급화와 QR 메뉴판 번역 기능으로 인해 다국어 음성 및 이미지 데이터 수요 또한 빠르게 증가하고 있다. 특히 플리토의 음성데이터는 헬스케어 분야에서 두각을 나타내는데, 뇌질환, 뇌경색 환자들의 음성데이터를 모은 뒤 일반인들의 발음을 분석한다. 그 뒤 특정 유저의 발음이 어눌해진 것을 통해 X 질환이 의심된다는 형식으로 사전 진단을 내린다. 또한 이미지 데이터 판매를 통해 게임업계에서부터 포토샵 분야에서 AI가 창작물을 만들어 낼 수 있는 빅데이터를 제공한다.
3. Valuation
최근 3개년 영업실적(단위: 10억 원))
12월 결산,IFRS 연결 |
2020A |
2021A |
2022A |
2023F |
2024F |
매출액 |
7.4 |
9.3 |
13.6 |
22.0 |
32.64 |
판관비 |
10.8 |
15.5 |
20.2 |
N/A |
25 |
영업이익 |
(3.4) |
(6.1) |
(6.6) |
0.2 |
7.64 |
영업이익률(%) |
(45.8) |
(65.8) |
(48.4) |
0.9 |
23 |
EBITDA |
(2.9) |
(5.6) |
(6.6) |
N/A |
14.8 |
당기순이익 |
(3.0) |
(5.8) |
(5.9) |
0.1 |
12.64 |
(업종 특성상 매출원가는 존재하지 않으며, 플리토 BEP는 매출액 200억)
(연결대상 종속회사 현황 : 플리토 재팬 주식회사, 역특망락기술(북경)유한공, 북경비역망락 유한공사)
(23년 실적은 시장 컨센서스에 기반)
23년 1~2분기 영업실적 및 Comment
IFRS 연결 |
1Q.23 |
2Q.23 |
매출액 |
4.7 |
2.2 |
판관비 |
(5.5) |
(4.4) |
영업이익 |
(0.9) |
(-2.6) |
영업이익률(%) |
(19.99) |
(18.18) |
당기순이익 |
(-0.1) |
(-2.4) |
- 단위 : 10억 원
- 글로벌 IT 향 코퍼스 데이터 유보로 인해, 매출 인식 4분기로 지연
- 국내 데이터 판매&플랫폼 매출액은 증가세 but, 일본 및 중국 현지 법인 실적 악화 추정
- 플리토 번역 플랫폼 ‘플리토 엔터프라이즈’ 일본 출시 이후 일본 다이와 증권 창구 매수 지속 확인
- 사우디 네옴 프로젝트팀과 파트너십 및 투자기회 모색으로 아랍어 데이터 구축 사업 진출 시동
수주잔고
구분 |
금액 |
데이터유형 |
데이터 판매 |
2.83 |
텍스트/음성 |
플랫폼 서비스 |
0.24 |
|
합계 |
30.7 |
|
Forward 추정 매출
DCF Valuation 사용을 시도하였지만, FCFF가 음수가 나오므로 추정이 불가. 이로 인해 매출액 추정 후, 보수적인 업종 OPM 가정 및 법인세율 등 비영업 손익을 고려하여 주가를 산정함. 또한 PER은 국내외 Peer 업체들의 PER을 가중 평균하여 반영함.
Peer PER (AI DATA) |
23/12(E) |
Appen Ltd;APX (호주) |
-0.78 |
RWS Holdings PLC (영국) |
15.36 |
REF Holdings (홍콩) |
7.11 |
Naver (한국) |
38.30 |
평균 PER |
15.00 |
- HM International Holdings Ltd (홍콩) PER은 96.00이므로 타 업체들과 괴리가 커, 미포함
- 크라우드웍스 (한국) PER은 현재 스팩 상장 진행중이기에 미포함
EPS 추정
1. 매출액 추정&NI 추정
- 데이터 판매 비중) KDX 한국데이터거래소 연평균 매출액 성장률 추이 참고 [3.141배]
- 플랫폼 서비스 비중) 자연어처리 (NLP) 산업 성장률(CAGR) 추이 참고 [21%]
- 데이터 판매 비중(75%)*3.141배 + 플랫폼 서비스 비중(25%)*0.21 = 2.2배 성장 예측
- 현재 데이터 판매 비중 68%이지만, 데이터 판매 시장 성장률에 맞춰 75%로 상향 조정
- 23F (혹은 24F) 매출액 326억원 예상, N/I 126억원 예상 (BEP 매출액 200억)
▷ TP : EPS(2408원)*PER (15) = 36125원 예측
기타 Valuation 참고 자료
- 23년 하반기 플리토 WACC 10.9% 예측
- 자기자본비용(CAPM) [9.1%]
- Rf : 한국 10년 국고채 수익률 3.876%
- E(Rm) : 10년치 코스닥 평균 수익률 9.5%
- B(베타) : 0.93
- 타인자본 비용 [12.37%]
- 플리토 신용평가등급 BB- : 15.87%
- 법인세율 : 22%
■ Compliance notice
|
안녕하세요, 건국금융연구회 입니다. 대학생의 젊은 시각으로, Top-down과 Bottom-up의 리서치를 작성해 헤게모니를 창출하겠습니다.
이런 글은 어떠세요?