일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
Tags
- AIVLE
- KoGPT
- KT
- Stable Diffusion
- 3기
- GPT4
- nlp
- AI
- 네이버
- naver
- Meta
- ChatGPT
- LLM
- 생성형
- SearchGPT
- 딥러닝
- deeplearning
- GPT-3.5
- OpenAI
- ML
- 생성형 AI
- TRANSFORMER
- LLaMA
- generative
- SKT
- gpt
- hyperclovaX
- 인공지능
- GPT-4
Archives
- Today
- Total
Ttoro_Tech
[AI토피아]_서울경제_뉴스기사('23.08.19) 본문
https://n.news.naver.com/mnews/hotissue/article/011/0004228095?type=series&cid=2001111
너도 나도 LLM 개발…얼마나 살아남을까 [AI토피아]
어느새 인공지능(AI) 거대언어모델(LLM) 개발에 뛰어든 국내 기업만 열 곳이 넘는다. 막대한 자금과 인력 동원이 가능한 빅테크 기업뿐 아니라 스타트업까지 나서고 있다. AI 생태계가 확장되는 건
n.news.naver.com
인공지능 거대언어모델(LLM) 개발에 뛰어든 국내 기업 - 10곳이 넘음
- 막대한 자금과 인력 동원이 가능한 빅테크 기업뿐 아니라 스타트업까지 나섬
- AI 생태계가 확장되는 건 긍정적,
- 하지만 버블이 꺼진 메타버스와 대체불가토큰(NFT)같은 길을 걷는 것 아니냐는 우려
- 네이버가 독식한 포털 분야처럼 시장의 선택을 받은 일부 LLM만 살아남을 것이라는 관측도 나옴
- 따라서 기업들은 자신만의 특화된 방식으로 LLM 경쟁력 확보에 총력을 기울이고 있음
AI 기술 주권 전쟁
- 다수의 전문가들은 이러한 현상을 긍정적으로 보고 있음
- 하정우 네이버클라우드 AI 이노베이션 센터장
글로벌 사업자에 맞서 국내 기업이 AI 주권을 가져야 한다.
GPT-4가 공개됐지만 기술 공개는 안 됐고, 한국어 같은 경우 ChatGPT에서 동일한 서비스를 이용하고도
영어 버전보다 4.5배 비용을 더 내야 한다.
생태계, 데이터 주권, 서비스 품질 관점에서 한국어 중심 AI를 만드는 작업이 필요
- 반대로 모든 기업이 성공하기에는 현실적 한계가 있다는 지적
- 고성능 LLM에는 풍부한 데이터셋이 필수적, 이를 얻기 위한 인프라나 자금력이 부족한 경우가 많음
- 한 전문가
AI가 많은 데이터를 학습해야 뛰어난 성능을 지닌 LLM을 만들 수 있다.
중소기업이나 스타트업들이 충분한 데이터를 확보할 수 있을지 의문
또 다른 업계 관계자
네이버는 20년 넘게 포털 시장을 장악했을 뿐 아니라 지식인, 블로그 등 각종 서비스를 운영하며
쌓아온 막대한 데이터를 가지고 있다.
카카오의 경우 카카오톡이라는 무기가 있지만 개인정보가 포함된 대화가 오가는
메신저 특성상 이용하는 데 한계가 있을 수 있다.
이는 국내 초거대 AI 모델을 학습시키기에 네이버만큼 유리한 곳이 없다는 의견
AI 스타트업 업스테이지
- 데이터 부족 문제를 해결하기 위해 지난 14일 '1T 클럽' 발족
- 1T : 1 Trillion Token (1 트릴리언 토큰) 의미
- 텍스트, 책, 기사 등 다양한 형태의 한국어 데이터 제공에 기여하는 파트너사들로 1T클럽을 구성할 계획
- 이를 통해 업스테이지는 한국어 데이터를 확보, 고품질 LLM 개발에 나설 방침
- 파트너사에게는 데이터 제공량에 비례해 API 사용료를 할인해주고 LLM의 API 사업으로 창출되는 수익을 공유한느 혜택을 제공할 예정
국대 다양한 LLM
LG | Naver | KAKAO | KT |
EXAONE 2.0 | HyperClovaX | KoGPT 2.0 | 믿음 |
4500만건에 달하는 논문, 특허 등 전문 자료를 학습시킨 전문가용 모델 | 생성 AI 기반 검색 서비스 "Cue:"를 시범서비스 할 예정 | 파라미터를 낮춘 중소형 LLM 모델로 쪼개 카카오톡 등 기존 서비스에 녹일 계획 | |
Parameter 300B | 이전 HyperClova의 경우 204B |
스타트업들의 소형언어모델 (sLLM)
- LLM은 학습에 사용되는 Parameter 수가 많아 컴퓨팅 리소스 등 하드웨어적 한계와 비용 문제가 있음
- 하지만 sLLM은 이러한 부분을 보완하고, 특정 영역에서 대규모 데이터를 학습시켜 일상 대화, 전문 용어 등 특정 도메인과 언어에 대한 성능을 기대할 수 있다는 점을 내세움
- 전창배 IAAE 국제인공지능&윤리협회 이사장
LLM이 모든 분야를 아울러 서비스하는 모델이라면
sLLM은 법률용, 게임용 등 특정 분야 전용 버티컬로 더 수월하게 쓰일 수 있음
스캐터랩
- ChatGPT 돌풍이 불기 전 지난해 10월 자체 개발한 sLLM '루다 Gen1'
- 이를 기반으로 AI ChatBot '이루다 2.0' 출시
- 개발 당시 이용자와의 자연스러운 대화에 초점,
현재는 여기에 지식 데이터를 학습해 논리적 상호작용까지 가능한 sLLM '핑퐁-1' 개발 중 - 김종윤 스캐터랩 대표
AI 기술 경쟁은 모델 싸움에서 결국 독점적 데이터 경쟁으로 전환될 것
장기적 관점에서 감성 대화에 특화된 데이터셋을 무기로한 sLLM 개발에 투자하고 있다.
NC소프트 VARCO (바르코)
- 지난 16일 NC소프트가 게임 시나리오와 이미지, 가상 인간 등 게임 개발에 특화된 중소형 LLM 바르코를 공개
- https://ttoro.tistory.com/114
[NC 생성형 AI]_NEWSIS_뉴스기사('23.08.17)
https://n.news.naver.com/mnews/article/003/0012034988?sid=105 생성형 AI 경쟁 뛰어든 엔씨….리니지 부진 만회할 또다른 카드? 엔씨소프트가 한국 게임사 최초로 자체 개발한 인공지능(AI) 대규모 언어모델(LLM)
ttoro.tistory.com
뤼튼테크놀로지스
- 구글의 LLM 팜2(PaLM 2) 비영어권 언어모델과 OpenAI의 GPT-4, GPT-3.5을 자사 서비스에 탑재
- 이용자들이 다양한 모델을 활용하도록 지원하는 AI 스타트업
최병호 고려대 인공지능연구소 교수
AI 분야는 데이터가 없으면 안 되는 게임
고사양 컴퓨터, 그래픽처리장치(GPU), 고급 인력 등이 필요해 대규모 투자도 뒷받침돼야 한다.
기업과 스타트업들이 버티컬 등 각자만의 LLM 개발, 운용 방식으로 경쟁력을 확보해야할 것
'Tech News > 국내 기업' 카테고리의 다른 글
[국내 첫 AutoGPT]_AITIMES_뉴스기사('23.08.17) (2) | 2023.08.23 |
---|---|
[프롬프트 엔지니어링]_AITIMES_뉴스기사('23.08.17) (0) | 2023.08.22 |
[코난 기업용 LLM]_AITIMES_뉴스기사('23.08.17) (0) | 2023.08.18 |
[HyperClovaX]_서울경제_뉴스기사('23.08.18) (0) | 2023.08.18 |
[맞춤형 치료 AI]_AITIMES_뉴스기사('23.08.15) (0) | 2023.08.17 |