Ttoro_Tech

[AI토피아]_서울경제_뉴스기사('23.08.19) 본문

Tech News/국내 기업

[AI토피아]_서울경제_뉴스기사('23.08.19)

Lee_Ttoro 2023. 8. 21. 09:40

https://n.news.naver.com/mnews/hotissue/article/011/0004228095?type=series&cid=2001111 

 

너도 나도 LLM 개발…얼마나 살아남을까 [AI토피아]

어느새 인공지능(AI) 거대언어모델(LLM) 개발에 뛰어든 국내 기업만 열 곳이 넘는다. 막대한 자금과 인력 동원이 가능한 빅테크 기업뿐 아니라 스타트업까지 나서고 있다. AI 생태계가 확장되는 건

n.news.naver.com

인공지능 거대언어모델(LLM) 개발에 뛰어든 국내 기업 - 10곳이 넘음

  • 막대한 자금과 인력 동원이 가능한 빅테크 기업뿐 아니라 스타트업까지 나섬
  • AI 생태계가 확장되는 건 긍정적,
  • 하지만 버블이 꺼진 메타버스와 대체불가토큰(NFT)같은 길을 걷는 것 아니냐는 우려
  • 네이버가 독식한 포털 분야처럼 시장의 선택을 받은 일부 LLM만 살아남을 것이라는 관측도 나옴
  • 따라서 기업들은 자신만의 특화된 방식으로 LLM 경쟁력 확보에 총력을 기울이고 있음

AI 기술 주권 전쟁

  • 다수의 전문가들은 이러한 현상을 긍정적으로 보고 있음
  • 하정우 네이버클라우드 AI 이노베이션 센터장

 

글로벌 사업자에 맞서 국내 기업이 AI 주권을 가져야 한다.
GPT-4가 공개됐지만 기술 공개는 안 됐고, 한국어 같은 경우 ChatGPT에서 동일한 서비스를 이용하고도
영어 버전보다 4.5배 비용을 더 내야 한다.
생태계, 데이터 주권, 서비스 품질 관점에서 한국어 중심 AI를 만드는 작업이 필요


  • 반대로 모든 기업이 성공하기에는 현실적 한계가 있다는 지적
  • 고성능 LLM에는 풍부한 데이터셋이 필수적, 이를 얻기 위한 인프라나 자금력이 부족한 경우가 많음
  • 한 전문가
AI가 많은 데이터를 학습해야 뛰어난 성능을 지닌 LLM을 만들 수 있다.
중소기업이나 스타트업들이 충분한 데이터를 확보할 수 있을지 의문


또 다른 업계 관계자

네이버는 20년 넘게 포털 시장을 장악했을 뿐 아니라 지식인, 블로그 등 각종 서비스를 운영하며
쌓아온 막대한 데이터를 가지고 있다.
카카오의 경우 카카오톡이라는 무기가 있지만 개인정보가 포함된 대화가 오가는
메신저 특성상 이용하는 데 한계가 있을 수 있다.


이는 국내 초거대 AI 모델을 학습시키기에 네이버만큼 유리한 곳이 없다는 의견

 

AI 스타트업 업스테이지

  • 데이터 부족 문제를 해결하기 위해 지난 14일 '1T 클럽' 발족
  • 1T : 1 Trillion Token (1 트릴리언 토큰) 의미
  • 텍스트, 책, 기사 등 다양한 형태의 한국어 데이터 제공에 기여하는 파트너사들로 1T클럽을 구성할 계획
  • 이를 통해 업스테이지는 한국어 데이터를 확보, 고품질 LLM 개발에 나설 방침
  • 파트너사에게는 데이터 제공량에 비례해 API 사용료를 할인해주고 LLM의 API 사업으로 창출되는 수익을 공유한느 혜택을 제공할 예정

국대 다양한 LLM

LG Naver KAKAO KT
EXAONE 2.0 HyperClovaX KoGPT 2.0 믿음
4500만건에 달하는 논문, 특허 등 전문 자료를 학습시킨 전문가용 모델 생성 AI 기반 검색 서비스 "Cue:"를 시범서비스 할 예정 파라미터를 낮춘 중소형 LLM 모델로 쪼개 카카오톡 등 기존 서비스에 녹일 계획  
Parameter  300B 이전 HyperClova의 경우 204B

 

스타트업들의 소형언어모델 (sLLM)

  • LLM은 학습에 사용되는 Parameter 수가 많아 컴퓨팅 리소스 등 하드웨어적 한계와 비용 문제가 있음
  • 하지만 sLLM은 이러한 부분을 보완하고, 특정 영역에서 대규모 데이터를 학습시켜 일상 대화, 전문 용어 등 특정 도메인과 언어에 대한 성능을 기대할 수 있다는 점을 내세움
  • 전창배 IAAE 국제인공지능&윤리협회 이사장
LLM이 모든 분야를 아울러 서비스하는 모델이라면
sLLM은 법률용, 게임용 등 특정 분야 전용 버티컬로 더 수월하게 쓰일 수 있음

스캐터랩

  • ChatGPT 돌풍이 불기 전 지난해 10월 자체 개발한  sLLM '루다 Gen1'
  • 이를 기반으로 AI ChatBot '이루다 2.0' 출시
  • 개발 당시 이용자와의 자연스러운 대화에 초점,
    현재는 여기에 지식 데이터를 학습해 논리적 상호작용까지 가능한 sLLM '핑퐁-1' 개발 중
  • 김종윤 스캐터랩 대표
AI 기술 경쟁은 모델 싸움에서 결국 독점적 데이터 경쟁으로 전환될 것
장기적 관점에서 감성 대화에 특화된 데이터셋을 무기로한  sLLM 개발에 투자하고 있다.



NC소프트 VARCO (바르코)

  • 지난 16일 NC소프트가 게임 시나리오와 이미지, 가상 인간 등 게임 개발에 특화된 중소형 LLM 바르코를 공개
  • https://ttoro.tistory.com/114
 

[NC 생성형 AI]_NEWSIS_뉴스기사('23.08.17)

https://n.news.naver.com/mnews/article/003/0012034988?sid=105 생성형 AI 경쟁 뛰어든 엔씨….리니지 부진 만회할 또다른 카드? 엔씨소프트가 한국 게임사 최초로 자체 개발한 인공지능(AI) 대규모 언어모델(LLM)

ttoro.tistory.com

 

뤼튼테크놀로지스

  • 구글의 LLM 팜2(PaLM 2) 비영어권 언어모델과 OpenAI의 GPT-4, GPT-3.5을 자사 서비스에 탑재
  • 이용자들이 다양한 모델을 활용하도록 지원하는 AI 스타트업

 

최병호 고려대 인공지능연구소 교수

AI 분야는 데이터가 없으면 안 되는 게임
고사양 컴퓨터, 그래픽처리장치(GPU), 고급 인력 등이 필요해 대규모 투자도 뒷받침돼야 한다.
기업과 스타트업들이 버티컬 등 각자만의 LLM 개발, 운용 방식으로 경쟁력을 확보해야할 것