챗GPT 러닝데이 | 한국어 LLM 민주화의 시작 KoAlpaca

자연어/LLM

챗GPT 러닝데이 | 한국어 LLM 민주화의 시작 KoAlpaca

2jin2 2023. 10. 2. 21:47

이준범(Beomi)님의 강연 - 2023.05.30

- KoAlpaca -> 어떻게 만들었는지, 어떻게 쓰이는지? 에 대한 강연 내용.

- LLM이란? LM이란? Instruction 이란?

- LM : 언어모델의 약자. 다음 단어 맞추기

앞에 나온 단어들로 그 다음에 나오는 단어를 예측하는 것.

- LLM : 큰 언어모델의 약자.

- Instruction : 모델이 좀 더 똑똑하게 실행할 수 있는 능력을 갖게되는 것.

질문을 하면 그거에 대한 답을 알려줘. ex) ~해줘. 하면 ~해줌

그리고 파인튜닝에 대해서도 공부하기. 완

- LLM은 다양한 지식을 알고 있고, 언어 이해 능력이 뛰어남. 예제 몇 개만으로도 뛰어난 성능. 쉬운 API 서비스

- ICL : 너는 ~ 해. 이것의 예제로는 ** && @@이 있어. => 진짜 함.

- LLM의 현실적 이슈 -> 인력, 예산, 데이터

- LLM을 이용하는 다양한 방법

#1) API 서비스를 활용하기

나와있는 서비스를 곧바로 적용하는 것. ex) ChatGPT, GPT-4, HyperClova ... 등등

-> 하지만 외부 API에 의존하는 건 많은 이슈 발생 가능성 업.

#2) 작은 전용 LM을 쓰기

1B 이내의 작은 LM으로 서비스를 만드는 것.

#3) 오픈소스 LLM 활용

100B 이내의 작은(?) LLM으로 서비스를 만들기. ex) LLAMA, Polyglot-ko

-> Domain 관련 Text 필요.

-> 등등등

Domain에 대해서도 공부하기 완

인코딩, 디코딩 개념 공부하기 완

- Alpaca : Instruction-Following Model

LLAMA 7B 모델을 Full Finetune

단순히 말을 잇기만 하는 것이 나닌, Instruct에 맞게 행동하는 LM

- KoAlpaca : 한국어 Instruct를 따르는 한국어 LM

한국어 Instruction Set을 제작함.

KoAlpaca v1.0 : Alpaca 번역 기반으로 데이터 생성 & 학습

KoAlpaca v1.1a : 네이버 지식인 기반으로 데이터 생성 & 학습

KoAlpaca v1.1b : 1a 기반에 맥락을 이해하도록 추가 학습

대표적인 오픈소스 한국어 LM인 Polyglot-ko 모델들을 기반으로 학습

- 언어 모델의 크기가 작아도, 좋은 Finetune 데이터로 새 능력을 넣어줄 수 있다.

'파인튜닝을 통해서 데이터의 내용을 학습시킨다' 라는게 초점이 아님.

어떤 형식으로 들어왔을 때, 어떤 결과물을 생성할 수 있는 방향성을 모델에게 알려주는 얼라이먼트 데이터셋이 중요함

- Emergent VS Instruct-Tuning

- LLM Emergent : 일정한 수준 이상이면 별도의 학습 없이 모델의 내재된 능력만으로도 작업이 가능함.

현실적인 가성비

- 데이터 가성비

- 학습 비용 가성비

- 서빙 비용 가성비

저작자표시

'자연어 > LLM' 카테고리의 다른 글

LLM 프로젝트 공부 - 섹션 3.Llama 2 논문 리뷰 (2)	2023.10.10
LLM 프로젝트 공부 - 섹션 2. Llama 1 모델 리뷰 (2)	2023.10.10
LLM 프로젝트 공부 - 섹션 1. LLM 개요 (4)	2023.10.10
LLM 프로젝트 공부 - OpenAI의 ChatGPT를 Fine-tuning 해보기 (0)	2023.10.04
LLM 프로젝트 공부 - 용어 공부 (2)	2023.10.02

현재글챗GPT 러닝데이 | 한국어 LLM 민주화의 시작 KoAlpaca

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

2jin2story