a smol course documentation
Parameter-Efficient Fine-Tuning, PEFT
Parameter-Efficient Fine-Tuning, PEFT
์ธ์ด ๋ชจ๋ธ์ด ์ปค์ง๋ฉด์ ์ ํต์ ์ธ ๋ฏธ์ธ ์กฐ์ ๋ฐฉ์์ ์ ์ฉํ๋ ๊ฒ์ด ์ ์ ์ด๋ ค์์ง๊ณ ์์ต๋๋ค. 1.7B ๋ชจ๋ธ์กฐ์ฐจ๋ ์ ์ฒด ๋ฏธ์ธ ์กฐ์ ์ ์ํํ๋ ค๋ฉด ์๋นํ GPU ๋ฉ๋ชจ๋ฆฌ๊ฐ ํ์ํ๋ฉฐ, ๋ชจ๋ธ ์ฌ๋ณธ์ ๋ณ๋๋ก ์ ์ฅํ๊ธฐ ์ํ ๋น์ฉ์ด ๋ง์ด ๋ค๊ณ , ๋ชจ๋ธ์ ์๋ ๋ฅ๋ ฅ์ ์์คํ๋ ์ํ์ด ์กด์ฌํฉ๋๋ค. Parmeter-Efficient Fine-Tuning(PEFT) ๋ฐฉ๋ฒ์ ๋๋ถ๋ถ์ ๋ชจ๋ธ ํ๋ผ๋ฏธํฐ๊ฐ ๊ณ ์ ๋ ์ํ์์ ๋ชจ๋ธ ํ๋ผ๋ฏธํฐ์ ์ผ๋ถ๋ง ์์ ํ์ฌ ์ ์ฒด ๋ฏธ์ธ ์กฐ์ ๊ณผ์ ์์ ๋ฐ์ํ๋ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋๋ค.
ํ์ต ๊ณผ์ ์์ ๋ชจ๋ธ์ ๋ชจ๋ ํ๋ผ๋ฏธํฐ๋ฅผ ์ ๋ฐ์ดํธํ๋ ์ ํต์ ์ธ ๋ฏธ์ธ ์กฐ์ ๋ฐฉ๋ฒ์ ๋ํ ์ธ์ด ๋ชจ๋ธ์ ์ ์ฉํ๋ ๊ฒ์ ํ์ค์ ์ผ๋ก ์ด๋ ต์ต๋๋ค. PEFT๋ ์๋ ๋ชจ๋ธ ํฌ๊ธฐ์ 1% ๋ฏธ๋ง์ ํด๋นํ๋ ํ๋ผ๋ฏธํฐ๋ง ํ์ต์์ผ ๋ชจ๋ธ์ ์กฐ์ ํ๋ ๋ฐฉ๋ฒ์ ๋๋ค. ํ์ต ๊ฐ๋ฅํ ํ๋ผ๋ฏธํฐ๋ฅผ ํฌ๊ฒ ์ค์ด๋ ๊ฒ์ ๋ค์๊ณผ ๊ฐ์ ์ด์ ์ ์ ๊ณตํฉ๋๋ค:
- ์ ํ๋ GPU ๋ฉ๋ชจ๋ฆฌ๋ฅผ ๊ฐ์ง ํ๋์จ์ด์์๋ ๋ฏธ์ธ ์กฐ์ ๊ฐ๋ฅ
- ํจ์จ์ ์ธ ํ์คํฌ๋ณ ์ ์ ๋ชจ๋ธ ์ ์ฅ
- ๋ฐ์ดํฐ๊ฐ ์ ์ ์ํฉ์์๋ ๋ฐ์ด๋ ์ผ๋ฐํ ์ฑ๋ฅ ์ ๊ณต
- ๋ ๋น ๋ฅธ ํ์ต ๋ฐ ๋ฐ๋ณต ๊ฐ๋ฅ
์ฌ์ฉ ๊ฐ๋ฅํ ๋ฐฉ๋ฒ
์ด ๋ชจ๋์์๋ ๋ง์ด ์ฌ์ฉ๋๋ ๋ ๊ฐ์ง PEFT ๋ฐฉ๋ฒ์ ๋ค๋ฃน๋๋ค:
1๏ธโฃ LoRA (Low-Rank Adaptation)
LoRA๋ ํจ์จ์ ์ธ ๋ชจ๋ธ ์ ์์ ์ํ ๋ฉ์ง ์๋ฃจ์ ์ ์ ๊ณตํ๋ฉด์ ๊ฐ์ฅ ๋ง์ด ์ฌ์ฉ๋๋ PEFT ๋ฐฉ๋ฒ์ผ๋ก ์๋ฆฌ ์ก์์ต๋๋ค. LoRA๋ ์ ์ฒด ๋ชจ๋ธ์ ์์ ํ๋ ๋์ ํ์ต ๊ฐ๋ฅํ ํ๋ผ๋ฏธํฐ๋ฅผ ๋ชจ๋ธ์ ์ดํ ์ ๋ ์ด์ด์ ์ฃผ์ ํฉ๋๋ค. ์ด ์ ๊ทผ๋ฒ์ ์ ์ฒด ๋ฏธ์ธ ์กฐ์ ๊ณผ ๋น์ทํ ์ฑ๋ฅ์ ์ ์งํ๋ฉด์ ํ์ต ๊ฐ๋ฅํ ํ๋ผ๋ฏธํฐ๋ฅผ ์ฝ 90%๊น์ง ์ค์ ๋๋ค. LoRA (Low-Rank Adaptation) ์น์ ์์ LoRA์ ๋ํด ์์ธํ ์์๋ณด๊ฒ ์ต๋๋ค.
2๏ธโฃ ํ๋กฌํํธ ํ๋
ํ๋กฌํํธ ํ๋์ ๋ชจ๋ธ ๊ฐ์ค์น๋ฅผ ์์ ํ๋ ๋์ ์ ๋ ฅ์ ํ์ต ๊ฐ๋ฅํ ํ ํฐ์ ์ถ๊ฐํ์ฌ ๋ ๊ฒฝ๋ํ๋ ์ ๊ทผ๋ฒ์ ์ ๊ณตํฉ๋๋ค. ํ๋กฌํํธ ํ๋์ LoRA๋งํผ ์ ๋ช ํ์ง๋ ์์ง๋ง, ๋ชจ๋ธ์ ์๋ก์ด ํ์คํฌ๋ ๋๋ฉ์ธ์ ๋น ๋ฅด๊ฒ ์ ์ฉํ ๋ ์ ์ฉํ๊ฒ ์ฐ์ผ ์ ์๋ ๊ธฐ์ ์ ๋๋ค. ํ๋กฌํํธ ํ๋ ์น์ ์์ ํ๋กฌํํธ ํ๋์ ๋ํด ํ๊ตฌํด๋ณผ ์์ ์ ๋๋ค.
์ฐธ๊ณ
- Hugging Face PEFT ๋ฌธ์
- LoRA ๋ ผ๋ฌธ
- QLoRA ๋ ผ๋ฌธ
- ํ๋กฌํํธ ํ๋ ๋ ผ๋ฌธ
- Hugging Face PEFT ๊ฐ์ด๋
- How to Fine-Tune LLMs in 2024 with Hugging Face
- TRL