Computer Science/Data Science
[Machine Learning] ์์๋ธ ๊ธฐ๋ฒ์ด๋?
_cactus
2022. 6. 20. 20:36
๋ฐ์ํ
Ensemble ๊ธฐ๋ฒ
Ensemble Learning์ด๋
- ์ฌ๋ฌ๊ฐ์ ๋ถ๋ฅ๊ธฐ๋ฅผ ์์ฑํ๊ณ ๊ทธ ์์ธก์ ๊ฒฐํฉํ์ฌ ๋ณด๋ค ์ ํํ ์์ธก์ ๋ด๋ ๊ธฐ๋ฒ
- ๊ฐ๋ ฅํ ํ๋์ ๋ชจ๋ธ์ ์ฌ์ฉํ๋ ๋์ ๋ณด๋ค ์ฝํ ๋ชจ๋ธ์ ์ฌ๋ฌ๊ฐ ์กฐํฉํ๋ ๋ฐฉ์
Ensemble Learning ์ข ๋ฅ
์์๋ธ ํ์ต์ 3๊ฐ์ง ์ ํ์ผ๋ก ๋ถ๋ฅ๋จ
- Voting
- Bagging
- Boosting
Voting
- ์ฌ๋ฌ๊ฐ์ classifier๊ฐ ํฌํ๋ฅผ ํตํด ์ต์ข ์์ธก๊ฒฐ๊ณผ ๊ฒฐ์
- ์๋ก ๋ค๋ฅธ ์๊ณ ๋ฆฌ์ฆ ์ฌ๋ฌ๊ฐ ๊ฒฐํฉํ์ฌ ์ฌ์ฉ
- Voting ๋ฐฉ์
- Hard Voting : ๋ค์์ classifier๊ฐ ์์ธกํ ๊ฒฐ๊ณผ๊ฐ์ ์ต์ข ๊ฒฐ๊ณผ๋ก ์ ์ (๋ค์๊ฒฐ์ ๋ฒ์น)
- Soft Voting : ๋ชจ๋ classifier๊ฐ ์์ธกํ label๊ฐ์ ๊ฒฐ์ ํ๋ฅ ํ๊ท ์ ๊ตฌํ ๋ค ๊ฐ์ฅ ํ๋ฅ ์ด ๋์ label๊ฐ์ ์ต์ข ๊ฒฐ๊ณผ๋ก ์ ์
Bagging
: Bootstrap Aggregating
- Bootstrap(๋ฐ์ดํฐ ์ํ๋ง)์ ํตํด ๋ชจ๋ธ ํ์ต, ๊ฒฐ๊ณผ ์ง๊ณ(Aggregate)ํ๋ ๋ฐฉ๋ฒ
- Bootstrap?
: ๋ฐ์ดํฐ ๋ด์์ ๋ฐ๋ณต์ ์ผ๋ก ์ํ์ ์ฌ์ฉํ๋ resampling ๊ธฐ๋ฒ
- Bootstrap?
- ๋ชจ๋ ๊ฐ์ ์ ํ์ ์๊ณ ๋ฆฌ์ฆ ๊ธฐ๋ฐ์ classifier ์ฌ์ฉ
- ๋ฐ์ดํฐ ๋ถํ ์ ์ค๋ณตํ์ฉ (Bootstrap)
- Aggregate์ง๊ณ ๋ฐฉ์
- ์ด์ฐํ ๋ฐ์ดํฐ : ๋ค์๊ฒฐ ํฌํ๋ฐฉ์์ผ๋ก ๊ฒฐ๊ณผ ์ง๊ณ
- ์ฐ์ํ ๋ฐ์ดํฐ : ํ๊ท ๊ฐ ์ง๊ณ
- ๊ณผ์ ํฉ ๋ฐฉ์ง์ ํจ๊ณผ์
- ๋ํ ์๊ณ ๋ฆฌ์ฆ : Random Forest
๐ Random Forest ์๊ณ ๋ฆฌ์ฆ ์ค๋ช ์ด ๊ถ๊ธํ๋ค๋ฉด..!๐
2021.03.08 - [Computer Science/Data Science] - Random Forest ๊ฐ.๋จ.๋ช .๋ฃ
Boosting
- ์ฌ๋ฌ๊ฐ์ classifier๊ฐ ์์ฐจ์ ์ผ๋ก ํ์ต ์ํ
- ์ด์ ๋ถ๋ฅ๊ธฐ๊ฐ ์์ธก์ ํ๋ฆฐ ๋ฐ์ดํฐ์ ๋ํด์ ์ฌ๋ฐ๋ฅด๊ฒ ์์ธกํ ์ ์๋๋ก ๋ค์ ๋ถ๋ฅ๊ธฐ์๊ฒ ๊ฐ์ค์น๋ฅผ ๋ถ์ฌํ๋ฉด์ ํ์ต&์์ธก ์งํ
- ์ด๋ฐ์์ผ๋ก ๊ณ์ํด์ ๋ถ๋ฅ๊ธฐ์ ๊ฐ์ค์น๋ฅผ ๋ถ์คํ ํ๋ฉฐ ํ์ต์ ์งํํ๋ ๋ฐฉ์์ “๋ถ์คํ ๋ฐฉ์"์ด๋ผ๊ณ ํจ
- ๋ณดํต ๋ถ์คํ ๋ฐฉ์์ ๋ฐฐ๊น ์ ๋นํด ์ฑ๋ฅ์ด ์ข์ง๋ง, ์๋๊ฐ ๋๋ฆฌ๊ณ ๊ณผ์ ํฉ ๋ฐ์ ๊ฐ๋ฅ์ฑ ์กด์ฌ
- ๋ํ ์๊ณ ๋ฆฌ์ฆ : XGBoost, LightGBM
๐ LightGBM ์๊ณ ๋ฆฌ์ฆ ์ค๋ช ์ด ๊ถ๊ธํ๋ค๋ฉด..!๐
reference: http://www.dinnopartners.com/__trashed-4/
728x90
๋ฐ์ํ