Computer Science/Data Science

[Machine Learning] ๋จธ์‹ ๋Ÿฌ๋‹, ๋ชจ๋ธ์˜ ํŽธํ–ฅ(bias)๊ณผ ๋ถ„์‚ฐ(variance) : trade-off ๊ด€๊ณ„

_cactus 2021. 5. 12. 20:13
๋ฐ˜์‘ํ˜•

๋จธ์‹ ๋Ÿฌ๋‹์—์„œ ํŽธํ–ฅ๊ณผ ๋ถ„์‚ฐ์€ ์–ธ์ œ ์“ฐ์ด๋Š” ์šฉ์–ด์ธ๊ฐ€?

Supervised Learning(์ง€๋„ํ•™์Šต)์— ๋Œ€ํ•ด์„œ ๊ฐ„๋‹จํžˆ ์„ค๋ช…ํ•ด๋ณด์ž๋ฉด ์‚ฌ๋žŒ์ด ์ •ํ•ด์ค€ ์ •๋‹ต์ด ์žˆ๊ณ , ์šฐ๋ฆฌ์˜ ๋ชจ๋ธ์€ ๊ทธ ์ •๋‹ต์„ ์ž˜ ๋งž์ถ”๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ํ•™์Šต(training)์„ ํ•œ๋‹ค. ์ด๋•Œ, ํ•™์Šต์„ ํ•˜๋ฉด์„œ ๋ชจ๋ธ์ด ๋‚ด๋†“๋Š” ์˜ˆ์ธก๊ฐ’๋“ค์˜ ๊ฒฝํ–ฅ์„ ํ‘œํ˜„ํ•˜๊ธฐ์œ„ํ•ด ํŽธํ–ฅ๊ณผ ๋ถ„์‚ฐ์ด๋ผ๋Š” ์šฉ์–ด๋ฅผ ์‚ฌ์šฉํ•œ๋‹ค.


์‰ฝ๊ฒŒ ๋งํ•˜์ž๋ฉด, ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค
A. ์˜ˆ์ธก๊ฐ’๊ณผ ์ •๋‹ต ๊ฐ„์˜ ๊ด€๊ณ„๋ฅผ "ํŽธํ–ฅ"์œผ๋กœ ํ‘œํ˜„ (bias : model์˜ output๊ณผ ์‹ค์ œ๊ฐ’ ์‚ฌ์ด์˜ ์ œ๊ณฑ error, ์ •ํ™•๋„์™€ ๋น„์Šทํ•œ ๊ฐœ๋…)
B. ์˜ˆ์ธก๊ฐ’๋ผ๋ฆฌ์˜ ๊ด€๊ณ„๋ฅผ "๋ถ„์‚ฐ"์œผ๋กœ ํ‘œํ˜„ (variance : model์ด ๊ฐ๊ธฐ ๋‹ค๋ฅธ train set์— ๋Œ€ํ•˜์—ฌ ์„ฑ๋Šฅ์˜ ๋ณ€ํ™”์ •๋„๊ฐ€ ๊ธ‰ํ•˜๊ฒŒ ๋ณ€ํ•˜๋Š”์ง€, ์•ˆ์ •์ ์œผ๋กœ ๋ณ€ํ•˜๋Š”์ง€๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ์ฒ™๋„)

 

[๋”ฅ๋Ÿฌ๋‹] Bias-Variance Tradeoff ์™€ ์•™์ƒ๋ธ”

โ— Bias-Variance Tradeoff ๋จธ์‹ ๋Ÿฌ๋‹์„ ์ด์šฉํ•ด ๋ถ„๋ฅ˜๊ธฐ๋ฅผ ๋งŒ๋“ค๋•Œ, ํ…Œ์ŠคํŠธ ํ•˜๋Š” ๊ณผ์ •์„ ๊ฑฐ์น˜๋ฉฐ ๋งŽ์€ ์—๋Ÿฌ๋“ค์ด ๋‚˜์˜ค๊ฒŒ ๋˜๋Š”๋ฐ ์ด๋Ÿฐ ์—๋Ÿฌ๋“ค์„ MSE๋กœ ๋ถ„์„ํ•ด๋ณด๋ฉด Bias์™€ Variance์˜ ์‹์œผ๋กœ ์ •๋ฆฌ๋ฉ๋‹ˆ๋‹ค. Learning Err

ebbnflow.tistory.com

๋ฐ˜์‘ํ˜•

ํ™œ์˜๊ธฐ๋กœ ๋น„์œ 

ํŽธํ–ฅ๊ณผ ๋ถ„์‚ฐ์„ ๋น„์œ ํ•  ๋•Œ ๊ฐ€์žฅ ํ”ํžˆ ๋“ฑ์žฅํ•˜๋Š” "ํ™œ์˜๊ธฐ"๋กœ ๋น—๋Œ€์–ด๋ณด์ž
- ๋นจ๊ฐ„ ์  : ์‚ฌ๋žŒ์ด ์ •ํ•ด์ค€ ์ •๋‹ต (true)
- ํŒŒ๋ž€ ์  : ์ปดํ“จํ„ฐ๊ฐ€ ์˜ˆ์ธกํ•œ ๊ฐ’ (predicted value)

bias vs variance

์œ„ ๊ทธ๋ฆผ์„ ํ•ด์„ํ•ด๋ณด์ž.
1. ์™ผ์ชฝ ์œ„
A. ์˜ˆ์ธก๊ฐ’๊ณผ ์ •๋‹ต๊ฐ„์˜ ๊ด€๊ณ„ : ์˜ˆ์ธก๊ฐ’๋“ค์ด ๋Œ€์ฒด์ ์œผ๋กœ ์ •๋‹ต ๊ทผ๋ฐฉ์— ๋ถ„ํฌํ•œ๋‹ค โžก ํŽธํ–ฅ์ด ๋‚ฎ๋‹คโฌ‡
B. ์˜ˆ์ธก๊ฐ’๋“ค๊ฐ„์˜ ๊ด€๊ณ„ : ์˜ˆ์ธก๊ฐ’๋“ค๊นŒ๋ฆฌ ์„œ๋กœ ๋ชฐ๋ ค์žˆ๋‹ค โžก ๋ถ„์‚ฐ์ด ๋‚ฎ๋‹คโฌ‡

2. ์˜ค๋ฅธ์ชฝ ์œ„ - overfitting
A. ์˜ˆ์ธก๊ฐ’๊ณผ ์ •๋‹ต๊ฐ„์˜ ๊ด€๊ณ„ : ์˜ˆ์ธก๊ฐ’๋“ค์ด ๋Œ€์ฒด์ ์œผ๋กœ ์ •๋‹ต ๊ทผ๋ฐฉ์— ๋ถ„ํฌํ•œ๋‹ค โžก ํŽธํ–ฅ์ด ๋‚ฎ๋‹คโฌ‡
B. ์˜ˆ์ธก๊ฐ’๋“ค๊ฐ„์˜ ๊ด€๊ณ„ : ์˜ˆ์ธก๊ฐ’๋“ค๊นŒ๋ฆฌ ์„œ๋กœ ํผ์ ธ์žˆ๋‹ค โžก ๋ถ„์‚ฐ์ด ๋†’๋‹คโฌ†

3. ์™ผ์ชฝ ์•„๋ž˜ - underfitting
A. ์˜ˆ์ธก๊ฐ’๊ณผ ์ •๋‹ต๊ฐ„์˜ ๊ด€๊ณ„ : ์˜ˆ์ธก๊ฐ’๋“ค์ด ๋Œ€์ฒด์ ์œผ๋กœ ์ •๋‹ต์œผ๋กœ๋ถ€ํ„ฐ ๋ฉ€๋ฆฌ ๋ถ„ํฌํ•œ๋‹ค โžก ํŽธํ–ฅ์ด ๋†’๋‹คโฌ†
B. ์˜ˆ์ธก๊ฐ’๋“ค๊ฐ„์˜ ๊ด€๊ณ„ : ์˜ˆ์ธก๊ฐ’๋“ค๊นŒ๋ฆฌ ์„œ๋กœ ๋ชฐ๋ ค์žˆ๋‹ค โžก ๋ถ„์‚ฐ์ด ๋‚ฎ๋‹คโฌ‡

4. ์˜ค๋ฅธ์ชฝ ์•„๋ž˜
A. ์˜ˆ์ธก๊ฐ’๊ณผ ์ •๋‹ต๊ฐ„์˜ ๊ด€๊ณ„ : ์˜ˆ์ธก๊ฐ’๋“ค์ด ๋Œ€์ฒด์ ์œผ๋กœ ์ •๋‹ต์œผ๋กœ๋ถ€ํ„ฐ ๋ฉ€๋ฆฌ ๋ถ„ํฌํ•œ๋‹ค โžก ํŽธํ–ฅ์ด ๋†’๋‹คโฌ†
B. ์˜ˆ์ธก๊ฐ’๋“ค๊ฐ„์˜ ๊ด€๊ณ„ : ์˜ˆ์ธก๊ฐ’๋“ค๊นŒ๋ฆฌ ์„œ๋กœ ํผ์ ธ์žˆ๋‹ค โžก ๋ถ„์‚ฐ์ด ๋†’๋‹คโฌ†



์ด์ œ ํ™œ์˜๊ธฐ ๊ณผ๋…์—์„œ ๋ฒ—์–ด๋‚˜ ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ์„ ๊ฐ€์ง€๊ณ  ์ดํ•ดํ•ด๋ณด์ž.

ํŽธํ–ฅ๊ณผ ๋ถ„์‚ฐ์€ ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ์˜ "๋ณต์žกํ•˜๊ฒŒ ์ƒ๊ธด ์ •๋„"์™€ ํฐ ๊ด€๋ จ์ด ์žˆ๋‹ค

๋จผ์ €, Regression Model (ํšŒ๊ท€) ์˜ˆ์‹œ๋ฅผ ๋ณด๊ฒ ๋‹ค
์•„๋ž˜๋Š” 3๊ฐ€์ง€์˜ ์„œ๋กœ ๋‹ค๋ฅธ ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ์ด๋‹ค. ์ด ๋ชจ๋ธ๋“ค์€ ๋ชจ๋‘ ๊ฐ™์€ ๋ฐ์ดํ„ฐ๋ฅผ ์„ค๋ช…ํ•˜๊ณ  ์žˆ๋‹ค.
- ์  : ์ •๋‹ต
- ์„  : ๋ชจ๋ธ์ด ๋‚ด๋†“์€ ์˜ˆ์ธก๊ฐ’

3๊ฐ€์ง€ ์„œ๋กœ ๋‹ค๋ฅธ ๋ชจ๋ธ (regression model)

(์•ž์„œ ๋งํ–ˆ๋“ฏ์ด ๋ชจ๋ธ์ด ๋‚ด๋†“์€ ์˜ˆ์ธก๊ฐ’๋“ค์˜ ๊ฒฝํ–ฅ์„ ์šฐ๋ฆฌ๊ฐ€ ์•Œ์•„๋ณด์ž๊ณ  ํ•˜๋Š” ๊ฒƒ์ด๋ฉฐ ์ด๋ฅผ ์œ„ํ•ด ์“ฐ์ด๋Š” ์šฉ์–ด๊ฐ€ ํŽธํ–ฅ๊ณผ ๋ถ„์‚ฐ์ด๋‹ค.)
1๋ฒˆ ๊ทธ๋ž˜ํ”„ :
์„ ์ด ์ ๋“ค๋กœ๋ถ€ํ„ฐ ๋ฉ€๋‹ค โžก ํŽธํ–ฅ์ด ๋†’๋‹ค
๋ชจ๋ธ์ด ๋‚ด๋†“์€ ์˜ˆ์ธก๊ฐ’๋ผ๋ฆฌ๋Š” ์„œ๋กœ ๋ชฐ๋ ค์žˆ๋‹ค (๊ฐ™์€ ์ง์„ ์œ„์˜ ์ ๋“ค์ด๋‹ˆ๊นŒ) โžก ๋ถ„์‚ฐ์ด ๋‚ฎ๋‹ค

2๋ฒˆ ๊ทธ๋ž˜ํ”„ : (๊ฐ€์žฅ ์ด์ƒ์  ๋ชจ๋ธ)
์„ ์ด ์ ๋“ค๋กœ๋ถ€ํ„ฐ ๊ฐ€๊น๋‹ค โžก ํŽธํ–ฅ์ด ๋‚ฎ๋‹ค
๋ชจ๋ธ์ด ๋‚ด๋†“์€ ์˜ˆ์ธก๊ฐ’๋“ค๋ผ๋ฆฌ๋Š” ์„œ๋กœ ๋ชฐ๋ ค์žˆ๋‹ค (๊ฐ™์€ ์ง์„ ์œ„์˜ ์ ๋“ค์ด๋‹ˆ๊นŒ) โžก ๋ถ„์‚ฐ์ด ๋‚ฎ๋‹ค

3๋ฒˆ ๊ทธ๋ž˜ํ”„ :
์„ ์ด ์ ๋“ค๋กœ๋ถ€ํ„ฐ ๊ฐ€๊น๋‹ค โžก ํŽธํ–ฅ์ด ๋‚ฎ๋‹ค
๋ชจ๋ธ์ด ๋‚ด๋†“์€ ์˜ˆ์ธก๊ฐ’๋“ค๋ผ๋ฆฌ ์„œ๋กœ ํผ์ ธ์žˆ๋‹ค (๊ตฌ๋ถˆ๊ตฌ๋ถˆํ•œ ์„  ์œ„์˜ ์ ๋“ค์ด๋‹ˆ๊นŒ) โžก ๋ถ„์‚ฐ์ด ๋†’๋‹ค


๋‹ค์Œ์œผ๋กœ, Classification Model (๋ถ„๋ฅ˜) ์˜ˆ์‹œ๋ฅผ ๋ณด๊ฒ ๋‹ค
์•„๋ž˜๋Š” 3๊ฐ€์ง€์˜ ์„œ๋กœ ๋‹ค๋ฅธ ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ์ด๋‹ค. ์ด ๋ชจ๋ธ๋“ค์€ ๋ชจ๋‘ ๊ฐ™์€ ๋ฐ์ดํ„ฐ๋ฅผ ์„ค๋ช…ํ•˜๊ณ  ์žˆ๋‹ค.
- ๋นจ๊ฐ„ ์ /์ดˆ๋ก ์‹ญ์ž๊ฐ€ : ์ •๋‹ต
- ์„  : ๋ชจ๋ธ์ด ๋‚ด๋†“์€ ์˜ˆ์ธก๊ฐ’

3๊ฐ€์ง€ ์„œ๋กœ ๋‹ค๋ฅธ ๋ชจ๋ธ (classification model)

(์•ž์„œ ๋งํ–ˆ๋“ฏ์ด ๋ชจ๋ธ์ด ๋‚ด๋†“์€ ์˜ˆ์ธก๊ฐ’๋“ค์˜ ๊ฒฝํ–ฅ์„ ์šฐ๋ฆฌ๊ฐ€ ์•Œ์•„๋ณด์ž๊ณ  ํ•˜๋Š” ๊ฒƒ์ด๋ฉฐ ์ด๋ฅผ ์œ„ํ•ด ์“ฐ์ด๋Š” ์šฉ์–ด๊ฐ€ ํŽธํ–ฅ๊ณผ ๋ถ„์‚ฐ์ด๋‹ค.)
1๋ฒˆ ๊ทธ๋ž˜ํ”„ :
์„ ์ด ์ ๋“ค๋กœ๋ถ€ํ„ฐ ๋ฉ€๋‹ค โžก ํŽธํ–ฅ์ด ๋†’๋‹ค
๋ชจ๋ธ์ด ๋‚ด๋†“์€ ์˜ˆ์ธก๊ฐ’๋ผ๋ฆฌ๋Š” ์„œ๋กœ ๋ชฐ๋ ค์žˆ๋‹ค (๊ฐ™์€ ์ง์„ ์œ„์˜ ์ ๋“ค์ด๋‹ˆ๊นŒ) โžก ๋ถ„์‚ฐ์ด ๋‚ฎ๋‹ค

2๋ฒˆ ๊ทธ๋ž˜ํ”„ : (๊ฐ€์žฅ ์ด์ƒ์  ๋ชจ๋ธ)
์„ ์ด ์ ๋“ค๋กœ๋ถ€ํ„ฐ ๊ฐ€๊น๋‹ค โžก ํŽธํ–ฅ์ด ๋‚ฎ๋‹ค
๋ชจ๋ธ์ด ๋‚ด๋†“์€ ์˜ˆ์ธก๊ฐ’๋“ค๋ผ๋ฆฌ๋Š” ์„œ๋กœ ๋ชฐ๋ ค์žˆ๋‹ค (๊ฐ™์€ ์ง์„ ์œ„์˜ ์ ๋“ค์ด๋‹ˆ๊นŒ) โžก ๋ถ„์‚ฐ์ด ๋‚ฎ๋‹ค

3๋ฒˆ ๊ทธ๋ž˜ํ”„ :
์„ ์ด ์ ๋“ค๋กœ๋ถ€ํ„ฐ ๊ฐ€๊น๋‹ค โžก ํŽธํ–ฅ์ด ๋‚ฎ๋‹ค
๋ชจ๋ธ์ด ๋‚ด๋†“์€ ์˜ˆ์ธก๊ฐ’๋“ค๋ผ๋ฆฌ ์„œ๋กœ ํผ์ ธ์žˆ๋‹ค (๊ตฌ๋ถˆ๊ตฌ๋ถˆํ•œ ์„  ์œ„์˜ ์ ๋“ค์ด๋‹ˆ๊นŒ) โžก ๋ถ„์‚ฐ์ด ๋†’๋‹ค


Underfitting๊ณผ Overfitting

์œ„์—์„œ ๋ณธ ๋ฐ”์™€ ๊ฐ™์ด, regression ๋ชจ๋ธ์ด๋“  classification ๋ชจ๋ธ์ด๋“  1๋ฒˆ ๊ทธ๋ž˜ํ”„์™€ ๊ฐ™์€ ์ƒํ™ฉ์„ "Underfitting", 3๋ฒˆ์งธ ๊ทธ๋ฆผ๊ณผ ๊ฐ™์€ ์ƒํ™ฉ์„ "Overfitting" ์ด๋ผ๊ณ  ํ•œ๋‹ค

์•ž์„œ ํŽธํ–ฅ๊ณผ ๋ถ„์‚ฐ์€ ๋ชจ๋ธ์˜ "๋ณต์žกํ•˜๊ฒŒ ์ƒ๊ธด ์ •๋„"์™€ ๊ด€๋ จ์ด ์žˆ๋‹ค๊ณ  ํ–ˆ๋‹ค.

  • ๋ชจ๋ธ์ด ๋„ˆ๋ฌด ๋‹จ์ˆœํ•˜๊ฒŒ ์ƒ๊ฒผ์œผ๋ฉด(=ํ•™์Šต์ด ๋œ ๋˜์–ด ์žˆ์œผ๋ฉด) ์ •๋‹ต์—์„œ ๋จผ ์˜ˆ์ธก๊ฐ’์„ ๋‚ด๋†“๋Š”๋‹ค(=์ •๋‹ต์„ ์ž˜ ๋งž์ถ”์ง€ ๋ชปํ•œ๋‹ค)
  • ๋ชจ๋ธ์ด ๋„ˆ๋ฌด ๋ณต์žกํ•˜๊ฒŒ ์ƒ๊ฒผ์œผ๋ฉด(=ํ•™์Šต์ด ๋„ˆ๋ฌด ์‹ฌํ•˜๊ฒŒ ๋˜์–ด ์žˆ์œผ๋ฉด) ํ•™์Šต ๋ฐ์ดํ„ฐ๋ฅผ ์™ธ์›Œ์„œ ๋งž์ถ”๋Š” ๊ฒƒ๊ณผ ๊ฐ™์€ ํ˜„์ƒ์ด ๋ฒŒ์–ด์ง€๊ธฐ ๋•Œ๋ฌธ์— ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ๋กœ testํ•˜๊ฒŒ ๋˜๋ฉด ๋ชจ๋ธ์ด ์™ธ์› ๋˜ ๋ฐ์ดํ„ฐ๊ฐ€ ์•„๋‹ˆ๊ธฐ ๋•Œ๋ฌธ์— ํ‹€๋ฆด ๋‹ต์„ ๋‚ด๋†“์„ ๊ฐ€๋Šฅ์„ฑ์ด ๋†’๋‹ค.

๋”ฐ๋ผ์„œ 2๋ฒˆ ๊ทธ๋ž˜ํ”„์™€ ๊ฐ™์ด ๋ชจ๋ธ์ด ์ ๋‹นํžˆ ํ›ˆ๋ จ๋˜์—ˆ์„ ๋•Œ๊ฐ€ ๊ฐ€์žฅ ์ด์ƒ์ ์ด์ง€๋งŒ ์ด๊ฒŒ ์ œ์ผ ์–ด๋ ต๋‹ค

Model Complexity

ํŽธํ–ฅ๊ณผ ๋ถ„์‚ฐ์€ trade-off ๊ฒฝํ–ฅ์„ ๋ค๋‹ค
trade-off๋Š” ํ•œ์ชฝ์ด ์ฆ๊ฐ€ํ•˜๋ฉด ๋‹ค๋ฅธ ํ•œ์ชฝ์€ ๊ฐ์†Œํ•˜๊ฑฐ๋‚˜ ํ•œ์ชฝ์ด ๊ฐ์†Œํ•˜๋ฉด ๋‹ค๋ฅธ ํ•œ์ชฝ์€ ์ฆ๊ฐ€ํ•˜๋Š” ํ˜„์ƒ์„ ๋งํ•œ๋‹ค

์šฐ๋ฆฌ์˜ ๋ชจ๋ธ์ด train set์„ ์—ฌ๋Ÿฌ๋ฒˆ ํ•™์Šตํ• ์ˆ˜๋ก ๋ชจ๋ธ์˜ ๋ณต์žก๋„(model complexity)๋Š” ์ด์— ๋”ฐ๋ผ ๋Š˜์–ด๋‚˜๊ฒŒ ๋˜๋Š”๋ฐ, ์ด๋Š” ๋ชจ๋ธ์ด train set์„ ๊ทธ๋Œ€๋กœ ์™ธ์šฐ๋Š” ๋ฐฉํ–ฅ์ด๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค
๋”ฐ๋ผ์„œ, training error๋Š” ํ•™์Šตํ• ์ˆ˜๋ก ์ค„์–ด๋“ค๊ฒŒ ๋˜์ง€๋งŒ, validation error๋Š” ์ค„์–ด๋“ค๋‹ค๊ฐ€ ์–ด๋Š ์ง€์  ์ดํ›„๋ถ€ํ„ฐ๋Š” ๋‹ค์‹œ ์ƒ์Šนํ•˜๊ฒŒ ๋œ๋‹ค

(training error, validation error๋ฅผ ๋ชจ๋ฅด์‹œ๋Š” ๋ถ„์€ ์•„๋ž˜ ์ ‘์€ ๊ธ€์„ ํ™•์ธํ•ด์ฃผ์„ธ์š”)

๋”๋ณด๊ธฐ

 

training error

- train set์œผ๋กœ ๋ชจ๋ธ์„ ํ›ˆ๋ จ์‹œํ‚ฌ ๋•Œ ๋ฐœ์ƒํ•˜๋Š” ์˜ค์ฐจ

- ๋ฐ์ดํ„ฐ๊ฐ€ ๋ชจ๋ธ์˜ ๋‚ด๋ถ€๊ตฌ์กฐ๋ฅผ ๋ณ€ํ™”์‹œํ‚ค๋ฉด์„œ ์ด ์˜ค์ฐจ๋ฅผ ์ค„์ด๋Š” ๊ฒƒ์ด ๋ชจ๋ธ์˜ ์ง€ํ–ฅ์  (์ฆ‰, ๋ชจ๋ธ์˜ ๊ตฌ์กฐ์— ์˜ํ–ฅ์„ ์ค€๋‹ค)

validation error

- ๋ฐ์ดํ„ฐ๋กœ ๋ชจ๋ธ์„ ํ‰๊ฐ€ํ•  ๋•Œ ๋ฐœ์ƒํ•˜๋Š” ์˜ค์ฐจ

- ๋ฐ์ดํ„ฐ๊ฐ€ ๋ชจ๋ธ์˜ ๋‚ด๋ถ€๊ตฌ์กฐ๋ฅผ ๋ณ€ํ™”์‹œํ‚ค์ง€ ์•Š๊ณ , ๊ทธ์ € validation set์„ ์ง‘์–ด๋„ฃ์—ˆ์„ ๋•Œ ๋ชจ๋ธ์˜ output(์˜ˆ์ธก๊ฐ’)์„ ๊ด€์ฐฐ (์ฆ‰, ๋ชจ๋ธ์˜ ๊ตฌ์กฐ์— ์˜ํ–ฅ์„ ์ฃผ์ง€ ์•Š๋Š”๋‹ค)

 

 

 







reference : opentutorials.org/module/3653/22071

 

728x90
๋ฐ˜์‘ํ˜•