Computer Science/Data Science

[๋จธ์‹ ๋Ÿฌ๋‹] Likelihood "์šฐ๋„" ๋ž€?

_cactus 2022. 8. 21. 14:05
๋ฐ˜์‘ํ˜•

์šฐ๋ฆฌ๊ฐ€ ๋จธ์‹ ๋Ÿฌ๋‹์„ ๊ณต๋ถ€ํ•˜๋‹ค๋ณด๋ฉด MLE(Maximum LIkelihood Estimation)์„ ๋งŽ์ด ์ ‘ํ•œ๋‹ค.

์—ฌ๊ธฐ์„œ ์˜๋ฏธํ•˜๋Š” Likelihood๊ฐ€ ๋ฌด์—‡์ธ๊ฐ€?

 

์ตœ๋Œ€์šฐ๋„๋ฒ•(MLE)๋ž€

- ๋ชจ์ˆ˜์ ์ธ ๋ฐ์ดํ„ฐ ๋ฐ€๋„ ์ถ”์ • ๋ฐฉ๋ฒ•

- ํŒŒ๋ผ๋ฏธํ„ฐ ๐œƒ = (๐œƒ1,๐œƒ2,..๐œƒn)์œผ๋กœ ๊ตฌ์„ฑ๋œ ์–ด๋–ค ํ™•๋ฅ ๋ฐ€๋„ํ•จ์ˆ˜ P์—์„œ ๊ด€์ธก๋œ ํ‘œ๋ณธ ๋ฐ์ดํ„ฐ ์ง‘ํ•ฉ์„ = (x1,x2,..,xn)๋ผ ํ•  ๋•Œ,

์ด ํ‘œ๋ณธ๋“ค์—์„œ ํŒŒ๋ผ๋ฏธํ„ฐ ๐œƒ = (๐œƒ1,๐œƒ2,..๐œƒn)์„ ์ถ”์ •ํ•˜๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค.

 

์ข€ ๋” ์‰ฌ์šด ์ดํ•ด๋ฅผ ์œ„ํ•ด ๊ทธ๋ฆผ๊ณผ ์—์‹œ๋ฅผ ๋ณด๋ฉด์„œ MLE๋ฅผ ๋” ์ž˜ ์ดํ•ดํ•ด๋ณด์ž

 

 


์˜ˆ์‹œ )

์˜ˆ๋ฅผ ๋“ค์–ด ๋‹ค์Œ๊ณผ ๊ฐ™์ด ๋ฐ์ดํ„ฐ๊ฐ€ ์žˆ๋‹ค๊ณ  ํ•˜์ž

x = { 1, 4, 5, 6, 9 }

์ด๋•Œ  ๋ฐ์ดํ„ฐ x๋Š” ์•„๋ž˜ ๊ทธ๋ฆผ์˜ ์ฃผํ™ฉ์ƒ‰ ๊ณก์„ ๊ณผ ํŒŒ๋ž€์ƒ‰ ๊ณก์„  ์ค‘ ์–ด๋–ค ๊ณก์„ ์œผ๋กœ๋ถ€ํ„ฐ ์ถ”์ถœ๋˜์—ˆ์„ ํ™•๋ฅ ์ด ๋” ๋†’์€๊ฐ€?

 

๋ฐ˜์‘ํ˜•

๋ˆˆ์œผ๋กœ๋งŒ ๋ด๋„ ํŒŒ๋ž€์ƒ‰ ๊ณก์„ ๋ณด๋‹ค๋Š” ์ฃผํ™ฉ์ƒ‰ ๊ณก์„ ์—์„œ ์ด ๋ฐ์ดํ„ฐ๋“ค์„ ์–ป์—ˆ์„ ๊ฐ€๋Šฅ์„ฑ์ด ๋” ์ปค๋ณด์ธ๋‹ค.

ํš๋“ํ•œ ๋ฐ์ดํ„ฐ๋“ค์˜ ๋ถ„ํฌใ…—๊ฐ€ ์ฃผํ™ฉ์ƒ‰ ๊ณก์„ ์˜ ์ค‘์‹ฌ์— ๋” ์ผ์น˜ํ•˜๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ๋ณด์ด๊ธฐ ๋•Œ๋ฌธ..!

 

→ ์šฐ๋ฆฌ๊ฐ€ ๋ฐ์ดํ„ฐ๋ฅผ ๊ด€์ฐฐํ•จ์œผ๋กœ์จ ์ด ๋ฐ์ดํ„ฐ๊ฐ€ ์ถ”์ถœ๋˜์—ˆ์„ ๊ฒƒ์œผ๋กœ ์ƒ๊ฐ๋˜๋Š” ๋ถ„ํฌ์˜ ํŠน์„ฑ์„ ์ถ”์ •ํ•  ์ˆ˜ ์žˆ์Œ์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค. ์—ฌ๊ธฐ์„œ๋Š” ์ถ”์ถœ๋œ ๋ถ„ํฌ๊ฐ€ ์ •๊ทœ๋ถ„ํ๊ณ  ๊ฐ€์ •ํ–ˆ๊ณ , ์šฐ๋ฆฌ๋Š” ๋ถ„ํฌ์˜ ํŠน์„ฑ ์ค‘ ํ‰๊ท ์„ ์ถ”์ •ํ•˜๋ ค๊ณ  ํ–ˆ๋‹ค.

 

 

์ข€ ๋” ๊ตฌ์ฒด์ ์œผ๋กœ, ์ˆ˜ํ•™์ ์ธ ์ ‘๊ทผ์œผ๋กœ ์ด ๋ถ„ํฌ์˜ ํŠน์„ฑ์„ ์ถ”์ •ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์ดํ•ดํ•ด๋ณด์ž

 

Likelihood Function

๋จผ์ €, ๋ฐ์ดํ„ฐ์˜

likelihood ๊ธฐ์—ฌ๋„

์— ๋Œ€ํ•ด ์•Œ์•„๋ณด์ž

์—ฌ๊ธฐ์„œ ์ฃผํ™ฉ์ƒ‰ ๋ถ„ํฌ์— ๋Œ€ํ•ด ๊ฐ ๋ฐ์ดํ„ฐ๋“ค์˜ Likelihood ๊ธฐ์—ฌ๋„๋ฅผ

์ ์„ ์˜ ๋†’์ด

๋กœ ๋‚˜ํƒ€๋ƒˆ๋‹ค.

likelihood๋Š” ํ•œ๋งˆ๋””๋กœ ์‰ฝ๊ฒŒ ํ‘œํ˜„ํ•˜๋ฉด,

์ง€๊ธˆ ์–ป์€ ๋ฐ์ดํ„ฐ๊ฐ€ ์ด ๋ถ„ํฌ๋กœ๋ถ€ํ„ฐ ๋‚˜์™”์„ ๊ฐ€๋Šฅ๋„

๋ฅผ ๋งํ•œ๋‹ค.

 

์ˆ˜์น˜์ ์œผ๋กœ ์ด ๊ฐ€๋Šฅ๋„๋ฅผ ๊ณ„์‚ฐํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ๊ฐ ๋ฐ์ดํ„ฐ ์ƒ˜ํ”Œ์—์„œ ํ›„๋ณด ๋ถ„ํฌ์— ๋Œ€ํ•œ ๋†’์ด(likelihood ๊ธฐ์—ฌ๋„)๋ฅผ ๊ณ„์‚ฐํ•ด์„œ ๋‹ค ๊ณฑํ•œ ๊ฒƒ์„ ์ด์šฉํ•  ์ˆ˜ ์žˆ๋‹ค. (์ด๋•Œ, ๊ณ„์‚ฐ๋œ ๋†’์ด๋ฅผ ๋”ํ•˜์ง€ ์•Š๊ณ  ๊ณฑํ•ด์ฃผ๋Š” ์ด์œ ๋Š” ๋ชจ๋“  ๋ฐ์ดํ„ฐ ์ถ”์ถœ์ด ๋…๋ฆฝ์ ์œผ๋กœ ์—ฐ๋‹ฌ์•„ ์ผ์–ด๋‚˜๋Š” ์‚ฌ๊ฑด์ด๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค)

 

์ด๋ ‡๊ฒŒ ํ•˜์—ฌ ๊ณ„์‚ฐ๋œ ๊ฐ€๋Šฅ๋„๋ฅผ ์ƒ๊ฐํ•ด๋ณผ ์ˆ˜ ์žˆ๋Š” ๋ชจ๋“  ํ›„๋ณด ๋ถ„ํฌ๋“ค์— ๋Œ€ํ•ด ๊ณ„์‚ฐํ•˜๊ณ  ์ด๊ฒƒ์„ ๋น„๊ตํ•˜๋ฉด ์šฐ๋ฆฌ๋Š” ์ง€๊ธˆ ์–ป์€ ๋ฐ์ดํ„ฐ๋ฅผ ๊ฐ€์žฅ ์ž˜ ์„ค๋ช…ํ•  ์ˆ˜ ์žˆ๋Š” ํ™•๋ฅ ๋ถ„ํฌ๋ฅผ ์–ป์–ด๋‚ผ ์ˆ˜ ์žˆ๊ฒŒ ๋œ๋‹ค.

 

์—ฌํƒœ๊ป ์–˜๊ธฐํ•œ likelihood๋ฅผ ์กฐ๊ธˆ ๋” ์ˆ˜ํ•™์ ์œผ๋กœ ์„œ์ˆ ํ•˜๋ฉด ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

์ „์ฒด ํ‘œ๋ณธ์ง‘ํ•ฉ์˜ ๊ฒฐํ•ฉํ™•๋ฅ ๋ฐ€๋„ ํ•จ์ˆ˜๋ฅผ likelihood function ์ด๋ผ๊ณ  ํ•œ๋‹ค.

์œ„ ์‹์˜ ๊ฒฐ๊ณผ ๊ฐ’์ด ๊ฐ€์žฅ ์ปค์ง€๋Š” ๐œƒ๋ฅผ ์ถ”์ •๊ฐ’ ๐œƒ^๋กœ ๋ณด๋Š” ๊ฒƒ์ด ๊ฐ€์žฅ ๊ทธ๋Ÿด๋“ฏํ•˜๋‹ค.

 

์œ„ ์‹์„ likelihood function์ด๋ผ๊ณ  ํ•˜๊ณ , ๋ณดํ†ต์€ ์ž์—ฐ๋กœ๊ทธ๋ฅผ ์ด์šฉํ•ด ์•„๋ž˜์™€ ๊ฐ™์ด log-likelihood function L(๐œƒ||x)๋ฅผ ์ด์šฉํ•œ๋‹ค.

 

 

์›๋ž˜ ์šฐ๋ฆฌ์˜ ๋ชฉ์ ์ด์—ˆ๋˜ Likelihood function์˜ maximum๊ฐ’์„ ์ฐพ๋Š” ๋ฐฉ๋ฒ•์„ ์•Œ์•„๋ณด์ž

 

 

Likelihood function์˜ ์ตœ๋Œ€๊ฐ’์„ ์ฐพ๋Š” ๋ฒ•

๊ฒฐ๋ก ์ ์œผ๋กœ, MLE, Maximum Likelihood Estimation์€ "Likelihoodํ•จ์ˆ˜์˜ ์ตœ๋Œ“๊ฐ’์„ ์ฐพ๋Š” ๋ฐฉ๋ฒ•" ์ด๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ๋‹ค.

 

logํ•จ์ˆ˜๋Š” ๋‹จ์กฐ์ฆ๊ฐ€ํ•จ์ˆ˜์ด๊ธฐ์— likelihood function์˜ ์ตœ๋Œ“๊ฐ’์„ ์ฐพ์œผ๋‚˜, log-likelihood function์˜ ์ตœ๋Œ“๊ฐ’์„ ์ฐพ์œผ๋‚˜ ๋‘ ๊ฒฝ์šฐ ๋ชจ๋‘์˜ ์ตœ๋Œ“๊ฐ’์„ ๊ฐ–๊ฒŒ ํ•ด์ฃผ๋Š” ์ •์˜์—ญ์˜ ํ•จ์ˆ˜ ์ž…๋ ฅ์€ ๋™์ผํžˆ๋‹ค.

→ ๋”ฐ๋ผ์„œ, ๋ณดํ†ต์€ ๊ณ„์‚ฐ์˜ ํŽธ์˜๋ฅผ ์œ„ํ•ด log-likelihood์˜ ์ตœ๋Œ“๊ฐ’์„ ์ฐพ๋Š”๋‹ค.

 

 

 

โœ”๏ธŽ ์–ด๋–ค ํ•จ์ˆ˜์˜ ์ตœ๋Œ“๊ฐ’์„ ์ฐพ๋Š” ๋ฐฉ๋ฒ• ์ค‘ ๊ฐ€์žฅ ๋ณดํŽธ์ ์ธ ๋ฐฉ๋ฒ•์€ ๋ฏธ๋ถ„๊ณ„์ˆ˜๋ฅผ ์ด์šฉํ•˜๋Š” ๊ฒƒ์ด๋‹ค.

 

์ฆ‰, ์ฐพ๊ณ ์žํ•˜๋Š” ํŒŒ๋ผ๋ฏธํ„ฐ ๐œƒ์— ๋Œ€ํ•˜์—ฌ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ํŽธ๋ฏธ๋ถ„์„ ํ•˜๊ณ  ๊ทธ ๊ฐ’์ด 0์ด ๋˜๋„๋กํ•˜๋Š” ๐œƒ๋ฅผ ์ฐพ๋Š” ๊ณผ์ •์„ ํ†ตํ•ด likelihoodํ•จ์ˆ˜๋ฅผ ์ตœ๋Œ€ํ™” ์‹œ์ผœ์ค„ ์ˆ˜ ์žˆ๋Š” ๐œƒ๋ฅผ ์ฐพ์„ ์ˆ˜ ์žˆ๋‹ค.

 

 

 

 

๐Ÿ‘‡ ๋จธ์‹ ๋Ÿฌ๋‹์„ ์œ„ํ•ด ์•Œ์•„์•ผํ•  ๊ธฐ์ดˆ ํ†ต๊ณ„์ง€์‹ ์ฐธ๊ณ ํ•˜์‹ค ๋ถ„์€ ์•„๋ž˜ ๋งํฌ๋ฅผ ํ†ตํ•ด ํ™•์ธํ•ด๋ณด์„ธ์š”..!

 

[๋จธ์‹ ๋Ÿฌ๋‹์„ ์œ„ํ•œ ํ†ต๊ณ„์ง€์‹]

1. ๋จธ์‹ ๋Ÿฌ๋‹์„ ํ•˜๋Š”๋ฐ ํ†ต๊ณ„๊ฐ€ ํ•„์š”ํ•œ๊ฐ€์š”? - ๋ฐ์ดํ„ฐ๋ฅผ ๋‹ค๋ฃฐ ๋•Œ ํ†ต๊ณ„์—์„œ ์ฃผ๋กœ ์‚ฌ์šฉํ•˜๋Š” ๊ฐ€์ •์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ๊ธฐ๋ณธ์ ์œผ๋กœ ์ „์ฒด๋ฅผ ์•Œ์ง€ ๋ชปํ•˜๋Š” ์ƒํ™ฉ์—์„œ sampling๋œ ๋ฐ์ดํ„ฐ๋งŒ์„ ๋ณด๊ณ  ๋ชจ๋ธ์„ ๋งŒ๋“ค๊ธฐ ๋•Œ

mac-user-guide.tistory.com

 

 

 

 

 

reference : https://angeloyeo.github.io/2020/07/17/MLE.html

728x90
๋ฐ˜์‘ํ˜•