[Machine Learning] Logistic Regression μμλ₯Ό ν΅ν΄ λ€μ€μ ννκ· μ΄ν΄νκΈ°
Logistic Regression
- λ²μ£Όν λ³μ μμΈ‘ λͺ¨λΈ
Logistic Regressionμ μκΈ°μ μ linear regressionμ λ¨Όμ μμμΌ.
Multiple Linear Regression (λ€μ€μ ννκ·)
- μμΉν μ€λͺ
λ³μ Xμ μ°μν μ«μλ‘ μ΄λ€μ§ μ’
μλ³μ Yκ°μ κ΄κ³λ₯Ό μ νμΌλ‘ κ°μ νκ³ μ΄λ₯Ό κ°μ₯ μ ννν μ μλ νκ·κ³μλ₯Ό λ°μ΄ν°λ‘λΆν° μΆμ νλ λͺ¨λΈ
- μ΄λ νκ·κ³μλ λͺ¨λΈμ μμΈ‘κ°κ³Ό μ€μ κ°μ μ°¨μ΄(μ€μ°¨μ κ³±ν© error sum of squared)μ μ΅μλ‘ νλ κ°
- μ€λͺ λ³μκ° pκ°μΈ λ€μ€μ ννκ·μ μΌλ° μ
- μμ - 1
- λμ΄μ νμ λ°μ΄ν°κ° μ£Όμ΄μ‘μ λ, μ€μ°¨μ κ³±ν©μ μ΅μλ‘ νλ νκ·κ³μ ꡬνκΈ°
- μ€λͺ λ³μ X : λμ΄
- μ’ μλ³μ Y : νμ
- λμ΄μ νμ λ°μ΄ν°κ° μ£Όμ΄μ‘μ λ, μ€μ°¨μ κ³±ν©μ μ΅μλ‘ νλ νκ·κ³μ ꡬνκΈ°
μμ μ’ μλ³μ Yλ ‘νμ’μΌλ‘ μ°μν μ«μμμ. κ·Έλ λ€λ©΄, μ°μν μ«μ λμ λ²μ£Όν λ³μλ₯Ό μ΄μ©ν΄ μμ κ°μ νκ·λͺ¨λΈμ λ§λ€ μ μλκ°
- μμ - 2
- λμ΄μ μ λ°μμ¬λΆ (1: λ°λ³, 0: μ μ)
- μ€λͺ λ³μ X : λμ΄
- μ’ μλ³μ Y : μ λ°μμ¬λΆ (0/1)
- λμ΄μ μ λ°μμ¬λΆ (1: λ°λ³, 0: μ μ)
μ΄μ²λΌ κ·Έλνκ° μ΄μνκ² κ·Έλ €μ§λ μ΄μ λ Yμ μ±μ§ λλ¬Έ. λ²μ£Όνμ΄κΈ° λλ¬Έμ μ μ 1, λ°λ³ 0 μΌλ‘ λ°λμ΄λ μ ν μ§μ₯μ΄ μμΌλ©° 0,1 μ«μλ μ무 μλ―Έλ₯Ό μ§λμ§ μμ
→ κ·Έλ κΈ°μ Yκ° λ²μ£ΌνμΈ κ²½μ° λ€μ€μ ννκ· λͺ¨λΈμ κ·Έλλ‘ μ μ©ν μ μμμμ½νμλ©΄, λ€μ€μ ννκ·λ μ’ μλ³μκ° μ°μν, λ‘μ§μ€ν±νκ·λ μ’ μλ³μκ° λ²μ£Όν
⇒ μ΄λ¬ν λ¬Έμ λ₯Ό ν΄κ²°νκΈ° μν΄ μ μλ λ‘μ§μ€ν± νκ· λͺ¨λΈ (Logistic Regression)
μμ½νμλ©΄, λ€μ€μ ννκ·λ μ’ μλ³μκ° μ°μν, λ‘μ§μ€ν±νκ·λ μ’ μλ³μκ° λ²μ£Όν