π‘π‘œπ‘‘π‘’π‘π‘œπ‘œπ‘˜

μ„ ν˜•νšŒκ·€ λ³Έλ¬Έ

λ¨Έμ‹ λŸ¬λ‹ 🦾

μ„ ν˜•νšŒκ·€

seoa__ 2025. 1. 17. 22:04

   [ λͺ©μ°¨ ]

     

     

    μ„ ν˜•νšŒκ·€

    • 곡톡
      • YλŠ” 쒅속 λ³€μˆ˜, κ²°κ³Ό λ³€μˆ˜
      • XλŠ” 독립 λ³€μˆ˜, 원인 λ³€μˆ˜, μ„€λͺ… λ³€μˆ˜
    • ν†΅κ³„ν•™μ—μ„œ μ‚¬μš©ν•˜λŠ” μ„ ν˜•νšŒκ·€ 식

    • $\beta_0$ : 편ν–₯ 
    • $\beta_1$ : νšŒκ·€ κ³„μˆ˜
    • $\varepsilon$ : 였차(μ—λŸ¬), λͺ¨λΈμ΄ μ„€λͺ…ν•˜μ§€ λͺ»ν•˜λŠ” Y의 변동성

     

    λ¨Έμ‹ λŸ¬λ‹/λ”₯λŸ¬λ‹μ—μ„œ μ‚¬μš©ν•˜λŠ” μ„ ν˜•νšŒκ·€ 식

    • w: κ°€μ€‘μΉ˜
    • b: 편ν–₯(Bias)
    κ²°κ΅­ 두 μˆ˜μ‹μ΄ μ „λ‹¬ν• λ €λŠ” μ˜λ―ΈλŠ” κ°™μŒ
    νšŒκ·€ κ³„μˆ˜ ν˜Ήμ€ κ°€μ€‘μΉ˜λ₯Ό 값을 μ•Œλ©΄ xκ°€ μ£Όμ–΄μ‘Œμ„ λ•Œ yλ₯Ό μ•Œ 수 μžˆλ‹€λŠ” 뜻 !
    우리의 편의λ₯Ό μœ„ν•΄ x의 κ³„μˆ˜λŠ” κ°€μ€‘μΉ˜λΌκ³  μ§€μΉ­

     

    질문

    Q1) κ°€μ€‘μΉ˜(w)λ₯Ό μ•Œκ²Œ 되면 X값에 λŒ€ν•˜μ—¬ Y값을 μ˜ˆμΈ‘ν•  수 μžˆλ‹€λŠ” 것은 이해가 λ˜λŠ”λ°, 그럼 κ°€μ€‘μΉ˜λŠ” μ–΄λ–»κ²Œ κ΅¬ν•˜μ£ ?

    • 데이터가 μΆ©λΆ„νžˆ μžˆλ‹€λ©΄ κ°€μ€‘μΉ˜λ₯Ό 'μΆ”μ •'ν•  수 μžˆλ‹€ μžμ„Έν•œ μ„€λͺ…은 λ‹€μŒ λΈ”λ‘œκ·Έμ—μ„œ 

    νšŒκ·€ ν‰κ°€μ§€ν‘œ - MSE

    • μ—λŸ¬ μ •μ˜λ°©λ²•
      • 방법1) μ—λŸ¬ = μ‹€μ œ 데이터 - 예츑 데이터 둜 μ •μ˜ν•˜κΈ°
      • 방법2) μ—λŸ¬λ₯Ό μ œκ³±ν•˜μ—¬ λͺ¨λ‘ μ–‘μˆ˜λ‘œ λ§Œλ“€κΈ°, λ‹€ ν•©μΉ˜κΈ°
      • 방법3) λ°μ΄ν„°λ§ŒνΌ λ‚˜λˆ„κΈ°
    • μ—λŸ¬ μ •μ˜ 방법 μˆ˜μ‹ν™”

    1️⃣ 방법

    2️⃣ 방법

    3️⃣방법

    yκ°’μ˜ 머리에 μžˆλŠ” ^ ν‘œκΈ°λ₯Ό hat이라고 ν•˜λ©°, 예츑(ν˜Ήμ€ μΆ”μ •)ν•œ μˆ˜μΉ˜μ— ν‘œκΈ°ν•¨

     

    • Mean Squared Erorr(MSE)라고 μ •μ˜

    • 기타 평가 μ§€ν‘œ
    • RMSE: MSE에 Rootλ₯Ό μ”Œμ›Œ 제곱 된 λ‹¨μœ„λ₯Ό λ‹€μ‹œ λ§žμΆ”κΈ°

    • MAE: μ ˆλŒ€ 값을 μ΄μš©ν•˜μ—¬ 였차 κ³„μ‚°ν•˜κΈ°

     

    데이터 μ‚¬μ΄μ–ΈμŠ€ 파이썬 라이브러리

    • scikit-learn : Python λ¨Έμ‹ λŸ¬λ‹ 라이브러리
    • numpy : Python κ³ μ„±λŠ₯ 수치 계산을 μœ„ν•œ 라이브러리
    • pandas : ν…Œμ΄λΈ” ν˜• 데이터λ₯Ό λ‹€λ£° 수 μžˆλŠ” 라이브러리
    • matplotlib : λŒ€ν‘œμ μΈ μ‹œκ°ν™” 라이브러리, κ·Έλž˜ν”„κ°€ λ‹¨μˆœν•˜κ³  μ„€μ • μž‘μ—… 많음
    • seaborn : matplot기반의 κ³ κΈ‰ μ‹œκ°ν™” 라이브러리, μƒμœ„ μˆ˜μ€€μ˜ μΈν„°νŽ˜μ΄μŠ€λ₯Ό 제곡

    자주 μ“°λŠ” ν•¨μˆ˜

    • sklearn.linear_model.LinearRegression : μ„ ν˜•νšŒκ·€ λͺ¨λΈ 클래슀
      • coef_ : νšŒκ·€ κ³„μˆ˜
      • intercept : 편ν–₯(bias)
      • fit : 데이터 ν•™μŠ΅
      • predict : 데이터 예츑