πππ‘πππππ
κ΅°μ§νκ° μ§ν λ³Έλ¬Έ
[ λͺ©μ°¨ ]
μ€λ£¨μ£ κ³μ
λΉμ§λ νμ΅ νΉμ± μ λ΅μ΄ μμ΄ λλ¬Έμ κ·Έ νκ°λ₯Ό νκΈ΄ μ½μ§ μμ΅λλ€. λ€λ§, κ΅°μ§νκ° μλμ΄ μλ€λ κ²μ λ€λ₯Έ κ΅°μ§κ°μ 거리λ λ¨μ΄μ Έ μκ³ λμΌν κ΅°μ§λΌλ¦¬λ κ°κΉμ΄ μλ€λ κ²μ μλ―Έν¨
μ΄λ₯Ό μ λν νκΈ° μν΄ μ€λ£¨μ£ λΆμ(silhouette analysis)μ΄λ κ° κ΅°μ§ κ°μ κ±°λ¦¬κ° μΌλ§λ ν¨μ¨μ μΌλ‘ λΆλ¦¬λμ΄ μλμ§ μΈ‘μ ν©λλ€. μμμ λ€μκ³Ό κ°μ§λ§ κ·Έλ₯ μ΄ν΄νλ μ©λλ‘ !
- μ€λ£¨μ£ κ³μ
- $a(i)$ : λ°μ΄ν° ν¬μΈνΈ $i$ κ³Ό κ°μ κ΅°μ§μ μν λ€λ₯Έ ν¬μΈνΈλ€κ³Όμ νκ· κ±°λ¦¬
- $b(i)$ : λ°μ΄ν° ν¬μΈνΈ $i$ μ κ°μ₯ κ°κΉμ΄ λ€λ₯Έ κ΅°μ§ κ°μ νκ· κ±°λ¦¬
- ν΄μ: 1λ‘ κ°μλ‘ μ κ΅°μ§ν λμ΄ μμ. -1μ κ°κΉμΈμλ‘ μ λͺ» κ΅°μ§ν λμ΄ μλ€
μμμ ν΄μν΄λ³΄μλ©΄ νΉμ ν λ°μ΄ν° iμ μ€λ£¨μ£ κ³μλ μΌλ§λ λ¨μ΄μ Έμλκ°
(b($i$)-a($i$))κ° ν΄ μλ‘ ν¬λ©°, μ΄λ₯Ό λ¨μ μ κ·νλ₯Ό μν΄ a($i$), b($i$) κ° μ€μ ν° κ°μΌλ‘ λλ
- μ’μ κ΅°μ§νμ 쑰건
- μ€λ£¨μ£ κ°μ΄ λμμλ‘(1μ κ°κΉμ)
- κ°λ³ κ΅°μ§μ νκ· κ°μ νΈμ°¨κ° ν¬μ§ μμμΌ ν¨
- Python λΌμ΄λΈλ¬λ¦¬
- sklearn.metrics.sihouette_score : μ μ λ°μ΄ν°μ μ€λ£¨μ£ κ³μ νκ· κ° λ°ν
- ν¨μ μ
λ ₯ κ°
- X : λ°μ΄ν° μΈνΈ
- labels : λ μ΄λΈ
- metrics : μΈ‘μ κΈ°μ€ κΈ°λ³Έμ euclidean
- ν¨μ μ
λ ₯ κ°
- sklearn.metrics.sihouette_score : μ μ λ°μ΄ν°μ μ€λ£¨μ£ κ³μ νκ· κ° λ°ν
(μ€μ΅)λΆκ½ λ°μ΄ν°λ₯Ό μ΄μ©ν κ΅°μ§ν
λΉμ§λ νμ΅μΌλ‘ ~!
κ³ κ° μΈκ·Έλ©ν μ΄μ μ μ μ
λΉμ§λ νμ΅μ΄ κ°μ₯ λ§μ΄ μ¬μ©λλ λΆμΌλ κ³ κ° κ΄κ³ κ΄λ¦¬(Customer Relationship Management, CRM)λΆμΌ μ λλ€. μ΄μ€ κ³ κ° μΈκ·Έλ©ν μ΄μ (Customer Segmentation)μ λ€μν κΈ°μ€μΌλ‘ κ³ κ°μ λΆλ₯νλ κΈ°λ²μ λλ€. μ£Όλ‘ νκ² λ§μΌν μ΄λΌ λΆλ¦¬λ κ³ κ° νΉμ±μ λ§κ² μΈλΆν νμ¬ μ νμ λ°λΌ λ§μΆ€ν λ§κ²ν μ΄λ μλΉμ€λ₯Ό μ 곡νλ κ²μ λͺ©νλ‘ λ‘λλ€.
- RFMμ κ°λ
- Recency(R) κ°μ₯ μ΅κ·Ό ꡬμ μΌμμ μ€λκΉμ§μ μκ°
- Frequency(F): μν ꡬ맀 νμ
- Monetary value(M): μ΄ κ΅¬λ§€ κΈμ‘
EDA → λ°μ΄ν°μ μ²λ¦¬(κ²°μΈ‘μΉ μμ ,νμΈ) → RFM κΈ°λ° λ°μ΄ν° κ°κ³΅ → κ³ κ° μΈκ·Έλ©ν μ΄μ → νκ°
'λ¨Έμ λ¬λ π¦Ύ' μΉ΄ν κ³ λ¦¬μ λ€λ₯Έ κΈ
μΉ΄μ΄μ κ³±κ²μ (0) | 2025.02.03 |
---|---|
λΉμ§λ νμ΅ (0) | 2025.01.23 |
μ΅κ·Όμ μ΄μ (1) | 2025.01.23 |
μμ¬κ²°μ λ무, λλ€ ν¬λ μ€νΈ (0) | 2025.01.21 |
λ‘μ§μ€ν± νκ· (0) | 2025.01.20 |