λͺ©λ‘2025/01 (28)

π‘π‘œπ‘‘π‘’π‘π‘œπ‘œπ‘˜

ꡰ집평가 μ§€ν‘œ

[ λͺ©μ°¨ ]  μ‹€λ£¨μ—£ κ³„μˆ˜ 비지도 ν•™μŠ΅ νŠΉμ„± 상 닡이 없이 λ•Œλ¬Έμ— κ·Έ 평가λ₯Ό ν•˜κΈ΄ 쉽지 μ•ŠμŠ΅λ‹ˆλ‹€. λ‹€λ§Œ, κ΅°μ§‘ν™”κ°€ μž˜λ˜μ–΄ μžˆλ‹€λŠ” 것은 λ‹€λ₯Έ κ΅°μ§‘κ°„μ˜ κ±°λ¦¬λŠ” λ–¨μ–΄μ Έ 있고 λ™μΌν•œ κ΅°μ§‘λΌλ¦¬λŠ” κ°€κΉŒμ΄ μžˆλ‹€λŠ” 것을 μ˜λ―Έν•¨  이λ₯Ό μ •λŸ‰ν™” ν•˜κΈ° μœ„ν•΄ 싀루엣 뢄석(silhouette analysis)μ΄λž€ κ°„ κ΅°μ§‘ κ°„μ˜ 거리가 μ–Όλ§ˆλ‚˜ 효율적으둜 λΆ„λ¦¬λ˜μ–΄ μžˆλŠ”μ§€ μΈ‘μ •ν•©λ‹ˆλ‹€. μˆ˜μ‹μ€ λ‹€μŒκ³Ό κ°™μ§€λ§Œ κ·Έλƒ₯ μ΄ν•΄ν•˜λŠ” μš©λ„λ‘œ !싀루엣 κ³„μˆ˜$a(i)$ : 데이터 포인트 $i$ κ³Ό 같은 ꡰ집에 μ†ν•œ λ‹€λ₯Έ ν¬μΈνŠΈλ“€κ³Όμ˜ 평균 거리$b(i)$ : 데이터 포인트 $i$ 와 κ°€μž₯ κ°€κΉŒμš΄ λ‹€λ₯Έ κ΅°μ§‘ κ°„μ˜ 평균 거리 해석: 1둜 갈수둝 잘 κ΅°μ§‘ν™” λ˜μ–΄ 있음. -1에 κ°€κΉŒμšΈμˆ˜λ‘ 잘 λͺ» κ΅°μ§‘ν™” λ˜μ–΄ μžˆλ‹€ μˆ˜μ‹μ„ ν•΄μ„ν•΄λ³΄μžλ©΄ νŠΉμ •ν•œ 데이터 i의 싀루엣..

비지도 ν•™μŠ΅

[ λͺ©μ°¨ ]  λ¨Έμ‹ λŸ¬λ‹ μ’…λ₯˜ 볡슡1.μ§€λ„ν•™μŠ΅: 문제 (x)와 μ •λ‹΅(y)κ°€ μ£Όμ–΄μ§€κ³  문제 (x)κ°€ μ£Όμ–΄μ‘Œμ„ λ•Œ μ •λ‹΅(y)을 λ§žμΆ”λŠ” ν•™μŠ΅ 2.λΉ„μ§€λ„ν•™μŠ΅: λ‹΅(y)을 μ•Œλ €μ£Όμ§€ μ•Šκ³  데이터 κ°„ μœ μ‚¬μ„±μ„ μ΄μš©ν•΄μ„œ λ‹΅(y)을 μ§€μ •ν•˜λŠ” 방법 λ¨Έμ‹ λŸ¬λ‹ κ°œμš” λΉ„지도 ν•™μŠ΅ μ˜ˆμ‹œκ³ κ° νŠΉμ„±μ— λ”°λ₯Έ κ·Έλ£Ήν™”ex) ν—€λΉ„μœ μ €, μΌλ°˜μœ μ €κ΅¬λ§€ λ‚΄μ—­λ³„λ‘œ 데이터 κ·Έλ£Ήν™”ex) μƒν•„ν’ˆ ꡬ맀비지도 ν•™μŠ΅μ€ 데이터λ₯Ό 기반으둜 λ ˆμ΄λΈ”λ§ν•˜λŠ” μž‘μ—…μ΄λΌκ³  ν•˜λ©΄ 정닡이 μ—†λŠ” 문제이기 떄문에 지도 ν•™μŠ΅λ³΄λ‹€ 쑰금 μ–΄λ ΅κ³  주관적인 νŒλ‹¨μ΄ κ°œμž…ν•˜κ²Œ λœλ‹€ λΉ„지도 ν•™μŠ΅ k-평균 μ•Œκ³ λ¦¬μ¦˜k-means clustering 이둠1. k개 κ΅°μ§‘ 수 μ„€μ •2. μž„μ˜μ˜ 쀑심을 μ„ μ •3. ν•΄λ‹Ή 쀑심점과 거리가 κ°€κΉŒμš΄ 데이터λ₯Ό κ·Έλ£Ή4. λ°μ΄ν„°μ˜ 그룹의 무게 μ€‘μ‹¬μœΌλ‘œ 쀑심점을 이동5. ..

μ΅œκ·Όμ ‘ 이웃

[ λͺ©μ°¨ ] μ΅œκ·Όμ ‘ 이웃 μ•Œκ³ λ¦¬μ¦˜ (KNN): μ£Όλ³€μ˜ 데이터λ₯Ό 보고 λ‚΄κ°€ μ•Œκ³  싢은 데이터λ₯Ό μ˜ˆμΈ‘ν•˜λŠ” 방식 k=3 이라면 별 1κ°œμ™€ μ„Έλͺ¨ 2κ°œμ΄λ―€λ‘œ ? λŠ” μ„Έλͺ¨λ‘œ 예츑될 것k=7 이라면 별 4κ°œμ™€ μ„Έλͺ¨ 3κ°œμ΄λ―€λ‘œ ? λŠ” λ³„λ‘œ 예츑될 κ²ƒβœ”οΈ μœ„μ™€ 같이 확일할 μ£Όλ³€ 데이터 k개λ₯Ό μ„ μ • 후에 거리 κΈ°μ€€μœΌλ‘œ κ°€μž₯ λ§Žμ€ κ²ƒμœΌλ‘œ μ˜ˆμΈ‘ν•˜λŠ” 것이 λ°”λ‘œ knn의 κΈ°λ³Έ 원리이닀 그럼 kλŠ” λͺ‡μœΌλ‘œ μ •ν•΄μ•Ό ν•˜λŠ” 걸까? 또 κ±°λ¦¬λŠ” μ–΄λ–»κ²Œ μΈ‘μ • ν•΄μ•Ό ν•˜λŠ” κ²ƒμΌκΉŒ? ν•˜μ΄νΌ νŒŒμ΄λ―Έν„°μ˜ κ°œλ… νŒŒλΌλ―Έν„°(Parameter): λ¨Έμ‹ λŸ¬λ‹ λͺ¨λΈμ΄ ν•™μŠ΅ κ³Όμ •μ—μ„œ μΆ”μ •ν•˜λŠ” λ‚΄λΆ€ λ³€μˆ˜μ΄λ©° μžλ™μœΌλ‘œ κ²°μ • λ˜λŠ” κ°’ex) μ„ ν˜•νšŒκ·€μ—μ„œ κ°€μ€‘μΉ˜μ™€ 편ν–₯ Pythonμ—μ„œλŠ” ν•¨μˆ˜ μ •μ˜μ—μ„œ ν•¨μˆ˜κ°€ 받을 수 μžˆλŠ” 인자(μž…λ ₯ κ°’)λ₯Ό μ§€μ •ν•˜λŠ” κ°œλ… ν•˜μ΄νΌ νŒŒλΌλ―Έν„°(Hy..