λͺ©λ‘2025/01/23 (2)

π‘π‘œπ‘‘π‘’π‘π‘œπ‘œπ‘˜

비지도 ν•™μŠ΅

[ λͺ©μ°¨ ]  λ¨Έμ‹ λŸ¬λ‹ μ’…λ₯˜ 볡슡1.μ§€λ„ν•™μŠ΅: 문제 (x)와 μ •λ‹΅(y)κ°€ μ£Όμ–΄μ§€κ³  문제 (x)κ°€ μ£Όμ–΄μ‘Œμ„ λ•Œ μ •λ‹΅(y)을 λ§žμΆ”λŠ” ν•™μŠ΅ 2.λΉ„μ§€λ„ν•™μŠ΅: λ‹΅(y)을 μ•Œλ €μ£Όμ§€ μ•Šκ³  데이터 κ°„ μœ μ‚¬μ„±μ„ μ΄μš©ν•΄μ„œ λ‹΅(y)을 μ§€μ •ν•˜λŠ” 방법 λ¨Έμ‹ λŸ¬λ‹ κ°œμš” λΉ„지도 ν•™μŠ΅ μ˜ˆμ‹œκ³ κ° νŠΉμ„±μ— λ”°λ₯Έ κ·Έλ£Ήν™”ex) ν—€λΉ„μœ μ €, μΌλ°˜μœ μ €κ΅¬λ§€ λ‚΄μ—­λ³„λ‘œ 데이터 κ·Έλ£Ήν™”ex) μƒν•„ν’ˆ ꡬ맀비지도 ν•™μŠ΅μ€ 데이터λ₯Ό 기반으둜 λ ˆμ΄λΈ”λ§ν•˜λŠ” μž‘μ—…μ΄λΌκ³  ν•˜λ©΄ 정닡이 μ—†λŠ” 문제이기 떄문에 지도 ν•™μŠ΅λ³΄λ‹€ 쑰금 μ–΄λ ΅κ³  주관적인 νŒλ‹¨μ΄ κ°œμž…ν•˜κ²Œ λœλ‹€ λΉ„지도 ν•™μŠ΅ k-평균 μ•Œκ³ λ¦¬μ¦˜k-means clustering 이둠1. k개 κ΅°μ§‘ 수 μ„€μ •2. μž„μ˜μ˜ 쀑심을 μ„ μ •3. ν•΄λ‹Ή 쀑심점과 거리가 κ°€κΉŒμš΄ 데이터λ₯Ό κ·Έλ£Ή4. λ°μ΄ν„°μ˜ 그룹의 무게 μ€‘μ‹¬μœΌλ‘œ 쀑심점을 이동5. ..

μ΅œκ·Όμ ‘ 이웃

[ λͺ©μ°¨ ] μ΅œκ·Όμ ‘ 이웃 μ•Œκ³ λ¦¬μ¦˜ (KNN): μ£Όλ³€μ˜ 데이터λ₯Ό 보고 λ‚΄κ°€ μ•Œκ³  싢은 데이터λ₯Ό μ˜ˆμΈ‘ν•˜λŠ” 방식 k=3 이라면 별 1κ°œμ™€ μ„Έλͺ¨ 2κ°œμ΄λ―€λ‘œ ? λŠ” μ„Έλͺ¨λ‘œ 예츑될 것k=7 이라면 별 4κ°œμ™€ μ„Έλͺ¨ 3κ°œμ΄λ―€λ‘œ ? λŠ” λ³„λ‘œ 예츑될 κ²ƒβœ”οΈ μœ„μ™€ 같이 확일할 μ£Όλ³€ 데이터 k개λ₯Ό μ„ μ • 후에 거리 κΈ°μ€€μœΌλ‘œ κ°€μž₯ λ§Žμ€ κ²ƒμœΌλ‘œ μ˜ˆμΈ‘ν•˜λŠ” 것이 λ°”λ‘œ knn의 κΈ°λ³Έ 원리이닀 그럼 kλŠ” λͺ‡μœΌλ‘œ μ •ν•΄μ•Ό ν•˜λŠ” 걸까? 또 κ±°λ¦¬λŠ” μ–΄λ–»κ²Œ μΈ‘μ • ν•΄μ•Ό ν•˜λŠ” κ²ƒμΌκΉŒ? ν•˜μ΄νΌ νŒŒμ΄λ―Έν„°μ˜ κ°œλ… νŒŒλΌλ―Έν„°(Parameter): λ¨Έμ‹ λŸ¬λ‹ λͺ¨λΈμ΄ ν•™μŠ΅ κ³Όμ •μ—μ„œ μΆ”μ •ν•˜λŠ” λ‚΄λΆ€ λ³€μˆ˜μ΄λ©° μžλ™μœΌλ‘œ κ²°μ • λ˜λŠ” κ°’ex) μ„ ν˜•νšŒκ·€μ—μ„œ κ°€μ€‘μΉ˜μ™€ 편ν–₯ Pythonμ—μ„œλŠ” ν•¨μˆ˜ μ •μ˜μ—μ„œ ν•¨μˆ˜κ°€ 받을 수 μžˆλŠ” 인자(μž…λ ₯ κ°’)λ₯Ό μ§€μ •ν•˜λŠ” κ°œλ… ν•˜μ΄νΌ νŒŒλΌλ―Έν„°(Hy..