๐๐๐ก๐๐๐๐๐
๋น์ง๋ ํ์ต ๋ณธ๋ฌธ
[ ๋ชฉ์ฐจ ]
๋จธ์ ๋ฌ๋ ์ข ๋ฅ ๋ณต์ต
1.์ง๋ํ์ต
: ๋ฌธ์ (x)์ ์ ๋ต(y)๊ฐ ์ฃผ์ด์ง๊ณ ๋ฌธ์ (x)๊ฐ ์ฃผ์ด์ก์ ๋ ์ ๋ต(y)์ ๋ง์ถ๋ ํ์ต
2.๋น์ง๋ํ์ต
: ๋ต(y)์ ์๋ ค์ฃผ์ง ์๊ณ ๋ฐ์ดํฐ ๊ฐ ์ ์ฌ์ฑ์ ์ด์ฉํด์ ๋ต(y)์ ์ง์ ํ๋ ๋ฐฉ๋ฒ
- ๋จธ์ ๋ฌ๋ ๊ฐ์
- ๋น์ง๋ ํ์ต ์์
- ๊ณ ๊ฐ ํน์ฑ์ ๋ฐ๋ฅธ ๊ทธ๋ฃนํ
- ex) ํค๋น์ ์ , ์ผ๋ฐ์ ์
- ๊ตฌ๋งค ๋ด์ญ๋ณ๋ก ๋ฐ์ดํฐ ๊ทธ๋ฃนํ
- ex) ์ํํ ๊ตฌ๋งค
- ๊ณ ๊ฐ ํน์ฑ์ ๋ฐ๋ฅธ ๊ทธ๋ฃนํ
๋น์ง๋ ํ์ต์ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ ์ด๋ธ๋งํ๋ ์์ ์ด๋ผ๊ณ ํ๋ฉด ์ ๋ต์ด ์๋ ๋ฌธ์ ์ด๊ธฐ ๋๋ฌธ์ ์ง๋ ํ์ต๋ณด๋ค ์กฐ๊ธ ์ด๋ ต๊ณ ์ฃผ๊ด์ ์ธ ํ๋จ์ด ๊ฐ์ ํ๊ฒ ๋๋ค
๋น์ง๋ ํ์ต k-ํ๊ท ์๊ณ ๋ฆฌ์ฆ
- k-means clustering ์ด๋ก
1. k๊ฐ ๊ตฐ์ง ์ ์ค์
2. ์์์ ์ค์ฌ์ ์ ์
3. ํด๋น ์ค์ฌ์ ๊ณผ ๊ฑฐ๋ฆฌ๊ฐ ๊ฐ๊น์ด ๋ฐ์ดํฐ๋ฅผ ๊ทธ๋ฃน
4. ๋ฐ์ดํฐ์ ๊ทธ๋ฃน์ ๋ฌด๊ฒ ์ค์ฌ์ผ๋ก ์ค์ฌ์ ์ ์ด๋
5. ์ค์ฌ์ ์ ์ด๋ํ๊ธฐ ๋๋ฌธ์ ๋ค์ ๊ฑฐ๋ฆฌ๊ฐ ๊ฐ๊น์ด ๋ฐ์ดํฐ๋ฅผ ๊ทธ๋ฃนํ (3~5๋ฒ ๋ฐ๋ณต)
์ ๋ฆฌ
- ์ฅ์
- ์ผ๋ฐ์ ์ด๊ณ ์ ์ฉํ๊ธฐ ์ฌ์
- ๋จ์
- ๊ฑฐ๋ฆฌ ๊ธฐ๋ฐ์ผ๋ก ๊ฐ๊น์์ ์ธก์ ํ๊ธฐ ๋๋ฌธ์ ์ฐจ์์ด ๋ง์์๋ก ์ ํ๋๊ฐ ๋จ์ด์ง
- ๋ฐ๋ณต ํ์๊ฐ ๋ง์์๋ก ์๊ฐ์ด ๋๋ ค์ง
- ๋ช ๊ฐ์ ๊ตฐ์ง(k)์ ์ ์ ํ ์ง ์ฃผ๊ด์ ์
- ํ๊ท ์ ์ด์ฉํ๊ธฐ ๋๋ฌธ์(์ค์ฌ์ ) ์ด์์น์ ์ทจ์ฝํจ
Python ๋ผ์ด๋ธ๋ฌ๋ฆฌ
- sklearn.cluster.KMeans
- ํจ์ ์
๋ ฅ ๊ฐ
- n_cluster: ๊ตฐ์งํ ๊ฐฏ์
- max_iter: ์ต๋ ๋ฐ๋ณต ํ์
- ๋ฉ์๋
- labels_: ๊ฐ ๋ฐ์ดํฐ ํฌ์ธํธ๊ฐ ์ํ ๊ตฐ์ง ์ค์ฌ์ ๋ ์ด๋ธ
- cluster_centers: ๊ฐ ๊ตฐ์ง ์ค์ฌ์ ์ ์ขํ
'๋จธ์ ๋ฌ๋ ๐ฆพ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
์นด์ด์ ๊ณฑ๊ฒ์ (0) | 2025.02.03 |
---|---|
๊ตฐ์งํ๊ฐ ์งํ (0) | 2025.01.24 |
์ต๊ทผ์ ์ด์ (1) | 2025.01.23 |
์์ฌ๊ฒฐ์ ๋๋ฌด, ๋๋ค ํฌ๋ ์คํธ (0) | 2025.01.21 |
๋ก์ง์คํฑ ํ๊ท (0) | 2025.01.20 |