๋ชฉ๋กํ๋ก์ ํธ๐ (2)
๐๐๐ก๐๐๐๐๐
[ ๋ชฉ์ฐจ ] ์ํ๋ง (sampling): ๋จธ์ ๋ฌ๋์์ ๋ฐ์ดํฐ ๋ถ๊ท ํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๋ค์ํ ์ํ๋ง ๊ธฐ๋ฒ์ ์ฌ์ฉ ์ข ๋ฅ 1๏ธโฃ ์ค๋ฒ์ํ๋ง (OverSampling)2๏ธโฃ ์ธ๋์ํ๋ง (UnderSampling)3๏ธโฃํผํฉ ์ํ๋ง ( Over + Under ) 1๏ธโฃ ์ค๋ฒ์ํ๋ง (OverSampling): ์์ ํด๋์ค์ ๋ฐ์ดํฐ๋ฅผ ์ฆ๊ฐ์์ผ ๊ท ํ์ ๋ง์ถ๋ ๊ธฐ๋ฒ(์ : ํ์๋งค๋ฌผ์ด ์ ์ ๊ฒฝ์ฐ, ํ์๋งค๋ฌผ ๋ฐ์ดํฐ๋ฅผ ์ธ์์ ์ผ๋ก ์์ฑ) ์ฃผ์ ๊ธฐ๋ฒRandom OverSampling ์์ ํด๋์ค ์ํ์ ๋จ์ ๋ณต์ ์ฅ์ : ์ฝ๊ณ ๋น ๋ฆ๋จ์ : ์ค๋ณต ๋ฐ์ดํฐ๋ก ๊ณผ์ ํฉ ์ํSMOTE (Synthetic Minority Over-sampling Technique)์ต๊ทผ์ ์ด์(KNN) ๊ธฐ๋ฐ์ผ๋ก ์๋ก์ด ๋ฐ์ดํฐ ์์ฑ๋ฐ์ดํฐ ๋ค์์ฑ์ด ์ฆ๊ฐ์ค๋ณต ..

[ ๋ชฉ์ฐจ ] ๋๋คํฌ๋ ์คํธ์ ์ฃผ์ ํ์ดํผํ๋ผ๋ฏธํฐn_estimators : ํธ๋ฆฌ ๊ฐ์๋๋ฌด ์ ์ผ๋ฉด ๊ณผ์์ ํฉ, ๋๋ฌด ๋ง์ผ๋ฉด ํ์ต ์๊ฐ์ด ๊ธธ์ด์ง๊ธฐ๋ณธ๊ฐ : 100max_depth : ํธ๋ฆฌ์ ์ต๋ ๊น์ด๋๋ฌด ๊น์ผ๋ฉด ๊ณผ์ ํฉ, ๋๋ฌด ์์ผ๋ฉด ๊ณผ์์ ํฉ๊ธฐ๋ณธ๊ฐ : ์ ํ ์์max_features : ์ฌ์ฉํ ์ต๋ ๋ณ์ ๊ฐ์๋ณ์ ๊ฐ์ ์ ํ๋ถ๋ฅ์์๋ sqrt๋ณ์ ๊ฐ ์๊ด์ฑ ๊ณ ๋ คmin_samples_split : ๋ ธ๋ ๋ถํ ์ต์ ์ํ ์๊ธฐ๋ณธ ๊ฐ : 2min_samples_leaf : ๋ฆฌํ ๋ ธ๋ ์ต์ ์ํ ์๊ธฐ๋ณธ ๊ฐ : 1 ๋ฐ์ดํฐ ๋ถ๋ฆฌ๋ ผ๋ฌธ ์ฐธ๊ณ https://sejong.dcollection.net/public_resource/pdf/200000630803_20250126185853.pdf# ์์ ์ฝ๋from sklearn.model_s..