๋ชฉ๋กํ”„๋กœ์ ํŠธ๐Ÿ  (2)

๐‘๐‘œ๐‘ก๐‘’๐‘๐‘œ๐‘œ๐‘˜

๋จธ์‹ ๋Ÿฌ๋‹ ์ƒ˜ํ”Œ๋ง

[ ๋ชฉ์ฐจ ]  ์ƒ˜ํ”Œ๋ง (sampling): ๋จธ์‹ ๋Ÿฌ๋‹์—์„œ ๋ฐ์ดํ„ฐ ๋ถˆ๊ท ํ˜• ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ๋‹ค์–‘ํ•œ ์ƒ˜ํ”Œ๋ง ๊ธฐ๋ฒ•์„ ์‚ฌ์šฉ ์ข…๋ฅ˜ 1๏ธโƒฃ ์˜ค๋ฒ„์ƒ˜ํ”Œ๋ง (OverSampling)2๏ธโƒฃ ์–ธ๋”์ƒ˜ํ”Œ๋ง (UnderSampling)3๏ธโƒฃํ˜ผํ•ฉ ์ƒ˜ํ”Œ๋ง ( Over + Under ) 1๏ธโƒฃ ์˜ค๋ฒ„์ƒ˜ํ”Œ๋ง (OverSampling): ์†Œ์ˆ˜ ํด๋ž˜์Šค์˜ ๋ฐ์ดํ„ฐ๋ฅผ ์ฆ๊ฐ€์‹œ์ผœ ๊ท ํ˜•์„ ๋งž์ถ”๋Š” ๊ธฐ๋ฒ•(์˜ˆ : ํ—ˆ์œ„๋งค๋ฌผ์ด ์ ์€ ๊ฒฝ์šฐ, ํ—ˆ์œ„๋งค๋ฌผ ๋ฐ์ดํ„ฐ๋ฅผ ์ธ์œ„์ ์œผ๋กœ ์ƒ์„ฑ) ์ฃผ์š” ๊ธฐ๋ฒ•Random OverSampling ์†Œ์ˆ˜ ํด๋ž˜์Šค ์ƒ˜ํ”Œ์„ ๋‹จ์ˆœ ๋ณต์ œ์žฅ์  : ์‰ฝ๊ณ  ๋น ๋ฆ„๋‹จ์  : ์ค‘๋ณต ๋ฐ์ดํ„ฐ๋กœ ๊ณผ์ ‘ํ•ฉ ์œ„ํ—˜SMOTE (Synthetic Minority Over-sampling Technique)์ตœ๊ทผ์ ‘ ์ด์›ƒ(KNN) ๊ธฐ๋ฐ˜์œผ๋กœ ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ ์ƒ์„ฑ๋ฐ์ดํ„ฐ ๋‹ค์–‘์„ฑ์ด ์ฆ๊ฐ€์ค‘๋ณต ..

๋žœ๋คํฌ๋ ˆ์ŠคํŠธ(ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ)

[ ๋ชฉ์ฐจ ] ๋žœ๋คํฌ๋ ˆ์ŠคํŠธ์˜ ์ฃผ์š” ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐn_estimators : ํŠธ๋ฆฌ ๊ฐœ์ˆ˜๋„ˆ๋ฌด ์ ์œผ๋ฉด ๊ณผ์†Œ์ ํ•ฉ, ๋„ˆ๋ฌด ๋งŽ์œผ๋ฉด ํ•™์Šต ์‹œ๊ฐ„์ด ๊ธธ์–ด์ง๊ธฐ๋ณธ๊ฐ’ : 100max_depth : ํŠธ๋ฆฌ์˜ ์ตœ๋Œ€ ๊นŠ์ด๋„ˆ๋ฌด ๊นŠ์œผ๋ฉด ๊ณผ์ ํ•ฉ, ๋„ˆ๋ฌด ์–•์œผ๋ฉด ๊ณผ์†Œ์ ํ•ฉ๊ธฐ๋ณธ๊ฐ’ : ์ œํ•œ ์—†์Œmax_features : ์‚ฌ์šฉํ•  ์ตœ๋Œ€ ๋ณ€์ˆ˜ ๊ฐœ์ˆ˜๋ณ€์ˆ˜ ๊ฐœ์ˆ˜ ์ œํ•œ๋ถ„๋ฅ˜์—์„œ๋Š” sqrt๋ณ€์ˆ˜ ๊ฐ„ ์ƒ๊ด€์„ฑ ๊ณ ๋ คmin_samples_split : ๋…ธ๋“œ ๋ถ„ํ•  ์ตœ์†Œ ์ƒ˜ํ”Œ ์ˆ˜๊ธฐ๋ณธ ๊ฐ’ : 2min_samples_leaf : ๋ฆฌํ”„ ๋…ธ๋“œ ์ตœ์†Œ ์ƒ˜ํ”Œ ์ˆ˜๊ธฐ๋ณธ ๊ฐ’ : 1 ๋ฐ์ดํ„ฐ ๋ถ„๋ฆฌ๋…ผ๋ฌธ ์ฐธ๊ณ  https://sejong.dcollection.net/public_resource/pdf/200000630803_20250126185853.pdf# ์˜ˆ์ œ ์ฝ”๋“œfrom sklearn.model_s..