๐‘๐‘œ๐‘ก๐‘’๐‘๐‘œ๐‘œ๐‘˜

๊ฐ€์„ค๊ฒ€์ •์˜ ์ฃผ์˜์  ๋ณธ๋ฌธ

ํ†ต๊ณ„ํ•™

๊ฐ€์„ค๊ฒ€์ •์˜ ์ฃผ์˜์ 

seoa__ 2025. 1. 13. 20:50

   [ ๋ชฉ์ฐจ ]

์žฌํ˜„ ๊ฐ€๋Šฅ์„ฑ

์šฐ์—ฐํžˆ ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์˜ค๋Š” ๊ฒƒ์ด ์•„๋‹Œ, ํ•ญ์ƒ ์ผ๊ด€๋œ ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์˜ค๋Š”์ง€ ํ™•์ธํ•ด์•ผ ํ•จ!

    ์žฌํ˜„ ๊ฐ€๋Šฅ์„ฑ

    • ๋™์ผํ•œ ์—ฐ๊ตฌ๋‚˜ ์‹คํ—˜์„ ๋ฐ˜๋ณตํ–ˆ์„ ๋•Œ ์ผ๊ด€๋œ ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์˜ค๋Š”์ง€ ์—ฌ๋ถ€ ( ์—ฐ๊ตฌ์˜ ์‹ ๋ขฐ์„ฑ์„ ๋†’์ด๋Š” ์ค‘์š”ํ•œ ์š”์†Œ )
    • ex) ์‹ ์•ฝ์„ ๊ฐœ๋ฐœํ•  ๋•Œ ์‹คํ—˜์‹ค์—์„œ๋งŒ ํšจ๊ณผ๊ฐ€ ์žˆ๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ ์‹ค์ œ ์ƒํ™ฉ์—์„œ๋„ ์ผ๊ด€๋œ ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์˜จ๋‹ค๊ณ  ๋ฏฟ์„ ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ๊ฐœ๋ฐœ ๊ฐ€๋Šฅํ•œ ๊ฒƒ
    • ์ตœ๊ทผ p๊ฐ’์— ๋Œ€ํ•œ ๋…ผ์Ÿ์ด ๋‘๋“œ๋Ÿฌ์ง€๊ณ  ์žˆ์Œ
      • p๊ฐ’์„ ์‚ฌ์šฉํ•˜์ง€ ์•Š๋Š” ๊ฒƒ์ด ์ข‹๋‹ค
      • ์œ ์˜ ์ˆ˜์ค€์„ 0.05์—์„œ ๋ณ€๊ฒฝํ•˜๋Š” ๊ฒƒ์ด ์ข‹๋‹ค
    • ๊ฐ€์„ค๊ฒ€์ • ์›๋ฆฌ์ƒ์˜ ๋ฌธ์ œ๋‚˜ ๊ฐ€์„ค๊ฒ€์ •์˜ ์ž˜๋ชป๋œ ์‚ฌ์šฉ์ด ๋‚ฎ์€ ์žฌํ˜„์„ฑ์œผ๋กœ ์ด์–ด์ง„๋‹ค๋Š” ๋ฌธ์ œ ๋ฐœ์ƒ
    • ์ตœ๊ทผ ๋…ผ๋ฌธ์„ ๋‹ค์‹œ ์žฌํ˜„ํ•ด์„œ ์‹คํ—˜์„ ํ•ด๋ณด๋Š”๋ฐ ๋˜‘๊ฐ™์€ ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์˜ค์ง€ ์•Š๋Š” ์‚ฌ๋ก€๊ฐ€ ๋งŽ์•„ ์žฌํ˜„์„ฑ ์œ„๊ธฐ๊ฐ€ ๋ฌธ์ œ ๋˜๊ณ  ์žˆ์Œ

    ์ค‘์š”์„ฑ

    • ๊ฒฐ๊ณผ๊ฐ€ ์žฌํ˜„๋˜์ง€ ์•Š๋Š”๋‹ค๋ฉด ํ•ด๋‹น ๊ฐ€์„ค์˜ ์‹ ๋ขฐ๋„๊ฐ€ ๋–จ์–ด์ง

    ์žฌํ˜„์„ฑ ์œ„๊ธฐ์˜ ์›์ธ์€ ๋ฌด์—‡์ธ๊ฐ€ โœ”๏ธ

    • ์‹คํ—˜ ์กฐ๊ฑด์„ ๋™์ผํ•˜๊ฒŒ ์กฐ์„ฑํ•˜๊ธฐ ์–ด๋ ค์›€
      • ์™„์ „ ๋™์ผํ•˜๊ฒŒ ๋‹ค์‹œ ๋˜‘๊ฐ™์€ ์‹คํ—˜์„ ์ˆ˜ํ–‰ํ•˜๋Š” ๊ฒƒ์ด ์‰ฝ์ง€ ์•Š์Œ
      • ๋˜ํ•œ ๊ฐ€์„ค๊ฒ€์ • ์ž์ฒด๋„ 100% ๊ฒ€์ •๋ ฅ์„ ๊ฐ€์ง„ ๊ฒƒ์ด ์•„๋‹ˆ๊ธฐ ๋•Œ๋ฌธ์— ์˜ค์ฐจ๊ฐ€ ๋‚˜ํƒ€๋‚  ์ˆ˜ ์žˆ์Œ
    • ๊ฐ€์„ค๊ฒ€์ • ์‚ฌ์šฉ๋ฐฉ๋ฒ•์— ์žˆ์–ด์„œ ์ž˜๋ชป๋จ
      • p๊ฐ’์ด 0.05๊ฐ€ ์œ ๋„๋˜๊ฒŒ๋” ์กฐ์ž‘ํ•˜๋Š” ๊ฒƒ์ด ๊ฐ€๋Šฅ (pํ•ดํ‚น)
      • ์‹ค์ œ๋กœ๋Š” ํ†ต๊ณ„์ ์œผ๋กœ ์•„๋ฌด ์˜๋ฏธ๊ฐ€ ์—†์Œ์—๋„ ์˜๋ฏธ๊ฐ€ ์žˆ๋‹ค๊ณ  ํ•ด๋ฒ„๋ฆฌ๊ณ  1์ข… ์˜ค๋ฅ˜๋ฅผ ์ €์ง€๋ฅผ ์ˆ˜ ์žˆ์Œ
      • 0.05๋ผ๋Š” ๊ฒƒ์€ 100๋ฒˆ ์ค‘์— 5๋ฒˆ ์ฆ‰, 20๋ฒˆ ์ค‘์— 1๋ฒˆ์€ ๊ท€๋ฌด๊ฐ€์„ค์ด ์˜ฎ์Œ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ๊ธฐ๊ฐ๋  ์ˆ˜ ์žˆ์Œ
      • ์œ ์˜ ์ˆ˜์ค€์œผ๋กœ ํ†ต์ œํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”
      • ํ•˜์ง€๋งŒ, ์œ ์˜ ์ˆ˜์ค€์„ ๋„ˆ๋ฌด ๋‚ฎ์ถ”๋ฉด ๋ฒ ํƒ€๊ฐ’์ด ์ปค์ ธ๋ฒ„๋ฆฌ๋Š” ๋ฌธ์ œ ๋ฐœ์ƒ
      • ๋”ฐ๋ผ์„œ, ์–ด๋–ค ๋…ผ๋ฌธ์—์„œ๋Š” ์œ ์˜ ์ˆ˜์ค€์„ 0.005๋กœ ์„ค์ •ํ•˜๋ฉด์„œ ๋ฐ์ดํ„ฐ ์ˆ˜๋ฅผ 70% ๋” ๋Š˜๋ ค์„œ ๋ฒ ํƒ€ ๊ฐ’๋„ ์ปจํŠธ๋กคํ•˜๋Š” ๋ฐฉํ–ฅ์„ ์ œ์•ˆํ•˜๊ธฐ๋„ ํ•จ
      • ์ž˜๋ชป๋œ ๊ฐ€์„ค์„ ์„ธ์šฐ๋”๋ผ๋„ ์šฐ์—ฐํžˆ 0.05๋ณด๋‹ค ๋‚ฎ์•„์„œ ๊ฐ€์„ค์ด ๋งž๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ๋ณด์ผ ์ˆ˜ ์žˆ์Œ ๋”ฐ๋ผ์„œ ๊ฐ€๋Šฅํ•œ ์ข‹์€ ๊ฐ€์„ค์„ ์„ธ์šฐ๋Š” ๊ฒƒ๋„ ์ค‘์š”

    p-ํ•ดํ‚น

    ์ธ์œ„์ ์œผ๋กœ p-๊ฐ’์„ ๋‚ฎ์ถ”์ง€ ์•Š์„ ์ˆ˜ ์žˆ๋„๋ก ์กฐ์‹ฌํ•ด์•ผ ํ•จ

     

    p-ํ•ดํ‚น

    • ๋ฐ์ดํ„ฐ ๋ถ„์„์„ ๋ฐ˜๋ณตํ•˜์—ฌ p-๊ฐ’์„ ์ธ์œ„์ ์œผ๋กœ ๋‚ฎ์ถ”๋Š” ํ–‰์œ„
    • ์œ ์˜๋ฏธํ•œ ๊ฒฐ๊ณผ๋ฅผ ์–ป๊ธฐ์œ„ํ•ด ๋‹ค์–‘ํ•œ ๋ณ€์ˆ˜๋ฅผ ์‹œ๋„ํ•˜๊ฑฐ๋‚˜, ๋ฐ์ดํ„ฐ๋ฅผ ๊ณ„์†ํ•ด์„œ ๋ถ„์„ํ•˜๋Š” ๋“ฑ์˜ ๋ฐฉ๋ฒ•์„ ํฌํ•จ

    ๋ฌธ์ œ์ 

    • p-ํ•ดํ‚น์€ ๋ฐ์ดํ„ฐ ๋ถ„์„ ๊ฒฐ๊ณผ์˜ ์‹ ๋ขฐ์„ฑ์„ ์ €ํ•˜์‹œํ‚ด

    p-ํ•ดํ‚น์€ ์–ธ์ œ ์กฐ์‹ฌํ•ด์•ผ ํ•˜๋Š”๊ฐ€โ‰๏ธ

    • ์—ฌ๋Ÿฌ ๊ฐ€์„ค ๊ฒ€์ •์„ ์‹œ๋„ํ•  ๋•Œ
      • ์—ฌ๋Ÿฌ ๊ฐ€์„ค ๊ฒ€์ •์„ ์‹œ๋„ํ•˜์—ฌ ์œ ์˜๋ฏธํ•œ p-๊ฐ’์„ ์–ป์„ ๋•Œ๊นŒ์ง€ ๋ฐ˜๋ณต ๋ถ„์„ํ•˜๋Š” ๊ฒƒ์„ ์กฐ์‹ฌ
      • p-ํ•ดํ‚น์€ ์œ ์˜๋ฏธํ•œ ๊ฒฐ๊ณผ๋ฅผ ์–ป๊ธฐ ์œ„ํ•ด p-๊ฐ’์ด 0.05 ์ดํ•˜์ธ ๊ฒฐ๊ณผ๋งŒ ์„ ํƒ์ ์œผ๋กœ ๋ณด๊ณ ํ•˜๋Š” ํ–‰์œ„๋ฅผ ์กฐ์‹ฌ
      • ๋ฐ์ดํ„ฐ์˜ ์ˆ˜๋ฅผ ๋Š˜๋ฆฌ๋‹ค๋ณด๋‹ˆ ํŠน์ • ๋ฐ์ดํ„ฐ ์ˆ˜๋ฅผ ๊ธฐ๋กํ•  ๋•Œ ์ž ๊น p๊ฐ’์ด 0.05 ์ดํ•˜๋ฅผ ๊ธฐ๋กํ•จ์œผ๋กœ ์ด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ๋Œ€๋ฆฝ๊ฐ€์„ค ์ฑ„ํƒํ•˜๋Š” ๊ฒƒ์„ ์กฐ์‹ฌ
      • ์ฆ‰, ๊ฒฐ๊ณผ๋ฅผ ๋ณด๋ฉฐ ๋ฐ์ดํ„ฐ ๊ฐœ์ˆ˜๋ฅผ ๋Š˜๋ ค์„œ๋Š” ์•ˆ ๋จ
      • ๋‹ค์–‘ํ•œ ์ƒํ™ฉ ์ค‘์—์„œ p๊ฐ’์ด ์œ ๋ฆฌํ•˜๊ฒŒ ๋‚˜์˜ค๋Š” ์ƒํ™ฉ๋งŒ ์„ ๋ณ„์ ์œผ๋กœ ๋ณด๊ณ ํ•˜๋Š” ๊ฒƒ์„ ์กฐ์‹ฌ
      • ๋‹ค์–‘ํ•œ ๋ณ€์ˆ˜๋ฅผ ๊ฑด๋“œ๋ฆฌ๋ฉฐ ์œ ๋ฆฌํ•œ ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์˜ฌ ๋•Œ ๋‹ค์‹œ ์ฒ˜์Œ๋ถ€ํ„ฐ ๊ฐ€์„ค์„ ๊ทธ ๊ฒฐ๊ณผ์— ๋งž๊ฒŒ ์„ธ์šฐ๋Š” ๊ฒƒ
      • ์ฆ‰, ๋งˆ์Œ์— ๋“œ๋Š” ์ƒํ™ฉ๋งŒ ๊ณจ๋ผ์„œ ๋ณด๊ณ ํ•ด์„œ๋„ ์•ˆ ๋จ ๋ชจ๋“  ๊ฒฐ๊ณผ๋ฅผ ๋‹ค ๋ณด๊ณ  ํ•˜๊ฑฐ๋‚˜ ๋” ์—„๊ฒฉํ•œ ์ถ”๊ฐ€์‹คํ—˜์„ ์ˆ˜ํ–‰
      • ๊ฐ€๋Šฅํ•œ ๊ฐ€์„ค์„ ๋ฏธ๋ฆฌ ์„ธ์šฐ๊ณ  ๊ฒ€์ฆํ•˜๋Š” ๊ฐ€์„ค๊ฒ€์ฆํ˜• ๋ฐฉ์‹์œผ๋กœ ๋ถ„์„์„ ํ•ด์•ผํ•˜๋ฉฐ ๋งŒ์•ฝ ํƒ์ƒ‰์ ์œผ๋กœ ๋ถ„์„ํ•œ ๊ฒฝ์šฐ ๊ฐ€๋Šฅํ•œ ๋ชจ๋“  ๋ณ€์ˆ˜๋ฅผ ๋ณด๊ณ ํ•˜๊ณ  ๋ณธํŽ˜๋กœ๋‹ˆ ๋ณด์ •๊ณผ ๊ฐ™์€ ๋ฐฉ๋ฒ•์„ ์‚ฌ์šฉํ•ด์•ผ ํ•จ

    ์„ ํƒ์  ๋ณด๊ณ 

    ๋ง ๊ทธ๋Œ€๋กœ ์„ ํƒ์ ์œผ๋กœ ๋ณด๊ณ ํ•˜๋Š” ๊ฒƒ

     

    ์„ ํƒ์  ๋ณด๊ณ 

    • ์œ ์˜๋ฏธํ•œ ๊ฒฐ๊ณผ๋งŒ์„ ๋ณด๊ณ ํ•˜๊ณ , ์œ ์˜๋ฏธํ•˜์ง€ ์•Š์€ ๊ฒฐ๊ณผ๋Š” ๋ณด๊ณ ํ•˜์ง€ ์•Š๋Š” ํ–‰์œ„
    • ์ด๋Š” ๋ฐ์ดํ„ฐ ๋ถ„์„์˜ ๊ฒฐ๊ณผ๋ฅผ ์™œ๊ณกํ•˜๊ณ , ์‹ ๋ขฐ์„ฑ์„ ์ €ํ•˜์‹œํ‚ด

    • ๋ชจ๋“  ๊ฒฐ๊ณผ์™€ ์„ ํƒ์ ์œผ๋กœ ๋ณด๊ณ ๋œ ๊ฒฐ๊ณผ๋ฅผ ํžˆ์Šคํ† ๊ทธ๋žจ์œผ๋กœ ๋‚˜ํƒ€๋ƒ„
    • ์ „์ฒด ๊ฒฐ๊ณผ์™€ ๋ณด๊ณ ๋œ ๊ฒฐ๊ณผ์˜ ๋ถ„ํฌ๊ฐ€ ๋‹ค๋ฅด๋ฉด ์„ ํƒ์  ๋ณด๊ณ ์˜ ๊ฐ€๋Šฅ์„ฑ์„ ์‹œ์‚ฌ

    ์„ ํƒ์  ๋ณด๊ณ ๋Š” ์–ธ์ œ ์กฐ์‹ฌํ•ด์•ผ ํ•˜๋Š”๊ฐ€โ‰๏ธ

    • ์œ ์˜๋ฏธํ•œ ๊ฒฐ๊ณผ๋งŒ ๊ณต๊ฐœํ•  ๋•Œ
      • ๋Œ€์ˆ˜์˜ ๋ฐ์ดํ„ฐ ๋ถ„์„ ์ค‘ ์œ ์˜๋ฏธํ•œ ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์˜จ ์‹คํ—˜๋งŒ์„ ๋ณด๊ณ ์„œ์— ์ž‘์„ฑํ•˜์—ฌ ๋ฐœํ‘œ
    • ๊ฒฐ๊ณผ๋ฅผ ๋ณด๋ฉด์„œ ๊ฐ€์„ค์„ ๋‹ค์‹œ ์ƒˆ๋กœ ์„ค์ •ํ–ˆ๋Š”๋ฐ ๋งˆ์น˜ ์ฒ˜์Œ๋ถ€ํ„ฐ ์„ค์ •ํ•œ ๊ฐ€์„ค์ด๋ผ๊ณ  ์–˜๊ธฐํ•  ๋•Œ
      • ๋ฏธ๋ฆฌ ๊ฐ€์„ค๊ณผ ์‹คํ—˜ ๋ฐฉ๋ฒ•๋“ฑ์— ๋Œ€ํ•ด์„œ ์„ค์ •์„ ํ•œ๋‹ค์Œ ์—ฐ๊ตฌ๋ฅผ ์ˆ˜ํ–‰ํ•˜๊ฑฐ๋‚˜ ์—ฐ๊ตฌํ•˜๋Š” ๋™์•ˆ ์–ป์–ด์ง„ ๋ชจ๋“  ๋ณ€์ˆ˜์™€ ๊ฒฐ๊ณผ์— ๋Œ€ํ•ด์„œ ๊ณต๊ฐœํ•˜์ง€ ๋ชปํ•  ๋•Œ

    ์ž๋ฃŒ์ˆ˜์ง‘ ์ค‘๋‹จ ์‹œ์  ๊ฒฐ์ •

    ์›ํ•˜๋Š” ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์˜ฌ ๋•Œ๊นŒ์ง€ ์ž๋ฃŒ๋ฅผ ์ˆ˜์ง‘ํ•˜๋Š” ๊ฒƒ์„ ์กฐ์‹ฌ

     

    ์ž๋ฃŒ์ˆ˜์ง‘ ์ค‘๋‹จ ์‹œ์  ๊ฒฐ์ •

    • ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘์„ ์‹œ์ž‘ํ•˜๊ธฐ ์ „์— ์–ธ์ œ ์ˆ˜์ง‘์„ ์ค‘๋‹จํ• ์ง€ ๋ช…ํ™•ํ•˜๊ฒŒ ๊ฒฐ์ •ํ•˜์ง€ ์•Š์œผ๋ฉด, ์›ํ•˜๋Š” ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์˜ฌ ๋•Œ๊นŒ์ง€ ๋ฐ์ดํ„ฐ๋ฅผ ๊ณ„์† ์ˆ˜์ง‘ํ•  ์ˆ˜ ์žˆ์Œ. ์ด๋Š” ๊ฒฐ๊ณผ์˜ ์‹ ๋ขฐ์„ฑ์„ ๋–จ์–ด๋œจ๋ฆผ

    • ์ƒ˜ํ”Œ ํฌ๊ธฐ์— ๋”ฐ๋ฅธ ํ‰๊ท ๊ฐ’๊ณผ 95% ์‹ ๋ขฐ๊ตฌ๊ฐ„์„ ๋‚˜ํƒ€๋‚ธ ๊ทธ๋ž˜ํ”„
    • ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘์„ ์–ธ์ œ ๋ฉˆ์ถœ์ง€ ๊ฒฐ์ •ํ•˜๋Š” ๊ฒƒ์€ ๊ฒฐ๊ณผ์— ์˜ํ–ฅ์„ ๋ฏธ์น  ์ˆ˜ ์žˆ์Œ
    • ์ด์ƒ์ ์œผ๋กœ ์‚ฌ์ „์— ์ •ํ•ด์ง„ ๊ณ„ํš์— ๋”ฐ๋ผ์•ผ ํ•จ

    ์ž๋ฃŒ์ˆ˜์ง‘ ์ค‘๋‹จ ์‹œ์ ์€ ์–ธ์ œ ์กฐ์‹ฌํ•ด์•ผ ํ•˜๋Š”๊ฐ€ โ‰๏ธ

    • ๊ฒฐ๊ณผ๋ฅผ ์ด๋ฏธ ์ •ํ•ด๋†“๊ณ  ๊ทธ์— ๋งž์ถ”๊ธฐ ์œ„ํ•ด ์ž๋ฃŒ์ˆ˜์ง‘์„ ํ•˜๊ณ ์ž ํ•  ๋•Œ
      • 50๋ช…์˜ ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ•˜๊ธฐ๋กœ ํ–ˆ์œผ๋‚˜, ์›ํ•˜๋Š” ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์˜ค์ง€ ์•Š์ž 100๋ช…๊นŒ์ง€ ์ถ”๊ฐ€๋กœ ์ˆ˜์ง‘
    # ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ์˜ˆ์‹œ
    np.random.seed(42)
    data = np.random.normal(0, 1, 1000)
    sample_sizes = [10, 20, 30, 40, 50, 100, 200, 300, 400, 500]
    p_values = []
    
    for size in sample_sizes:
        sample = np.random.choice(data, size)
        _, p_value = stats.ttest_1samp(sample, 0)
        p_values.append(p_value)
    
    # p-๊ฐ’ ์‹œ๊ฐํ™”
    plt.plot(sample_sizes, p_values, marker='o')
    plt.axhline(y=0.05, color='red', linestyle='dashed', linewidth=1)
    plt.title('์ž๋ฃŒ์ˆ˜์ง‘ ์ค‘๋‹จ ์‹œ์ ์— ๋”ฐ๋ฅธ p-๊ฐ’ ๋ณ€ํ™”')
    plt.xlabel('์ƒ˜ํ”Œ ํฌ๊ธฐ')
    plt.ylabel('p-๊ฐ’')
    plt.show()
    •  

    ๋ฐ์ดํ„ฐ ํƒ์ƒ‰๊ณผ ๊ฒ€์ฆ ๋ถ„๋ฆฌ

    ๊ฒ€์ฆํ•˜๊ธฐ ์œ„ํ•œ ๋ฐ์ดํ„ฐ๋Š” ๋ฐ˜๋“œ์‹œ ๋”ฐ๋กœ ๋ถ„๋ฆฌ ํ•ด๋†“์•„์•ผ ํ•จ

     

    ๋ฐ์ดํ„ฐ ํƒ์ƒ‰๊ณผ ๊ฒ€์ฆ ๋ถ„๋ฆฌ

    • ๋ฐ์ดํ„ฐ ํƒ์ƒ‰์„ ํ†ตํ•ด ๊ฐ€์„ค์„ ์„ค์ •ํ•˜๊ณ , ์ด๋ฅผ ๊ฒ€์ฆํ•˜๊ธฐ ์œ„ํ•ด ๋ณ„๋„์˜ ๋…๋ฆฝ๋œ ๋ฐ์ดํ„ฐ์…‹์„ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ
    • ์ด๋Š” ๋ฐ์ดํ„ฐ ๊ณผ์ ‘ํ•ฉ์„ ๋ฐฉ์ง€ํ•˜๊ณ  ๊ฒฐ๊ณผ์˜ ์‹ ๋ขฐ์„ฑ์„ ๋†’์ž„ 

    • ํƒ์ƒ‰ ๋ฐ์ดํ„ฐ์™€ ๊ฒ€์ฆ ๋ฐ์ดํ„ฐ๋ฅผ ํžˆ์Šคํ† ๊ทธ๋žจ์œผ๋กœ ๋‚˜ํƒ€๋ƒ„
    • ๋ฐ์ดํ„ฐ ํƒ์ƒ‰๊ณผ ๊ฒ€์ฆ์„ ๋ถ„๋ฆฌํ•˜๋ฉด ํƒ์ƒ‰ ๊ณผ์ •์—์„œ ๋ฐœ๊ฒฌ๋œ ํŒจํ„ด์ด ๊ฒ€์ฆ ๋ฐ์ดํ„ฐ์—์„œ๋„ ์œ ํšจํ•œ์ง€ ํ™•์ธ ๊ฐ€๋Šฅ
    • ๊ฒ€์ฆ ๋ฐ์ดํ„ฐ๋Š” ์ฒ ์ €ํ•˜๊ฒŒ ํƒ์ƒ‰ ๋ฐ์ดํ„ฐ์™€ ๊ตฌ๋ถ„๋˜์–ด์ ธ์•ผ ํ•จ

    ๋ฐ์ดํ„ฐ ํƒ์ƒ‰๊ณผ ๊ฒ€์ฆ ๋ถ„๋ฆฌ๋Š” ์–ธ์ œ ์‚ฌ์šฉํ•ด์•ผ ํ•˜๋Š”๊ฐ€ โ‰๏ธ

    • ๊ฒ€์ฆํ•˜๊ธฐ ์œ„ํ•œ ๋ฐ์ดํ„ฐ๊ฐ€ ๋”ฐ๋กœ ํ•„์š”ํ•  ๋•Œ
      • ๋ฐ์ดํ„ฐ์…‹์„ ํƒ์ƒ‰์šฉ๊ณผ ๊ฒ€์ฆ์šฉ์œผ๋กœ ๋ถ„๋ฆฌํ•˜์—ฌ ์‚ฌ์šฉ
    from sklearn.model_selection import train_test_split
    
    # ๋ฐ์ดํ„ฐ ์ƒ์„ฑ
    np.random.seed(42)
    X = 2 * np.random.rand(100, 1)
    y = 4 + 3 * X + np.random.randn(100, 1)
    
    # ๋ฐ์ดํ„ฐ ๋ถ„ํ•  (ํƒ์ƒ‰์šฉ 80%, ๊ฒ€์ฆ์šฉ 20%)
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
    
    # ๋ชจ๋ธ ํ•™์Šต
    model = LinearRegression()
    model.fit(X_train, y_train)
    
    # ํƒ์ƒ‰์šฉ ๋ฐ์ดํ„ฐ๋กœ ์˜ˆ์ธก
    y_train_pred = model.predict(X_train)
    
    # ๊ฒ€์ฆ์šฉ ๋ฐ์ดํ„ฐ๋กœ ์˜ˆ์ธก
    y_test_pred = model.predict(X_test)
    
    # ํƒ์ƒ‰์šฉ ๋ฐ์ดํ„ฐ ํ‰๊ฐ€
    train_mse = mean_squared_error(y_train, y_train_pred)
    train_r2 = r2_score(y_train, y_train_pred)
    print(f"ํƒ์ƒ‰์šฉ ๋ฐ์ดํ„ฐ - MSE: {train_mse}, R2: {train_r2}")
    
    # ๊ฒ€์ฆ์šฉ ๋ฐ์ดํ„ฐ ํ‰๊ฐ€
    test_mse = mean_squared_error(y_test, y_test_pred)
    test_r2 = r2_score(y_test, y_test_pred)
    print(f"๊ฒ€์ฆ์šฉ ๋ฐ์ดํ„ฐ - MSE: {test_mse}, R2: {test_r2}")

     

    ๐ŸŸขํ†ต๊ณ„ํ•™์„ ๊ณต๋ถ€ํ•˜๊ธฐ ์œ„ํ•˜์—ฌ

    • ์—ฌ์ธ๊ถŒ ๊ต์ˆ˜๋‹˜์˜ ๊ธฐ์ดˆํ†ต๊ณ„ํ•™
    • ๊ณ ์ง€๋งˆ ํžˆ๋กœ์œ ํ‚ค,  ์„ธ์ƒ์—์„œ ๊ฐ€์žฅ ์‰ฌ์šด ํ†ต๊ณ„ํ•™ ์ž…๋ฌธ
      1. https://m.blog.naver.com/ahnsfarm/222164446352
      2. https://jhnoru.tistory.com/121
    • ์•„๋ฒ  ๋งˆ์‚ฌํ† , ํ†ต๊ณ„ 101 x ๋ฐ์ดํ„ฐ ๋ถ„์„
     

    2270 ์„ธ์ƒ์—์„œ ๊ฐ€์žฅ ์‰ฌ์šด ํ†ต๊ณ„ํ•™ ์ž…๋ฌธ - ๊ณ ์ง€๋งˆ ํžˆ๋กœ์œ ํ‚ค

    ์„ธ์ƒ์—์„œ ๊ฐ€์žฅ ์‰ฌ์šด ํ†ต๊ณ„ํ•™ ์ž…๋ฌธ      ๅฎŒๅ…จ็จ็ฟ’็ตฑ่จˆๅญธๅ…ฅ้–€   ๊ณ ...

    blog.naver.com

     

     

    ์„ธ์ƒ์—์„œ ๊ฐ€์žฅ ์‰ฌ์šด ํ†ต๊ณ„ํ•™ ์ž…๋ฌธ[๊ณ ์ง€๋งˆ ํžˆ๋กœ์œ ํ‚ค] ์ •๋ฆฌ

     

    jhnoru.tistory.com

     

    ์—ฐ์Šต๋ฌธ์ œ

    1. ์žฌํ˜„ ๊ฐ€๋Šฅ์„ฑ์— ๋Œ€ํ•œ ์„ค๋ช…์œผ๋กœ ์˜ณ์€ ๊ฒƒ

    • ์žฌํ˜„ ๊ฐ€๋Šฅ์„ฑ์€ ๋‹ค๋ฅธ ์—ฐ๊ตฌ์ž๊ฐ€ ๋™์ผํ•œ ์‹คํ—˜ ์ ˆ์ฐจ๋ฅผ ๋”ฐ๋ผ ์‹คํ—˜์„ ์ˆ˜ํ–‰ํ•˜์—ฌ ๋™์ผํ•œ ๊ฒฐ๊ณผ๋ฅผ ์–ป๋Š” ๊ฒƒ

    2. p-ํ•ดํ‚น์˜ ์ •์˜์— ๊ฐ€์žฅ ๊ฐ€๊นŒ์šด ๊ฒƒ์„ ๊ณ ๋ฅด์„ธ์š”

    • ์—ฐ๊ตฌ์ž๊ฐ€ ์›ํ•˜๋Š” ๊ฒฐ๊ณผ๋ฅผ ์–ป์–ด๋‚ด๊ธฐ ์œ„ํ•ด ๋ฐ์ดํ„ฐ๋ฅผ ๋ฐ˜๋ณต์ ์œผ๋กœ ๋ถ„์„ํ•˜๊ณ  p-value๋ฅผ ์กฐ์ž‘ํ•˜๋Š” ํ–‰์œ„

    3. ์„ ํƒ์  ๋ณด๊ณ (selective reporting)๊ฐ€ ๋ฌธ์ œ์ธ ์ด์œ ๋กœ ์ ์ ˆํ•œ ๊ฒƒ์„ ๊ณ ๋ฅด์„ธ์š”

    • ์—ฐ๊ตฌ์ž๊ฐ€ ์—ฐ๊ตฌ ๊ฒฐ๊ณผ๋ฅผ ์™œ๊ณกํ•˜์—ฌ ๋ณด๊ณ ํ•  ์ˆ˜ ์žˆ๋‹ค

    4. ์ž๋ฃŒ์ˆ˜์ง‘ ์ค‘๋‹จ ์‹œ์ ์„ ๊ฒฐ์ •ํ•  ๋•Œ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ๋Š” ๋ฌธ์ œ๋Š” ๋ฌด์—‡์ธ๊ฐ€์š”

    • ์—ฐ์ˆ˜์ž์˜ ํŽธํ–ฅ์ด ๊ฒฐ๊ณผ์— ์˜ํ–ฅ์„ ๋ฏธ์น  ์ˆ˜ ์žˆ๋‹ค

    5. ๋ฐ์ดํ„ฐ ํƒ์ƒ‰(exploration)๊ณผ ๊ฒ€์ฆ(validation)์„ ๋ถ„๋ฆฌํ•˜๋Š” ์ด์œ ๋กœ ๊ฐ€์žฅ ์ ์ ˆํ•œ ๊ฒƒ์„ ๊ณ ๋ฅด์„ธ์š”

    • ๋ฐ์ดํ„ฐ ํƒ์ƒ‰๊ณผ ๊ฒ€์ฆ์„ ๋ถ„๋ฆฌํ•˜๋ฉด ๊ณผ์ ํ•ฉ(overfitting)์„ ๋ฐฉ์ง€ํ•˜๊ณ  ๋ชจ๋ธ์˜ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ์„ ๋†’์ผ ์ˆ˜ ์žˆ๋‹ค

    'ํ†ต๊ณ„ํ•™' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€

    ์ƒ๊ด€๊ด€๊ณ„  (0) 2025.01.13
    ์œ ์˜์„ฑ๊ฒ€์ •  (0) 2025.01.10
    ํ†ต๊ณ„ํ•™ ๊ธฐ์ดˆ 2  (1) 2025.01.10
    ํ†ต๊ณ„ํ•™ ๊ธฐ์ดˆ  (2) 2025.01.10