๋ชฉ๋กํต๊ณํ (5)
๐๐๐ก๐๐๐๐๐

[ ๋ชฉ์ฐจ ]์ฌํ ๊ฐ๋ฅ์ฑ์ฐ์ฐํ ๊ฒฐ๊ณผ๊ฐ ๋์ค๋ ๊ฒ์ด ์๋, ํญ์ ์ผ๊ด๋ ๊ฒฐ๊ณผ๊ฐ ๋์ค๋์ง ํ์ธํด์ผ ํจ!์ฌํ ๊ฐ๋ฅ์ฑ๋์ผํ ์ฐ๊ตฌ๋ ์คํ์ ๋ฐ๋ณตํ์ ๋ ์ผ๊ด๋ ๊ฒฐ๊ณผ๊ฐ ๋์ค๋์ง ์ฌ๋ถ ( ์ฐ๊ตฌ์ ์ ๋ขฐ์ฑ์ ๋์ด๋ ์ค์ํ ์์ )ex) ์ ์ฝ์ ๊ฐ๋ฐํ ๋ ์คํ์ค์์๋ง ํจ๊ณผ๊ฐ ์๋ ๊ฒ์ด ์๋๋ผ ์ค์ ์ํฉ์์๋ ์ผ๊ด๋ ๊ฒฐ๊ณผ๊ฐ ๋์จ๋ค๊ณ ๋ฏฟ์ ์ ์๊ธฐ ๋๋ฌธ์ ๊ฐ๋ฐ ๊ฐ๋ฅํ ๊ฒ์ต๊ทผ p๊ฐ์ ๋ํ ๋ ผ์์ด ๋๋๋ฌ์ง๊ณ ์์p๊ฐ์ ์ฌ์ฉํ์ง ์๋ ๊ฒ์ด ์ข๋ค์ ์ ์์ค์ 0.05์์ ๋ณ๊ฒฝํ๋ ๊ฒ์ด ์ข๋ค๊ฐ์ค๊ฒ์ ์๋ฆฌ์์ ๋ฌธ์ ๋ ๊ฐ์ค๊ฒ์ ์ ์๋ชป๋ ์ฌ์ฉ์ด ๋ฎ์ ์ฌํ์ฑ์ผ๋ก ์ด์ด์ง๋ค๋ ๋ฌธ์ ๋ฐ์์ต๊ทผ ๋ ผ๋ฌธ์ ๋ค์ ์ฌํํด์ ์คํ์ ํด๋ณด๋๋ฐ ๋๊ฐ์ ๊ฒฐ๊ณผ๊ฐ ๋์ค์ง ์๋ ์ฌ๋ก๊ฐ ๋ง์ ์ฌํ์ฑ ์๊ธฐ๊ฐ ๋ฌธ์ ๋๊ณ ์์์ค์์ฑ๊ฒฐ๊ณผ๊ฐ ์ฌํ๋์ง ์๋๋ค๋ฉด ํด๋น ๊ฐ์ค์ ์ ๋ขฐ๋๊ฐ ๋จ..

[ ๋ชฉ์ฐจ ] ํผ์ด์จ ์๊ด๊ณ์๊ฐ์ฅ ๋ํ์ ์ผ๋ก ๋ง์ด ์ฌ์ฉํ๋ ์๊ด๊ณ์ํ๋์ ์ ๋ค๋ก ๋ํ๋ด์์ผ๋ฉฐ, x์ y์ ์ ํ ๊ด๊ณ๋ฅผ ๋ณด์ฌ์ค๊ทธ๋ํ์์ ์ ๋ค์ด ์ง์ ์ ์ผ๋ก ํผ์ ธ์์ผ๋ฉฐ, ์๊ด๊ณ์๋ 0.99๋ก ๋งค์ฐ ๊ฐํ ์์ ์ ํ ๊ด๊ณ๋ฅผ ๋ํ๋ํผ์ด์จ ์๊ด๊ณ์๋ ์ฐ์ํ ๋ณ์ ๊ฐ์ ์ ํ ๊ด๊ณ๋ฅผ ์ธก์ ํ๋ ์งํ-1์์ 1์ฌ์ด์ ๊ฐ์ ๊ฐ์ง๋ฉฐ1์ ์์ ํ ์์ ์ ํ ๊ด๊ณ-1์ ์์ ํ ์์ ์ ํ ๊ด๊ณ0์ ์ ํ ๊ด๊ณ๊ฐ ์์์ ์๋ฏธํผ์ด์จ ์๊ด๊ณ์๋ ์ธ์ ์ฌ์ฉํ ๊นโ๊ณต๋ถ ์๊ฐ๊ณผ ์ํ ์ ์ ๊ฐ์ ์๊ด๊ด๊ณ ๋ถ์ํ ๋๐ซ๋น์ ํ ๊ด๊ณ์์ ์ฌ์ฉํ ์ ์์ import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsfrom scipy.stats import pe..

[ ๋ชฉ์ฐจ ]A/B ๊ฒ์ : ๋ ๋ฒ์ (A์ B) ์ค ์ด๋ ๊ฒ์ด ๋ ํจ๊ณผ์ ์ธ์ง ํ๊ฐํ๊ธฐ ์ํด ์ฌ์ฉ๋๋ ๊ฒ์ ๋ฐฉ๋ฒ๋ง์ผํ , ์น์ฌ์ดํธ ๋์์ธ ๋ฑ์์ ๋ง์ด ์ฌ์ฉ๋จ์ฌ์ฉ์๋ค์ ๋ ๊ทธ๋ฃน์ผ๋ก ๋๋๊ณ , ๊ฐ ๊ทธ๋ฃน์ ๋ค๋ฅธ ๋ฒ์ ์ ์ ๊ณตํ ํ, ๋ฐ์ ๋น๊ต์ผ๋ฐ์ ์ผ๋ก ์ ํ์จ, ๊ตฌ๋งค์, ๋ฐฉ๋ฌธ ๊ธฐ๊ฐ, ๋ฐฉ๋ฌธํ ํ์ด์ง ์, ํน์ ํ์ด์ง ๋ฐฉ๋ฌธ ์ฌ๋ถ, ๋งค์ถ๋ฑ์ ์งํ ๋น๊ต๋ชฉ์ ๋ ๊ทธ๋ฃน ๊ฐ์ ๋ณํ๊ฐ ์ฐ์ฐ์ด ์๋๋ผ ํต๊ณ์ ์ผ๋ก ์ ์๋ฏธํ์ง๋ฅผ ํ์ธA/B ๊ฒ์ ์ด ์ค์ ๋ก ์ด๋ป๊ฒ ์ ์ฉ๋๋์ง์จ๋ผ์ธ ์ผํ๋ชฐ์์ ๋ ๊ฐ์ง ๋์์ธ(A์ B)์ ๋ํ ๋๋ฉ ํ์ด์ง๋ฅผ ํ ์คํธํ์ฌ ์ด๋ค ๋์์ธ์ด ๋ ๋์ ๊ตฌ๋งค ์ ํ์จ์ ๊ฐ์ ธ์ค๋์ง ํ๊ฐimport numpy as np import scipy.stats as stats # ๊ฐ์ ๋ ์ ํ์จ ๋ฐ์ดํฐ group_a = np.random.bin..

[ ๋ชฉ์ฐจ ]๋ชจ์ง๋จ: ๊ถ๊ทน์ ์ผ๋ก ๊ด์ฌ์๋ ์ง๋จ, ๋ชจ์ง๋จ์ ํน์ง์ ๋ชจ์๋ผ ํจex) ์ธ๊ตฌ ์ด์กฐ์ฌ ํ์ค ์ง๋จ: ๋ชจ์ง๋จ์์ ํน์ ํ ๋ฐฉ๋ฒ์ ์ด์ฉํ์ฌ ๋ฝ์๋ธ ์์์ ์ง๋จ, ํน์ง๋ค์ ํต๊ณ๋์ด๋ผ ํจex) ๋ฏธ๊ตญ๋์ ์ถ๊ตฌ์กฐ์ฌ๋ชจ์ง๋จ์ ๋ชจ๋ ์ ์์กฐ์ฌํ์ฌ ๊ธฐ์ ํต๊ณ๋ฅผ ํ๋ฉด ์ ํํ ๊ฐ์ ์ป์ ์ ์์ง๋ง ๋น์ฉ์ ํ๊ณ๋ก ์ํํ์ง ๋ชปํ๋ ๊ฒฝ์ฐ์ "๋ํ์ฑ"์๋ ์ํ์ ์ถ์ถํ์ฌ ์ด๋ฅผ ์ถ๋ก ํ๋ ๊ฒ์ด ๋ชฉ์ ํ๋ณธ ์ถ์ถ์ ์ค์์ฑ์ํ๋ง ํธํฅ(Sampling bias) : ๋ถ์ ๋์์ด ํ๋ณธ์ ์ ํํ ๋ ๊ณผ๋ํ๊ฒ ๋ํ๋๊ฑฐ๋ ๋ฐ๋์ ๊ฒฝ์ฐ1936๋ ๋ฏธ๊ตญ๋์ ๋น์ ๋ฏผ์ฃผ๋น ๋ฃจ์ฆ๋ฒจํธ vs ๊ณตํ๋น ๋๋์ ๊ฒฝ์ 1000๋ง๋ช ์ด ๋๋ ์ฌ๋์ผ๋ก๋ถํฐ ๋์ ์ค๋ฌธ ์กฐ์ฌ ์งํ → ๊ณตํ๋น ๋๋ ์น๋ฆฌ ์์ธก๊ฐค๋ฝ์ ๊ฒจ์ฐ 2000๋ช ์ ๋์์ผ๋ก ๊ฒฉ์ฃผ๋ก ์ฌ๋ก ์กฐ์ฌ ์ค์ → ๋ฏผ์ฃผ๋น ๋ฃจ์ฆ๋ฒจํธ ์น๋ฆฌ..

[ ๋ชฉ์ฐจ ]๋ฐ์ดํฐ ๋ถ์์ผ๋ก ํ ์ ์๋ ์ผ๊ธฐ์ ํต๊ณ/์๊ฐํ : ๋ฐ์ดํฐ ๋ช ํํ๊ฒ ๋ณด๊ธฐ์ถ๋ก ํต๊ณ : ์์ง๋ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ง์ง ๊ทธ ์ฌ์ค์ด ๋ง๋? ํ์ธ๋จธ์ ๋ฌ๋/๋ฅ๋ฌ๋ : ์๊ณ ๋ฆฌ์ฆ์ ๊ธฐ๋์ด ๊ฒฐ๊ณผ๋ฅผ ์์ธกํ๊ฑฐ๋ ์๋ก์ด ์ ๋ณด ๋์ถํต๊ณํ ๋๊ตฌExcelSASRPython์์์๋ฃํ์ ์ข ๋ฅ๋ฒ์ฃผํ ์๋ฃ๋ช ๋ชฉํ ์๋ฃ : ์์๊ฐ ์๋ฏธ ์๋ ์๋ฃ (ex : ํ์กํ A, B, O, AB)์์ํ ์๋ฃ : ์์๊ฐ ์๋ฏธ ์๋ ์๋ฃ (ex : ํ์ A, B, C)์์นํ ์๋ฃ์ด์ฐํ ์๋ฃ : ๋ ๋ฐ์ดํฐ ๊ตฌ๊ฐ์ด ์ ํํ ์๋ฃ (ex : 1๋ช ,2๋ช )์ฐ์ํ ์๋ฃ : ๋ ๋ฐ์ดํฐ ๊ตฌ๊ฐ์ด ๋ฌดํํ ์๋ฃ (ex : ํค 160 ~ 170)๋ฒ์ฃผํ ์๋ฃ๋ ์ธ๊ฐ์ ์ธ์ด๋ก ํํ๋ ์๋ฃ์ด๊ธฐ ๋๋ฌธ์ ์ปดํจํฐ ํน์ ์์์ ์ ์ฉํ ๋๋ ๋ฐ๋์ ์ซ์ํ์ผ๋ก ๋ณํํ์ฌ ์ ๋ฌํด์ผ ํจco..