λͺ©λ‘λΆ„λ₯˜ 전체보기 (33)

π‘π‘œπ‘‘π‘’π‘π‘œπ‘œπ‘˜

μœ μ˜μ„±κ²€μ •

[ λͺ©μ°¨ ]A/B κ²€μ •: 두 버전(A와 B) 쀑 μ–΄λŠ 것이 더 νš¨κ³Όμ μΈμ§€ ν‰κ°€ν•˜κΈ° μœ„ν•΄ μ‚¬μš©λ˜λŠ” κ²€μ • λ°©λ²•λ§ˆμΌ€νŒ…, μ›Ήμ‚¬μ΄νŠΈ λ””μžμΈ λ“±μ—μ„œ 많이 μ‚¬μš©λ¨μ‚¬μš©μžλ“€μ„ 두 그룹으둜 λ‚˜λˆ„κ³ , 각 그룹에 λ‹€λ₯Έ 버전을 μ œκ³΅ν•œ ν›„, λ°˜μ‘ λΉ„κ΅μΌλ°˜μ μœΌλ‘œ μ „ν™˜μœ¨, ꡬ맀수, λ°©λ¬Έ κΈ°κ°„, λ°©λ¬Έν•œ νŽ˜μ΄μ§€ 수, νŠΉμ • νŽ˜μ΄μ§€ λ°©λ¬Έ μ—¬λΆ€, λ§€μΆœλ“±μ˜ μ§€ν‘œ 비ꡐλͺ©μ λ‘ κ·Έλ£Ή κ°„μ˜ λ³€ν™”κ°€ μš°μ—°μ΄ μ•„λ‹ˆλΌ ν†΅κ³„μ μœΌλ‘œ μœ μ˜λ―Έν•œμ§€λ₯Ό 확인A/B 검정이 μ‹€μ œλ‘œ μ–΄λ–»κ²Œ μ μš©λ˜λŠ”μ§€μ˜¨λΌμΈ μ‡Όν•‘λͺ°μ—μ„œ 두 κ°€μ§€ λ””μžμΈ(A와 B)에 λŒ€ν•œ λžœλ”© νŽ˜μ΄μ§€λ₯Ό ν…ŒμŠ€νŠΈν•˜μ—¬ μ–΄λ–€ λ””μžμΈμ΄ 더 높은 ꡬ맀 μ „ν™˜μœ¨μ„ κ°€μ Έμ˜€λŠ”μ§€ 평가import numpy as np import scipy.stats as stats # κ°€μ •λœ μ „ν™˜μœ¨ 데이터 group_a = np.random.bin..

톡계학 2025. 1. 10. 14:15
톡계학 기초 2

[ λͺ©μ°¨ ]λͺ¨μ§‘단: ꢁ극적으둜 κ΄€μ‹¬μžˆλŠ” 집단, λͺ¨μ§‘λ‹¨μ˜ νŠΉμ§•μ„ λͺ¨μˆ˜λΌ 함ex) 인ꡬ 총쑰사 ν‘œμ€€ 집단: λͺ¨μ§‘λ‹¨μ—μ„œ νŠΉμ •ν•œ 방법을 μ΄μš©ν•˜μ—¬ 뽑아낸 μž„μ˜μ˜ 집단, νŠΉμ§•λ“€μ„ ν†΅κ³„λŸ‰μ΄λΌ 함ex) λ―Έκ΅­λŒ€μ„  μΆœκ΅¬μ‘°μ‚¬λͺ¨μ§‘단을 λͺ¨λ‘ μ „μˆ˜μ‘°μ‚¬ν•˜μ—¬ κΈ°μˆ ν†΅κ³„λ₯Ό ν•˜λ©΄ μ •ν™•ν•œ 값을 얻을 수 μžˆμ§€λ§Œ λΉ„μš©μ˜ ν•œκ³„λ‘œ μˆ˜ν–‰ν•˜μ§€ λͺ»ν•˜λŠ” κ²½μš°μ— "λŒ€ν‘œμ„±"μžˆλŠ” μƒ˜ν”Œμ„ μΆ”μΆœν•˜μ—¬ 이λ₯Ό μΆ”λ‘ ν•˜λŠ” 것이 λͺ©μ ν‘œλ³Έ μΆ”μΆœμ˜ μ€‘μš”μ„±μƒ˜ν”Œλ§ 편ν–₯(Sampling bias) : 뢄석 λŒ€μƒμ΄ ν‘œλ³Έμ„ 선택할 λ–„ κ³ΌλŒ€ν•˜κ²Œ λŒ€ν‘œλ˜κ±°λ‚˜ λ°˜λŒ€μ˜ 경우1936λ…„ λ―Έκ΅­λŒ€μ„  λ‹Ήμ‹œ λ―Όμ£Όλ‹Ή 루즈벨트 vs 곡화당 랜던의 κ²½μ„ 1000만λͺ…이 λ„˜λŠ” μ‚¬λžŒμœΌλ‘œλΆ€ν„° λŒ€μ„  μ„€λ¬Έ 쑰사 μ§„ν–‰ β†’ 곡화당 랜던 승리 μ˜ˆμΈ‘κ°€λŸ½μ€ 겨우 2000λͺ…을 λŒ€μƒμœΌλ‘œ 격주둜 μ—¬λ‘  쑰사 μ‹€μ‹œ β†’ λ―Όμ£Όλ‹Ή 루즈벨트 승리..

톡계학 2025. 1. 10. 13:51
톡계학 기초

[ λͺ©μ°¨ ]데이터 λΆ„μ„μœΌλ‘œ ν•  수 μžˆλŠ” μΌκΈ°μˆ ν†΅κ³„/μ‹œκ°ν™” : 데이터 λͺ…ν™•ν•˜κ²Œ 보기좔둠톡계 : μˆ˜μ§‘λœ 데이터λ₯Ό 기반으둜 μ§„μ§œ κ·Έ 사싀이 λ§žλ‚˜? ν™•μΈλ¨Έμ‹ λŸ¬λ‹/λ”₯λŸ¬λ‹ : μ•Œκ³ λ¦¬μ¦˜μ— κΈ°λŒ€μ–΄ κ²°κ³Όλ₯Ό μ˜ˆμΈ‘ν•˜κ±°λ‚˜ μƒˆλ‘œμš΄ 정보 λ„μΆœν†΅κ³„ν•™ 도ꡬExcelSASRPythonμˆ˜μ‹μžλ£Œν˜•μ˜ μ’…λ₯˜λ²”μ£Όν˜• 자료λͺ…λͺ©ν˜• 자료 : μˆœμ„œκ°€ 의미 μ—†λŠ” μžλ£Œ (ex : ν˜ˆμ•‘ν˜• A, B, O, AB)μˆœμ„œν˜• 자료 : μˆœμ„œκ°€ 의미 μžˆλŠ” μžλ£Œ (ex : 학점 A, B, C)μˆ˜μΉ˜ν˜• μžλ£Œμ΄μ‚°ν˜• 자료 : 두 데이터 ꡬ간이 μœ ν•œν•œ μžλ£Œ (ex : 1λͺ…,2λͺ…)μ—°μ†ν˜• 자료 : 두 데이터 ꡬ간이 λ¬΄ν•œν•œ μžλ£Œ (ex : ν‚€ 160 ~ 170)λ²”μ£Όν˜• μžλ£ŒλŠ” μΈκ°„μ˜ μ–Έμ–΄λ‘œ ν‘œν˜„λœ 자료이기 λ•Œλ¬Έμ— 컴퓨터 ν˜Ήμ€ μˆ˜μ‹μ— μ μš©ν•  λ•ŒλŠ” λ°˜λ“œμ‹œ μˆ«μžν˜•μœΌλ‘œ λ³€ν˜•ν•˜μ—¬ 전달해야 함co..

톡계학 2025. 1. 10. 13:47