λͺ©λ‘λΆλ₯ μ 체보기 (33)
πππ‘πππππ

[ λͺ©μ°¨ ] νΌμ΄μ¨ μκ΄κ³μκ°μ₯ λνμ μΌλ‘ λ§μ΄ μ¬μ©νλ μκ΄κ³μνλμ μ λ€λ‘ λνλ΄μμΌλ©°, xμ yμ μ ν κ΄κ³λ₯Ό 보μ¬μ€κ·Έλνμμ μ λ€μ΄ μ§μ μ μΌλ‘ νΌμ ΈμμΌλ©°, μκ΄κ³μλ 0.99λ‘ λ§€μ° κ°ν μμ μ ν κ΄κ³λ₯Ό λνλνΌμ΄μ¨ μκ΄κ³μλ μ°μν λ³μ κ°μ μ ν κ΄κ³λ₯Ό μΈ‘μ νλ μ§ν-1μμ 1μ¬μ΄μ κ°μ κ°μ§λ©°1μ μμ ν μμ μ ν κ΄κ³-1μ μμ ν μμ μ ν κ΄κ³0μ μ ν κ΄κ³κ° μμμ μλ―ΈνΌμ΄μ¨ μκ΄κ³μλ μΈμ μ¬μ©ν κΉβκ³΅λΆ μκ°κ³Ό μν μ μ κ°μ μκ΄κ΄κ³ λΆμν λπ«λΉμ ν κ΄κ³μμ μ¬μ©ν μ μμ import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsfrom scipy.stats import pe..

KEEP (νμ¬ λ§μ‘±νκ³ μλ λΆλΆ, μ΄μ΄κ°λ©΄ μ’μ λΆλΆ)ν΅κ³ν μ΄μ¬ν 볡μ΅νλ©΄μ λͺ¨λ₯΄λ κ±° μμΌλ©΄ λ°λ‘ ꡬκΈλ§νκ³ μ΅λν μ΄ν΄ν΄λ³Όλ €λ μμΈ PROBLEM (λΆνΈνκ² λλΌλ λΆλΆ, κ°μ μ΄ νμν λΆλΆ)νΌμ νμΌλ‘λ νλ κ² μμΌλ λ°λ‘ νν°λ μ°Ύμκ°κΈ° TRY (λ¬Έμ μ λν ν΄κ²°μ± , λ€μ νκ³ λ νλ³ κ°λ₯ν κ², λΉμ₯ μ€ν κ°λ₯ν κ²)μ± μ μ΄κΉ κ³ λ―Όμ€μ΄κ³ μ§κΈ λΉμ₯μ ν μ μλ건 κ³μ 볡μ΅νκΈ°

[ λͺ©μ°¨ ]A/B κ²μ : λ λ²μ (Aμ B) μ€ μ΄λ κ²μ΄ λ ν¨κ³Όμ μΈμ§ νκ°νκΈ° μν΄ μ¬μ©λλ κ²μ λ°©λ²λ§μΌν , μΉμ¬μ΄νΈ λμμΈ λ±μμ λ§μ΄ μ¬μ©λ¨μ¬μ©μλ€μ λ κ·Έλ£ΉμΌλ‘ λλκ³ , κ° κ·Έλ£Ήμ λ€λ₯Έ λ²μ μ μ 곡ν ν, λ°μ λΉκ΅μΌλ°μ μΌλ‘ μ νμ¨, ꡬ맀μ, λ°©λ¬Έ κΈ°κ°, λ°©λ¬Έν νμ΄μ§ μ, νΉμ νμ΄μ§ λ°©λ¬Έ μ¬λΆ, λ§€μΆλ±μ μ§ν λΉκ΅λͺ©μ λ κ·Έλ£Ή κ°μ λ³νκ° μ°μ°μ΄ μλλΌ ν΅κ³μ μΌλ‘ μ μλ―Ένμ§λ₯Ό νμΈA/B κ²μ μ΄ μ€μ λ‘ μ΄λ»κ² μ μ©λλμ§μ¨λΌμΈ μΌνλͺ°μμ λ κ°μ§ λμμΈ(Aμ B)μ λν λλ© νμ΄μ§λ₯Ό ν μ€νΈνμ¬ μ΄λ€ λμμΈμ΄ λ λμ ꡬ맀 μ νμ¨μ κ°μ Έμ€λμ§ νκ°import numpy as np import scipy.stats as stats # κ°μ λ μ νμ¨ λ°μ΄ν° group_a = np.random.bin..

[ λͺ©μ°¨ ]λͺ¨μ§λ¨: κΆκ·Ήμ μΌλ‘ κ΄μ¬μλ μ§λ¨, λͺ¨μ§λ¨μ νΉμ§μ λͺ¨μλΌ ν¨ex) μΈκ΅¬ μ΄μ‘°μ¬ νμ€ μ§λ¨: λͺ¨μ§λ¨μμ νΉμ ν λ°©λ²μ μ΄μ©νμ¬ λ½μλΈ μμμ μ§λ¨, νΉμ§λ€μ ν΅κ³λμ΄λΌ ν¨ex) λ―Έκ΅λμ μΆκ΅¬μ‘°μ¬λͺ¨μ§λ¨μ λͺ¨λ μ μμ‘°μ¬νμ¬ κΈ°μ ν΅κ³λ₯Ό νλ©΄ μ νν κ°μ μ»μ μ μμ§λ§ λΉμ©μ νκ³λ‘ μννμ§ λͺ»νλ κ²½μ°μ "λνμ±"μλ μνμ μΆμΆνμ¬ μ΄λ₯Ό μΆλ‘ νλ κ²μ΄ λͺ©μ νλ³Έ μΆμΆμ μ€μμ±μνλ§ νΈν₯(Sampling bias) : λΆμ λμμ΄ νλ³Έμ μ νν λ κ³Όλνκ² λνλκ±°λ λ°λμ κ²½μ°1936λ λ―Έκ΅λμ λΉμ λ―Όμ£ΌλΉ λ£¨μ¦λ²¨νΈ vs 곡νλΉ λλμ κ²½μ 1000λ§λͺ μ΄ λλ μ¬λμΌλ‘λΆν° λμ μ€λ¬Έ μ‘°μ¬ μ§ν β 곡νλΉ λλ μΉλ¦¬ μμΈ‘κ°€λ½μ κ²¨μ° 2000λͺ μ λμμΌλ‘ κ²©μ£Όλ‘ μ¬λ‘ μ‘°μ¬ μ€μ β λ―Όμ£ΌλΉ λ£¨μ¦λ²¨νΈ μΉλ¦¬..

[ λͺ©μ°¨ ]λ°μ΄ν° λΆμμΌλ‘ ν μ μλ μΌκΈ°μ ν΅κ³/μκ°ν : λ°μ΄ν° λͺ ννκ² λ³΄κΈ°μΆλ‘ ν΅κ³ : μμ§λ λ°μ΄ν°λ₯Ό κΈ°λ°μΌλ‘ μ§μ§ κ·Έ μ¬μ€μ΄ λ§λ? νμΈλ¨Έμ λ¬λ/λ₯λ¬λ : μκ³ λ¦¬μ¦μ κΈ°λμ΄ κ²°κ³Όλ₯Ό μμΈ‘νκ±°λ μλ‘μ΄ μ 보 λμΆν΅κ³ν λꡬExcelSASRPythonμμμλ£νμ μ’ λ₯λ²μ£Όν μλ£λͺ λͺ©ν μλ£ : μμκ° μλ―Έ μλ μλ£ (ex : νμ‘ν A, B, O, AB)μμν μλ£ : μμκ° μλ―Έ μλ μλ£ (ex : νμ A, B, C)μμΉν μλ£μ΄μ°ν μλ£ : λ λ°μ΄ν° ꡬκ°μ΄ μ νν μλ£ (ex : 1λͺ ,2λͺ )μ°μν μλ£ : λ λ°μ΄ν° ꡬκ°μ΄ 무νν μλ£ (ex : ν€ 160 ~ 170)λ²μ£Όν μλ£λ μΈκ°μ μΈμ΄λ‘ ννλ μλ£μ΄κΈ° λλ¬Έμ μ»΄ν¨ν° νΉμ μμμ μ μ©ν λλ λ°λμ μ«μνμΌλ‘ λ³ννμ¬ μ λ¬ν΄μΌ ν¨co..
[ λͺ©μ°¨ ]ν¬λ§·ν (formatting)f-stringx = 10print(f"λ³μ xμ κ°μ {x}μ λλ€.")x = 10print("λ³μ xμ κ°μ {}μ λλ€.".format(x))x = 10print("λ³μ xμ κ°μ %dμ λλ€." % (x))splitλ¬Έμμ΄ β 리μ€νΈλ‘ λ³ν (곡백 κΈ°μ€μΌλ‘ λΆν )sentence = "Hello, how are you doing today?"words = sentence.split()print(words) # μΆλ ₯: ['Hello,', 'how', 'are', 'you', 'doing', 'today?'](νΉμ ꡬλΆμλ₯Ό κΈ°μ€μΌλ‘)data = "apple,banana,grape,orange"fruits = data.split(',')print(fruits) # μΆλ ₯..