2.SQL

Notice

Recent Posts

Recent Comments

Link

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Tags more

Archives

Today

Total

관리 메뉴

𝑁𝑜𝑡𝑒𝑏𝑜𝑜𝑘

2.SQL 본문

SQL

2.SQL

seoa__ 2025. 1. 8. 20:55

[ 목차 ]

DBMS

: DB에 접근하고 관리할 수 있는 소프트웨어

DBMS ❓

: 데이터의 저장, 검색, 업데이트, 삭제를 효율적으로 수행할 수 있도록 지원

주요 DBMS와 특징

관계형이 가장 널리 사용되는 방식
관계형 데이터베이스는 데이터를 "테이블"이라는 단위로 관리

코딩순서

SELECT → FROM → JOIN → ON → WHERE → GROUP BY → HAVING → ORDER BY → LIMIT

실행순서

FROM → ON → JOIN → WHERE → GROUP BY → HAVING → SELECT → DISTINCT → ORDER BY → LIMIT

📌select절에서 선언한 별칭을 having 절에서 사용할 수 있는가?📌
A : Yes !!!!!!! where절에선 No !!!!!!!

SELECT절에서 선언해준 Alias를 ORDER BY는 물론이고 GROUP BY, HAVING에서도 이용

열 (Column) ↓

열은 테이블에 저장된 데이터의 각 항목(특성)을 나타냄
즉, 열은 데이터의 속성을 정의하며, 같은 열에는 동일한 유형의 데이터가 저장됨

행(Row) →

행은 테이블에서 개별 데이터 항목(레코드)을 나타냄
고유한 데이터를 담고 있으며, 각 열의 데이터를 조합하여 하나의 완전한 정보를 나타냄

데이터 타입

문자형 : varchar (문자, 숫자, 특수문자 포함)
수치형 : int, float (정수,실수)
날짜/시간형 : date (yyyy-mm-dd)
불리언 : boolean (true/fales 혹은 0/1)

join = vlook up

union : 합치고 정렬, 중복제거 = 성능이 다소 떨어질 수도 있음 (시간 오래 걸림)
union all : 합치기만 함

반환
1. 값
    2. 행
    3. 테이블

의존
1. 상관 : 외부커리랑 계속 주고 받음
2. 비상관 : 딱 한 번만 실행 (독립)


서브쿼리는 외부 쿼리보다 먼저 실행되며, 반환된 결과는 외부 쿼리에서 사용

null

null = 값이 없다
0 이랑 다른 개념이다
null 은 'is null', 'is not null' 사용

-- 일반적인 비교연산은 NULL에서 작동하지 않습니다.
SELECT *
FROM 테이블명
WHERE 컬럼명 = NULL; -- 작동하지 않음!

-- NULL 값만 선택
SELECT * 
FROM 테이블명
WHERE 컬럼명 IS NULL;

-- NULL이 아닌 값만 선택
SELECT * 
FROM 테이블명
WHERE 컬럼명 IS NOT NULL;

select : 조회
from : 테이블 지정
distinct : 중복 제거

SELECT DISTINCT city 
FROM employees;

limit : 갯수 제한

where : 조건 지정
between A and B : A 와 B 사이 조회

-- 나이가 30~50 사이인 직원 조회
SELECT * 
FROM employees 
WHERE age BETWEEN 30 AND 50;

in : 일치하는 데이터 필터링

-- IN 예시: 특정 도시에서 근무하는 직원 조회
SELECT * 
FROM employees 
WHERE city IN ('Seoul', 'Busan');

not in : 제외한 데이터 조회

-- NOT IN 예시: 특정 도시를 제외한 직원 조회
SELECT * 
FROM employees 
WHERE city NOT IN ('Seoul', 'Busan');

like

: 특정 패턴과 일치하는 데이터 필터링 %, _ 활용 (not like도 가능)
조건문에서 사용할 수 있는 연산자 : <>, !=

case when

else end as

: 첫번째로 참인 조건이 실행 → 조건을 만족하지 않으면 else 절이 실행

SELECT name, age,
       CASE 
           WHEN age < 30 THEN '청년'
           WHEN age BETWEEN 30 AND 50 THEN '중년'
           ELSE '노인'
       END AS age_group
FROM employees;

집계함수

: 단일 결과값을 반환하는 함수
대부분의 집계 함수는 null 값 제외하고 작동함
예외적으로 count(*) 는 null포함 ‼️‼️‼️

count : 데이터의 행 수 반환
count(distinct) : 고유한 값을 갖는 데이터의 행 수 반환
sum : 열의 값을 모두 더함
avg : 열 값의 평균 계산
min : 최소값
max : 최대값

group by : 그룹화하여 요약 정보 생성
having : group by로 그룹화된 데이터에 조건을 추가로 적용할 때 사용

where + group by

-- IT 부서가 아닌 직원들만 선택하여 부서별 총 급여를 계산
SELECT department_id, SUM(salary) AS total_salary
FROM employees
WHERE department_id != 'IT'
GROUP BY department_id;

--WHERE department_id != 'IT'로 데이터를 필터링합니다.
--필터링된 데이터를 GROUP BY department_id로 그룹화한 후, 총 급여를 계산

group by + having

-- 예제 코드1 
-- 부서별 총 급여가 10,000 이상인 부서만 선택
SELECT department_id, SUM(salary) AS total_salary
FROM employees
GROUP BY department_id
HAVING SUM(salary) >= 10000;
-- 모든 데이터를 GROUP BY department_id로 그룹화합니다.
-- HAVING 조건을 적용하여 총 급여가 10,000 이상인 부서만 선택!
-- SELECT 절에서 두 컬럼 조회

where + group by + having

-- 예제 코드1
-- 나이가 30 이상인 직원만 선택하고(WHERE), 성별별 그룹화가 된 후(GROUP BY)
-- 평균 나이가 35 이상인 성별만 조회(HAVING)
SELECT gender,
       AVG(age) AS average_age
FROM employees
WHERE age >= 30
GROUP BY gender
HAVING AVG(age) >= 35;

-- 예제 코드2
-- IT 부서의 직원만 선택하고, 부서별 총 급여가 10,000 이상인 경우만 표시
SELECT department_id, SUM(salary) AS total_salary
FROM employees
WHERE department_id IN ('IT', 'HR')
GROUP BY department_id
HAVING SUM(salary) >= 10000;

--WHERE department_id IN ('IT', 'HR')로 IT와 HR 부서의 직원만 필터링
--필터링된 데이터를 GROUP BY department_id로 그룹화
--그룹화된 결과에서 SUM(salary) >= 10000 조건을 만족하는 부서만  조회

📌where 와 having 차이점📌
where

그룹화 이전에 데이터 필터링
개별 행을 기준으로 조건 적용
having
-그룹화 이후에 데이터를 필터링, 즉 그룹화된 결과를 기준으로 조건을 적용
차이 요약데이터 → where (개별 행 필터링) → group by (그룹화) → having (그룹화된 결과 필터링)

order by

: 정렬
asc(생략가능)

: 오름차순
desc

: 내림차순

윈도우 함수

: over() 절과 함께 사용, 행을 그룹화, 정렬, 범위 설정하여 다양한 함수들을 제공

윈도우 함수 기본 문법
select 윈도우함수(컬럼1) over (
[partition by 컬럼2] -- 그룹화
    [order by 컬럼3 asc/desc] --정렬
    [rows/range between a and b] --계산 범위
    ) as 결과
    from 테이블;

윈도우 함수의 진행 순서

1. 데이터를 파티션으로 나눔 (그룹화)
2. 각 그룹별 데이터 정렬
3. 정렬된 데이터 내에서 연산범위 설정
4. 지정된 범위와 정렬에 따라 윈도우함수 값 계산

윈도우 함수 특징

집계 함수의 확장 : sum,avg 등의 집계 결과를 개별 행에 표시
1.기존 집계 함수는 그룹 단위로 함수가 적용되지만, 윈도우 함수는 **~~각 행의 데이터와 함께~~** 집계 결과 유지
2. 원본 데이터 유지 : 원본 데이터와 함께 윈도우 함수의 결과를 동시에 확인 가능
3. 다양한 기능의 함수 제공 : 순위 매기기, 누적합 계산, 특정 행 값 참조, 백분위 계산 등등

윈도우 함수가 추가된다면 ?
from → on → join → where → group by → having → 윈도우 → select → distinct→ order by → limit

종류

순위 함수 → rank(), dense_rank(), row nember()
집계 함수 → sum() -그룹화된 데이터(파티션 내)에 대해 누적합 계산 (△생각하기!)
행 참조 함수 → laf(),lead()
비율 함수 : percent_rank()

윈도우 함수 범위 지정
raws : 데이터 행 순서 기준 (앞뒤 한 행씩)
range : 데이터 값 기준 (값 +, - 인 모든 행)

'SQL' 카테고리의 다른 글

1. 데이터 분석에 대하여 (1)	2025.01.08

'SQL' Related Articles

1. 데이터 분석에 대하여 2025.01.08

𝑁𝑜𝑡𝑒𝑏𝑜𝑜𝑘

2.SQL 본문

2.SQL

DBMS

DBMS ❓

코딩순서

실행순서

null

like

case when

집계함수

윈도우 함수

'SQL' 카테고리의 다른 글

티스토리툴바