- RECURSIVE, 재귀적으로 데이터 조회하기
1. RECURSIVE 쿼리란?
RECURSIVE 쿼리는 데이터베이스에서 재귀적으로 데이터를 조회하거나 처리하는 데 사용되는 쿼리다.
주로 계층적 데이터 모델이나 트리 구조와 같은 데이터를 다룰 때 유용하며, 대표적으로 Common Table Expressions (CTE)를 활용하여 구현된다.
- 재귀 쿼리의 활용
- 계층적 데이터 조회: 조직도, 카테고리 트리 등의 계층적 데이터를 조회할 때 유용
- 그래프 탐색: 그래프 구조의 데이터를 탐색하고 분석하는 데 활용될 수 있음
- 계층적 쿼리 연산: 계층적 데이터를 수정하거나 계산할 때 사용될 수 있음
2. 재귀 쿼리의 구성 요소
- Anchor Member: 재귀를 시작하는 기본 쿼리. 이 쿼리의 결과가 재귀적으로 확장된다.
- Recursive Member: 재귀적으로 반복되는 쿼리. 자신의 결과를 참조하여 다시 실행된다.
- Termination Condition: 재귀를 종료하는 조건. 이 조건이 충족될 때까지 재귀가 계속된다.
아래 쿼리는 조직도를 생성하는 재귀 쿼리이다. 초기에는 최상위 매니저를 찾기 위한 기본 쿼리가 실행되고, 그 후 재귀 쿼리가 매니저를 찾아 계속해서 실행된다. (이를 통해 조직도를 계층적으로 조회할 수 있음)
-- Anchor Member: 초기 쿼리 부분, 재귀를 시작하는 지점
-- 최상위 매니저를 찾기 위한 쿼리
WITH RECURSIVE OrgChart AS (
SELECT employee_id, name, manager_id, 0 AS level
FROM employees
WHERE manager_id IS NULL -- 최상위 매니저는 manager_id가 NULL인 경우
UNION ALL
-- Recursive Member: 재귀적으로 반복되는 쿼리 부분
-- 매니저를 찾아 계속해서 재귀적으로 실행됨
SELECT e.employee_id, e.name, e.manager_id, oc.level + 1
FROM employees e
INNER JOIN OrgChart oc ON e.manager_id = oc.employee_id
)
-- Termination Condition: 재귀를 종료하는 조건은 따로 명시하지 않음
-- 최상위 매니저를 찾고 그 하위 직원을 재귀적으로 계속 조회함
SELECT * FROM OrgChart;
3. 재귀 쿼리 주의사항
- 성능 문제: 재귀 쿼리는 대량의 데이터에 대해서는 성능 문제를 일으킬 수 있으므로 주의가 필요
- 루프: 잘못된 재귀 쿼리는 무한 루프에 빠질 수 있으므로 조심해야 함
- 재귀 깊이 제한: 일부 데이터베이스 시스템은 재귀 쿼리의 최대 깊이를 제한할 수 있음