티스토리 뷰

데이터베이스에 접근하기 위해서 사용자는 질의문 즉, 쿼리를 하용한다.DBMS는 사용자가 입력한 이 쿼리를 그대로 실행하는게 아니라 필요에 따라 최적화하고, 기계가 이해할 수 있는 방식으로 재해석해서 실행한다.

최적화

쿼리는 같은 논리적인 의미를 가지는 다양한 표현이 있을 수 있다. 때문에 같은 의미를 가지는 가장 간결한 쿼리로 쿼리를 최적화시키는 작업이 필요하다. 몇가지 공식을 통해 쿼리를 최적화할 수 있다.

  1. and로 묶여있는 select는 두번의 select로 나눈다.
  2. select 연산은 교환법칙이 성립한다.
  3. 다중 project 연산은 가장 바깥쪽에 있는 하나만 남기고 제거할 수 있다.
  4. cartesian product의 select는 theta join으로 최적화할 수 있다.

natural join
두 릴레이션을 합치면서 중복되는 값을 제거하고 반환한다. 비교를 위한 각 릴레이션의 튜플은 기호의 아래첨자로 제공된다.
theta join
두 릴레이션을 합치면서 부등호 조건에 맞는 결과만 반환한다. 기호 아래첨자로 조건식이 제공된다.
natural join
두 릴레이션을 합치면서 등호조건에 맞는 결과만 반환한다. theta join과 동일하지만 등호를 사용한다는 점이 다르다.

  1. theta join 연산은 교환법칙이 성립한다.
  2. natural join은 결합법칙이 성립한다.
  3. theta join과 select연산은 특수한 경우에 순서를 바꿀 수 있다. 이 경우 보통 select보다 join이 더 비싼 연산이기 때문에 select로 join을 하기 전에 릴레이션의 크기를 줄일 수 있어서 효율적이다.
  4. project연산과 join은 분배법칙이 적용될 수 있다.
  5. 릴레이션의 교집합과 합집합 연산은 교환법칙, 분배법칙이 성립한다.
  6. select 연산은 특정 경우 분배될 수 있다.
  7. project 연산은 합집합에 분배될 수 있다.

쿼리 비용

컴퓨터 분야에서 최적화는 연산의 횟수를 줄이는 것을 뜻한다. 따라서 쿼리를 최적화하기 위해서는 해당 쿼리가 얼마나 많은 연산을 가지는지 계산할 수 있어야한다. 기본적으로 걸리는 시간은 탐색 < 읽기 < 쓰기 순서로 길며, 쿼리에서 이 세가지 연산이 어떻게 조합되어있는지에 따라 비용을 계산할 수 있다.

댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함