db

DBMS의 SQL 비교

C/H 2006. 10. 19. 14:36

DBMS의 SQL 비교

1. Data type

비고 : oracle

Datatype 설 명
VARCHAR2(size) size 만큼 2000개까지 문자열 데이터 저장. 가변형.
CHAR(size) size 만큼 255개 문자까지 문자열 데이터 저장. 고정형.
NUMBER 실수형 데이터 저장 NUMBER(p,s)
NUMBER(p,s) 숫자데이터를 저장. p는 최대자리수, s는 소수점 이하 자리수
DATEBC 4712년 1월 1일부터 AD 4712년 12월 31일까지의 날짜를저장
* 기본 날짜 형식은 'DD-MON-YY' 임
LONG2GB의 문자까지 문자열 데이터를 저장.
비고사항* CHAR과 VARCHAR2의 사용
- 데이터의 update가 잦은 칼럼은 char형은 씀.
- 한 칼럼에서 고정된 길이의 데이터를 입력할 경우는 char형,
가변형길이의 데이터를 입력할 경우는 varchar를 사용.

비고 : MS-SQL

Datatype설 명
VARCHAR2(size)가변길이 문자열. 자신의 실제길이로 저장됨.
CHAR(size)고정 문자열, 최대값은 8000
NCHAR(n)고정길이 유니코드 문자셋 저장. CHAR는 1바이트를 사용함에비해,
NCHAR는 2바이트를 사용. 최대 4000.
NVARCHAR(n)가변길이 유니코드 문자셋.
TEXT(n)최대 2GB까지의 고정길이 문자열 저장
NTEXT(n)큰 가변 길이 문자 데이터 저장. TEXT는 1바이트, NTEXT는 2바이트사용.
INT정수값 표현. 4바이트.
SMALLINT정수값 표현. 2바이트(-32768~32767
TINYINT음이 아닌 정수값 표현. 1바이트(0~255)
DECIMAL(p,[s])고정 소수점 값.
NUMBER(p,[s])DECIMAL과 동의어.
REAL부동소수점 값
FLOAT[(p)]부동소수점 값
MONEY화폐값을 표현 하는 데 사용. 8바이트
SMALLMONEYMONEY와 같지만, 4바이트 사용.
DATETIME4바이트의 정수값으로 저장되는 DATE와 TIME을 저장.
SMALLDATETIME2바이트의 정수값으로 저장되는 DATE와 TIME을 저장

비고 : Informix

Datatype설 명
VARCHAR(a,b)가변길이 문자열. 자신의 실제길이로 저장됨. Max 255
CHAR(size)고정 문자열, 최대값은 32767 byte
TEXT최대 2GB까지의 고정길이 문자열 저장 blobspace공간을 만들어저장하는 것이 IO향상됨
Byte최대 2Gb까지의 바이너리 데이터 저장blobspace공간을 만들어별도로 저장
INT정수값 표현. 4바이트.
SMALLINT정수값 표현. 2바이트(-32768~32767
SERIAL서버에 의해 자동적으로 1씩 증가 내부적 int와 동일
DECIMAL(p,[s])고정 소수점 값. ? 숫자형은 모두 decimal로 하는 것이 좋다.엔진에서 decimal로 처리
REAL부동소수점 값
FLOAT16자리 부동소수점 값
SMALLFLOTE8자리 부동 소수점
MONEY화폐값을 표현 하는 데 사용. Decimal 형태로 저장되며 $와 소수점뒤에 두자리 표시 DBMONY=’\’;export DBMONEY
DATETIME INTERVAL4바이트의 정수값으로 저장되는 DATE와 TIME을 저장.
DATE2바이트의 정수값으로 저장되는 DATE만 저장 DBDATE=y4md/;exportDBDATE

SQL3 type : Informix 9.x, oracle 8.x이상 버젼에서 비정형 데이더를저장, 검색하기 위한 확장형 타입과 ORDBMS의 특징인 object type을지원한다.

  • clob : 문자열 데이터를 저장
  • blob : 바이너리 데이터를 저장
  • list, multiset, set : 한 컬럼에 여러 데이터 저장
  • named row type, unnamed row type : type을 상속받아 테이블을생성할 수 있음
  • user define function 및 user define type을 생성
  • cast 함수를 이용하여 type의 확장지원
  • Informix : lvarchar,int8,Serial8 type 새롭게 지원

2. 데이터 저장 공간

비고 : oracle

  • 데이터베이스(oracle instance당 한 개가 존재)
  • >테이블스페이스(system, nonsystem tablespace로 나누어 장치간 적절히스토리지를 분배해야 함, 물리적인 공간)
  • > 세그먼트 ( 테이블세그먼트, 인텍스 세그먼트, 임시세그먼트, 롤백세그먼트 :tablespace에 있는 여러 datafile에 걸처서 (생성할 수 있음)
  • > datafile(물리적 공간)
  • > 익스텐트( 연속된 블록의 집합 )
  • >데이터 블록 (가장 작은단위의 저장공간)

비고 : MS-SQL

  • 데이터 베이스 ( system database : master,tempdb,msdb,model userdatabase로 나누며 user database는 여러 개 생성할 수 있음 )
  • > 주데이터 파일( .mdf ), 보조 데이터 파일( .ndf), 로그 데이터 파일 (.ldf )
  • > 익스텐트
  • > 블럭

비고 : Informix

  • dbspace ( system, nonsystem dbspace로 구별하여 생성해야 함 )
  • > chunk (물리적인 데이터 공간)
  • > database ( 한 dbspace에 여러 개의데이터베이스 생성 가능 )
  • > chunk(물리적은 공간 cook device, rawdevice로 구성할 수 있음)
  • > tablespace ( extent들의 연속된 공간 )
  • > extent
  • > page

3. 테이블 정보 보기 및 sql query tool

비고 : oracle-sqlplus를 이용해서 server에 connection

SELECT * FROM tab; 
DESC table_name

비고 : MS-SQL

Enterprise Manager를 이용해서 비주얼 볼 수 있음

비고 : Informix-dbaccess를 이용해서 볼 수 있음.

  • Dbaccess -> 메뉴에서 table -> database선택 ->table선택.
  • Dbshcema 툴을 이용
dbschema -ㅇ dbname >> filename # 하여 filename을 vi로 열어본다.
	# 옵션을 보려면 dbschema - -

4. SQL 문 이용 가이드

4.1 NULL

비고 : oracle,Informix 동일

  • 이용할 수도 없고, 값이 할당되어 있지도 않고, 알려져 있지않은 또는 적용불가능한 값을 의미.
  • 0이나 공백(space)와 같은 것이 아님.
  • NULL 값을 포함한 산술 표현식 결과는 NULL임.

NVL 함수 이용.

  • NULL 값은 NVL함수를 이용하여 다른 값으로 대치할 수 있음.
  • 사용가능한 datatype은 날짜, 문자 및 숫자형.
  • 구문 : NVL(expr1, expr2)
    • expr1 : 널값을 포함할 수 있는 값이거나 표현식
    • expr2 : 널값을 전환하여 사용할 값
# EX
NVL(hiredate, '01-JAN-95')
NVL(job, 'FRESH MAN')
NVL(comm, 1000)
권장 사항

nvl함수를 자주 쓰는 것은 성능에 걸림돌이 될 수 있음. 따라서 컬럼에 공백이 들어가지 않도록 하는 것이 성능향상에좋다. table을 생성할 때 default값을 주어 nvl 함수대신 default값을가지고 구분할 수 있도록 한다.

4.2 합성문자.

비고 : oracle,Informix 동일

  • 칼럼과 문자 또는 칼럼과 다른 칼럼을 연결
  • 두 개의 수직바(||)에 의해 이루어짐.
  • 문자 표현식의 결과에 의해 새로운 칼럼이 생성됨.
    SELECT ename||ename
    FROM emp;
  • Literal 이란 SELECT 리스트에 포함된 문자, 표현식 또는숫자임.
  • 날짜 및 문자값은 단일 인용부호로 둘러쌈.
    SELECT job||' is job of '||ename FROM emp;

4.3 조건절 사용

비고 : oracle

  • 비교 연산자 : =, >, >=, <, <=
  • SQL 연산자
    • between .....and... : 두 값사이의 값
    • in(list) : 리스트 중 하나와 같은 값을 가지는 값
    • like : 문자 패턴과 일치하는 값
    • is null : 널값인 것
  • 논리 연산자 : and, or, not ( 우선순위 and -> or )
  • 부정 연산자
    • 비교 연산자 : !=(VAX,UNIX, PC), ^=(IBM), <>(all OS)
    • SQL 연산자 : not between....and...., not in(list), not like, isnot null

비고 : Informix

  • 부정 비교 연산자는 <>를 쓴다.
  • Like는 %만을 이용하여 검색 가능하며, matches는 *만을이용한다.

4.4 함수

비고 : oracle

구문
  • function_name(column|expr, [arg1, arg2,....])
    • function_name : 함수의 이름
    • column : 데이터베이스에 존재하는 칼럼명
    • expr : 어떤 문자열 또는 계산된 표현식
    • arg1, arg1,... : 함수에 의해 사용될 인수
  • 함수는 데이터 값을 조작함.
  • 인수를 받아들여 한 개의 값을 return
  • 각각의 행에 적용됨.
  • 행당 하나의 결과를 돌려줌
  • datatype을 바꾸어 줌.
  • 중첩하여 사용하는 것이 가능함.
문자함수
  • LOWER(column/expr) : 알파벳 문자를 소문자로 바꾸어 줌.
  • UPPER(column/expr) : 알파벳 문자를 대준자로 바꾸어 줌.
  • SUBSTR(column/expr,m[, n]) : 문자값 중에서 m위치에서 n 문자길이에해당하는 문자를 돌려줌. Informix 에서는 substr을 써야만 index를탄다.
  • LENGTH(column/expr) : 문자개수를 값으로 돌려줌.
  • NVL(expr1, expt2) : 첫번째 값이 널이면 두번째 값으로 바꾸어줌.
    SELECT ename, job, deptno FROM emp WHERE lower(job) ='clerk';
  • LTRIM(‘ lee’); 공백을 왼쪽으로 밀어준다.
  • RTRIM(‘Lee ‘);
숫자함수
  • ROUND(column/expr, n) : column/expr의 값을 소수점 n자리까지반올림. n이 없으면 소수점은 없어지고, 음수라면 소수점의왼쪽자리만큼 반올림됨.
  • TRUNC(column/expr, n) : column/expr의 값을 소수점 n자리까지 버림n이 없으면 소수점은 없어지고, 음수라면 소수점의 왼쪽자리만큼버림.
  • MOD(m, n) : m값을 n으로 나누고 남은 나머지를 return
날짜함수
  • date + number : 날수를 날짜에 더함. 결과는 date.
  • date - number : 날짜에서 날수를 뺌. 결과는 date.
  • date - date : 날짜에서 날짜를 뺌. 결과는 날수.
  • date + date/24 : 시간을 날짜에 더함. 결과는 date
  • MONTHS_BETWEEN(date1, date2) : 두 날짜 사이의 달수를찾아줌.
  • ADD_MONTHS(date, n) : 날짜에 n달을 추가
  • NEXT_DAY(date, 'char') : date 다음의 첫번째 해당요일('char')일자.
  • LAST_DAY(date) : date를 포함하고 있는 달의 마지막날
    select ename,(sysdate-hiredate)/7 weeks from emp where deptno =20 oder by week;
전환함수
  • 숫자 또는 날짜값을 fmt 모델을 사용하여 varchar2 문자열로바꿈.
  • TO_CHAR(date, 'fmt')
    • fmt 형식모델은 단일 인용부호로 에워싸야 하고, 대소문자 구별이있음.
    • 형식 모델은 어떠한 날짜 형식 요소도 포함할 수 있고, 날짜값은 콤마에 의해 구분됨.
    • 결과에 일, 월의 이름은 자동적으로 공백으로 덧붙여 짐.
    • 공백 및 선행제로를 없애기 위해서는 'fm'을 사용
  • TO_CHAR(number, 'fmt') - 대소문자 구별
    • 9 : 숫자위치(9의 수는 폭을 결정)
    • 0 : 0을 나타냄
    • $ : 달러기호 예) to_char(sal,’fm$9,999,999’)
    • . : 위치에 소수점(999.999 -- > 123.2)
    • , : 위치에 콤마 (999,999,999 -- > 1,234)
      select ename, to_char(hiredate, ‘fmDD “of” Month YYYY’)start_date from emp 
      where hiredate like ‘%87’;
      # soctt 19 of April 1987 ß 결과값
  • TO_NUMBER 함수
    to_number(char)
    to_number(to_char(empno))
  • TO_DATE 함수
    to_date(char[, ‘fmt’])
    to_date(‘1981/05/10’,’yyyy/mm/dd’);
그룹함수
  • 그룹당 하나의 결과를 return
  • 그룹함수들은 SELECT 절 및 HAVING 절에 쓸 수 있음.
  • SELECT 문장에서 GROUP BY 절은 행들을 작은 그룹으로 나눔.
  • HAVING 절은 그룹을 제한함.
그룹함수의 종류
  • AVG() : 널값을 제외한 행의 평균값
  • COUNT() : 행의 개수. expr은 널값이 아닌 것을, '*'를 玲淪玖?중복및 널값을 갖는 것도 포함.
  • MAX() : 최대값 : 어떤 데이터 type도 쓴다.
  • MIN() : 최소값: “
  • STDDEV() : 널값을 제외한 표준편차
  • SUM() : 널값을 제외한 합계
  • VARIANCE() : 널값을 제외한 분산

비고 : Informix

함수명설명Ver.
날자함수DATEDATE(char1)비날자형 값을 날자로 변환ALL
DAYDAY(d1)날자형값중 일을 구함ALL
MONTHMONTH(d1)날자형값중 월을 구함ALL
WEEKDAYWEEKDAY(d1)날자형값중 요일을 구함ALL
YEARYEAR(d1)날자형값중 년을 구함ALL
EXTENDEXTEND(d1날자형값을 지정한 길이로 조정함ALL
MDY비날자형 값을 날자로 변환ALL
산술함수ABSABS(n)n의 절대값 구함ALL
MODMOD(m,n)m을 n으로 나눈 나머지 구함ALL
POWPOW(m)값의 n제곱 구함ALL
ROOTROOT(m)제곱근 구함ALL
ROUNDROUND(m,n)m의 값을 n자리수 위치 기준으로 반올림ALL
SQRTALL
TRUNCTRUNC(m,n)m의 값을 n자리수 위치 기준으로 반올림ALL
로그함수EXPALL
LOGNALL
LOG10ALL
삼각함수SINSIN 함수ALL
COSCOS 함수ALL
TANTAN 함수ALL
ASINALL
ACOSALL
ATANALL
ATAN2ALL
String 함수LENGTHLENGTH(char1)Charter 길이 구하기ALL
TRIMTRIM(char1)공백 자르기ALL
집계함수COUNTCOUNT(*)건수 구하기ALL
AVGAVG(m)평균 구하기ALL
MINMIN(n)최소값 구하기ALL
MAXMAX(m)최대값 구하기ALL
SUMSUM(n)합 구하기ALL
RANGERANGE(m)최대값과 최소값 차 구하기ALL
STDEVSTDEV(n)표준편차 구하기ALL
VARIANCEVARIANCE(m)분산 구하기ALL
기타함수DBINFODBINFO(KEYWORD)ALL
TODAY오늘날자ALL
CURRENT현재 날자+ 시분초ALL
USER사용자 이름ALL
SITENAMEHOST명 구하기ALL
DBSERVER
NAME
INFORMIXSERVER 명 구하기ALL
NVLNVL(m,n)m값을 검사 NULL 이면 n값을 Return7.3Y
DECODEDECODE(c1,a1,A1,b1,
B1,c1,C1,D1)
Multi-Case 문7.3Y
CASESELECT 문에서 CASE 비교7.3Y
INITCAPINITCAP(char1)첫글자 대문자7.3Y
UPPERUPPER(char1)대문자로ALL
LOWERLOWER(char1)소문자로ALL
REPLACEREPLACE(char1,search_string[,replacement_string])search_string 의 각 문자를 대응하는 replacement_string 으로치환 . replacement_string이 미지정이면
serach_string 을 제거
7.3Y
SUBSTRSUNSTR(char,m[n]char의 m번째 문자부터 n개의 문자를 취한다 .7.3Y
LPADLPAD(char1,n,[char2])Char1의 왼쪽에 Char2를 덧붇여 전체가 n문자로 되도록한다 .Char2가 미지정이면 blank 적용7.3Y
RPADRPAD(char1,n,[char2])Char1의 오른쪽에 Char2를 덧붇여 전체가 n문자로 되도록한다 .Char2가 미지정이면 blank 적용7.3Y
SPL로 제공되는 함수CEILn 보다 크거나 같은 최소 정수
NEXT_DAY

4.5 Having절의 사용

Having 절에 조건을 줌으로서 그룹을 제한할 수 있다.

# 예> job이 vp로 시작하지 않는 사람들을 job별로 급여의 합계를구한다음 급여합계가 5000이상인 job과 그 합계를 구하라.
Select job,sum(sal) payroll from emp
Where job not like ‘VP%’ Group by job having sum(sal) >5000;

4.6 JOIN

Join을 쓰는 목적은 Cartesian product를 막고 정규화 된 테이블 간데이터를 가져올 때.
비고 : 오라클
  1. equi join
join시 table alias를 주어서 쓰는 것이속도 향상에 좋음.
  1. non-equijoin
  2. self join
같은 테이블에 대해 두개의 가명을줌.
  1. outer join : 정상적으로 조인 조건을 만족하지 못하는 행들을 보기위해
outer join의 연산자는 (+)를 붙임..모자라는 곳에 붙임..in 명령어 사용 못함.
SQL은 inner,outer join이라고명령을 써준다.

4.7 SubQuery

* subquery는 다른 SQL 문장안에 존재하는 SELECT 구문을 말함.
* 주 질의가 실행되기 전에 일단 한번 먼저 실행되어 그 결과는 주질의의 조건으로 사용됨.
* subquery에는 ORDER BY 절을 사용할 수 없음.
SELECT select_list
FROM tables
WHERE expr operator (SELECT select_list FROM table);
오라클은 where 조건절 및 from절에도 subquery ( inline View )를실행할 수 있지만 informix는 inline view가 지원되지 않는다.

4.8 HINT 사용

비고 : Informix
* SQL을 어떠한 방법으로 실행할 것인가를 결정을 optimizer에게 지시
  • index, join 방법을 지정할 수 있다.
  • INDEX, AVOID_INDEX, FULL, AVOID_FULL
  • ORDERED : join의 대상 테이블에 대한 join순서를 테이블 순서대로하도록 한다.
  • USE_NL,AVOID_NL,USE_HASH, AVIOD_HASH : NL은 nested loop join을말함.
  • FIRST_ROWS, ALL_ROWS (default)
  • FIRST N 질의 결과 중 n개의 row를 가져옴.
예) 1. select --+ index(esalary_index) name,salary from emp e
where e.dno=1 and e.salary >50000;
2. select {+ avoid_full(e), index(esalary_indx) } name, salary
where e.dno = 1 and e.salary >50000;
3. select --+ ORDEREDname,title,dept
from dept,job,emp where title = 'aaa'and emp.dno = dept.dno;
  1. select --+ first_rows name,age from employee e,department
where e.dept_no = d.dept_no;

4.9 ROWID

* 각 행의 주소를 반환하며, 반환되는 데이터는 ROWID 데이터타입을가짐.
* ROWID는 행에 접근하는 가장 빠른 방법임.
* 어떻게 테이블의 데이터 행들이 저장되었는 지 보여주고, 한 테이블의각 행에 유일성을 줌.
Select rowid,ename from emp;

4.10 ROWNUM

비고 : 오라클
* 검색될 테이블의 칼럼 데이터 행의순서를 반환하는 pseudocolumn이며, 첫번째 행은 1로 시작.
* ROWNUM을 이용하여 반환되는 행의 수를 제한할 수 있음
예) 사원중 급여를 적게 받는 사람 순서대로 다섯명을 나타내라.
select ename,sal from ( select ename, sal from emp group bysal,ename)
where rownum <= 5;
subquery에서는 order by를 쓸 수없으므로 같은 역할을 하는 group by를 이용
비고 : Informix
자체적인 함수가 제공되지 않는다.하지만 Informix ius 9.x버전부터 지원되는 UDF (user definefunction)을 만들어 활용할 수 있음.
비고 : SQL
top n [percent]구문
* 순위별로 체크하여 반환되는 행의수를 제한할 수 있음.
* 행의 개수를 쓰거나 percent 구문을 이용
with ties : 마지막 등수가 여러명일 때
예) select top 4 with ties employeeID, LastName, HireDate
fromEmployees order by hiredatedesc

4.11 테이블 생성

ansi 표준으로 만드는 것이 좋음.
비고 : Oracle: subquery를 이용한 테이블 생성방법
* As subquery를 이용하여 테이블 생성
* subquery에서의 컬럼수와 생성하는 컬럼이 일치해야 함.
* 컬럼명과 default 값, 무결성 제약조건만이 subquery를 이용해생성됨
* NOT NULL 만이 복사됨
예) create table emp_20 AS select empno,emame,hiredate,job
from emp where deptno = 20; -- 데이터 까지 복제..
비고 :Informix :
테이블을 DataBase가 저장된 space외에 다른 space에 생성할 수 있을뿐만 아니라 컬럼까지도 다른 space에 저장할 수 있다.
예) create table aaa ( a int, b char(10) in space2);
성능 향상 법 : 모든 DBMS에서 테이블을 생성시 테이블 저장량을예측하여, extend size 및 저장할 곳을 적절히 분산하여 생성해야 한다.또한 index 저장 할 곳도 각 DBMS성격에 맞게 구축해야 한다.
테이블이 대용량일 경우는 분할 하여 저장하는 것이 좋다.
-분할 방법 :
  • 가급적 remainder를 쓰지 않는다.
  • 여러 디스크에 분산하여 설계한다.
  • Expressino의 조건은 가급적 숫자형 type( date포함 )하는 것이좋다.
  • 테이블 전체에 거처 조회가 된다면 round robin방법을 쓰는 것이좋다.
  • 인텍스는 fragment하지 않고 별도의 dbspace 한곳에 저장한다.
  • 100만 건 이상의 테이블을 고려 대상으로 한다.
  1. round robin방법 : 컬럼이 insert시 dbs1,dbs2,dbs3에 순차적으로저장
예)create table rtable ( col_1 int,cal_2 char(20) )
fragment by round robin indbs1,dbs2,dbs3
extent size 10000 next size3000;
  1. expression 방법 : 조건을 주어 조건에 맞는 space에 저장
예) create table rtable ( col_1 int,cal_2 char(20) )
fragment by expression
col_1 <=100 and col_1 >=1 indbs1
col_1 <=200 and col_1 > 100 indbs2
remainder in dbs3 ;
  1. hash 방법 : DBMS의 function을 이용해 space에 저장
예) create table rtable ( col_1 int,cal_2 char(20) )
fragment by expression
mod(col_1,3) = 0 in dbs1
mod(col_1,3) = 1 in dbs2
mod(col_1,3) = 2 in dbs3 ;

4.12 인덱스 생성 조건

* 컬럼이 WHERE 절이나 join 조건에 자주 사용되어야 함
* 컬럼이 넓은 범위의 값을 가지고 있어야 함
* 컬럼이 null value를 많이 가지고 있어야 함
* 두 개나 그 이상의 컬럼이 같이 WHERE절이나 join조건에 자주사용되어야 함
* 테이블이 매우 크고, 대부분의 질의결과가 행들중 10~15%만을가져오는 것이 좋음
* 많은 인덱스는 항상 질의속도를 높이지는 않음
* 테이블이 만약 다음과 같은 조건이라면 인덱스를 생성하는 것이 좋지않음
- 테이블이 너무 작음
- 컬럼이 질의에서 조건절에 자주 사용되지 않음
- 대부분의 질의결과가 10~15% 이상의 행들을 결과로 가져옴
- 테이블의 변경이 자주 일어나는 경우

4.13 시스템 권한

비고 : Oracle
권한부여
* 80개 이상의 권한이 있음
* DBA(Database Administrator)는 상위 레벨의 시스템 권한을가짐
- 새로운 사용자 생성 : CREATE USER(다른 사람에게 유저를 생성할 수있는 권한을
줄 수도 있음)
- 사용자 삭제 : DROP USER
- 테이블 삭제 : DROP ANY TABLE(어떤 사람의 테이블도 삭제할 수있음)
- 테이블 백업 : BACKUP ANY TABLE(export utility를 이용하여 어떤사람의 테이블도
백업할 수 있음)
* DBA는 CREATE USER 명령을 통해 사용자를 생성함
예) CREATE USER user_name IDENTIFIED BY password;
ALTER USER user_name IDENTIFIED BY password;
* 사용자를 생성하면 DBA는 GRANT 명령을 실행하여 사용자에게 권한을부여할 수 있음
* 사용자는 다음의 시스템 권한을 가짐
- CREATE SESSION : 시스템에 접속할 수 있도록 함.
- CREATE TABLE : 테이블을 생성할 수 있도록 함
- CREATE SEQUENCE : 시퀀스를 생성할 수 있도록 함
- CREATE VIEW : 뷰를 생성할 수 있도록 함
- CREATE PROCEDURE : 프로시져를 생성할 수 있도록 함
* 구문
GRANT privilege [,privilege,....] TO user_name [, user....];
Role
* Role이란 사용자에게 줄 수 있는 연관있는 권한들을 모아둔 그룹을말함
* role을 사용함으로써 사용자에게 권한을 주고 다시 회수하는 것을쉽게 다룰 수 있음
예) CREATE ROLE role_name; a grantcreate table,create view to man; a grant man to kim
권한 회수
* revoke 명령어를 사용
비고 : Informix
* 별도의 DB유저를 생성하지 않고system 유저를 이용. 따라서 system에 유저를 생성하고 로긴 스크립트(.cshrc , .profile, NT의 글로벌 변수)에 인포믹스 유저의 스크립트를copy하는 것으로 작업 종결.
* DBA는 informix로 login 했을때 부여 되며, 각 유저의 권한을 설정할수 있음.
DBA,RESOURCE,CONNECT 의 권한을 부여할수 있으며, DB level, table level의 DML 작업 권한을 부여 할 수있음.
* 뒤에 자세히 설명
비고 : SQL
* user 관리는 두가지 방법을 제공함
Database에 생성 방법과 system유저를 이용하는 방법
처음 설치 시 user생성 방법을 물어보며, default admin은 sapasswd는없음.

4.14 load, unload

- UNLOAD
UNLOAD TO 파일명 SELECT 문
예)unload to ‘new_cust’ select *from customer where customer_num > 120;
- LOAD
LOAD FROM 파일명 INSERT문
예)load from ‘new_cust’ insert intocustomer;
121|a|b|c|d|
122|aa|bb|cc|dd|


5. 인포믹스의 무결성 기능

5.1. 자료의 무결성 (ISOLATION)

- ISOLATION의 개요
INFORMIX-ONLINE은 shared lock를사용하여 자료를 읽을 때4가지 수준의 격리수준을 제공한다.sharedlock는 다른 프로세스에서 자료를 읽을 수 있으나자료를 갱신할 수는없다.
- ISOLATION의 종류
1) DIRTY READS
2) COMMITED READ
3) CURSOR STABILITY
4) REPEATABLE READ
DB별 default level 이 있음.
NO logging mode DB : DirtyRead,
Logging DB : Committed Read
ANSI DB : Repeatable Read
1) DIRTY READS
프로세스들은 자료를 읽기 전에 lock의존재 여부를 확인하지 않으면 검색시, 사용자는 DIRTY DATA라 불리우는아직 변경이 완료되지 않은 행을 볼 수도 있다. 다음과 같은 경우유용하다
- 테이블이 정적일 경우
- 자료의 정확성보다는 자유로운 자료접근이 중요한 경우
- lock가 해제되기를 기다릴 수 없는경우
2) COMMITTED READS
실제로 행들을 lock하는 것이 아니라lock할 수 있는지 만을 조사한다.
적어도 프로세스가 읽고 있는시점에서는 그 행에 대한 트랜잭션이 완료되었음을 알 수있다.
3) CURSOR STABILITY
커서를 이용하여 읽어 들이는 각 행을shared lock한다. 다음 행을 검색하기 전까지 shared lock는 해제되지않는다.
이 격리 수준에서는 트랜잭션이 완료된행만을 보게 되며현재행을 검색하고 있는 동안에는 다른 프로세스가 그행을 수정할 수 없다.
* 격리 수준을CURSORSTABILITY로설정하고, 커서를 사용하지 않는다면 CURSOR STABILITY 는 COMMITEDREAD와 같이 작동된다.
4) REPEATABLE READS
이 격리 수준은 DB서버에 의해 검색되는모든 행을 shared lock한다. 이 모든 행들은 트랜잭션이 완료되기전까지 해제되지 않는다.
다른 프로세스들은 트랜잭션이 COMMIT되기 전까지 행을 갱신할 수없다.
집계함수를 쓰는 경우에 이 level을사용하게 되며, index가 없는 경우에는 사용하지 않는 것이 좋다.
- 격리 수준의 설정
프로세스 격리 수준을 설정하기 위해데이터베이스는 반드시 로깅을 지정해야 하며 격리 수준을 설정하기위하여 SET ISOLATION구문을 사용한다.
SETISAOLATION TODIRTY READ;
SETISAOLATION TOCOMMITED READ;
SETISAOLATION TOCURSORSTABILITY;
SETISAOLATION TOREPEATABLEREAD;

5.2 Locking

다수의 사용자가 사용하는 시스템에서두개 이상의 프로그램이 동시에 수행될 수 있으며, 이러한 병행 처리시에 locking을 사용하여 다른 사용자들간의 충돌을 방지 할 수있다.
- 데이터베이스 수준의 Locking
DATABASE 데이타베이스명 EXCLUSIVE;
예) database stores_demoexclusive;
여러 테이블에 갱신이 일어날 때데이터베이스 수준의 lock를 사용한다.
데이터베이스의 구조를 변경할 때데이터베이스 수준의 lock를 사용한다.
데이터베이스를 백업받을 때데이터베이스 수준의 lock를 사용한다.
배타적(exclusive)lock를 해제하려면데이터베이스를 close하고 다시 open한다.
- 테이블 수준의 Locking
LOCK TABLE 테이블명 IN { SHARE |EXCLUSIVE } MODE ;
UNLOCK TABLE 테이블명;
SET LOCK MODE TO [ NOT ] WAIT [대기시간 ] ;
예) lock table customer in exclusivemode;
unlock table customer;
set lock mode to wait 20;
Share mode : 다른 사용자들로부터lock된 테이블에 자료를 select만 허용.
Exclusive mode : 다른 사용자들로부터lock된 테이블에 접근을 방지한다.
테이블 내의 대부분의 행에 영향을 주는일괄 처리 작업을 한다면 다른 사용자들과의 충돌을 막기 위해 테이블수준의 lock를 사용한다. 테이블의 구조를 변경하거나 색인을 생성할 때테이블 수준의 lock를 사용한다.
- 페이지,행 수준의 Locking
테이블을 생성할 때테이블의 행들을접근 시 사용하는 lock 모드를 설정한다. Page level lock는 페이지상의 하나의 행이 lock되는 경우에도 페이지 전체를 lock한다.
Row level lock는 요청된 행만lock한다.
테이블 생성시 기본값은 page levellock이다.
* 페이지 수준의 lock는 row level 의lock보다 병행성을 감소시키지만, 보다 적은 자원(시스템에서 허용하는lock 수)을 사용한다.
* 운영 시 lock이 자주 걸린다면table을 row level 로 변경하고 sql에서는 set lock mode to wait을주어 ap가 데이터에 접근할 때 lock 걸려 있으면 waiting하고 있다가lock 풀리면 접근 할 수 있도록 프로그램 하는 것이 좋다. 또한 lock이가급적 빨리 풀릴 수 있도록 sql튜닝을 하는 것이 좋다.
실습(3) - 보완성,무결성

1. items 테이블을 unload한다.
items 테이블의 모든 행을 삭제한다.
items 테이블을 load한다.
각각의 경우 items 테이블을 검색해 보고 생성된 자료 파일도 확인해본다.

2. 두 명의 사용자가 나누어 실습한다.
데이터베이스를 생성한 사용자(DBA)가 다음 각각의 SQL문을 실행할때
다른 사용자는 데이터베이스를 connect해 본다.
SQL 1 > revoke dba from public
revoke resource from public
revoke connect from public

3. DBA가 데이터베이스에 connect권한을 부여한 후
다른 사용자는 다음 SQL문을 실행시켜 본다.
SQL 2 > create index idx_cname on customer(담당자명);
lock table orders in exclusive mode;
unlock table orders;

4. DBA가 데이터베이스에 resource 권한을 부여한 후
다른 사용자는 다음 SQL문을 실행시켜 본다.
SQL 3 > create index idx_cname on customer(담당자명);
lock table orders in exclusive mode;
unlock table orders;

5. 다음 SQL을 실행한 상태에서 다른 사용자가 데이터베이스를 선택해본다.
SQL 4> database user## exclusive;

6. 데이터베이스를 새로 connect하고 다음과 같은 SQL을 실행해본다.

# user1
drop database user## ;
create database user## with log;
grant connect to public;
begin work;
create table test (a date);
insert into test values (today);
lock table test in exclusive mode;


rollback work;
select * from test;
# user2
database user##;
select * from test;
set lock mode to wait 10;
select * from test;
set isolation to dirty read;
select * from test;

6.Informix DBMS SQL 성능 향상 기법

서론

  1. Set Explain 의 출력을 해석하는 방법
  2. Informix Optimizer의 역할
  3. 성능향상을 위한 방법

  • Root Dbspace 에는 최소한의 시스템 정보만 포함할 것
  • UNIX File system 공간을 큰 정렬 파일로 채우면 UNIX 프로세스에서오류가능성
  • 논리LOG를 LONG TRANSACTION으로 채우지 말것 : LOG TRX주의

6.1. OPTIMIZER

  • 주어진 질의를 실행하기 전 가장 좋은 최선의 경로를 찾는 INFORMIX엔진의 한 부분
  • SET EXPLAIN ON : OPTIMIZER가 데이타에 접근하는데 선택한 경로를나타냄
  • SYSTEM CATALOG의 정보를 바탕으로 결정
  1. 질의에 사용되는 테이블의 행수 :systables.nrows
  1. 데이타에 사용되는 페이지수와 색인에 사용되는 페이지수 :systables.npused
  2. Column값의 uniqueness : sysconstraints
  3. 색인존재여부 :sysindexes
  4. 데이타가 색인과 같은 순서 즉, cluster index인지 여부:sysindexes.clust
  5. root node에서 leafnode 까지 색인의 레벨수
  6. 각 column에서 두번째로 큰 값과 두번째로 작은 값. optimizer는 이정보로 값의 범위를 대략적으로 알아낼 수 있슴 : syscolumns.colmin,colmax
위의 정보를 바탕으로 옵티마이저는가능한 모든 경로를 검색하고 각각 비용(디스크 접근, 필요한 CPU자원,네트워크 접근 등)을 추정하여 평가함.
  • 테이블 조인 순서 결정
  • Sequential scan의 수행 여부
  • 임시 테이블의 작성 여부
  • 색인 사용 여부 결정
where절에 필터 조건이 많아지고테이블이 많이 포함되면 결정과정이 더욱 복잡해지고 정확한 통계의중요성도 커짐
  • 통계의 정확도
. 시스템 카달로그 정보는 UPDATESTATISTICS가 실행될 때에만 갱신됨
. 동적인 테이블에 대해서는 자주실행시킬 것
. UPDATE STATISTICS는 데이타베이스전체나 개별 테이블, 테이블의 칼럼,
내장 프로시저에 대하여 실행 할 수있음.
  • 엔진이 최적화를 수행하는 시기
.표준 SQL로 사용될 때마다 질의가최적화됨.
.SQL문이 반복 사용될 경우 PREPARE를사용하여 한번만 최적화 시킴
.STORED PROCEDURE의 경우 PROCEDURE 가만들어지거나
내장 PROCEDURE에 대하여 UPDATESTATISTICS가 실행될 때 SQL이
최적화 됨
  • 질의가 갑자기 느려질 때
프로그램이 SET EXPLAIN ON을 사용하여문제 파악

6.2. 개발 시 고려사항

  • 개발하는 동안 잘 실행되는질의가 실제적용에 들어가면옵티마이저가 완전히 다른 경로를 선택할 수 있슴--> 실제환경의데이타베이스와 비슷한 크기의 시험데이타베이스에서 같은 데이타로질의를 실행
  • 단순 명료한 시스템 설계에 충분한 시간을 갖는다.
  • Optimizer는 항상 최적의 query plan을 세우는 것은 아니다. 따라서optimizer가 좋은 역할을 하도록 factor - hint 기능 사용 ( index,full scan method)를 부여한다.
  • ESQL/C 코딩시 onconfig 파라메터의 FET_BUF_SIZE를 32767로 늘려놓아 커서 fetch 사이즈를 늘려 놓는다.
  • 코딩 시 prepare 구문을 사용하여 SQL을 이용한다.
  • prepare 시점에 SQL문장에 대하여 미리 parsing되고 query plan이생성된다.
  • Execute 시점에는 처리해야 할 값만 넘겨주면 즉시 실행된다.
예) Exec sql prepare ins_p from “insert into customer
( customer_num,fname,lname,company)values(0,?,?,?)”;
Exec SQL execute ins_p using:fname,:lname,:company

6.3. 옵티마이저 제어

  • SET OPTIMIZATION HIGH : 엔진이 모든 엑세스 경로를 검사
  • SET OPTIMIZATION LOW : 초기 단계에서 가능성이 적은 옵션을제거하여 최적화 시간을 줄임.그러나 최적의 경로가 될 수 있는엑세스경로가 초반에 제거되어 버릴 수 있슴
  • Onconfig 환경 파일의 OPTCOMPIND 파라메터 고려
OPTCOMPIND=2 (Default) : INDEX SCAN과 FULL SCAN 비용을 비교하여가장 효율적인 경로를 선택하도록 함
OPTCOMPIND=0 : INDEX사용
OPTCOMPIND=1 : OPTIMIZER가 2로 설정되었을 때처럼 작동.
단REPEATABLE READ가 선택되면 OPTCOMPIND가 0으로 설정되었을 때
처럼 작동
행을 모두 SCAN하면서 읽는 동안 전체테이블을 효과적으로 공유할 수 있슴

6.4. 옵티마이저를 위한 데이타분산

칼럼에서 데이타표본을 채취하여테이블 영역에 관한 정보를 다양한BIN에 저장하는 것으로 이루어짐 : 대형 테이블을 다룰 경우 유용한정보가 됨. 또한 UPDATE STATISTICS명령으로 각 칼럼 분포 정보를 생성할 수 있슴
  • UPDATE STATISTICS HIGH FOR :테이블의 모든 행 평가. 느린 대신정확함
  • UPDATE STATISTICS MEDIUM FOR :데이타 표본만 추출하여 실행
  • UPDATE STATISTICS LOW FOR : 데이타 분포 정보를 얻지 않음

6.5. UPDATE STATISTICS 실행 계획

  1. UPDATE STATISTICS문을 모든 테이블에 실행
  2. 복합 색인의 첫번째 칼럼이나 질의의 한 부분으로 사용된 모든칼럼에는 UPDATE STATISTICS HIGH문을 실행하거나 테이블이 클 경우에는update statistics medium resolution 0.0598;을 실행한다.
  3. 복합 색인의 첫번째 칼럼이 아닌 모든 칼럼에 대해서 UPDATESTATISTICS LOW를 실행
  4. UPDATE STATISTICS단계를 완료하면 DBSCHEMA UTILITY의 다음OPTION을 사용하여 데이타분포정보를 확인 할 수 있슴
예) dbschema -d databasename-hdtablename
  1. 위의 내용은 fragmentation 전략에 유용하게 사용할 수 있슴
  2. 대형 정적 테이블에 대해서는 UPDATE STATISTICS를 재실행할 필요가없슴

6.6. SQL 질의 품질보증과 최적화

  1. 큰 테이블에서는 순차적 검색을 하지 않는 것이 좋음
  2. 임시 정렬FILE이 크게 생성되도록 하는 질의는 사용하지 말 것
  3. Correlated Subquery를 사용
  4. 서로 다른 칼럼에서 사용된 OR문은 옵티마이저의 색인 사용을방해하므로 색인이 있고 질의 계획에서 옵티마이저가 순차스캔을선택하면 UNION문의 사용을 고려할 것
  5. 질의 초기에 가능하면 많은 행을 제거할 것
UPDATE STATISTICS HIGH 를 사용하면 옵티마이저에 데이타분포에 대한정보
가 추가로 제공되므로 알맞은 테이블이 먼저 제거됨. INDEX SCAN이항상최선
의 방법은 아님
  1. 자료형을 변환하고 문자 칼럼을 비교하는 것. 가능하면 칼럼의자료형을 숫자형으로 바꿀 것. 조인 칼럼이 문자형이면 매 행마다 한바이트씩 비교함.
  2. OR, LIKE, MATCH, 함수(MONTH, DAY, LENGTH등), 부정표현(!=’NOUN’), 첫 문자를 제외한 하위 열 검색(POSTCODE[4,5] >10)등은 INDEX를 사용하지 못함
  3. LOGGING된 데이타베이스에서 LONG TRANSACTION을 실행하지 말것,LONG TRANSACTION은 논리로그를 채워 데이타베이스를 손상시킬 위험이있슴
LOCK을 지나치게 많이 사용하는 것을막으려면 테이블을 EXCLUSIVE MODE로 LOCK할 것. LOCK을 지나치게사용하면 성능이 저하되고 또한 LOCK의 최대수에 도달하면 명령문이실행되지 않음
  1. 필요한 칼럼만 선택할 것. FRONT END와 BACK END간의 통신이 줄고I/O도 줄어듬. 가능한 한 “SELECT *” 은 사용하지 말 것.
  2. 데이타의 일정부분 집합이 WHERE 술어로 다시 선택되면 임시테이블을 사용할 것. 검색하고자 하는 테이블이 매우 클 경우 모든테이블을 임시 테이블로 선택하고 임시 테이블에서 재검색을 할것.
  3. 옵티마이저가 가장 좋은 경로를 선택하도록 임시 테이블을 사용함.큰 테이블에서 임시 테이블로 행을 선택하고 임시 테이블을 나머지테이블에 조인하면 됨
  4. 임시 테이블에 색인 사용
  5. 임시 테이블에 UPDATE STATISTICS사용
  6. 임시 테이블을 만들 경우 WITH NO LOG를 사용. 논리 로그에 쓰는오버헤드가 없어지므로 성능이 향상됨. 임시 테이블에 LONGTRANSACTION을 만들 가능성이 없어짐


반응형

'db' 카테고리의 다른 글

마이그레이션 이런된장  (0) 2010.10.28
DBMS에 따른 날짜포맷 변환  (0) 2008.11.10
게시판 write시 자동증가 컬럼의 비효율성 극복  (0) 2006.10.20
Subquery특징  (0) 2006.09.22
limit, rownum, top  (0) 2006.09.22