1. 데이터 모델링이란?데이터 모델링이란 현실 세계의 어떤 사물이나 현상을 추상화(모형화)해 데이터 간 구조와 관계를 정의한 데이터 모델을 만드는 과정이다. 즉, 데이터를 어떤 구조로 저장하고, 데이터 간 관계를 어떻게 설정할지 등을 정의하는 일이다. 데이터 모델링을 거치면 약속된 형식의 데이터 모델이 만들어진다. 1.1. 데이터 모델링의 이점데이터 모델링은 다음과 같은 6가지 주요 이점을 제공한다. 1) 비즈니스 요구사항 반영: - 조직의 비즈니스 요구사항과 규칙을 정확히 반영한 데이터베이스 구축이 가능하다. 2) 의사소통 개선: - 기술팀과 비즈니스팀 간의 의사소통을 원활하게 하며, 모든 이해관계자가 동일한 데이터 구조를 이해할 수 있게 한다. 3) 데이터 무결성 보장: - 적절한 제약 조..
1. 서브쿼리란?서브쿼리는 쿼리 안에 포함된 또 다른 쿼리를 의미한다.서브쿼리는 메인쿼리의 일부로 사용되며, 메인쿼리는 서브쿼리의 결과를 이용해 최종 실행된다.서브쿼리는 괄호 () 안에 작성되며, 다양한 SQL 구문 내에서 사용할 수 있다.다만, 서브쿼리는 편리하지만 성능 측면에서는 JOIN을 사용하는 것이 더 효율적인 경우가 많다.1.1. 기본 구문SELECT 칼럼명1, 칼럼명2, ...FROM 테이블명WHERE 칼럼명 연산자 ( 서브쿼리); 특성서브쿼리JOIN가독성일반적으로 높음 (간단한 경우)복잡한 조인 조건에서는 낮을 수 있음성능다중 실행 시 비효율적일 수 있음일반적으로 더 효율적사용 적합성단순 필터링, 임시 결과 필요 시여러 테이블 데이터 결합 시결과 형태필터링이나 집계 결과테이블 간 결합된 ..
1. 그룹화란?그룹화란 데이터 분석 기법의 하나로, 데이터를 특정 기준에 따라 여러 그룹으로 나누고 그룹별 데이터를 요약하거나 분석하는 것이다. 복잡한 데이터 사이에서 유의미한 패턴을 찾거나 특정 변수에 따른 행동이나 특성을 이해하기 위해 수행한다. 사용방법:SELECT 그룹화_칼럼, 집계_함수(일반_칼럼)FROM 테이블명WHERE 조건 -- 필터링 조건이 없으면 생략 가능GROUP BY 그룹화_칼럼; 위 쿼리는 데이터를 '그룹화_칼럼'에 따라 분류하고, 각 그룹에 대해 집계 함수를 적용하여 결과를 반환한다. 1.1. 그룹화의 특징1) 집계 함수와 함께 사용해야 한다. 단순히 그룹화만 사용하면 데이터를 묶기만 할 뿐 아무 의미가 없다. 유의미한 데이터 분석 결과를 얻으려면 반드시 후속 집계 작업을 해야..
1. 조인이란?조인(JOIN)은 데이터베이스에서 두 개 이상의 테이블을 연결하여 하나의 결과셋으로 출력하는 SQL 명령이다. 테이블 간에 일치하는 칼럼을 기준으로 두 테이블을 하나로 합쳐 보여주는 방식으로 작동한다. 조인은 FROM의 테이블1을 기준으로 JOIN의 테이블2를 ON 키워드 다음의 조건으로 연결한다. 이때 사용하는 칼럼을 조인 칼럼이라고 하는데, 보통 한 테이블의 외래키(FK)와 다른 테이블의 기본키(PK)를 사용한다. 1.1. 기본 문법SELECT 칼럼명1, 칼럼명2... FROM 테이블1 JOIN 테이블2 ON 테이블1.조인_칼럼 = 테이블2.조인_칼럼; 조인 결과로 두 테이블의 칼럼이 일치하는 두 튜플(행)이 나란히 연결되어 출력된다. 1.2. 조인의 특징 1) 조인 칼럼이 필요하다두 ..
1.관계란?관계는 여러 테이블에 분산 저장된 데이터가 서로 어떻게 연결돼 있는지를 정의하는 개념이다.테이블이 서로 관련 있는 데이터를 묶은 것이라면, 관계는 여러 테이블에 흩어져 있는 데이터 간 연결고리를 맺어주는 것이다.관계는 크게 일대일(1:1), 일대다(1:N), 다대다(N:M) 관계로 나뉜다. 1.1 일대일(1:1) 관계하나의 데이터가 하나의 데이터와만 연결된 관계이다.A 테이블의 한 튜플이 B 테이블의 특정 튜플과 1:1로 매칭될 때 일대일 관계 라고 한다. ex) 사용자(User)와 프로필(Profile) 테이블CREATE TABLE User ( user_id INT PRIMARY KEY, username VARCHAR(50) NOT NULL);CREATE TABLE Profile ..
1. 자료형자료형은 데이터의 형태를 의미하며, 데이터가 가질 수 있는 값의 종류와 메모리에서 차지하는 크기를 결정한다.적절한 자료형을 선택하지 않으면 메모리 낭비가 발생하거나 연산 제약이 생길 수 있다.데이터베이스에서 사용하는 자료형은 크게 숫자형, 문자형, 날짜 및 시간형으로 나뉜다. 1.1. 숫자형 (Numeric Types)숫자형 데이터는 정수형과 실수형으로 나뉜다. 1) 정수형 (Integer Types)정수형은 소수점이 없는 숫자를 저장하며, 차지하는 메모리 크기에 따라 여러 종류가 있다.정수형을 저장할 때 UNSIGNED를 붙이면 음수를 제거하고 양수의 범위를 2배로 늘릴 수 있다.단순한 값을 저장하기 때문에 정확한 값을 빠르게 처리한다. 자료형크기 (byte)값의 범위 (Signed)값의 ..