development
카디널리티(Cardinality)의 두 의미
주먹불끈
2023. 10. 3. 19:15
개요
카디널리티(Cardinality)라는 단어를 자주 마주쳤는데 소화가 안되는 단어였다. 이참에 제대로 이해하고 넘어가려 한다. 참고로 이 글의 대부분은 GPT-4의 도움을 받았다(존대말은 GPT-4 복붙)
카디널리티란?
데이터베이스에서 카디널리티는 크게 두 가지 의미로 쓰인다.
- 데이터베이스 테이블간의 관계
- 데이터베이스 컬럼에 있는 고유한 값의 개수
테이블간의 관계
한 테이블의 레코드가 다른 테이블의 레코드와 어떤 관계가 있는지를 나타내며 네 가지 경우로 구분할 수 있다. 각각의 관계를 예시와 함께 보자.
- 일대일 (One-to-One) 관계 예시:
- “사용자(User)" 테이블과 "주소(Address)" 테이블이 있습니다. 각 사용자는 하나의 주소만 가질 수 있고, 각 주소는 하나의 사용자에게만 연결됩니다. 이 경우, 각 사용자가 하나의 주소와 연결된 일대일 관계가 있습니다.
- 일대다 (One-to-Many) 관계 예시:
- "부서(Department)" 테이블과 "직원(Employee)" 테이블이 있습니다. 각 부서는 여러 직원을 가질 수 있지만, 각 직원은 하나의 부서에 속합니다. 이 경우, 각 부서는 여러 직원과 연결된 일대다 관계가 있습니다.
- 다대일 (Many-to-One) 관계 예시:
- 예시: "도시(City)" 테이블과 "나라(Country)" 테이블이 있습니다. 여러 도시가 같은 나라에 속할 수 있지만, 각 도시는 하나의 나라에 속합니다. 이 경우, 각 도시와 나라 사이에 다대일 관계가 있습니다.
- 다대다 (Many-to-Many) 관계 예시:
- 예시: "학생(Student)" 테이블과 "과목(Subject)" 테이블이 있습니다. 하나의 학생은 여러 과목을 수강할 수 있고, 하나의 과목은 여러 학생에게 수강될 수 있습니다. 이 경우, 학생과 과목 사이에 다대다 관계가 있으며, 일반적으로 중간 테이블(예: "수강신청(Enrollment)" 테이블)을 사용하여 관계를 정의합니다.
컬럼에 있는 고유한 값의 개수
컬럼(Column)의 카디널리티(Cardinality)는 해당 컬럼에 있는 고유한(distinct) 값의 개수를 의미합니다. 이 개념은 데이터베이스에서 중요하며, 데이터 분석, 데이터베이스 설계, 쿼리 최적화, 인덱스 생성 등 다양한 데이터 관련 작업에서 사용됩니다.
카디널리티의 중요한 측면과 몇 가지 예시
- 고유한 값의 개수: 카디널리티는 컬럼에 저장된 서로 다른 값의 수를 나타냅니다. 예를 들어, "성별(Gender)" 컬럼이 있고 그 중에 '남성'과 '여성' 두 가지 값만 있다면 이 컬럼의 카디널리티는 2입니다.
- 쿼리 최적화: 카디널리티는 데이터베이스 쿼리 최적화에 영향을 미칩니다. 예를 들어, 고유한 값이 많은 컬럼의 경우 인덱스를 사용하여 검색 성능을 향상시킬 수 있습니다.
- 데이터 분석: 데이터 분석에서 카디널리티를 이해하는 것은 데이터의 다양성을 파악하는 데 도움이 됩니다. 예를 들어, 카디널리티가 높은 컬럼은 데이터의 다양성이 크다는 것을 나타내며, 이를 통해 인사이트를 얻을 수 있습니다.
- 데이터베이스 설계: 데이터베이스 테이블을 설계할 때, 각 컬럼의 카디널리티를 고려하여 테이블 간의 관계를 설정하고 인덱스를 생성하는 데 도움이 됩니다.
- 중복 데이터 확인: 높은 카디널리티를 가진 컬럼은 중복 데이터를 쉽게 확인할 수 있도록 도와줍니다. 중복 데이터는 데이터 정합성을 위해 해결해야 할 문제가 될 수 있습니다.
요약하면, 컬럼의 카디널리티는 해당 컬럼에 있는 서로 다른 값의 수를 나타내며, 데이터 관련 작업과 데이터베이스 설계에서 중요한 역할을 합니다.
반응형