어제보다 더 나은 나

메타데이터, 데이터 표준화 본문

데이터분석 공부/대용량데이터 처리

메타데이터, 데이터 표준화

확인해볼까 2022. 8. 8. 22:20

1. 데이터에 대한 데이터

  • 실제로 존재하거나 사용할 수 있는 데이터 X
  • 실제 데이터와 직접적 또는 간접적으로 연관된 정보를 제공해주는 데이터

 

 

2. 데이터에 대한 구조화된 데이터

  • '속성 정보' 라고 함
  • 대량의 정보 가운데에서 찾고자 하는 정보를 효율적으로 찾아내서 이용하기 위해 일정한 규칙에 따라 콘텐츠에 대하여 부여되는 데이터
  • 데이터를 표현하기 위한 목적과 데이터를 빨리 찾기 위한 목적으로 사용
  • '어떤 목적을 가지고 만들어진 데이터' - Karen Coyle

 

 

ex) 영화를 보려고 DVD 타이틀을 구매하였을 때, 포장에 붙어있는 제목, 상영시간, 등급, 제작사, 감독, 줄거리 등에 대한 정보

 


* 메타데이터 관리 시스템 구축 효과

  1. 정보시스템 개발 생산성 증대
  2. 비생산적인 작업 감소
  3. 데이터 중복 감소
  4. 중복 프로세스 감소
  5. 정보시스템 전반적 관리기능 개선
  6. 작업 결과에 대한 타 팀에의 전달효과 증대

 

* 구축 방법

1단계. 데이터 표준화 / 품질 정의

2단계. 데이터 품질 강화

3단계 . 통합 데이터 관리

 


* 데이터 표준화 

=> 데이터 표준 정의, 명칭, 형식 및 규칙

 

'

* 데이터 표준화의 특징

  • 데이터 관리의 시작점
  • 데이터 표준 근거 마련
  • 메타데이터 관리시스템과 연관, 연동을 통해 데이터를 관리할 수 있도록 구축

 

* 데이터 표준화 지침 작성 기준

  • 표준화 원칙 ( 표준화 체계, 단어, 도메인, 용어, 코드 )
  • 표준화 절차 수립 (프로세스)
  • 수행 조직 및 역할 (R&R)

 

* 데이터 용어 표준화

  • 누구나 같은 의미로 이해하고 같은 방법으로 사용할 수 있는 원칙(기준)을 정하는 것
  • 자료사전을 데이터 표준 중심으로 통합하여 사용자에게 일관되고 정확한 데이터의 의미를 제공하는 일련의 과정

 

* 표준화 대상

  • 표준 용어, 표준 단어, 표준 도메인, 통합 코드 (표준 코드)

통합 코드에 대한 부분들은 고객들의 각자의 생각들이 다르기 때문에 통합할 수 있는 방안을 반드시 마련해야지만 사이트에 대한 이슈들도 줄고 개발도 편하게 가능

 

 

* 표준화 범위

  • 전사에 걸쳐 수집된 모든 데이터에 대한 정확한 정의와 데이터 사전
  • 각 센터 및 플랫폼 업체 제공 데이터의 작성에서부터 사용자의 데이터 활용 때까지 일련의 과정
  • 모델링의 명명 규칙과 물리적인 오브젝트의 명명 규칙
  • 논리 데이터 모델과 물리 데이터 모델

'데이터분석 공부 > 대용량데이터 처리' 카테고리의 다른 글

데이터 허브  (0) 2022.08.17
대용량 데이터 처리 : 데이터 이행(마이그레이션)  (0) 2022.08.16
ODS, DW란  (0) 2022.08.15
ETL / ETCL / ELT / CDC  (0) 2022.08.09
Comments