Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 계층적질의문
- 대용량 데이터 Batch
- 코테
- 대용량 데이터 이행
- sql
- K-MOOC
- K-MOOC 3주차
- 2022 마이데이터 국민참여단 후기
- dbms
- 마이데이터 개념과 원칙
- 코딩테스트
- 구름Level
- 측정계
- 대용량 데이터 처리
- 마이데이터 개념
- GROUP함수
- 데이터 이행
- 백준
- 무결성제약조건
- 고전압안전
- 1주차:메타데이터와 데이터표준화
- 대용량데이터 처리방안
- 마이데이터 국민참여단
- 데이터 허브
- 오라클
- K-MOOC 매치업 강좌
- EBH
- 2주차 : ETL/CDC
- ETCL
- 마이데이터 비즈니스 모델
Archives
- Today
- Total
어제보다 더 나은 나
메타데이터, 데이터 표준화 본문
1. 데이터에 대한 데이터
- 실제로 존재하거나 사용할 수 있는 데이터 X
- 실제 데이터와 직접적 또는 간접적으로 연관된 정보를 제공해주는 데이터
2. 데이터에 대한 구조화된 데이터
- '속성 정보' 라고 함
- 대량의 정보 가운데에서 찾고자 하는 정보를 효율적으로 찾아내서 이용하기 위해 일정한 규칙에 따라 콘텐츠에 대하여 부여되는 데이터
- 데이터를 표현하기 위한 목적과 데이터를 빨리 찾기 위한 목적으로 사용
- '어떤 목적을 가지고 만들어진 데이터' - Karen Coyle
ex) 영화를 보려고 DVD 타이틀을 구매하였을 때, 포장에 붙어있는 제목, 상영시간, 등급, 제작사, 감독, 줄거리 등에 대한 정보
* 메타데이터 관리 시스템 구축 효과
- 정보시스템 개발 생산성 증대
- 비생산적인 작업 감소
- 데이터 중복 감소
- 중복 프로세스 감소
- 정보시스템 전반적 관리기능 개선
- 작업 결과에 대한 타 팀에의 전달효과 증대
* 구축 방법
1단계. 데이터 표준화 / 품질 정의
2단계. 데이터 품질 강화
3단계 . 통합 데이터 관리
* 데이터 표준화
=> 데이터 표준 정의, 명칭, 형식 및 규칙
'
* 데이터 표준화의 특징
- 데이터 관리의 시작점
- 데이터 표준 근거 마련
- 메타데이터 관리시스템과 연관, 연동을 통해 데이터를 관리할 수 있도록 구축
* 데이터 표준화 지침 작성 기준
- 표준화 원칙 ( 표준화 체계, 단어, 도메인, 용어, 코드 )
- 표준화 절차 수립 (프로세스)
- 수행 조직 및 역할 (R&R)
* 데이터 용어 표준화
- 누구나 같은 의미로 이해하고 같은 방법으로 사용할 수 있는 원칙(기준)을 정하는 것
- 자료사전을 데이터 표준 중심으로 통합하여 사용자에게 일관되고 정확한 데이터의 의미를 제공하는 일련의 과정
* 표준화 대상
- 표준 용어, 표준 단어, 표준 도메인, 통합 코드 (표준 코드)
통합 코드에 대한 부분들은 고객들의 각자의 생각들이 다르기 때문에 통합할 수 있는 방안을 반드시 마련해야지만 사이트에 대한 이슈들도 줄고 개발도 편하게 가능
* 표준화 범위
- 전사에 걸쳐 수집된 모든 데이터에 대한 정확한 정의와 데이터 사전
- 각 센터 및 플랫폼 업체 제공 데이터의 작성에서부터 사용자의 데이터 활용 때까지 일련의 과정
- 모델링의 명명 규칙과 물리적인 오브젝트의 명명 규칙
- 논리 데이터 모델과 물리 데이터 모델
'데이터분석 공부 > 대용량데이터 처리' 카테고리의 다른 글
데이터 허브 (0) | 2022.08.17 |
---|---|
대용량 데이터 처리 : 데이터 이행(마이그레이션) (0) | 2022.08.16 |
ODS, DW란 (0) | 2022.08.15 |
ETL / ETCL / ELT / CDC (0) | 2022.08.09 |
Comments