제 1절 데이터와 정보
1. 데이터의 정의
데이터란?
- 1646년 영국 문헌에서 처음 등장 주어진것이란 과거분사형
- 1940년 컴퓨터 시대 도래 이후 관념적, 추상적 개념 → 기술적 사실적 변화
- 옥스퍼드 대사전 : 데이터를 추론과 추정의 근거를 이루는 사실
다른 객체와의 상호관계 속에서 가치를 갖는 것
- 객관적 사실이라는 존재적 특성 + 추론, 예측, 전망, 추정을 위한 근거의 당위적 특성
데이터 유형
구분 |
형태 |
예시 |
정성적 데이터(qualitative data) |
언어, 문자 |
회사 매출이 증가함 |
정량적 데이터(quantitative data) |
수치, 도형, 기호 |
나이, 몸무게, 온도, 풍속, 강우량 |
정성적 데이터 : 기술이 가능함, 설문조사의 주관식 답, SNS상의 글 (=비정형데이터) → 분석비용
정량적 데이터 : 수치로 명확하게 표현, 데이터 관리 시스템으로 저장, 검색, 분석
암묵지와 형식지
암묵지 : 학습과 체험을 통해 개인에게 습득되었지만 겉으로 들어나지 않는 지식
오랜 경험을 통해 개인에게 습득된 무형의 지식
다른사람에게 공유되기 어렵다
공통화(Socialization) , 내면화(Internalizaion)
형식지 : 형상화된 지식, 유형의 대상이기에 지식의 전달과 공유가 매우 용이
조직원 개인의 지식 공유, 발전 가능
표출화(ExternaIization) , 연결화(Combination)
암묵지와 형식지의 상호작용 : 지식 형성의 중요한 기초
현장 경험을 통해 축적된 내면화된 지식
→ 조직의 지식으로 공통화를 위해서는
→ 개인의 암묵지를 표출화하고
→ 다른 개인이 본인의 지식에 연결
→ 새로운 경험을 부가하여 다시 내면화 하는 과정
2. 데이터와 정보의 관계
DIKW 피라미드
데이터, 정보, 지식을 통해 최종적으로 지혜를 얻어내는 과정을 계층구조로 설명
지혜 (Wisdom) |
근본 원리에 대한 깊은 이해를 바탕으로 도출되는 창의적인 아이디어 예) A마트의 다른 상품들도 B마트보다 쌀 것이라고 판단 |
지식 (Knowledge) |
상호 연결된 정보 패턴을 이해하며 이를 토대로 예측한 결과물 예) 상대적으로 저렴한 A마트에서 연필을 사야겠다. |
정보 (Information) |
데이터의 가공 및 상관관계간 이해를 통해 패턴을 인식하고 그 의미를 부여한 데이터 예) A마트의 연필가격이 더 싸다 |
데이터 (Data) |
존재형식을 불문하고, 타 데이터와 상관관계가 없는 가공하기전의 순수한 수치나 기호 |
데이터의 정확성은 향후 데이터 간의 관계 및 현상의 분석(정보)과 적용(지식)
더 나아가 미래를 예측하고 창의적 산물을 도출(지혜)하는 데 지대한 영향을 미치며
가치창출에 핵심적인 역할을 수행
제 2절 데이터베이스 정의와 특징
1. 용어의 연역
데이터베이스(database)
- 1950년대 미국정부 자국군대의 군비상황 관리를 위한 도서관 설립 '데이터의 기지'
- 1963년 6월 미국 SDC '컴퓨터 중심의 데이터베이스 개발과 관리' : 쉽게 검색하는 작업
: 대량의 데이터를 축척하는 기지
- 1965년 2차 심포지엄 : 시스템을 통한 체계적 관리와 저장 의미를 담은 '데이터베이스 시스템'
- 1963년 GE의 C.바크만 : 데이터베이스 관리 시스템 IDS개발 → 데이터 모델 기반 관리 시스템
- 1970년대 유럽 '데이터베이스' 단일어 일반화, 1970년 후반 미국에서 사용
※ 우리나라는 1975년 미국의 CAC가 KORSTIC을 통해 서비스 되면서 이용
자기테이프형태의 배치방식 → 온라인 정보검색 시스템 → 데이터 연구개발(80년 중반)
2. 데이터베이스의 정의
다양한 정보기술의 발달과 인터넷이 확산등으로 현대적 개념이 적용된 용어로 정의
체계적으로 정렬된 데이터의 집합
- “문자,기호,음성,화상,영상 등 상호 관련된 다수의 콘텐츠를
정보 처리 및 정보통신 기기에 의하여 체계적으로 수집 ·축적하여
다양한 용도와 방법으로 이용할 수 있도록 정리한 정보의 집합제”
- EU의 데이터베이스의 법적 보호에 관한 지침 : “체계적이 거나 조직적으로 정리되고 전자식
또는 기타 수단으로 개별적으로 접근할 수 있는 독립된 저작물, 데이터 또는 기타 소재의 수집물”
- 국내 ‘저작권법’ : “소재를 체계적으로 배열 또는 구성한 편집물로서 개별적으로
그 소재에 접근하거나 그 소재를 검색할 수 있도록 한 것”
- 컴퓨터 용어사전 등 : “동시에 복수의 적용 업무를 지원할 수 있도록 복수 이용자의 요구에 대응해서
데이터를 받아들이고 저장, 공급하기 위하여 일정한 구조에 따라서 편성된 데이터의 집합”
“관련된 레코드의 집합 소프트웨어로는 데이터베이스관리시스템을 의미한다"
※ DBMS : 데이터베이스를 구축, 유지하는 소프트웨어
+ 데이터베이스 = 데이터베이스 시스템
3. 데이터베이스의 특징
텍스트나 숫자 그래프 + 멀티미디어까지 저장가능, 정보를 저장하는 지식 베이스, 복합체로 진화
1) 통합된 데이터 : 동일한 내용, 중복이 허용되지 않음
2) 저장된 데이터 : 검퓨터가 접근할 수 있는 저장 매체에 저장
3) 공용 데이터 : 여러 사용자가 서로 다른 목적으로 데이터 공동 이용, 대용량화, 구조복잡
4) 변화되는 데이터 : 저장하는 내용이 한 상태를 나타냄, 변화하지만 현재의 정확한 데이터 유지
- 정보의 축적 및 전달 : 기계가독성, 검색가능성, 원격조작성
- 정보이용 : 정보요구에 따라 신속하게 원하는 정보 획득하여 경제적으로 찾아냄
- 정보관리 : 일정한 질서와 구조에 따라 정리, 저장하고 검색, 관리
→ 방대한 양의 정보를 체계적으로 축적하고 새로운 내용 추가나 갱신 용이
- 정보기술 발전 : 정보처리, 검색·관리 소프트웨어, 관련 하드웨어, 정보 전송을 위한 네트워크 기술 등의 발전
- 경제, 산업적 측면 : 인프라로서 특성 → 효율성 제고, 국민의 편의 증진하는 수단
제 3절 데이터베이스 활용
1. 기업내부 데이터베이스
정보통신망 구축 → 기업경영전반 모든 자료 연계, 체계구축, 운영 → 전사시스템
단순 수집에서 탈피 '분석'이 중심이 되는 시스템 구축
단순 자동화 OLTP(Online Transaction Processing) → OLAP (Online Analytical Processing) 로 변화
2000년대 이후
- CRM(Consumer Relationship Management, 고객관계 관리) : 고객분석, 마케팅전략
- SCM(Supply Chain Management, 공급망관리) : 시간과 비용 최적화
SCM은 일반적으로 자재구매 데이터 생산·재고 데이터 유통·판매 데이터 고객 데이터로 구성
특히 유통·판매 및 고객 데이터가 CRM과 연동되기 때문에 CRM과 SCM은 상호 밀접한 관련
가. 제조부분
기업별 고유 시스템 형태 → 솔루션 유형(전 공정을 포함하는 범위)
ERP(Enterprise Resource Planning) + SCM
실시간 기업(RTE)은 기업의 비즈니스 프로세스를 투명하고 민첩하게 유지하여
환경 변화에 따른 적응 속도를 최대화하여 지연시간을 없애는 정보화 전략
대기업-중소기업 협업적 IT화
ERP 시스템 도입과 함께 DW, CRM, BI(Business Intelligence) 등의 인하우스 DB 구축
나. 금융부분
2000년대 초반 EAI(Enterprise Applications Integration), ERP, e-CRM, 인터넷뱅킹
2000년대 중반 DB 마케팅, 방카슈랑스, BI기반 시스템 구축
최근 EDW(Enterprise Data Warehouse)의 확장이 데이터베이스 시장 확대에 기여할 것으로 예상
다. 유통부분
CRM + SCM
상거래를 위한 각종 인프라 및 KMS(Knowledge Management System)를 위한 별도의 백업시스템도 구축
균형성과관리(BSC), 핵심성과지표(KPI), 웹 리포팅 등의 다 고객 분석 툴을 통해 기존 데이터베이스와 연계
전자태그(RFID)는 사물과 주변 정보를 접촉 없이도 무선주파수로 전송·처리가 가능한 인식기술
2. 사회기반구조로서의 데이터베이스
90년대 사회간접자본(SOC) 차원에서 EDI(Electronic Data Interchange, 전자문서교환)
→ 부가가치통신망(VAN)을 통한 정보망이 구축
1995년에 조세전산망, 1996년에는 조달·국방·물류종합망· 의료정보망·산업정보망
90년대 후반 지리, 교통부문의 데이터베이스 구축이 본격적으로 시작
00년대 의료· 교육·행정 등 사회 각 부문으로 공공 DB의 구축·이용, 인터넷 보편화 일반가정에서도 가능
가. 물류부분
'실시간 차량추적 : 운행중인 차량의 위치 및 상태를 실시간으로 파악하여 관제
CVO서비스(Commercial Vehicle Operation System, 화물운송정보)
EDI서비스, 데이터베이스 서비스(물류정보) 부가서비스
한국통신 - 기업물류정보 제공
한국물류정보통신 - 해양수산 데이터베이스 개발
종합물류정보망 연계
민간 기업 물류 VAN은 2000년 이후 활성화 → 택배/물류 회사 발전
나. 지리부분
1995년 시작된 국가지리정보체계(NGIS) 구축 - 국가표준설정, 활용체계 개발
2000년 1단계 사업이 종료 : 국가 수치지형도의 구축
단, 데이터 포뱃인 DXF(Data eXchange Format)로 구축되어 표현 한계
2005년 2차 단계 : 토지종합정보망(LMIS) 및 공공제한 관련 정보,7대 지하시설물 지리정보
GIS, RS(Remote Sensing), GPS(Global Positioning System) , ITS(Intelligent Transport System)
기술을 통합하여 새로운 GIS 응용에 활용하는 4S 통합기술
LBS(Location Based Service) 기술, SIM(Spatial Information Management),
공간 DBMS 등 GIS 관련 정보기술의 비약적인 발전
다. 교통부분
동적(실시간) 교통정보 : 지능형교통시스템(ITS Intelligent Transport System), 교통방송
정적(비실시간) 교통정보 : 교통정책 및 계획 수립 등에 필요한 교통 분야별 기초자료 및 통계
라. 의료부분
1996년부터 53개 기관을 대상으로 의료EDI 상용서비스가 제공
2002년 의료법 개정에 따른 전자의무기록
의료정보시스템 → u-헬스 등장 → 환자중심의 병원 경영기법
마. 교육부분
대학정보화 : 대학도서관 소장자료
교육정보 공동활용체제 : 에뉴넷
교육행정정보시스템 (NEIS. National Education Information System)
'자격증 공방 > ADSP' 카테고리의 다른 글
4-1 R 기초와 데이터 마트 (0) | 2018.08.27 |
---|---|
3-2 분석 마스터 플랜 (0) | 2018.08.22 |
3-1 데이터 분석 기획의 이해 (0) | 2018.08.22 |
1-3 가치창조를 위한 데이터과학과 전략 인사이트 (0) | 2018.08.22 |
1-2 데이터의 가치와 미래 (0) | 2018.08.22 |