1 데이터와 정보

 

1. 데이터의 정의

 

데이터란?

- 1646 영국 문헌에서 처음 등장 주어진것이란 과거분사형

- 1940 컴퓨터 시대 도래 이후 관념적, 추상적 개념 → 기술적 사실적 변화

- 옥스퍼드 대사전 : 데이터를 추론과 추정의 근거를 이루는 사실

다른 객체와의 상호관계 속에서 가치를 갖는

- 객관적 사실이라는 존재적 특성 + 추론, 예측, 전망, 추정을 위한 근거의 당위적 특성

 

데이터 유형

구분

형태

예시

정성적 데이터(qualitative data)

언어, 문자

회사 매출이 증가함

정량적 데이터(quantitative data)

수치, 도형, 기호

나이, 몸무게, 온도, 풍속, 강우량

정성적 데이터 : 기술이 가능함, 설문조사의 주관식 ,  SNS상의 (=비정형데이터) → 분석비용

정량적 데이터 : 수치로 명확하게 표현, 데이터 관리 시스템으로 저장, 검색, 분석

 

암묵지와 형식지

암묵지 : 학습과 체험을 통해 개인에게 습득되었지만 겉으로 들어나지 않는 지식

오랜 경험을 통해 개인에게 습득된 무형의 지식

다른사람에게 공유되기 어렵다

공통화(Socialization) , 내면화(Internalizaion)

형식지 : 형상화된 지식, 유형의 대상이기에 지식의 전달과 공유가 매우 용이

조직원 개인의 지식 공유, 발전 가능

표출화(ExternaIization) , 연결화(Combination)

 

암묵지와 형식지의 상호작용 : 지식 형성의 중요한 기초

현장 경험을 통해 축적된 내면화된 지식

조직의 지식으로 공통화를 위해서는

개인의 암묵지를 표출화하고

다른 개인이 본인의 지식에 연결

새로운 경험을 부가하여 다시 내면화 하는 과정

 

2. 데이터와 정보의 관계

 

DIKW 피라미드

데이터, 정보, 지식을 통해 최종적으로 지혜를 얻어내는 과정을 계층구조로 설명

지혜

(Wisdom)

근본 원리에 대한 깊은 이해를 바탕으로 도출되는 창의적인 아이디어

) A마트의 다른 상품들도  B마트보다 것이라고 판단

지식

(Knowledge)

상호 연결된 정보 패턴을 이해하며 이를 토대로 예측한 결과물

) 상대적으로 저렴한 A마트에서 연필을 사야겠다.

정보

(Information)

데이터의 가공 상관관계간 이해를 통해 패턴을 인식하고 의미를 부여한 데이터

) A마트의 연필가격이 싸다

데이터

(Data)

존재형식을 불문하고, 데이터와 상관관계가 없는 가공하기전의 순수한 수치나 기호
) A마트는 100, B마트는 200원에 연필을 판매한다.

데이터의 정확성은 향후 데이터 간의 관계 및 현상의 분석(정보)과 적용(지식)

더 나아가 미래를 예측하고 창의적 산물을 도출(지혜)하는 데 지대한 영향을 미치며

가치창출에 핵심적인 역할을 수행

 

2 데이터베이스 정의와 특징

 

1. 용어의 연역

데이터베이스(database)

- 1950년대 미국정부 자국군대의 군비상황 관리를 위한 도서관 설립 '데이터의 기지'

- 1963 6 미국 SDC '컴퓨터 중심의 데이터베이스 개발과 관리' : 쉽게 검색하는 작업

: 대량의 데이터를 축척하는 기지

- 1965 2 심포지엄 : 시스템을 통한 체계적 관리와 저장 의미를 담은 '데이터베이스 시스템'

- 1963 GE C.바크만 : 데이터베이스 관리 시스템 IDS개발 데이터 모델 기반 관리 시스템

- 1970년대 유럽 '데이터베이스' 단일어 일반화, 1970 후반 미국에서 사용

우리나라는 1975 미국의 CAC KORSTIC 통해 서비스 되면서 이용

자기테이프형태의 배치방식 온라인 정보검색 시스템 데이터 연구개발(80 중반)

 

2. 데이터베이스의 정의

다양한 정보기술의 발달과 인터넷이 확산등으로 현대적 개념이 적용된 용어로 정의

체계적으로 정렬된 데이터의 집합

-  “문자,기호,음성,화상,영상 등 상호 관련된 다수의 콘텐츠를

정보 처리 및 정보통신 기기에 의하여 체계적으로 수집 ·축적하여

다양한 용도와 방법으로 이용할 수 있도록 정리한 정보의 집합제”

- EU의 데이터베이스의 법적 보호에 관한 지침 :  “체계적이 거나 조직적으로 정리되고 전자식

또는 기타 수단으로 개별적으로 접근할 수 있는 독립된 저작물, 데이터 또는 기타 소재의 수집물”

-  국내 ‘저작권법’ : “소재를 체계적으로 배열 또는 구성한 편집물로서 개별적으로

그 소재에 접근하거나 그 소재를 검색할 수 있도록 한 것”

- 컴퓨터 용어사전 등 :  “동시에 복수의 적용 업무를 지원할 수 있도록 복수 이용자의 요구에 대응해서

데이터를 받아들이고 저장, 공급하기 위하여 일정한 구조에 따라서 편성된 데이터의 집합”

 “관련된 레코드의 집합 소프트웨어로는 데이터베이스관리시스템을 의미한다"

DBMS : 데이터베이스를 구축, 유지하는 소프트웨어

      + 데이터베이스 = 데이터베이스 시스템

 

3. 데이터베이스의 특징

텍스트나 숫자 그래프 + 멀티미디어까지 저장가능, 정보를 저장하는 지식 베이스, 복합체로 진화

 

1) 통합된 데이터 : 동일한 내용, 중복이 허용되지 않음

2) 저장된 데이터 : 검퓨터가 접근할 있는 저장 매체에 저장

3) 공용 데이터 : 여러 사용자가 서로 다른 목적으로 데이터 공동 이용, 대용량화, 구조복잡

4) 변화되는 데이터 : 저장하는 내용이 상태를 나타냄, 변화하지만 현재의 정확한 데이터 유지

 

- 정보의 축적 전달 : 기계가독성, 검색가능성, 원격조작성

- 정보이용 : 정보요구에 따라 신속하게 원하는 정보 획득하여 경제적으로 찾아냄

- 정보관리 : 일정한 질서와 구조에 따라 정리, 저장하고 검색, 관리

방대한 양의 정보를 체계적으로 축적하고 새로운 내용 추가나 갱신 용이

- 정보기술 발전 :  정보처리, 검색·관리 소프트웨어, 관련 하드웨어, 정보 전송을 위한 네트워크 기술 등의 발전

- 경제, 산업적 측면 : 인프라로서 특성 → 효율성 제고, 국민의 편의 증진하는 수단

 

3 데이터베이스 활용

 

1. 기업내부 데이터베이스

정보통신망 구축 기업경영전반 모든 자료 연계, 체계구축, 운영 전사시스템

단순 수집에서 탈피 '분석' 중심이 되는 시스템 구축

단순 자동화 OLTP(Online Transaction Processing)   OLAP (Online Analytical Processing) 로 변화

2000년대 이후  

- CRM(Consumer Relationship Management, 고객관계 관리) : 고객분석, 마케팅전략

- SCM(Supply Chain Management, 공급망관리) : 시간과 비용 최적화

SCM은 일반적으로 자재구매 데이터 생산·재고 데이터 유통·판매 데이터 고객 데이터로 구성

특히 유통·판매 및 고객 데이터가 CRM과 연동되기 때문에 CRM과 SCM은 상호 밀접한 관련

 

. 제조부분

기업별 고유 시스템 형태 솔루션 유형( 공정을 포함하는 범위)

 ERP(Enterprise Resource Planning) + SCM

실시간 기업(RTE)은 기업의 비즈니스 프로세스를 투명하고 민첩하게 유지하여

환경 변화에 따른 적응 속도를 최대화하여 지연시간을 없애는 정보화 전략

대기업-중소기업 협업적 IT

 ERP 시스템 도입과 함께 DW, CRM, BI(Business Intelligence) 등의 인하우스 DB 구축

 

. 금융부분

2000년대 초반 EAI(Enterprise Applications Integration), ERP, e-CRM, 인터넷뱅킹

2000년대 중반 DB 마케팅, 방카슈랑스, BI기반 시스템 구축

최근  EDW(Enterprise Data Warehouse)의 확장이 데이터베이스 시장 확대에 기여할 것으로 예상

 

. 유통부분

CRM + SCM

상거래를 위한 각종 인프라 및 KMS(Knowledge Management System)를 위한 별도의 백업시스템도 구축

균형성과관리(BSC), 핵심성과지표(KPI), 웹 리포팅 등의 다 고객 분석 툴을 통해 기존 데이터베이스와 연계

전자태그(RFID)는 사물과 주변 정보를 접촉 없이도 무선주파수로 전송·처리가 가능한 인식기술

 

2. 사회기반구조로서의 데이터베이스

90년대 사회간접자본(SOC) 차원에서 EDI(Electronic Data Interchange, 전자문서교환)

부가가치통신망(VAN)을 통한 정보망이 구축

1995년에 조세전산망, 1996년에는 조달·국방·물류종합망· 의료정보망·산업정보망

90년대 후반  지리, 교통부문의 데이터베이스 구축이 본격적으로 시작

00년대  의료· 교육·행정 등 사회 각 부문으로 공공 DB의 구축·이용, 인터넷 보편화 일반가정에서도 가능

 

. 물류부분

'실시간 차량추적 :  운행중인 차량의 위치 및 상태를 실시간으로 파악하여 관제

CVO서비스(Commercial Vehicle Operation System, 화물운송정보)

EDI서비스, 데이터베이스 서비스(물류정보) 부가서비스

한국통신 - 기업물류정보 제공

한국물류정보통신 - 해양수산 데이터베이스 개발

종합물류정보망 연계

 민간 기업 물류 VAN은 2000 이후 활성화 택배/물류 회사 발전

 

. 지리부분

1995년 시작된 국가지리정보체계(NGIS) 구축 - 국가표준설정, 활용체계 개발

2000년 1단계 사업이 종료 :  국가 수치지형도의 구축

,  데이터 포뱃인 DXF(Data eXchange Format)로 구축되어 표현 한계

2005 2 단계 :  토지종합정보망(LMIS) 및 공공제한 관련 정보,7대 지하시설물 지리정보

GIS, RS(Remote Sensing), GPS(Global Positioning System) , ITS(Intelligent Transport System)

기술을 통합하여 새로운 GIS 응용에 활용하는 4S 통합기술

LBS(Location Based Service) 기술, SIM(Spatial Information Management),

공간 DBMS 등 GIS 관련 정보기술의 비약적인 발전

 

. 교통부분

동적(실시간) 교통정보 :  지능형교통시스템(ITS Intelligent Transport System), 교통방송

정적(비실시간) 교통정보 :  교통정책 및 계획 수립 등에 필요한 교통 분야별 기초자료 및 통계

 

. 의료부분

1996년부터 53개 기관을 대상으로 의료EDI 상용서비스가 제공

2002 의료법 개정에 따른 전자의무기록

의료정보시스템  u-헬스 등장 → 환자중심의 병원 경영기법

 

. 교육부분

대학정보화 : 대학도서관 소장자료

교육정보 공동활용체제 : 에뉴넷

교육행정정보시스템 (NEIS. National Education Information System)


+ Recent posts