|
|
|
|
2데이타마이닝
|
|
|
|
데이타마이닝
데이타마이닝이란
축적되는 데이터의 폭발적인 증가와 더불어 비약적으로 발전한 정보기술은 대용량의 데이터에 대한 분석을 통해 유용한 정보를 얻을 수 있도록 한다. 즉, 대용량의 데이터로부터 기존에 알려지지 않은 유용한 지식을 찾아내는 일련의 과정을 데이타마이닝 이라고 한다. 이 기술은 기업들이 가지고 있는 대용량의 데이터에 숨겨져 있는 유용한 패턴을 찾을 수 있도록 한다.
주요 고객들의 구매 패턴을 이해 할 수 있도록 도와주며, 카드 사기 검출이나 부정보험 청구 탐지, 금융시장에서의 변화예측 등을 가능하도록 한다. 기업이 많은 비용을 들여서 수집한 데이터를 진정으로 이해할 수 있는 기반을 제공한다.
과정과 방법
데이타마이닝은 데이터베이스로부터 분석 대상이 되는
①데이터를 선별하는 과정(data selection),
②선별된 데이터를 적절한 형태로 가공하고 정제(cleaning, transformation)하는 과정,
③변환된 데이터에 마이닝 알고리즘을 수행하는 과정(data mining),
④알고리즘의 결과를 재가공하고 기존의 지식과 통합하는 과정을 거치게 된다.
⑤위의 과정을 거쳐 결과로 얻은 지식은 예측(prediction)이나 분류(classification) 모델을 만드는 것에 사용되기도 하며, 데이터베이스의 레코드들 사이의 연관성을 밝혀내기도 하고, 데이터베이스의 내용을 요약해 주기도 한다.
데이타마이닝의 응용
.... |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|