비정형 데이터 + 데이터레이크(data lake) 정리
현장실습 과정중... 비정형데이터에 대해 자료조사 과제가 주어졌다. 핵심? 기본 적인 내용만 정리한 글입니다. 비정형 데이터는 구조가 사실상 없는 데이터로, 비디오, 오디오, 일반 텍스트 등의 형태를 말합니다. 1.틀이 잡혀 있지 않고 사전 정의가 없는 데이터 2.다양하고 방대한 양의 데이터, 별도의 분석 처리 기술이 필요 3.텍스트, 이미지, 음원데이터, 빅데이터 비정형 데이터는 정형 데이터에 상반되는 개념입니다. 비정형 데이터는 최근 빅데이터가 주목을 받기 시작하면서 부각된 데이터 형태인데, 정형 데이터 외의 모든 데이터가 비정형 데이터입니다. 이를테면 이메일 내용과 소셜미디어 포스트, 각종 텍스트 문서, 음원과 이미지, 스마트폰에 기록되는 각종 행동 정보와 기계에서 출력되는 각종 메시지와 로그(lo..
2022. 12. 27.