비정형 데이터 + 데이터레이크(data lake) 정리
현장실습 과정중... 비정형데이터에 대해 자료조사 과제가 주어졌다. 핵심? 기본 적인 내용만 정리한 글입니다. 비정형 데이터는 구조가 사실상 없는 데이터로, 비디오, 오디오, 일반 텍스트 등의 형태를 말합니다. 1.틀이 잡혀 있지 않고 사전 정의가 없는 데이터 2.다양하고 방대한 양의 데이터, 별도의 분석 처리 기술이 필요 3.텍스트, 이미지, 음원데이터, 빅데이터 비정형 데이터는 정형 데이터에 상반되는 개념입니다. 비정형 데이터는 최근 빅데이터가 주목을 받기 시작하면서 부각된 데이터 형태인데, 정형 데이터 외의 모든 데이터가 비정형 데이터입니다. 이를테면 이메일 내용과 소셜미디어 포스트, 각종 텍스트 문서, 음원과 이미지, 스마트폰에 기록되는 각종 행동 정보와 기계에서 출력되는 각종 메시지와 로그(lo..
2022. 12. 27.
day02_DBMS + DBS + VIEW에 대해..🥪
[1교시: 2단원_DBMS] 1세대 : 네트워크 구조로 데이터를 관리하기 힘들었다. 그래서 계층 구조로 된 계층DBMS 를 사용해보았지만 여전히 2세대 : 관계형 DBMS 가 나옴.. 데이터베이스를 테이블 형태로 구성. - 현재 가장 널리 사용된 데이터베이스 관리시스템 관계형 데이터베이스 특징: SQL, 테이블 어떤 DBMS 를 사용하든 SQL, 테이블 구조는 동일하다. 3세대: 객체형 DBMS => 객체관계DBMS 4세대 : nosql: 비관계형 dbms +정형데이터 : 틀이 잡혀 있는 데이터, 체계화된 데이터, 높은 안전성, 대부분기업의 업무용 데이터베이스 + 비정형데이터: 틀이 잡혀있지 않고 사전정의가 없는 데이터, 다양하고 방대한 양의 데이터, 텍스트,이미지,음원데이터,빅데이터 ----------..
2022. 9. 15.