오늘 할 일: 끝내주게 숨쉬기
article thumbnail
[Hive] 하이브 이해하기

하이브(Hive)란 무엇인가 하둡 기반의 데이터 웨어하우스(DW, Data Warehouse) 솔루션으로 데이터 요약, 질의 및 분석 기능을 제공합니다. 하이브를 이용하면 HDFS(Hadoop Distributed File System)에 저장된 데이터에 SQL과 유사한 HiveQL이라는 쿼리를 날려 접근할 수 있습니다. 하이브는 맵리듀스(MapReduce)의 모든 기능을 지원하여 직접 맵리듀스를 작성하는 것보다 쉽게 구현할 수 있고, 쿼리를 빠르게 하는 비트맵 인덱스도 제공하고 있습니다. HDFS에 저장된 데이터를 수정할 수는 없지만 SQL에 익숙한 분석가들이 정형화된 대용량 데이터를 다루기에 유용한 솔루션이라고 합니다. 한마디로 대용량 정형화 데이터를 질의하고 그 결과를 생성하는 쿼리 엔진, "하둡의..

article thumbnail
[프로그래머스] SQL 고득점 Kit : JOIN

※ 모든 코드는 Oracle을 기준으로 작성되었습니다. 1. 없어진 기록 찾기 문제설명 Solutions 1 2 3 4 5 6 SELECT O.ANIMAL_ID, O.NAME FROM ANIMAL_OUTS O LEFT OUTER JOIN ANIMAL_INS I ON O.ANIMAL_ID = I.ANIMAL_ID WHERE I.ANIMAL_ID IS NULL ORDER BY ANIMAL_ID; cs 코드해석 입양을 간 기록은 있는데 보호소에 들어온 기록이 없다면 입양 간 동물의 정보를 담은 테이블 ANIMAL_OUTS의 모든 값이 일단 조회가 되어야겠죠. 그래서 ANIMAL_ID을 기준으로 LEFT JOIN을 사용하여 조인을 수행하고요, ANIMAL_INS의 ANIMAL_ID가 존재하지 않는다면 NULL로..

article thumbnail
[프로그래머스] SQL 고득점 Kit : GROUP BY

※ 모든 코드는 Oracle을 기준으로 작성되었습니다. 1. 고양이와 개는 몇 마리 있을까 문제 설명 Solution 1 2 3 4 SELECT ANIMAL_TYPE, COUNT(ANIMAL_TYPE) count FROM ANIMAL_INS GROUP BY ANIMAL_TYPE ORDER BY ANIMAL_TYPE; 코드해석 GROUP BY절을 사용하여 동물의 종에 따라 그룹화를 하고, COUNT 함수를 사용하여 동물의 종마다 행의 개수를 집계합니다. 고양이(Cat)가 개(Dog)보다 먼저 조회되어야 하므로 ORDER BY절을 사용해 동물의 종으로 정렬하였습니다. 2. 동명 동물 수 찾기 문제 설명 Solution 1 2 3 4 5 6 SELECT NAME, COUNT(NAME) FROM ANIMAL_I..

article thumbnail
[프로그래머스] SQL 고득점 Kit : SUM, MAX, MIN

※ 모든 코드는 Oracle을 기준으로 작성되었습니다. 1. 최댓값 구하기 문제 설명 Solution 1 2 3 4 5 SELECT DATETIME FROM (SELECT DATETIME FROM ANIMAL_INS ORDER BY DATETIME DESC) WHERE ROWNUM = 1; 코드해석 서브쿼리를 활용하여 보호 시작일을 내림차순 정렬합니다. 날짜를 내림차순 정렬하게 되면 가장 최근 날짜가 맨 위에 위치하게 됩니다. 정렬된 테이블에서 행 번호가 1인 행을 추출합니다. 2. 최솟값 구하기 문제 설명 Solution 1 2 3 4 5 SELECT DATETIME FROM (SELECT DATETIME FROM ANIMAL_INS ORDER BY DATETIME) WHERE ROWNUM = 1; 코..

반응형