Flask 소개 Flask는 파이썬에서 사용하는 경량 WSGI(Web Server Gateway Interface)로, 웹 애플리케이션을 구축할 수 있는 라이브러리입니다. Flask를 활용하면 웹 페이지, 블로그 혹은 머신러닝 예측 결과를 제공하는 웹 API를 만들 수 있습니다. 아래 그림에서 보는 바와 같이 머신러닝 모델과 프론트엔드 웹 페이지를 연결해주는 중간 다리로 사용되죠. 장고Django와 함께 파이썬 웹 프레임워크의 양대산맥으로 알려져 있습니다. Django는 이미 잘 짜여진 다양한 기능을 제공하는 반면 Flask는 심플한 대신에 사용자 자유도가 높다고 하네요. (마치 케라스와 파이토치같은..?ㅎ 아님 말고..) 이제 아래 예시에서 iris 데이터를 이용하여 모델을 만든 후, 플라스크가 모델에..
하이브(Hive)란 무엇인가 하둡 기반의 데이터 웨어하우스(DW, Data Warehouse) 솔루션으로 데이터 요약, 질의 및 분석 기능을 제공합니다. 하이브를 이용하면 HDFS(Hadoop Distributed File System)에 저장된 데이터에 SQL과 유사한 HiveQL이라는 쿼리를 날려 접근할 수 있습니다. 하이브는 맵리듀스(MapReduce)의 모든 기능을 지원하여 직접 맵리듀스를 작성하는 것보다 쉽게 구현할 수 있고, 쿼리를 빠르게 하는 비트맵 인덱스도 제공하고 있습니다. HDFS에 저장된 데이터를 수정할 수는 없지만 SQL에 익숙한 분석가들이 정형화된 대용량 데이터를 다루기에 유용한 솔루션이라고 합니다. 한마디로 대용량 정형화 데이터를 질의하고 그 결과를 생성하는 쿼리 엔진, "하둡의..
R에서 원소에 동일한 연산을 반복적으로 수행하고 싶을 때 apply 계열의 함수를 사용합니다. 일반적으로 반복 계산을 할 때 사용하는 for, while보다 시간이 적게 듭니다. 1. apply() 행렬이나 데이터 프레임의 행, 열에 대해 함수를 적용할 때 사용합니다. apply(x, margin, function) margin = 1 : 행에 대한 연산 margin = 2 : 열에 대한 연산 margin = c(1,2) : 원소에 대한 연산 2. lapply() 리스트에 적용하며 결과 역시 리스트로 반환합니다. lapply(x, function) 3. sapply() lapply()와 유사한데요, lapply()는 결과를 리스트로 반환하는 반면 sapply()는 결과를 벡터나 행렬로 반환합니다. 4. ..