Apache Hive Hadoop Ecosystem에서 데이터를 모델링하고 프로세싱할 때 가장 많이 사용하는 데이터 웨어하우스 솔루션 HDFS에 저장된 데이터를 RDB 데이터베이스 테이블과 같은 구조로 정의하는 방법을 제공한다. Hive를 사용하면 하둡 에코시스템에 저장된 거대한 데이터세트를 SQL 기반으로 쿼리하고 처리할 수 있게 된다. 💡 Hadoop Ecosystem Apache Hadoop 소프트웨어 라이브러리를 이루는 다양한 구성 요소. HDFS, Hive, Pig, YARN, MapReduce 등이 해당된다. 💡 데이터 웨어하우스 여러 소스에서 가져온 구조화된 데이터와 반구조화된 데이터를 분석하고 보고하는 데 사용되는 엔터프라이즈 시스템 구성 요소 Hive는 다음과 같은 구조로 되어 있다. U..