Tipus | model relacional de dades i programari lliure |
---|---|
Versió inicial | 9 novembre 2011 |
Versió estable | |
Llicència | Llicència Apache, versió 2.0 |
Característiques tècniques | |
Sistema operatiu | multiplataforma |
Plataforma | Màquina Virtual Java |
Escrit en | Java |
Equip | |
Desenvolupador(s) | Apache Software Foundation |
Més informació | |
Lloc web | hive.apache.org |
Seguiment d'errors | Seguiment d'errors |
| |
Apache Hive és un projecte de programari d'emmagatzematge, agrupament, gestió i anàlisi de dades construït sobre Apache Hadoop. Apache Hive ofereix una interfície semblant a SQL per a consultar i fer anàlisi de dades emmagatzemades en diversos sistemes de fitxers i bases de dades. Inicialment desenvolupat per Meta Platforms (Facebook Inc. en aquell moment), l'eina és ara utilitzada per altres empreses com Netflix. Amazon manté una derivació del programari Apache Hive inclosa en Amazon Elastic MapReduce, eina dels seus serveis AWS.
Apache Hive dona suport a l'anàlisi de grans conjunts de dades emmagatzemats amb Apache Hadoop i amb altres sistemes compatibles com el sistema d'emmagatzematge d'arxius Amazon S3. Ofereix un llenguatge de consultes basat en SQL anomenat HiveQL, que permet llegir i convertir consultes de forma transparent a MapReduce, Apache Tez i tasques Spark. Els tres motors d'execució tot just mencionats poden funcionar sota YARN. Per a accelerar les consultes, Apache Hive proveeix l'usuari d'índexs, que inclouen índexs de bitmaps. Altres característiques significatives de Hive són les següents:
Per defecte, Hive emmagatzema les seves metadades en una base de dades Apache Derby, però pot ser configurat per a utilitzar MySQL.