Foro Formación Hadoop

Pig & Hive - Complementarias?

 
Imagen de Fernando Agudo
Re: Pig & Hive - Complementarias?
de Fernando Agudo - miércoles, 24 de enero de 2018, 07:26
 

Hola Alexandre, 

Pig y Hive son 2 herramientas que se utilizan para lo mismo. 2 intérpretes que convierten el lenguaje (Pig Latin o HiveQL) en un procesamiento con tareas MapReduce.

La elección de una u otra es cuestión de gustos.... todo lo que se puede realizar en una se puede realizar en la otra, y a nivel de rendimiento en principio son iguales. 

Por mi experiencia profesional, PIG se suele utilizar más en procesos de ETL y Hive como respositorio final de las salidas para que el equipo de análisis de datos pueda realizar sus procesamientos a través de un lenguaje like SQL (HiveQL).

Un saludo,