Aula Virtual Formación Hadoop: Ejercicio. Ejecutando un Workflow con Hue.

Foro Formación Hadoop

Return to: Site

Ejercicio. Ejecutando un Workflow con Hue.

Buenas Tardes,

Estoy con el último ejercicio del módulo 1. En el se pide ejecutar un workflow con Hue y me esta dando problemas:

No consigo añadir el jar ni añadir las propertis, dónde se añaden las propertis??.

Gracias.

Permalink

Hola Andrés,

Entendemos que estás utilizando la VM de Cloudera para realizar los ejercicios. Para poder ayudarte necesitamos que nos digas que versión estás utilizando.

Un saludo,

Permalink | Show parent

Estoy utilizando Cloudera Manager la versión 5.12.

Gracias.

Permalink | Show parent

Hola Andrés,

La interfaz de la última versión de HUE en la distribución de Cloudera ha cambiado bastante. Debe acceder a query/scheduler/workflow.

Una vez en el editor de workflow podrá generar su workflow seleccionando la acción de MapReduce. El jar de MapReduce que desea ejecutar debe estar en el HDFS.

A continuación le indicamos unas capturas para intentar ayudarle:

Acceso al editor de oozie:

Scheduler

Panel/editor de creación de workflows:

Mapreduce job

Ejemplo configuración acción MapReduce:

conf mapreduce

Un saludo,

Permalink | Show parent

Hasta ahí he llegado yo, no me soluciona nada.

Yo arrastro Save MapReduce Job al recuadro dónde pone: Drop your action here.

Cuándo hago eso me sale una pantalla para introducir mi programa MapReduce, introduzco el wordcount-1.jar como pone en los apuntes pero no me deja añadirlo....

Permalink | Show parent

¿El wordcount-1.jar lo tienes en HDFS?

Permalink | Show parent

Pues entiendo que si, ya que he seguido los pasos de los ejercicios. Aún así como se miraba en la terminal si esta en el HDFS??????

Permalink | Show parent

Al inicio del ejercicio se indica:

Si no lo hiciste, debes crear el JAR siguiendo los pasos del ejercicio WordCount. Nota: el Reducer de este ejercicio realiza la misma función que el del programa WordCount que ejecutaste antes. Puedes reutilizar ese código o puedes escribir uno nuevo.

Para comprobar que el jar está en HDFS debes utilizar el comando visto en capítulos anteriores (hadoop fs -ls) indicando la ruta donde has dejado el jar, por ejemplo, si el jar lo pusiste en /tmp del hdfs:

hadoop fs -ls /tmp

Al ejecutar el comando anterior deberías ver el .jar generado.

En el hue debes insertar la ruta completa (por ejemplo: /tmp/wordcount.jar)

Permalink | Show parent

Yo tengo mi wordcount-1.jar en el escritorio y en cloudera`s home en la carperta Temp.

Por tanto en la terminal entro en el escritorio (cd Desktop), una vez ahí busco hadoop fs -ls /wordcount-1.jar y nada.

Está claro que hago algo mal pero no se el que...

Permalink | Show parent

Tienes varios conceptos "difusos". Por una parte tenemos el sistema de ficheros local (el escritorio, home, etc.. que tendríamos en cada una de las máquinas que forman nuestro cluster Hadoop), y por otra parte tenemos el sistema de ficheros de Hadoop (HDFS) que lo componen todas las máquinas del cluster.

Para moverte por el sistema de ficheros local, utilizas los comandos de unix, cd ..., ls .. etc.

Para realizar acciones sobre el sistema de ficheros de Hadoop se realizan a través del cliente "hadoop fs".

Con todo esto, si tienes el wordcount-1.jar en el escritorio (sistema de ficheros local) para insertarlo en el tmp de HDFS debes realizar:

cd Desktop

hadoop fs -put wordcount-1.jar /tmp

A continuación, si haces un listado del tmp de HDFS verás el jar:

hadoop fs -ls /tmp

Recordarte que si en la terminal indicas únicamente la instrucción hadoop fs, te muestra un listado con todas las operaciones disponibles.

Si no te aclaras con estas cosas, te recomendaríamos que revisar los 2 primeros ejercicios del módulo 1.

Un saludo.

Permalink | Show parent

Hago lo que me indicas en el post de arriba:

- cd Desktop

- hadoop fs -put wordcount-1.jar /Temp

Me sale lo siguiente:

- put: Permission denied: user=cloudera, access=write, inode="/":hdfs:supergroup:drwxr-xr-x

Tengo el cloudera manager con la sesión abierta y nada.

Permalink | Show parent

Hola Andrés,

Estás poniendo mal la instrucción de hadoop fs -put:

Tu estás poniendo:

hadoop fs -put wordcount-1.jar /Temp

Y en el post de arriba se indica:

hadoop fs -put wordcount-1.jar /tmp

Un saludo,

Permalink | Show parent

Buenas, siento ser tan pesado....

Ejecuto: hadoop fs -ls /tmp

Me sale:
Found 6 items
drwxrwxrwx - hdfs supergroup 0 2017-11-14 07:13 /tmp/.cloudera_health_monitoring_canary_files
drwxrwxrwt - mapred mapred 0 2017-07-19 05:34 /tmp/hadoop-yarn
drwx--x--x - hbase supergroup 0 2017-10-09 01:06 /tmphbase-staging
drwx-wx-wx - hive supergroup 0 2017-11-02 08:17 /tmp/hive
drwxrwxrwt - mapred hadoop 0 2017-10-09 23:40 /tmp/logs
-rw-r--r-- 1 cloudera supergroup 3367 2017-11-14 05:16 /tmp/wordcount-1.jar

Añado el MapReduce en HUE.

Introduzco el jar: /tmp/wordcount-1.jar le doy a ADD y no me lo añade....

Que me puede estar pasando??? Gracias!!

Permalink | Show parent

Hola Andrés,

Vamos a generar un vídeo tutorial con la ejecución de un workflow con Oozie-Hue para intentar solucionarte los problemas.

En tenerlo generado lo colgaremos en nuestro canal de youtube y te avisaremos.

Un saludo,

Permalink | Show parent

Muchas Gracias!!!

Permalink | Show parent

Novedades del sitio ►