Foro Formación Hadoop
Ejercicio: Escribiendo un programa hadoop streaming
Buenas Fernando,
En mi caso como te comentaba, no he cogido la solución de phyton, sino que he creado yo un script de map y uno de reduce en bash. En esos scripts no puse la conversión de minúscula, como tampoco lo hice la conversión en el script de java que realicé (entiendo que el de java lo hice bien, no tengo el vuestro de la solución pero lo he comparado ahora y es bastante parecido).
En mi script hecho en bash el resultado a parte de devolver también la media de palabras que empiezan por caracteres (eso entiendo que es normal porque no he simulado en bash el split que hace en java con "\\W+") en las letras y números el resultado para muchas de ellas no es el mismo. Por ejemplo en java me devuelve que la media de "C" es 6 en java y en el que he hecho con bash me devuelve 7.
Te subo de nuevo los ficheros de resultados y el map.sh y el reduce.sh realizado en shell script. (Lo estoy subiendo dando al último icono el de "Gestionar ficheros" que aparece en la parte superior del mensaje, que entiendo que es la forma correcta de hacerlo).
Muchas gracias !!!!
Social networks