Foro Formación Hadoop

Ejercicio RDD de pares

 
Imagen de Manuel Garcia Garcia
Ejercicio RDD de pares
de Manuel Garcia Garcia - martes, 12 de noviembre de 2019, 22:12
 
Buenas, tengo la siguiente duda:

En el ejercicio 4 de RDD de pares se pide lo siguiente:
"El conjunto de datos de ~/formacionhadoop/accounts.csvconsiste en informaciónsobre las cuentas de usuario. El primer campo de cada línea es el id de usuario, que corresponde con el id de usuario de los logs del servidor web. Los otros campos incluyen información sobre la cuenta como su fecha de creación, nombre, apellido...Haz un join entre los datos de las cuentas de usuario y los de los logs del servidor web para producir un conjunto de datos en el que la clave sea el user id y como valor tenga la información de la cuenta de usuario y el número de visitas del usuario."

1 - "Haz map de los datos de cuenta a pares clave/lista de valores del tipo (userid, [valores...])"
En este primer apartado he intentado hacerlo pero no me ha salido y en la solución no entiendo lo siguiente:

.map(lambda account: (account[0],account[1:]))

¿Que significa los dos puntos despues del 1?

Gracias. Saludos.
Imagen de Manuel Garcia Garcia
Re: Ejercicio RDD de pares
de Manuel Garcia Garcia - miércoles, 13 de noviembre de 2019, 21:25
 

Ya encontré lo que significa.

Disculpad.

Saludos.

Imagen de Admin Formación Hadoop
Re: Ejercicio RDD de pares
de Admin Formación Hadoop - jueves, 14 de noviembre de 2019, 09:54
 

Hola, 

Por si a alguien le surge la misma duda, en python colocar como índice de un array [1:], significa que coges de la posición 1 en adelante.

Un saludo,