Foro Formación Hadoop
Ejercicio RDD de pares
Buenas, tengo la siguiente duda:
En el ejercicio 4 de RDD de pares se pide lo siguiente:
"El conjunto de datos de ~/formacionhadoop/accounts.csvconsiste en informaciónsobre las cuentas de usuario. El primer campo de cada línea es el id de usuario, que corresponde con el id de usuario de los logs del servidor web. Los otros campos incluyen información sobre la cuenta como su fecha de creación, nombre, apellido...Haz un join entre los datos de las cuentas de usuario y los de los logs del servidor web para producir un conjunto de datos en el que la clave sea el user id y como valor tenga la información de la cuenta de usuario y el número de visitas del usuario."
1 - "Haz map de los datos de cuenta a pares clave/lista de valores del tipo (userid, [valores...])"
En este primer apartado he intentado hacerlo pero no me ha salido y en la solución no entiendo lo siguiente:
.map(lambda account: (account[0],account[1:]))
¿Que significa los dos puntos despues del 1?
Gracias. Saludos.
Social networks