Foro Formación Hadoop

Curso Online Apache Spark

 
Imagen de Admin Formación Hadoop
Re: Curso Online Apache Spark
de Admin Formación Hadoop - jueves, 11 de diciembre de 2014, 20:01
 

Ejemplo WordCount en Spark:

 

val file = spark.textFile("hdfs://...")
val counts = file.flatMap(line => line.split(" "))
                 .map(word => (word, 1))
                 .reduceByKey(_ + _)

 

Como se puede observar, mucho más "sencillo" que el WordCount en MapReduce