Aula Virtual Formación Hadoop: Duda Spark shell: No se encuentra disponible el SparkContext

Foro Formación Hadoop

Volver a: Sitio

Duda Spark shell: No se encuentra disponible el SparkContext

Hola a tod@s:

Otra duda que nos han remitido a la hora de utilizar el SparkContext de la shell:

**********************************************************************************************

Al comienzo de los ejercicios de Spark. Abro el shell de Python y miro si

está el objeto SparkContext pero me dice que no.Te mando el código:

>>> sc

Traceback (most recent call last):

File "<stdin>", line 1, in <module>

NameError: name 'sc' is not defined

El shell está en python 2.6, yo en mi ordena tengo el python 3.5, esto no tiene nada que ver,¿no?

Muchísimas gracias, espero no tener tantos problemas de aquí en adelante!

Un saludo.

P.D. Al arrancar el pyspark me pone lo siguiente:

[cloudera@quickstart ~]$ pyspark

Python 2.6.6 (r266:84292, Jul 23 2015, 15:22:56)

[GCC 4.4.7 20120313 (Red Hat 4.4.7-11)] on linux2

Type "help", "copyright", "credits" or "license" for more information.

16/09/20 07:59:40 INFO spark.SparkContext: Running Spark version 1.6.0

16/09/20 07:59:44 WARN util.Utils: Your hostname, quickstart.cloudera resolves to a loopback address: 127.0.0.1; using 172.16.39.131 instead (on interface eth1)

16/09/20 07:59:44 WARN util.Utils: Set SPARK_LOCAL_IP if you need to bind to another address

16/09/20 07:59:44 INFO spark.SecurityManager: Changing view acls to: cloudera

16/09/20 07:59:44 INFO spark.SecurityManager: Changing modify acls to: cloudera

16/09/20 07:59:44 INFO spark.SecurityManager: SecurityManager: authentication disabled; ui acls disabled; users with view permissions: Set(cloudera); users with modify permissions: Set(cloudera)

16/09/20 07:59:45 INFO util.Utils: Successfully started service 'sparkDriver' on port 41327.

16/09/20 07:59:48 INFO slf4j.Slf4jLogger: Slf4jLogger started

16/09/20 07:59:48 INFO Remoting: Starting remoting

16/09/20 07:59:49 INFO Remoting: Remoting started; listening on addresses :[akka.tcp://sparkDriverActorSystem@172.16.39.131:58620]

16/09/20 07:59:49 INFO Remoting: Remoting now listens on addresses: [akka.tcp://sparkDriverActorSystem@172.16.39.131:58620]

16/09/20 07:59:49 INFO util.Utils: Successfully started service 'sparkDriverActorSystem' on port 58620.

16/09/20 07:59:49 INFO spark.SparkEnv: Registering MapOutputTracker

16/09/20 07:59:49 INFO spark.SparkEnv: Registering BlockManagerMaster

16/09/20 07:59:49 INFO storage.DiskBlockManager: Created local directory at /tmp/blockmgr-96a7b01a-09db-45f0-af73-8c4e31082287

16/09/20 07:59:49 INFO storage.MemoryStore: MemoryStore started with capacity 534.5 MB

16/09/20 07:59:51 INFO spark.SparkEnv: Registering OutputCommitCoordinator

16/09/20 07:59:52 INFO util.Utils: Successfully started service 'SparkUI' on port 4040.

16/09/20 07:59:52 INFO ui.SparkUI: Started SparkUI at http://172.16.39.131:4040

16/09/20 07:59:53 INFO client.RMProxy: Connecting to ResourceManager at quickstart.cloudera/127.0.0.1:8032

16/09/20 07:59:55 INFO yarn.Client: Requesting a new application from cluster with 1 NodeManagers

16/09/20 07:59:55 INFO yarn.Client: Verifying our application has not requested more than the maximum memory capability of the cluster (2816 MB per container)

16/09/20 07:59:55 INFO yarn.Client: Will allocate AM container, with 896 MB memory including 384 MB overhead

16/09/20 07:59:55 INFO yarn.Client: Setting up container launch context for our AM

16/09/20 07:59:55 INFO yarn.Client: Setting up the launch environment for our AM container

16/09/20 07:59:55 INFO yarn.Client: Preparing resources for our AM container

16/09/20 08:00:08 WARN yarn.Client: Failed to cleanup staging dir .sparkStaging/application_1474361377281_0009

java.net.ConnectException: Call From quickstart.cloudera/127.0.0.1 to quickstart.cloudera:8020 failed on connection exception: java.net.ConnectException: Connection refused; For more details see: http://wiki.apache.org/hadoop/ConnectionRefused

at sun.reflect.NativeConstructorAccessorImpl.newInstance0(Native Method)

at sun.reflect.NativeConstructorAccessorImpl.newInstance(NativeConstructorAccessorImpl.java:57)

at sun.reflect.DelegatingConstructorAccessorImpl.newInstance(DelegatingConstructorAccessorImpl.java:45)

at java.lang.reflect.Constructor.newInstance(Constructor.java:526)

at org.apache.hadoop.net.NetUtils.wrapWithMessage(NetUtils.java:791)

at org.apache.hadoop.net.NetUtils.wrapException(NetUtils.java:731)

at org.apache.hadoop.ipc.Client.call(Client.java:1475)

at org.apache.hadoop.ipc.Client.call(Client.java:1408)

at org.apache.hadoop.ipc.ProtobufRpcEngine$Invoker.invoke(ProtobufRpcEngine.java:230)

at com.sun.proxy.$Proxy19.getFileInfo(Unknown Source)

at org.apache.hadoop.hdfs.protocolPB.ClientNamenodeProtocolTranslatorPB.getFileInfo(ClientNamenodeProtocolTranslatorPB.java:757)

at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)

at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)

at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)

at java.lang.reflect.Method.invoke(Method.java:606)

at org.apache.hadoop.io.retry.RetryInvocationHandler.invokeMethod(RetryInvocationHandler.java:256)

at org.apache.hadoop.io.retry.RetryInvocationHandler.invoke(RetryInvocationHandler.java:104)

at com.sun.proxy.$Proxy20.getFileInfo(Unknown Source)

at org.apache.hadoop.hdfs.DFSClient.getFileInfo(DFSClient.java:2102)

at org.apache.hadoop.hdfs.DistributedFileSystem$19.doCall(DistributedFileSystem.java:1215)

at org.apache.hadoop.hdfs.DistributedFileSystem$19.doCall(DistributedFileSystem.java:1211)

at org.apache.hadoop.fs.FileSystemLinkResolver.resolve(FileSystemLinkResolver.java:81)

at org.apache.hadoop.hdfs.DistributedFileSystem.getFileStatus(DistributedFileSystem.java:1211)

at org.apache.hadoop.fs.FileSystem.exists(FileSystem.java:1412)

at org.apache.spark.deploy.yarn.Client.cleanupStagingDir(Client.scala:168)

at org.apache.spark.deploy.yarn.Client.submitApplication(Client.scala:153)

at org.apache.spark.scheduler.cluster.YarnClientSchedulerBackend.start(YarnClientSchedulerBackend.scala:57)

at org.apache.spark.scheduler.TaskSchedulerImpl.start(TaskSchedulerImpl.scala:144)

at org.apache.spark.SparkContext.<init>(SparkContext.scala:541)

at org.apache.spark.api.java.JavaSparkContext.<init>(JavaSparkContext.scala:59)

at sun.reflect.NativeConstructorAccessorImpl.newInstance0(Native Method)

at sun.reflect.NativeConstructorAccessorImpl.newInstance(NativeConstructorAccessorImpl.java:57)

at sun.reflect.DelegatingConstructorAccessorImpl.newInstance(DelegatingConstructorAccessorImpl.java:45)

at java.lang.reflect.Constructor.newInstance(Constructor.java:526)

at py4j.reflection.MethodInvoker.invoke(MethodInvoker.java:234)

at py4j.reflection.ReflectionEngine.invoke(ReflectionEngine.java:381)

at py4j.Gateway.invoke(Gateway.java:214)

at py4j.commands.ConstructorCommand.invokeConstructor(ConstructorCommand.java:79)

at py4j.commands.ConstructorCommand.execute(ConstructorCommand.java:68)

at py4j.GatewayConnection.run(GatewayConnection.java:209)

at java.lang.Thread.run(Thread.java:745)

Caused by: java.net.ConnectException: Connection refused

at sun.nio.ch.SocketChannelImpl.checkConnect(Native Method)

at sun.nio.ch.SocketChannelImpl.finishConnect(SocketChannelImpl.java:739)

at org.apache.hadoop.net.SocketIOWithTimeout.connect(SocketIOWithTimeout.java:206)

at org.apache.hadoop.net.NetUtils.connect(NetUtils.java:530)

at org.apache.hadoop.net.NetUtils.connect(NetUtils.java:494)

at org.apache.hadoop.ipc.Client$Connection.setupConnection(Client.java:614)

at org.apache.hadoop.ipc.Client$Connection.setupIOstreams(Client.java:713)

at org.apache.hadoop.ipc.Client$Connection.access$2900(Client.java:375)

at org.apache.hadoop.ipc.Client.getConnection(Client.java:1524)

at org.apache.hadoop.ipc.Client.call(Client.java:1447)

... 34 more

16/09/20 08:00:08 ERROR spark.SparkContext: Error initializing SparkContext.

at sun.reflect.NativeConstructorAccessorImpl.newInstance0(Native Method)

at sun.reflect.NativeConstructorAccessorImpl.newInstance(NativeConstructorAccessorImpl.java:57)

at sun.reflect.DelegatingConstructorAccessorImpl.newInstance(DelegatingConstructorAccessorImpl.java:45)

at java.lang.reflect.Constructor.newInstance(Constructor.java:526)

at org.apache.hadoop.net.NetUtils.wrapWithMessage(NetUtils.java:791)

at org.apache.hadoop.net.NetUtils.wrapException(NetUtils.java:731)

at org.apache.hadoop.ipc.Client.call(Client.java:1475)

at org.apache.hadoop.ipc.Client.call(Client.java:1408)

at org.apache.hadoop.ipc.ProtobufRpcEngine$Invoker.invoke(ProtobufRpcEngine.java:230)

at com.sun.proxy.$Proxy19.mkdirs(Unknown Source)

at org.apache.hadoop.hdfs.protocolPB.ClientNamenodeProtocolTranslatorPB.mkdirs(ClientNamenodeProtocolTranslatorPB.java:544)

at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)

at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)

at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)

at java.lang.reflect.Method.invoke(Method.java:606)

at org.apache.hadoop.io.retry.RetryInvocationHandler.invokeMethod(RetryInvocationHandler.java:256)

at org.apache.hadoop.io.retry.RetryInvocationHandler.invoke(RetryInvocationHandler.java:104)

at com.sun.proxy.$Proxy20.mkdirs(Unknown Source)

at org.apache.hadoop.hdfs.DFSClient.primitiveMkdir(DFSClient.java:3082)

at org.apache.hadoop.hdfs.DFSClient.mkdirs(DFSClient.java:3049)

at org.apache.hadoop.hdfs.DistributedFileSystem$18.doCall(DistributedFileSystem.java:957)

at org.apache.hadoop.hdfs.DistributedFileSystem$18.doCall(DistributedFileSystem.java:953)

at org.apache.hadoop.fs.FileSystemLinkResolver.resolve(FileSystemLinkResolver.java:81)

at org.apache.hadoop.hdfs.DistributedFileSystem.mkdirsInternal(DistributedFileSystem.java:953)

at org.apache.hadoop.hdfs.DistributedFileSystem.mkdirs(DistributedFileSystem.java:946)

at org.apache.hadoop.fs.FileSystem.mkdirs(FileSystem.java:1861)

at org.apache.hadoop.fs.FileSystem.mkdirs(FileSystem.java:609)

at org.apache.spark.deploy.yarn.Client.prepareLocalResources(Client.scala:357)

at org.apache.spark.deploy.yarn.Client.createContainerLaunchContext(Client.scala:725)

at org.apache.spark.deploy.yarn.Client.submitApplication(Client.scala:143)