Guía de Developer Tool

10.5.2
- 10.5.1
- 10.4.1

Anterior Siguiente

Propiedades de conexión de HDFS

Utilice una conexión de sistema de archivos Hadoop (HDFS) para acceder a los datos del clúster de Hadoop. La conexión de HDFS es una conexión de tipo de sistema de archivos. Puede crear y administrar una conexión de HDFS en la herramienta del administrador, la herramienta del analista o la herramienta del desarrollador. Las propiedades de conexión de HDFS distinguen mayúsculas de minúsculas a menos que se indique lo contrario.

El orden de las propiedades de conexión puede variar según la herramienta en que las vea.

La siguiente tabla describe las propiedades de conexión de HDFS:

Propiedad	Descripción
Nombre	Nombre de la conexión. El nombre no distingue mayúsculas de minúsculas y, además, debe ser exclusivo en el dominio. El nombre no puede superar los 128 caracteres, contener espacios ni contener los siguientes caracteres especiales: ~ ` ! $ % ^ & * ( ) - + = { [ } ] \| \ : ; " ' < , > . ? /
ID	Cadena que utiliza el servicio de integración de datos para identificar la conexión. El ID no distingue entre mayúsculas y minúsculas. Debe contener 255 caracteres o menos y debe ser único en el dominio. No puede modificar esta propiedad después de crear la conexión. El valor predeterminado es el nombre de la conexión.
Descripción	La descripción de la conexión. La descripción no puede tener más de 765 caracteres.
Ubicación	Dominio donde desea crear la conexión. No válido para la Herramienta del analista.
Tipo	El tipo de conexión. El valor predeterminado es Sistema de archivos Hadoop.
Nombre de usuario	Nombre de usuario para acceder a HDFS.
URI de NameNode	URI para acceder al sistema de almacenamiento. Puede encontrar el valor de fs.defaultFS en el conjunto de configuración core-site.xml de la configuración del clúster. Si crea conexiones al importar la configuración del clúster, la propiedad URI de NameNode se rellena de forma predeterminada y se actualiza cada vez que se actualiza la configuración del clúster. Si usa un clúster de cómputo Cloudera CDP Public Cloud y el HDFS está en un clúster de Cloudera Data Lake, establezca la propiedad `spark.yarn.access.hadoopFileSystems` en las propiedades de Spark de Hadoop Connection en el mismo valor establecido aquí.

Acceso a varios tipos de almacenamiento

Utilice la propiedad URI de NameNode en los parámetros de conexión para conectarse a diversos tipos de almacenamiento. En la tabla siguiente se enumera el tipo de almacenamiento y el formato de URI de NameNode para el tipo de almacenamiento:

Almacenamiento	Formato de URI de NameNode
HDFS	hdfs://<namenode>:<port> Donde: <nodonombre> es el nombre de host o la dirección IP del NameNode. <puerto> es el puerto que NameNode escucha a las llamadas a procedimientos remotos (RPC). HDFS://<nameservice> en el caso de alta disponibilidad de NameNode.
MapR-FS	maprfs:///
WASB en HDInsight	wasb://<container_name>@<account_name>.blob.core.windows.net/<path> Donde: <container_name> identifica un contenedor de blob de almacenamiento de Azure específico. <container_name> es opcional. <account_name> identifica el objeto de blob de almacenamiento de Azure. Ejemplo: wasb://infabdmoffering1storage.blob.core.windows.net/infabdmoffering1cluster/mr-history
ADLS en HDInsight	adl://home

Cuando se crea una configuración de clúster a partir de un clúster de Azure HDInsight, la configuración del clúster utiliza ADLS o WASB como almacenamiento principal. No se puede crear una configuración de clúster con ADLS o WASB como almacenamiento secundario. Puede editar la propiedad de URI de NameNode en la conexión HDFS para conectarse a una ubicación HDFS local.

Apéndice C: Propiedades de conexión

Descargar guía

Enviar comentarios

Communities

Knowledge Base

Success Portal

Rename Saved Search

Índice

Guía de Developer Tool

Guía de Developer Tool

Propiedades de conexión de HDFS

Propiedades de conexión de HDFS

Acceso a varios tipos de almacenamiento