Índice

Search

  1. Prólogo
  2. Informatica Developer
  3. El repositorio de modelos
  4. Búsquedas en Informatica Developer
  5. Conexiones
  6. Objetos de datos físicos
  7. Objetos de datos de archivo sin formato
  8. Vista lógica de datos
  9. Cómo visualizar datos
  10. Implementación de aplicaciones
  11. Implementación de revisiones de la aplicación
  12. Implementación de revisiones de la aplicación Ejemplo
  13. Integración continua y entrega continua (CI/CD)
  14. Importación y exportación de objetos
  15. Apéndice A: Referencia de tipos de datos
  16. Apéndice B: Accesos directos del teclado
  17. Apéndice C: Propiedades de conexión

Guía de Developer Tool

Guía de Developer Tool

Propiedades de conexión de HDFS

Propiedades de conexión de HDFS

Utilice una conexión de sistema de archivos Hadoop (HDFS) para acceder a los datos del clúster de Hadoop. La conexión de HDFS es una conexión de tipo de sistema de archivos. Puede crear y administrar una conexión de HDFS en la herramienta del administrador, la herramienta del analista o la herramienta del desarrollador. Las propiedades de conexión de HDFS distinguen mayúsculas de minúsculas a menos que se indique lo contrario.
El orden de las propiedades de conexión puede variar según la herramienta en que las vea.
La siguiente tabla describe las propiedades de conexión de HDFS:
Propiedad
Descripción
Nombre
Nombre de la conexión. El nombre no distingue mayúsculas de minúsculas y, además, debe ser exclusivo en el dominio. El nombre no puede superar los 128 caracteres, contener espacios ni contener los siguientes caracteres especiales:
~ ` ! $ % ^ & * ( ) - + = { [ } ] | \ : ; " ' < , > . ? /
ID
Cadena que utiliza el servicio de integración de datos para identificar la conexión. El ID no distingue entre mayúsculas y minúsculas. Debe contener 255 caracteres o menos y debe ser único en el dominio. No puede modificar esta propiedad después de crear la conexión. El valor predeterminado es el nombre de la conexión.
Descripción
La descripción de la conexión. La descripción no puede tener más de 765 caracteres.
Ubicación
Dominio donde desea crear la conexión. No válido para la Herramienta del analista.
Tipo
El tipo de conexión. El valor predeterminado es Sistema de archivos Hadoop.
Nombre de usuario
Nombre de usuario para acceder a HDFS.
URI de NameNode
URI para acceder al sistema de almacenamiento. Puede encontrar el valor de
fs.defaultFS
en el conjunto de configuración
core-site.xml
de la configuración del clúster.
Si crea conexiones al importar la configuración del clúster, la propiedad URI de NameNode se rellena de forma predeterminada y se actualiza cada vez que se actualiza la configuración del clúster.
Si usa un clúster de cómputo Cloudera CDP Public Cloud y el HDFS está en un clúster de Cloudera Data Lake, establezca la propiedad
spark.yarn.access.hadoopFileSystems
en las propiedades de Spark de Hadoop Connection en el mismo valor establecido aquí.

Acceso a varios tipos de almacenamiento

Utilice la propiedad URI de NameNode en los parámetros de conexión para conectarse a diversos tipos de almacenamiento. En la tabla siguiente se enumera el tipo de almacenamiento y el formato de URI de NameNode para el tipo de almacenamiento:
Almacenamiento
Formato de URI de NameNode
HDFS
hdfs://<namenode>:<port>
Donde:
  • <nodonombre>
    es el nombre de host o la dirección IP del NameNode.
  • <puerto>
    es el puerto que NameNode escucha a las llamadas a procedimientos remotos (RPC).
HDFS://<nameservice>
en el caso de alta disponibilidad de NameNode.
MapR-FS
maprfs:///
WASB en HDInsight
wasb://<container_name>@<account_name>.blob.core.windows.net/<path>
Donde:
  • <container_name>
    identifica un contenedor de blob de almacenamiento de Azure específico.
    <container_name>
    es opcional.
  • <account_name>
    identifica el objeto de blob de almacenamiento de Azure.
Ejemplo:
wasb://infabdmoffering1storage.blob.core.windows.net/infabdmoffering1cluster/mr-history
ADLS en HDInsight
adl://home
Cuando se crea una configuración de clúster a partir de un clúster de Azure HDInsight, la configuración del clúster utiliza ADLS o WASB como almacenamiento principal. No se puede crear una configuración de clúster con ADLS o WASB como almacenamiento secundario. Puede editar la propiedad de URI de NameNode en la conexión HDFS para conectarse a una ubicación HDFS local.