> ## Documentation Index
> Fetch the complete documentation index at: https://private-7c7dfe99-mintlify-8a08bda2.mintlify.site/llms.txt
> Use this file to discover all available pages before exploring further.

> Permite procesar archivos de HDFS en paralelo desde varios nodos de un clúster especificado.

# hdfsCluster

Permite procesar archivos de HDFS en paralelo desde varios nodos de un clúster especificado. En el iniciador, crea una conexión con todos los nodos del clúster, expande los asteriscos en la ruta de archivo de HDFS y asigna dinámicamente cada archivo. En el nodo worker, consulta al iniciador cuál es la siguiente tarea que debe procesar y la procesa. Esto se repite hasta que todas las tareas hayan finalizado.

<div id="syntax">
  ## Sintaxis
</div>

```sql theme={null}
hdfsCluster(cluster_name, URI, format, structure)
```

<div id="arguments">
  ## Argumentos
</div>

| Argumento      | Descripción                                                                                                                                                                                                                                                                                                                                          |
| -------------- | ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |
| `cluster_name` | Nombre de un clúster que se utiliza para construir un conjunto de direcciones y parámetros de conexión para servidores remotos y locales.                                                                                                                                                                                                            |
| `URI`          | URI de un archivo o de un conjunto de archivos. Admite los siguientes comodines en modo de solo lectura: `*`, `**`, `?`, `{'abc','def'}` y `{N..M}`, donde `N` y `M` son números, y `abc` y `def` son cadenas. Para obtener más información, consulte [Comodines en la ruta](/es/reference/engines/table-engines/integrations/s3#wildcards-in-path). |
| `format`       | El [formato](/es/reference/formats) del archivo.                                                                                                                                                                                                                                                                                                     |
| `structure`    | Estructura de la tabla. Formato: `'column1_name column1_type, column2_name column2_type, ...'`.                                                                                                                                                                                                                                                      |

<div id="returned_value">
  ## Valor devuelto
</div>

Una tabla con la estructura especificada para leer datos del archivo especificado.

<div id="examples">
  ## Ejemplos
</div>

1. Supongamos que tenemos un clúster de ClickHouse llamado `cluster_simple` y varios archivos con los siguientes URI en HDFS:

* 'hdfs\://hdfs1:9000/some\_dir/some\_file\_1'
* 'hdfs\://hdfs1:9000/some\_dir/some\_file\_2'
* 'hdfs\://hdfs1:9000/some\_dir/some\_file\_3'
* 'hdfs\://hdfs1:9000/another\_dir/some\_file\_1'
* 'hdfs\://hdfs1:9000/another\_dir/some\_file\_2'
* 'hdfs\://hdfs1:9000/another\_dir/some\_file\_3'

2. Consulta cuántas filas hay en estos archivos:

```sql theme={null}
SELECT count(*)
FROM hdfsCluster('cluster_simple', 'hdfs://hdfs1:9000/{some,another}_dir/some_file_{1..3}', 'TSV', 'name String, value UInt32')
```

3. Consulta el número de filas de todos los archivos de estos dos directorios:

```sql theme={null}
SELECT count(*)
FROM hdfsCluster('cluster_simple', 'hdfs://hdfs1:9000/{some,another}_dir/*', 'TSV', 'name String, value UInt32')
```

<Note>
  Si tu lista de archivos contiene intervalos numéricos con ceros a la izquierda, usa la sintaxis con llaves para cada dígito por separado o `?`.
</Note>

<div id="related">
  ## Temas relacionados
</div>

* [motor HDFS](/es/reference/engines/table-engines/integrations/hdfs)
* [función de tabla HDFS](/es/reference/functions/table-functions/hdfs)
