# Data Hub — Instrumente de Ingestie

Instrumente CLI pentru importul, validarea și transformarea datelor statistice.

## Instalare

```bash
cd /storage/volumes/geoserver-1-storage/apps/data-hub/ingest
pip install -e .
```

## Comenzi

### 1. Pregătire geometrii

Pregătește toate geometriile dintr-o dată:

```bash
datahub-ingest geometry prepare-all \
  --base-dir ../../administrative_boundaries \
  --output-dir ../data/geometries
```

Sau un singur nivel:

```bash
datahub-ingest geometry prepare \
  --source ../../administrative_boundaries/county/ro_admin_county_polygon.parquet \
  --level county \
  --output ../data/geometries/county.parquet
```

### 2. Adăugare set de date statistice

```bash
datahub-ingest dataset add \
  --id census_2021 \
  --source /path/to/census_data.csv \
  --level county \
  --join-key natcode \
  --name "Recensământul 2021" \
  --source-name "INS" \
  --license "Open Data"
```

### 3. Validare

```bash
datahub-ingest dataset validate --id census_2021
```

### 4. Listare seturi

```bash
datahub-ingest dataset list
```

### 5. Inițializare DuckDB

```bash
datahub-ingest db init
```

## Structura datelor

```
data/
├── datahub.duckdb           # Baza de date DuckDB
├── catalog.json             # Catalogul de metadate
├── geometries/
│   ├── region.parquet
│   ├── region_simplified.parquet
│   ├── county.parquet
│   ├── county_simplified.parquet
│   ├── lau.parquet
│   └── lau_simplified.parquet
└── statistics/
    ├── census_2021_county.parquet
    ├── census_2021_lau.parquet
    └── ...
```

## Template metadate

Consultați `templates/metadata_template.json` pentru structura completă a metadatelor.
