Manual de uso del mÃ³dulo `pydatajson`
=====================================

## Contexto

En el marco de la polÃtica de Datos Abiertos, y el Decreto 117/2016, *"Plan de Apertura de Datosâ€*, pretendemos que todos los conjuntos de datos (*datasets*) publicados por organismos de la AdministraciÃ³n PÃºblica Nacional sean descubribles desde el Portal Nacional de Datos, http://datos.gob.ar/. A tal fin, se decidiÃ³ que todo portal de datos de la APN cuente en su raÃz con un archivo `data.json`, que especifica sus propiedades y los contenidos disponibles.

Para facilitar y automatizar la validaciÃ³n, manipulaciÃ³n y transformaciÃ³n de archivos `data.json`, se creÃ³ el mÃ³dulo `pydatajson`

Para aquellos organismos que por distintos motivos no cuenten con un archivo de metadatos en formato estÃ¡ndar (JSON) describiendo el catÃ¡logo de datasets presente en su portal, se creÃ³ una [plantilla en formato XLSX](samples/plantilla_data.xlsx) que facilita la carga de metadatos, y cuyo contenido puede ser programÃ¡ticamente convertido por este mÃ³dulo al formato JSON que los estÃ¡ndares especifican.

## Glosario

Un Portal de datos consiste en un *catÃ¡logo*, compuesto por *datasets*, que a su vez son cada uno un conjunto de *distribuciones*. De la "GuÃa para el uso y la publicaciÃ³n de metadatos".

* **CatÃ¡logo de datos**: Es un directorio de conjuntos de datos, que recopila y organiza metadatos descriptivos, de los datos que produce una organizaciÃ³n. Un portal de datos es un catÃ¡logo.

* **Dataset**: TambiÃ©n llamado conjunto de datos, es la pieza principal en todo catÃ¡logo. Se trata de un activo de datos que agrupa recursos referidos a un mismo tema, que respetan una estructura de la informaciÃ³n. Los recursos que lo componen pueden diferir en el formato en que se los presenta (por ejemplo: .csv, .json, .xls, etc.), la fecha a la que se refieren, el Ã¡rea geogrÃ¡fica cubierta o estar separados bajo algÃºn otro criterio. 

* **DistribuciÃ³n o recurso**: Es la unidad mÃnima de un catÃ¡logo de datos. Se trata de los activos de datos que se publican allÃ y que pueden ser descargados y re-utilizados por un usuario como archivos. Los recursos pueden tener diversos formatos (.csv, .shp, etc.). EstÃ¡n acompaÃ±ados de informaciÃ³n contextual asociada (â€œmetadataâ€) que describe el tipo de informaciÃ³n que se publica, el proceso por el cual se obtiene, la descripciÃ³n de los campos del recurso y cualquier informaciÃ³n extra que facilite su interpretaciÃ³n, procesamiento y lectura.

* **data.json y data.xlsx**: Son las dos _representaciones externas_ de los metadatos de un catÃ¡logo que `pydatajson` comprende. Para poder ser analizados programÃ¡ticamente, los metadatos de un catÃ¡logo deben estar representados en un formato estandarizado: el PAD establece el archivo `data.json` para tal fin, y para extender la cobertura del programa hemos incluido una plantilla XLSX que denominamos `data.xlsx`.

* **diccionario de metadatos**: Es la _representaciÃ³n interna_ que la librerÃa tiene de los metadatos de un catÃ¡logo. Todas las rutinas de la librerÃa `pydatajson` que manipulan catÃ¡logos, toman como entrada una _representaciÃ³n externa_ (`data.json` o `data.xlsx`) del catÃ¡logo, y lo primero que hacen es "leerla" y generar una _representaciÃ³n interna_ de la informaciÃ³n que la rutina sea capaz de manipular. En Python, la clase `dict` ("diccionario") nos provee la flexibilidad justa para esta tarea.

## Funcionalidades

La librerÃa cuenta con funciones para tres objetivos principales:
- **validaciÃ³n de metadatos de catÃ¡logos** y los datasets,
- **generaciÃ³n de reportes** sobre el contenido y la validez de los metadatos de catÃ¡logos y datasets, y
- **transformaciÃ³n de archivos de metadatos** al formato estÃ¡ndar (JSON).


Como se menciona en el Glosario estos mÃ©todos no tienen acceso *directo* a ningÃºn catÃ¡logo, dataset ni distribuciÃ³n, sino Ãºnicamente a sus *representaciones externas*: archivos o partes de archivos en formato JSON que describen ciertas propiedades. Por conveniencia, en este documento se usan frases como "validar el dataset X", cuando una versiÃ³n mÃ¡s precisa serÃa "validar la fracciÃ³n del archivo `data.json` que consiste en una representaciÃ³n del dataset X en forma de diccionario". La diferencia es sutil, pero conviene mantenerla presente.

Todos los mÃ©todos pÃºblicos de la librerÃa toman como primer parÃ¡metro `catalog`:
- o bien un diccionario de metadatos (una _representaciÃ³n interna_),
- o la ruta (local o remota) a un archivo de metadatos en formato legible (idealmente JSON, alternativamente XLSX).

Cuando el parÃ¡metro esperado es `catalogs`, en plural, se le puede pasar o un Ãºnico catÃ¡logo, o una lista de ellos.

Todos los mÃ©todos comienzan por convertir `catalog(s)` en una **representaciÃ³n interna** unÃvoca: un diccionario cuyas claves son las definidas en el [Perfil de Metadatos](https://docs.google.com/spreadsheets/d/1PqlkhB1o0u2xKDYuex3UC-UIPubSjxKCSBxfG9QhQaA/edit?usp=sharing). La conversiÃ³n se realiza a travÃ©s de `pydatajson.readers.read_catalog(catalog)`: Ã©ste es la funciÃ³n que todos ellos invocan para obtener un diccionario de metadatos estÃ¡ndar.

### MÃ©todos de validaciÃ³n de metadatos

* **pydatajson.DataJson.is_valid_catalog(catalog) -> bool**: Responde `True` Ãºnicamente si el catÃ¡logo no contiene ningÃºn error.
* **pydatajson.DataJson.validate_catalog(catalog) -> dict**: Responde un diccionario con informaciÃ³n detallada sobre la validez "global" de los metadatos, junto con detalles sobre la validez de los metadatos a nivel catÃ¡logo y cada uno de sus datasets. De haberlos, incluye una lista con informaciÃ³n sobre los errores encontrados.

### MÃ©todos de transformaciÃ³n de formatos de metadatos

Transformar un archivo de metadatos de un formato a otro implica un primer paso de lectura de un formato, y un segundo paso de escritura a un formato distinto. Para respetar las disposiciones del PAD, sÃ³lo se pueden escribir catÃ¡logos en formato JSON.

* **pydatajson.readers.read_catalog()**: MÃ©todo que todas las funciones de DataJson llaman en primer lugar para interpretar cualquier tipo de representaciÃ³n externa de un catÃ¡logo.
* **pydatajson.writers.write_json_catalog()**: Fina capa de abstracciÃ³n sobre `pydatajson.writers.write_json`, que simplemente vuelca un objeto de Python a un archivo en formato JSON.

### MÃ©todos de generaciÃ³n de reportes

#### Para federaciÃ³n de datasets

Los siguientes mÃ©todos toman una o varias representaciones externas de catÃ¡logos, y las procesan para generar reportes especÃficos sobre su contenido:

- **pydatajson.DataJson.generate_datasets_report()**: Devuelve un reporte con informaciÃ³n clave sobre cada dataset incluido en un catÃ¡logo, junto con variables indicando la validez de sus metadatos.
- **pydatajson.DataJson.generate_harvester_config()**: Devuelve un reporte con los campos mÃnimos que requiere el Harvester para federar un conjunto de datasets.
- **pydatajson.DataJson.generate_harvestable_catalogs()**: Devuelve la lista de catÃ¡logos ingresada, filtrada de forma que cada uno incluya Ãºnicamente los datasets que se pretende que el Harvester federe.

Los tres mÃ©todos toman los mismos cuatro parÃ¡metros, que se interpretan de manera muy similar:
- **catalogs**: RepresentaciÃ³n externa de un catÃ¡logo, o una lista compuesta por varias de ellas.
- **harvest**: Criterio de decisiÃ³n utilizado para marcar los datasets a ser federados/cosechados. Acepta los siguientes valores:
  - `'all'`: Cosechar todos los datasets presentes en **catalogs**.
  - `'none'`: No cosechar ninguno de los datasets presentes en **catalogs**.
  - `'valid'`: Cosechar Ãºnicamente los datasets que no contengan errores, ni en su propia metadata ni en la metadata global del catÃ¡logo.
  - `'report'`: Cosechar Ãºnicamente los datasets indicados por el reporte provisto en `report`.
- **report**: En caso de que se pretenda cosechar un conjunto especÃfico de catÃ¡logos, esta variable debe recibir la representaciÃ³n externa (path a un archivo) o interna (lista de diccionarios) de un reporte que identifique los datasets a cosechar.
- **export_path**: Esta variable controla el valor de retorno de los mÃ©todos de generaciÃ³n. Si es `None`, el mÃ©todo devolverÃ¡ la representaciÃ³n interna del reporte generado. Si especifica el path a un archivo, el mÃ©todo devolverÃ¡ `None`, pero escribirÃ¡ a `export_path` la representaciÃ³n externa del reporte generado, en formato CSV o XLSX.

**generate_harvester_config()** puede tomar un parÃ¡metro extra, `frequency`, que permitirÃ¡ indicarle a la rutina de cosecha de con quÃ© frecuencia debe intentar actualizar su versiÃ³n de cierto dataset. Por omisiÃ³n, lo harÃ¡ diariamente.

### Para presentaciÃ³n de catÃ¡logos y datasets

Existen dos mÃ©todos, cuyos reportes se incluyen diariamente entre los archivos que disponibiliza el repositorio [`libreria-catalogos`](https://github.com/datosgobar/libreria-catalogos/):

- **pydatajson.DataJson.generate_datasets_summary()**: Devuelve un informe tabular (en formato CSV o XLSX) sobre los datasets de un catÃ¡logo, detallando cuÃ¡ntas distribuciones tiene y el estado de sus propios metadatos.
- **pydatajson.DataJson.generate_catalog_readme()**: Genera un archivo de texto plano en formato Markdown para ser utilizado como "README", es decir, como texto introductorio al contenido del catÃ¡logo.

## Uso

### Setup

`DataJson` valida catÃ¡logos contra un esquema default que cumple con el perfil de metadatos recomendado en la [GuÃa para el uso y la publicaciÃ³n de metadatos (v0.1)](https://github.com/datosgobar/paquete-apertura-datos/raw/master/docs/Gu%C3%ADa%20para%20el%20uso%20y%20la%20publicaci%C3%B3n%20de%20metadatos%20(v0.1).pdf) del [Paquete de Apertura de Datos](https://github.com/datosgobar/paquete-apertura-datos). El setup por default cubre la enorme mayorÃa de los casos:

```python
from pydatajson import DataJson

dj = DataJson()
```

Si se desea utilizar un esquema alternativo, se debe especificar un **directorio absoluto** donde se almacenan los esquemas (`schema_dir`) y un nombre de esquema de validaciÃ³n (`schema_filename`), relativo al directorio  de los esquemas. Por ejemplo, si nuestro esquema alternativo se encuentra en `/home/datosgobar/metadatos-portal/esquema_de_validacion.json`, especificaremos:

```python
from pydatajson import DataJson

dj = DataJson(schema_filename="esquema_de_validacion.json",
              schema_dir="/home/datosgobar/metadatos-portal")
```

### ValidaciÃ³n de catÃ¡logos

Los mÃ©todos de validaciÃ³n de catÃ¡logos procesan un catÃ¡logo por llamada. En el siguiente ejemplo, `catalogs` contiene las cinco representaciones de un catÃ¡logo que DataJson entiende:
```python
from pydatajson import DataJson

dj = DataJson()
catalogs = [
    "tests/samples/full_data.json", # archivo JSON local
    "http://181.209.63.71/data.json", # archivo JSON remoto
    "tests/samples/catalogo_justicia.xlsx", # archivo XLSX local
    "https://raw.githubusercontent.com/datosgobar/pydatajson/master/tests/samples/catalogo_justicia.xlsx", # archivo XLSX remoto
    {
        "title": "CatÃ¡logo del Portal Nacional",
	"description" "Datasets abiertos para el ciudadano."
        "dataset": [...],
	(...)
    } # diccionario de Python
]

for catalog in catalogs:
    validation_result = dj.is_valid_catalog(catalog)
    validation_report = dj.validate_catalog(catalog)
```
Un ejemplo del resultado completo de `validate_catalog()` se puede consultar en el **Anexo I: Estructura de respuestas**.

### TransformaciÃ³n de `data.xlsx` a `data.json`

La lectura de un archivo de metadatos por parte de `pydatajson.readers.read_catalog` **no realiza ningÃºn tipo de verificaciÃ³n sobre la validez de los metadatos leÃdos**. Por ende, si se quiere generar un archivo en formato JSON estÃ¡ndar Ãºnicamente en caso de que los metadatos de archivo XLSX sean vÃ¡lidos, se deberÃ¡ realizar la validaciÃ³n por separado.

El siguiente cÃ³digo, por ejemplo, escribe a disco un catÃ¡logos de metadatos en formato JSONO sÃ y sÃ³lo sÃ los metadatos del XLSX leÃdo son vÃ¡lidos:
```python
from pydatajson.readers import read_catalog
from pydatajson.writers import write_json
from pydatajson import DataJson

dj = DataJson()
catalogo_xlsx = "tests/samples/catalogo_justicia.xlsx"

catalogo = read_catalog(catalogo_xlsx)
if dj.is_valid_catalog(catalogo):
    write_json(obj=catalogo, path="tests/temp/catalogo_justicia.json")
else:
    print "Se encontraron metadatos invÃ¡lidos. OperaciÃ³n de escritura cancelada."
```

Para mÃ¡s informaciÃ³n y una versiÃ³n mÃ¡s detallada de esta rutina en Jupyter Notebook, dirigirse [aquÃ](samples/caso-uso-1-pydatajson-xlsx-justicia-valido.ipynb) (metadatos vÃ¡lidos) y [aquÃ](samples/caso-uso-2-pydatajson-xlsx-justicia-no-valido.ipynb) (metadatos invÃ¡lidos).

### GeneraciÃ³n de reportes

El objetivo final de los mÃ©todos `generate_datasets_report`, `generate_harvester_config` y `generate_harvestable_catalogs`,  es proveer la configuraciÃ³n que Harvester necesita para cosechar datasets. Todos ellos devuelven una "tabla", que consiste en una lista de diccionarios que comparten las mismas claves (consultar ejemplos en el **Anexo I: Estructura de respuestas**). A continuaciÃ³n, se proveen algunos ejemplos de uso comunes:

#### Crear un archivo de configuraciÃ³n eligiendo manualmente los datasets a federar

```python
catalogs = ["tests/samples/full_data.json", "http://181.209.63.71/data.json"]
report_path = "path/to/report.xlsx"
dj.generate_datasets_report(
    catalogs=catalogs,
    harvest='none', # El reporte generado tendrÃ¡ `harvest==0` para todos los datasets
    export_path=report_path
)
# A continuaciÃ³n, se debe editar el archivo de Excel 'path/to/report.xlsx', cambiando a '1' el campo 'harvest' para aquellos datasets que se quieran cosechar.

config_path = 'path/to/config.csv'
dj.generate_harvester_config(
    harvest='report',
    report=report_path,
    export_path=config_path
)
```
El archivo `config_path` puede ser provisto a Harvester para federar los datasets elegidos al editar el reporte intermedio `report_path`.

Alternativamente, el output de `generate_datasets_report()` se puede editar en un intÃ©rprete de python:
```python
# Asigno el resultado a una variable en lugar de exportarlo
datasets_report = dj.generate_datasets_report(
    catalogs=catalogs,
    harvest='none', # El reporte generado tendrÃ¡ `harvest==0` para todos los datasets
)
# Imaginemos que sÃ³lo se desea federar el primer dataset del reporte:
datasets_report[0]["harvest"] = 1

config_path = 'path/to/config.csv'
dj.generate_harvester_config(
    harvest='report',
    report=datasets_report,
    export_path=config_path
)
```

#### Crear un archivo de configuraciÃ³n que incluya Ãºnicamente los datasets con metadata vÃ¡lida
Conservando las variables anteriores:
```python
dj.generate_harvester_config(
    catalogs=catalogs,
    harvest='valid'
    export_path='path/to/config.csv'
)
```
Para fines ilustrativos, se incluye el siguiente bloque de cÃ³digo que produce los mismos resultados, pero genera el reporte intermedio sobre datasets:
```python
datasets_report = dj.generate_datasets_report(
    catalogs=catalogs,
    harvest='valid'
)

# Como el reporte ya contiene la informaciÃ³n necesaria sobre los datasets que se pretende cosechar, el argumento `catalogs` es innecesario.
dj.generate_harvester_config(
    harvest='report'
    report=datasets_report
    export_path='path/to/config.csv'
)
```

#### Modificar catÃ¡logos para conservar Ãºnicamente los datasets vÃ¡lidos

```python
# Creamos un directorio donde guardar los catÃ¡logos
output_dir = "catalogos_limpios"
import os; os.mkdir(output_dir)

dj.generate_harvestable_catalogs(
    catalogs,
    harvest='valid',
    export_path=output_dir
)
```

## Anexo I: Estructura de respuestas

### validate_catalog()

El resultado de la validaciÃ³n completa de un catÃ¡logo, es un diccionario con la siguiente estructura:

```
{
    "status": "OK",  # resultado de la validaciÃ³n global
    "error": {
	"catalog": {
            # validez de la metadata propia del catÃ¡logo, ignorando los
            # datasets particulares
	    "status": "OK",
 	    "errors": []
	    "title": "TÃtulo Catalog"},
	"dataset": [
	    {
		# Validez de la metadata propia de cada dataset
                "status": "OK",
		"errors": [],
		"title": "Titulo Dataset 1"
	    },
	    {
		"status": "ERROR",
		"errors": [
                    {
                        "error_code": 2,
                        "instance": "",
                        "message": "'' is not a 'email'",
                        "path": ["publisher", "mbox"],
                        "validator": "format",
                        "validator_value": "email"
                   },
                   {
                        "error_code": 2,
                        "instance": "",
                        "message": """ is too short",
                        "path": ["publisher", "name"],
                        "validator": "minLength",
                        "validator_value": 1
                   }
               ],
               "title": "Titulo Dataset 2"
	    }
	]
    }
}
```

Si `validate_catalog()` encuentra algÃºn error, Ã©ste se reportarÃ¡ en la lista `errors` del nivel correspondiente, a travÃ©s de un diccionario con las siguientes claves:
- **path**: PosiciÃ³n en el diccionario de metadata del catÃ¡logo donde se encontrÃ³ el error.
- **instance**: Valor concreto que no pasÃ³ la validaciÃ³n. Es el valor de la clave `path` en la metadata del catÃ¡logo.
- **message**: DescripciÃ³n humanamente legible explicando el error.
- **validator**: Nombre del validador violado, ("type" para errores de tipo, "minLength" para errores de cadenas vacÃas, et cÃ©tera).
- **validator_value**: Valor esperado por el validador `validator`, que no fue respetado.
- **error_code**: CÃ³digo describiendo genÃ©ricamente el error. Puede ser:
  - **1**: Valor obligatorio faltante: Un campo obligatorio no se encuentra presente.
  - **2**: Error de tipo y formato: se esperaba un `array` y se encontrÃ³ un `dict`, se esperaba un `string` en formato `email` y se encontrÃ³ una `string` que no cumple con el formato, et cÃ©tera.

### generate_datasets_report()
El reporte resultante tendrÃ¡ tantas filas como datasets contenga el conjunto de catÃ¡logos ingresado, y contarÃ¡ con los siguientes campos, casi todos autodescriptivos:
- **catalog_metadata_url**: En caso de que se haya provisto una representaciÃ³n externa de un catÃ¡logo, la string de su ubicaciÃ³n; sino `None`.
- **catalog_title**
- **catalog_description**
- **valid_catalog_metadata**: Validez de la metadata "global" del catÃ¡logo, es decir, ignorando la metadata de datasets particulares.
- **dataset_title**
- **dataset_description**
- **dataset_index**: PosiciÃ³n (comenzando desde cero) en la que aparece el dataset en cuestiÃ³n en lista del campo `catalog["dataset"]`.
- **valid_dataset_metadata**: Validez de la metadata *especÃfica a este dataset* que figura en el catÃ¡logo (`catalog["dataset"][dataset_index]`).
- **harvest**: '0' o '1', segÃºn se desee excluir o incluir, respectivamente, un dataset de cierto proceso de cosecha. El default es '0', pero se puede controlar a travÃ©s del parÃ¡metro 'harvest'.
- **dataset_accrualPeriodicity**
- **dataset_publisher_name**
- **dataset_superTheme**: Lista los valores que aparecen en el campo dataset["superTheme"], separados por comas.
- **dataset_theme**: Lista los valores que aparecen en el campo dataset["theme"], separados por comas.
- **dataset_landingPage**
- **distributions_list**: Lista los tÃtulos y direcciones de descarga de todas las distribuciones incluidas en un dataset, separadas por "newline".

La *representaciÃ³n interna* de este reporte es una lista compuesta en su totalidad de diccionarios con las claves mencionadas. La *representaciÃ³n externa* de este reporte, es un archivo con informaciÃ³n tabular, en formato CSV o XLSX. A continuaciÃ³n, un ejemplo de la _lista de diccionarios_ que devuelve `generate_datasets_report()`:
```python
[
    {
        "catalog_metadata_url": "http://181.209.63.71/data.json",
        "catalog_title": "Andino",
        "catalog_description": "Portal Andino Demo",
        "valid_catalog_metadata": 0,
        "dataset_title": "Dataset Demo",
        "dataset_description": "Este es un dataset de ejemplo, se incluye como material DEMO y no contiene ningun valor estadistico.",
        "dataset_index": 0,
        "valid_dataset_metadata": 1,
        "harvest": 0,
        "dataset_accrualPeriodicity": "eventual",
        "dataset_publisher_name": "Andino",
        "dataset_superThem"": "TECH",
        "dataset_theme": "Tema.demo",
        "dataset_landingPage": "https://github.com/datosgobar/portal-andino",
        "distributions_list": ""Recurso de Ejemplo": http://181.209.63.71/dataset/6897d435-8084-4685-b8ce-304b190755e4/resource/6145bf1c-a2fb-4bb5-b090-bb25f8419198/download/estructura-organica-3.csv"
    },
    {
        "catalog_metadata_url": "http://datos.gob.ar/data.json",
        "catalog_title": "Portal Nacional de Datos Abiertos",
        ( ... )
    }
]
```

### generate_harvester_config()
Este reporte se puede generar a partir de un conjunto de catÃ¡logos, o a partir del resultado de `generate_datasets_report()`, pues no es mÃ¡s que un subconjunto del mismo. Incluye Ãºnicamente las claves necesarias para que el Harvester pueda federar un dataset, si `'harvest'==1`:
- **catalog_metadata_url**
- **dataset_title**
- **dataset_accrualPeriodicity**

La *representaciÃ³n interna* de este reporte es una lista compuesta en su totalidad de diccionarios con las claves mencionadas. La *representaciÃ³n externa* de este reporte, es un archivo con informaciÃ³n tabular, en formato CSV o XLSX. A continuaciÃ³n, un ejemplo con la _lista de diccionarios_ que devuelve `generate_harvester_config()`:
```python
[
    {
        "catalog_metadata_url": "tests/samples/full_data.json",
        "dataset_title": "Sistema de contrataciones electrÃ³nicas",
        "dataset_accrualPeriodicity": "R/P1Y"
    },
    {
        "catalog_metadata_url": "tests/samples/several_datasets_for_harvest.json",
        "dataset_title": "Sistema de Alumbrado PÃºblico CABA",
        "dataset_accrualPeriodicity": "R/P1Y"
    },
    {
        "catalog_metadata_url": "tests/samples/several_datasets_for_harvest.json",
        "dataset_title": "Listado de Presidentes Argentinos",
        "dataset_accrualPeriodicity": "R/P1Y"
    }
]
```

### generate_datasets_summary()

Se genera a partir de un Ãºnico catÃ¡logo, y contiene, para cada uno de dus datasets:

* **Ãndice**: El Ãndice, identificador posicional del dataset dentro de la lista `catalog["dataset"]`.
* **TÃtulo**: dataset["title"], si lo tiene (es un campo obligatorio).
* **Identificador**: dataset["identifier"], si lo tiene (es un campo recomendado).
* **Cantidad de Errores**: CuÃ¡ntos errores de validaciÃ³n contiene el dataset, segÃºn figure en el detalle de `validate_catalog`
* **Cantidad de Distribuiones**: El largo de la lista `dataset["distribution"]`

A continuaciÃ³n, un fragmento del resultado de este mÃ©todo al aplicarlo sobre el CatÃ¡logo del Ministerio de Justicia:
```
[OrderedDict([(u'indice', 0),
              (u'titulo', u'Base de datos legislativos Infoleg'),
              (u'identificador', u'd9a963ea-8b1d-4ca3-9dd9-07a4773e8c23'),
              (u'estado_metadatos', u'OK'),
              (u'cant_errores', 0),
              (u'cant_distribuciones', 3)]),
 OrderedDict([(u'indice', 1),
              (u'titulo', u'Centros de Acceso a la Justicia -CAJ-'),
              (u'identificador', u'9775fcdf-99b9-47f6-87ae-6d46cfd15b40'),
              (u'estado_metadatos', u'OK'),
              (u'cant_errores', 0),
              (u'cant_distribuciones', 1)]),
 OrderedDict([(u'indice', 2),
              (u'titulo',
               u'Sistema de Consulta Nacional de Rebeld\xedas y Capturas - Co.Na.R.C.'),
              (u'identificador', u'e042c362-ff39-476f-9328-056a9de753f0'),
              (u'estado_metadatos', u'OK'),
              (u'cant_errores', 0),
              (u'cant_distribuciones', 1)]),

( ... 13 datasets mÃ¡s ...)

 OrderedDict([(u'indice', 15),
              (u'titulo',
               u'Registro, Sistematizaci\xf3n y Seguimiento de Hechos de Violencia Institucional'),
              (u'identificador', u'c64b3899-65df-4024-afe8-bdf971f30dd8'),
              (u'estado_metadatos', u'OK'),
              (u'cant_errores', 0),
              (u'cant_distribuciones', 1)])]
```

### generate_catalog_readme()

Este reporte en texto plano se pretende como primera introducciÃ³n somera al contenido de un catÃ¡logo, como figurarÃ¡n en la [LibrerÃa de CatÃ¡logos](https://github.com/datosgobar/libreria-catalogos/). Incluye datos clave sobre el editor responsable del catÃ¡logo, junto con:
- estado de los metadatos a nivel catÃ¡logo,
- estado global de los metadatos, y
- cantidad de datasets y distribuciones incluidas.

A continuaciÃ³n, el resultado de este mÃ©todo al aplicarlo sobre el CatÃ¡logo del Ministerio de Justicia:
```
# CatÃ¡logo: Datos Justicia Argentina

## InformaciÃ³n General

- **Autor**: Ministerio de Justicia y Derechos Humanos
- **Correo ElectrÃ³nico**: justiciaabierta@jus.gov.ar
- **Nombre del catÃ¡logo**: Datos Justicia Argentina
- **DescripciÃ³n**:

> Portal de Datos de Justicia de la RepÃºblica Argentina. El Portal publica datos del sistema de justicia de modo que pueda ser reutilizada para efectuar visualizaciones o desarrollo de aplicaciones. Esta herramienta se propone como un punto de encuentro entre las organizaciones de justicia y la ciudadanÃa.

## Estado de los metadatos y cantidad de recursos

Estado metadatos globales | Estado metadatos catÃ¡logo | # de Datasets | # de Distribuciones
--------------------------|---------------------------|---------------|--------------------
OK | OK | 16 | 56

## Datasets incluidos

Por favor, consulte el informe [`datasets.csv`](datasets.csv).
```