Modalidad: Virtual
Cantidad de clases: 4
Docente: -
Sede: Plataforma Virtual
Trabajadores/as de la Administración Pública Provincial que participen en el relevamiento y análisis de la información para la toma de decisiones.
Módulo 1. Introducción al análisis de datos y sus tecnologías
Introducción a los conceptos de big data y análisis de datos. Cómo se organiza la información. De Excel a CSV. La actualidad de los datos en el mundo. Las grandes empresas de datos. La confidencialidad de la información. Privacidad de los datos. Datos abiertos. Tecnologías a ver en el curso: Anaconda Navigator, IPython notebook, Google Colab, Python, Pandas, Matplotlib. Conceptos básicos de programación.
Módulo 2. Relevamiento, sistematización y exploración de datos
Relevamiento y sistematización de la información. La importancia y posibilidades que se tienen para obtener la información. Uso de librería Pandas para la exploración y análisis de los datos. Archivos CSV. Procesar estadísticas básicas: totales por columna, cantidad de repetidos, agrupar por algún valor, promedios, cantidad de valores nulos, estadísticas básicas.
Módulo 3. Procesamiento de datos
Procesamiento de la información: las diferentes herramientas para procesar la información. Concepto de Serie y DataFrame en Pandas. Modificación y operación de los datos con Pandas.
Módulo 4. Visualización y generación de informes
Introducción a la librería Matplotlib para la visualización de datos. Tipos de gráficos y cuándo utilizarlos. Generación de informes con Ipython notebook. Tipos de informes posibles.