preloder
aumentar disminuir

EVENTOS

Análisis de datos con Python. Escuela de Métodos 2018

del 3 al 26 de septiembre

lunes y miércoles
descargar ver

Análisis de datos con Python

(Del 3 al 26 de septiembre)

Introducción

Python es el lenguaje más popular para hacer ciencia de datos. Sus múltiples librerías permiten llevar a cabo todo el proceso de obtención, limpieza, análisis y visualización de datos de una manera muy eficiente. Además, es gratis y muy fácil e intuitivo de aprender.

En este curso vamos a conocer Python y a empezar a programar desde cero en este lenguaje que puede abrir muchas oportunidades en tu carrera. Específicamente aprenderemos a usar las librerías más populares para las tareas de manejo y visualización de datos, no solo numéricos, sino también de datos geográficos y de texto.

 

Objetivos

El objetivo del curso es aprender a usar Python para el manejo y visualización de datos. Específicamente, los objetivos del curso son aprender a:

  • Hacer operaciones básicas de manejo de bases de datos.
  • Hacer el pre procesamiento y limpieza de variables.
  • Elaborar gráficas estáticas e interactivas.
  • Realizar operaciones básicas de manejo de datos geoespaciales.
  • Hacer procesamiento básico de texto para su análisis.

Dirigido a

Cualquier profesional interesado en ciencia de datos.

Conocimientos previos

Preferentemente con experiencia en análisis de datos y algún software para manejo de bases de datos (R, Stata, Excel, etc).

Temario

1.    Introducción básica a Python:

En esta sesión veremos lo fundamental para empezar a programar en Python desde cero.

  • ¿Qué es?
  • ¿qué se puede hacer en Python?
  • Ejemplos de aplicaciones
  • Cómo instalar Python y sus paquetes
  • Jupyter notebooks
  • Tipos de datos: str, int, float
  • Funciones built-in básicas: print(), type(), len(), range(),
    • Estructuras de datos en Python: Tuplas, Listas, Diccionarios, Conjuntos, Arrays, DataFrames

2.    Introducción intermedia a Python:

En esta sesión seguiremos aprendiendo a programar en Python utilizando las estructuras de control -que nos permiten automatizar y controlar procesos repetitivos- y también veremos cómo crear nuestras propias funciones y comandos.

  • Estructuras de control en Python: for, while, if, else, elif, whit
  • Listas y diccionarios por comprensión
  • Funciones
  • Clases y métodos

3.    Manejo de datos en Pandas I

Pandas es la librería más popular de Python para el manejo datos. Es sencilla y muy completa. En esta sesión aprenderemos desde cómo leer los archivos con datos, pasando por cómo crear y transformar variables, reestructurar la base de datos, resumir la información y finalmente exportar a otros formatos los datos.

  • DataFrames y Series
  • Leer datos de diferentes fuentes (csv, Excel, stata, spss, internet)
  • Filtro de variables y valores
  • Consultas
  • Crear variables
  • Renombrar variables
  • Reemplazar valores
  • Reestructurar (pivot, melt)
  • Transformación de variables
  • Resumir información (summary)
  • Unir bases de datos.
  • Exportar los datos.

4.    Manejo de datos en Pandas II

En esta sesión veremos algunas funcionalidades más avanzadas de Pandas.

  • Agrupar y agregar datos
  • Multindex
  • Manejo de variables de tiempo
  • Missing Values
  • Duplicados
  • Aplicar funciones
  • Variables dummies
  • Outliers

5.    Gráficas con MatplotLib y  Seaborn 

En esta sesión exploraremos las librerías más populares de Python para elaborar gráficas. Haremos desde las gráficas más básicas hasta gráficas interactivas que responden a las selecciones de los usuarios.

  • Gráficas en Matplotlib
  • Propiedades de las gráficas
  • Múltiples gráficas
  • Gráficas en Seaborn

6.    Manejo de datos espaciales con GeoPandas

GeoPandas hace muy fácil el manejo y la visualización de datos geográficos. En esta sesión aprenderemos cómo usar la información geográfica para enriquecer el análisis de datos.

  • Instalación
  • Estructuras de datos de GeoPandas
  • Lectura de datos espaciales
  • Operaciones geométricas
  • Uniones de bases datos
  • Uniones espaciales
  • Geocodificación
  • Mapas

7.    Manejo de texto

En esta sesión aprenderemos los fundamentos del procesamiento de texto para su análisis. Veremos cómo pre procesar y limpiar el texto, cómo usar expresiones regulares y algunos análisis básicos de analítica de texto.

  • Funciones built-in de los strings
  • Expresiones regulares
  • Métodos para variables string en Pandas
  • Lectura de archivos de texto
  • NLTK
  • Tokenización
  • Lematización
  • Ngrams
  • Medidas de similitud
  • Conteo de frecuencias

8.    Otras utilidades de Python para el análisis de datos

Estas son utilidades varias que nos ayudan en tareas cotidianas del manejo de datos.

  • Librerías para manejar fechas y tiempo.
  • Librerías para obtener datos de APIS.
  • Introducción a Numpy y la vectorización.

 

Bibliografía

  1. McKinney, W. (2012). Python for data analysis: Data wrangling with Pandas, NumPy, and IPython. ” O’Reilly Media, Inc.”.
  2. Automate the Boring Stuff with Python. Libro en línea disponible en: https://automatetheboringstuff.com/
  3. Bird, S., Klein, E., & Loper, E. (2009). Natural language processing with Python: analyzing text with the natural language toolkit. ” O’Reilly Media, Inc.”. Disponible en : http://www.nltk.org/book/

PROFESOR

Juan Javier Santos Ochoa y Juan Pablo de Bott0n

E-mail: juan.santos@cide.edu

HORARIO DE CLASES

El curso tendrá una duración total de 24 horas. 8 sesiones de 3 horas.

Lunes y miércoles de 18:00 a 21:00 horas ( 3, 5, 10, 12 17, 19 , 24 y 26 de septiembre)

LUGAR: Teatro de Decisiones del LNPP, CIDE.

 

Requisitos de Admisión:

Para ser admitido como alumno de nuevo ingreso al programa de Educación Continua, el solicitante debe satisfacer los siguientes requisitos:

  • Copia de identificación oficial con fotografía
  • Realizar su inscripción en línea a través de la liga: http://200.10.244.148:8084/solicitud/.
  • Enviar comprobante de pago y el formato de inscripción del curso en PDF, al correo: maricarmen.garcia@cide.edu antes de la fecha de inicio y entregar los originales el primer día de clase.

Precio y formas de pago:

Los participantes deberán cubrir una colegiatura de $6,500.00 (seis mil quinientos pesos 00/100 m.n.) por cada curso, la cual deberá ser cubierta en una sola exhibición, a pagar al momento de la inscripción en línea. Bajo ninguna circunstancia se otorgarán prórrogas para el pago de cuotas. Las inscripciones se cierran el primer día del curso.

El depósito o transferencia bancaria se deberá hacer al banco HSBC a nombre de Centro de Investigación y Docencia Económicas, A. C. a la cuenta número: 4039603584, sucursal número 0763 (Lilas), CLABE: 021180040396035842.

 

Estacionamiento:

Los participantes de la Escuela de Métodos tendrán acceso al estacionamiento del CIDE.

 

Mayores informes:

Maricarmen García Hernández

Tel. (55) 5727 9800 ext. 2825

maricarmen.garcia@cide.edu

SUBIR
COMENTARIOS.png