Sobre el curso: Este curso tiene por finalidad el aprendizaje práctico de Python orientado al manejo básico y sencillo de datos.
En esta segunda sesión, vamos a importar y trabajar con Pandas para explorar sus funcionalidades básicas.
Una vez instalado, podemos importar Pandas para comenzar a trabajar con datos:
import pandas as pdPandas soporta la lectura de una variedad de formatos de archivos como CSV, Excel entre otros. El método read_csv es frecuentemente usado:
df = pd.read_csv('ruta/al/archivo.csv', sep=',', header=0)Parámetros principales:
filepath_or_buffer: Ruta del archivo o un objeto similar a un archivo que contiene los datos.sep: el delimitador del archivo (por defecto,,).header: índice de la fila que se usa como cabecera.skiprows: Número de filas o lista de números de línea para omitir al leer el archivo.na_values: Secuencia de valores que, si se encuentran en el archivo, deben ser tratados como NaN.dtype: Tipo de datos para las columnas. Por ejemplo, {'a': np.float64, 'b': np.int32}.encoding: Codificación del archivo (generalmente UTF-8).
Para obtener una vista rápida de los datos, podemos utilizar:
df.head() # Muestra las primeras 5 filasTambién puede usar:
head(),tail(): Muestra las primeras o últimas 'n' filas.describe(): Proporciona estadísticas descriptivas resumidas.info(): Resumen conciso del DataFrame, incluyendo el tipo de datos de las columnas y los valores no nulos.dtypes: Muestra los tipos de datos de cada columna.value_counts(): Cuenta cuántas veces aparece cada valor único en una columna.
Para seleccionar una sola columna, utilizamos:
columna = df['NombreColumna']Podemos seleccionar filas específicas usando su índice:
filas = df.iloc[0:5] # Selecciona las primeras 5 filasTambién podemos seleccionar filas que cumplan una condición:
condicion = df[df['Edad'] > 30] # Selecciona filas donde la columna 'Edad' es mayor que 30Para exportar un DataFrame a CSV, utilizamos:
df.to_csv('ruta/al/nuevo_archivo.csv', index=False)Parámetros principales:
index: indica si incluir el índice de las filas en el archivo.sep: el delimitador del archivo (por defecto,,).encoding: Codificación del archivo (generalmente UTF-8).
Fecha de actualización: 26/04/2024
GitHub: https://github.com/Wences91/teaching