Python Básico
Domina lo esencial de Python: variables, control de flujo, funciones y manejo de datos desde cero con ejemplos prácticos. Ideal para empezar a programar.
import pandas as pd
# Cargar datos
df = pd.read_csv("ventas.csv")
# Ver las primeras filas
print(df.head())
# Estadísticas descriptivas
print(df.describe())
# Filtrar datos
ventas_mayores = df[df["importe"] > 1000]
print(ventas_mayores)
# Agrupar por categoría
resumen = df.groupby("categoria")["importe"].mean()
print(resumen)
—
import seaborn as sns
import matplotlib.pyplot as plt
# Histograma
sns.histplot(df["importe"], bins=30, kde=True)
plt.show()
# Correlaciones
sns.heatmap(df.corr(), annot=True, cmap="coolwarm")
plt.show()
—
from pyspark.sql import SparkSession
# Crear sesión Spark
spark = SparkSession.builder.appName("Ejemplo").getOrCreate()
# Leer CSV en DataFrame de Spark
df_spark = spark.read.csv("ventas.csv", header=True, inferSchema=True)
# Operaciones básicas
df_spark.show(5)
df_spark.groupBy("categoria").avg("importe").show()
# SQL en Spark
df_spark.createOrReplaceTempView("ventas")
spark.sql("SELECT categoria, AVG(importe) as media FROM ventas GROUP BY categoria").show()
—
from transformers import pipeline
# Cargar un modelo de análisis de sentimiento
sentiment = pipeline("sentiment-analysis")
texto = "Python es genial para Big Data!"
print(sentiment(texto))
—
import sqlalchemy as db
# Conexión a MySQL
engine = db.create_engine("mysql+pymysql://usuario:password@localhost:3306/empresa")
# Leer datos con Pandas
query = "SELECT nombre, salario FROM empleados WHERE salario > 3000"
df = pd.read_sql(query, engine)
print(df.head())
—
from pymongo import MongoClient
# Conexión a MongoDB
client = MongoClient("mongodb://localhost:27017/")
db = client["empresa"]
coleccion = db["empleados"]
# Insertar un documento
coleccion.insert_one({"nombre": "Sergio", "puesto": "Data Engineer", "salario": 4000})
# Consultar datos
for empleado in coleccion.find({"salario": {"$gt": 3000}}):
print(empleado)
—
✨ Nota final: Estos son solo algunos ejemplos básicos de lo mucho que se puede hacer con Python en Big Data e Ingeniería de Datos. Te animo a que investigues, explores nuevas librerías y sobre todo a que practiques. ✅ Recuerda: programar se aprende programando.
Domina lo esencial de Python: variables, control de flujo, funciones y manejo de datos desde cero con ejemplos prácticos. Ideal para empezar a programar.
Profundiza con listas/diccionarios, manejo de errores y POO. Ejemplos reales para llevar tus habilidades al siguiente nivel.
Decoradores, concurrencia, módulos, E/S y automatización para proyectos profesionales de alto nivel.
Pipelines de datos, ETL, y procesamiento a escala con Python/Spark. Conceptos clave y casos reales.