Мини-ETL: CSV → SQLite → SQL-запросы → pandas-анализ → отчёты. Подготовка к стажировке ASTON Data Engineer.
python3 -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
python src/load_to_db.py
python src/analyze_sales.pydata-engineer-mini-project/
├── data/ # CSV и локальная БД (sales.db не пушим)
├── sql/ # create_tables + учебные запросы
├── src/ # Python-скрипты ETL и анализа
├── requirements.txt # зависимости проекта
└── README.md # описание проекта
-- Топ клиентов по выручке
SELECT c.customer_name, SUM(p.price * oi.quantity) AS total_spent
FROM customers c
JOIN orders o ON o.customer_id = c.customer_id
JOIN order_items oi ON oi.order_id = o.order_id
JOIN products p ON p.product_id = oi.product_id
GROUP BY c.customer_name
ORDER BY total_spent DESC;SQLite3 — локальная база данных
SQLAlchemy — подключение к БД
pandas — анализ данных
Python 3.12 — основной язык проекта
Jupyter / VSCode — для визуализации и интерактивного анализа
✅ 5 строк объединённых данных ✅ Автоматическое вычисление выручки ✅ CSV-отчёт: data/full_sales_join.csv ✅ Готовая структура для мини-ETL-проекта
✅ Всего строк: 5
💰 Доход по клиентам: customer_name Andrey 210.0 Lera 40.0 Name: line_total, dtype: float64
📦 Доход по категориям: category Apparel 195.0 Supplements 55.0 Name: line_total, dtype: float64
🏙️ Доход по городам: city Moscow 210.0 Perm 40.0 Name: line_total, dtype: float64
✅ Отчёт сохранён в data/full_sales_join.csv
Андрей Крылов 📧 ak.chemp@gmail.com