Skip to content

Тетюхин.Task9#3

Open
MaximTetuchin wants to merge 12 commits into
mainfrom
Task9
Open

Тетюхин.Task9#3
MaximTetuchin wants to merge 12 commits into
mainfrom
Task9

Conversation

@MaximTetuchin
Copy link
Copy Markdown
Owner

Задача 9. Сравнение методов регрессии

** Дедлайн: 28.11.2025, 23:59

  • Полный балл: 20

Задача

  • Найти данные, на которых интересно будет решать задачу регрессии (больше 1000 строк, больше 5 признаков).
  • Считать данные, выполнить первичный анализ данных, при необходимости произвести чистку данных (Data Cleaning).
  • Выполнить разведочный анализ (EDA), использовать визуализацию, сделать выводы, которые могут быть полезны при дальнейшем решении задачи регрессии.
  • При необходимости выполнить полезные преобразования данных (например, трансформировать категориальные признаки в количественные), убрать ненужные признаки, создать новые (Feature Engineering).
  • Используя подбор гиперпараметров, кросс-валидацию и при необходимости масштабирование данных, добиться наилучшего качества предсказания для библиотечных реализаций (например, из sklearn) четырёх регрессионных методов.
  • Сравнить все обученные модели с точки зрения времени обучения/предсказания и результирующей точности. Сделать выводы о полученных моделях в рамках решения задачи регрессии на выбранных данных.
  • (Доп., +5 балла) Самостоятельно реализовать один из регрессионных методов, с возможностью настройки гиперпараметров. Повторить все пункты задания для собственной реализации.
  • (Доп., +5 балла) Используя два разных фреймворка автоматического машинного обучения, получить две модели для решения задачи регрессии. Сравнить полученные модели с использованными Вами.

@MaximTetuchin MaximTetuchin requested a review from Krekep November 25, 2025 11:53
@MaximTetuchin MaximTetuchin changed the title Task9 Тетюхин.Task9 Nov 26, 2025
@MaximTetuchin MaximTetuchin requested review from Krekep and removed request for Krekep November 26, 2025 08:39
Copy link
Copy Markdown
Collaborator

@Krekep Krekep left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Необходимы исправления

  1. Добавьте ссылку на колаб
  2. Добавьте описание датасета и задачи, которую решаете
  3. Объясните, почему Вы удалили ocean_proximity, longitude, total_bedrooms, population, households
  4. Ваши метрики не совсем показательны. Разве не нужно их обратно отскалировать?
  5. Пункт про сравнение/вывод не выполнен
  6. Какая метрика более уместна в Вашей задаче?
  7. Почему TPOT показал такой плохой результат?

@Krekep
Copy link
Copy Markdown
Collaborator

Krekep commented Nov 26, 2025

И удалите файлы не относящиеся к текущему PR (CI проверки оставьте)

@MaximTetuchin
Copy link
Copy Markdown
Owner Author

MaximTetuchin commented Nov 28, 2025

TPOT я удалил (по ТЗ надо 2 либы autoML), но изначально причина была в том, что он а) учился на маленьком к-ве данных из-за особенностей ген. алгоритма, б) кушает много ресурсов, пришлось урезать к-во эпох
Остальное, в тч метрики и анализ, я поправил
Ссылка на колаб: https://drive.google.com/file/d/1iP3OuM1Go87_AXDeIKat9YChP55Scj5G/view?usp=sharing

@MaximTetuchin MaximTetuchin requested a review from Krekep November 28, 2025 13:28
Copy link
Copy Markdown
Collaborator

@Krekep Krekep left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Необходимы исправления

  1. Пошарьте ноутбук на доступ
  2. MAE это хорошо, но непонятен размер Ваших исходных данных (когда дома стоят миллионы, ошибка в 50к это немного, а когда дома стоят 50к, то такая ошибка весьма существенна). Добавьте процентные метрики, например MAPE
  3. Пункт про сравнение моделей выполнен не полностью

@MaximTetuchin
Copy link
Copy Markdown
Owner Author

Все сделано!
Опять же, дублирую ссылку.
https://drive.google.com/file/d/1iP3OuM1Go87_AXDeIKat9YChP55Scj5G/view?usp=sharing

@MaximTetuchin MaximTetuchin requested a review from Krekep November 28, 2025 15:32
Copy link
Copy Markdown
Collaborator

@Krekep Krekep left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Зачтено

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

2 participants