- Сообщения
- 27,269
- Реакции
- 106,185
- #1
Голосов: 0
0.0
5
0
0
https://s2.sharewood.me/threads/stepik-%D0%9C%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5-%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5-%D0%9F%D0%BE%D0%B4%D0%B3%D0%BE%D1%82%D0%BE%D0%B2%D0%BA%D0%B0-%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85-%D0%9C%D0%BE%D0%B4%D1%83%D0%BB%D1%8C-1-2024.137243/
Автор: Stepik
Название: Машинное обучение - Подготовка данных (Модуль 1) (2024)
Описание
Данный курс является первым модулем из серии моих курсов по машинному обучению (ML). В этом курсе в качестве задачи будет рассматриваться прогнозирование в футбольной аналитике. Мы сосредоточимся на сборе данных, которые будут использоваться для прогнозирования в следующих модулях. Помимо сбора данных, мы также применим некоторые техники предобработки данных.
Программа курса
1. Введение
О курсе
Среда разработки
2. Сбор данных с использованием парсинга
Выбор источника данных
Выбор метода парсинга
Определение целевых данных
Разработка скрипта парсинга
Библиотека прасинга датасета
3. Обзор данных
Обзор датасета
Библиотеки для анализа данных
4. Очистка данных
Важность и цель очистки данных.
Устранение дубликатов
Методы заполнения пропущенных данных.
Целевая переменная
Входные параметры
5. Валидация данных
Проверка качества данных после очистки и обработки
Проверка точност на моделях
Анализ важности признаков
6. Кластерный анализ
Понижение размерности
Кластерный анализ
Добавление новых параметров
Оценка качества модели после применения кластеризации
7. Нормализация и стандартизация данных
Приведение данных к единообразному формату.
Преобразование категориальных признаков.
Оценка качества модели после нормализации модели
8. Балансировка данных
Статистический анализ
Балансировка данных
Автор: Алексей Кожакин
Мне очень нравится помогать ученикам, изучающим Python, разбираться в сложных моментах и показывать наилучший путь изучения программирования, чтобы они могли стать успешными разработчиками.
Подробнее:
Скачать:
Название: Машинное обучение - Подготовка данных (Модуль 1) (2024)
Описание
Данный курс является первым модулем из серии моих курсов по машинному обучению (ML). В этом курсе в качестве задачи будет рассматриваться прогнозирование в футбольной аналитике. Мы сосредоточимся на сборе данных, которые будут использоваться для прогнозирования в следующих модулях. Помимо сбора данных, мы также применим некоторые техники предобработки данных.
Программа курса
1. Введение
О курсе
Среда разработки
2. Сбор данных с использованием парсинга
Выбор источника данных
Выбор метода парсинга
Определение целевых данных
Разработка скрипта парсинга
Библиотека прасинга датасета
3. Обзор данных
Обзор датасета
Библиотеки для анализа данных
4. Очистка данных
Важность и цель очистки данных.
Устранение дубликатов
Методы заполнения пропущенных данных.
Целевая переменная
Входные параметры
5. Валидация данных
Проверка качества данных после очистки и обработки
Проверка точност на моделях
Анализ важности признаков
6. Кластерный анализ
Понижение размерности
Кластерный анализ
Добавление новых параметров
Оценка качества модели после применения кластеризации
7. Нормализация и стандартизация данных
Приведение данных к единообразному формату.
Преобразование категориальных признаков.
Оценка качества модели после нормализации модели
8. Балансировка данных
Статистический анализ
Балансировка данных
Автор: Алексей Кожакин
Мне очень нравится помогать ученикам, изучающим Python, разбираться в сложных моментах и показывать наилучший путь изучения программирования, чтобы они могли стать успешными разработчиками.
Подробнее:
Для просмотра ссылок пройдите регистрацию
Скачать:
Для просмотра ссылок пройдите регистрацию