<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
	<id>https://www.wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%9C%D0%9E%D0%92%D0%A1_MLOps_%D0%9D%D0%B0%D1%87%D0%B0%D0%BB%D0%BE_%282024-25%2C_1_%D0%BC%D0%BE%D0%B4%D1%83%D0%BB%D1%8C%29</id>
	<title>МОВС MLOps Начало (2024-25, 1 модуль) - История изменений</title>
	<link rel="self" type="application/atom+xml" href="https://www.wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%9C%D0%9E%D0%92%D0%A1_MLOps_%D0%9D%D0%B0%D1%87%D0%B0%D0%BB%D0%BE_%282024-25%2C_1_%D0%BC%D0%BE%D0%B4%D1%83%D0%BB%D1%8C%29"/>
	<link rel="alternate" type="text/html" href="https://www.wikicshse.ru/index.php?title=%D0%9C%D0%9E%D0%92%D0%A1_MLOps_%D0%9D%D0%B0%D1%87%D0%B0%D0%BB%D0%BE_(2024-25,_1_%D0%BC%D0%BE%D0%B4%D1%83%D0%BB%D1%8C)&amp;action=history"/>
	<updated>2026-06-08T16:59:09Z</updated>
	<subtitle>История изменений этой страницы в вики</subtitle>
	<generator>MediaWiki 1.45.3</generator>
	<entry>
		<id>https://www.wikicshse.ru/index.php?title=%D0%9C%D0%9E%D0%92%D0%A1_MLOps_%D0%9D%D0%B0%D1%87%D0%B0%D0%BB%D0%BE_(2024-25,_1_%D0%BC%D0%BE%D0%B4%D1%83%D0%BB%D1%8C)&amp;diff=1225&amp;oldid=prev</id>
		<title>imported&gt;Saprokhorov 1: Migrated current public revision from wiki.cs.hse.ru</title>
		<link rel="alternate" type="text/html" href="https://www.wikicshse.ru/index.php?title=%D0%9C%D0%9E%D0%92%D0%A1_MLOps_%D0%9D%D0%B0%D1%87%D0%B0%D0%BB%D0%BE_(2024-25,_1_%D0%BC%D0%BE%D0%B4%D1%83%D0%BB%D1%8C)&amp;diff=1225&amp;oldid=prev"/>
		<updated>2024-10-09T03:44:35Z</updated>

		<summary type="html">&lt;p&gt;Migrated current public revision from wiki.cs.hse.ru&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Новая страница&lt;/b&gt;&lt;/p&gt;&lt;div&gt;==О курсе==&lt;br /&gt;
&lt;br /&gt;
Курс читается для студентов 2 курса магистратуры &amp;quot;Искусственный интеллект&amp;quot; в 1 модуле 2024/2025 учебного года.&lt;br /&gt;
&lt;br /&gt;
Вы познакомитесь с концепцией MLOps, поймете, как именно Data Scientist использует автоматизацию в своих решениях, а также попробуете самостоятельно создать пайплайн обучения ML-модели с помощью AirFlow и версионировать свои эксперименты с помощью MLFlow. Ближе к концу участников интенсива ждет мини-проект по обучению ML-модели по расписанию.&lt;br /&gt;
Цель этого курса - научиться поднимать необходимое окружение для автоматизации ML-экспериментов и грамотно версионировать свои результаты.&lt;br /&gt;
&lt;br /&gt;
==Контакты==&lt;br /&gt;
&lt;br /&gt;
Чат курса в TG: https://t.me/+b_3MbJqsLYoxMWVi&lt;br /&gt;
&lt;br /&gt;
Преподаватель: Елизавета Гаврилова https://t.me/lizvladii @lizvladii&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Ассистент !! Telegram&lt;br /&gt;
|-&lt;br /&gt;
| style=&amp;quot;background:#eaecf0;&amp;quot; | Милана Кучумова || [https://t.me/milana_kma @ milana_kma ]&lt;br /&gt;
|-&lt;br /&gt;
| style=&amp;quot;background:#eaecf0;&amp;quot; | Мария Харченко || [https://t.me/mister_autocrat @mister_autocrat]&lt;br /&gt;
|-&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
==Материалы курса (начальная группа)==&lt;br /&gt;
Ссылка на степик с материалами курса: https://stepik.org/course/181476/&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Занятие !! Тема !! Дата !! Ссылки&lt;br /&gt;
|-&lt;br /&gt;
| style=&amp;quot;background:#eaecf0;&amp;quot; | &amp;#039;&amp;#039;&amp;#039;1 (Вебинар 1)&amp;#039;&amp;#039;&amp;#039;  ||  Введение&lt;br /&gt;
 || 10.09 || [https://stepik.org/lesson/1410492/step/2?unit=1428000 Файлы недели здесь], [https://stepik.org/lesson/1410492/step/9?unit=1428000 Материалы по установке docker здесь]&lt;br /&gt;
|-&lt;br /&gt;
| style=&amp;quot;background:#eaecf0;&amp;quot; | &amp;#039;&amp;#039;&amp;#039;2 (Вебинар 1)&amp;#039;&amp;#039;&amp;#039;  ||  AirFlow Часть 1&lt;br /&gt;
 || 16.09 || [https://stepik.org/lesson/1410493/step/2?unit=1428001 Файлы недели здесь]&lt;br /&gt;
|-&lt;br /&gt;
| style=&amp;quot;background:#eaecf0;&amp;quot; | &amp;#039;&amp;#039;&amp;#039;3 (Вебинар 2)&amp;#039;&amp;#039;&amp;#039;  ||  AirFlow Часть 2 &lt;br /&gt;
 ||23.09 || [https://stepik.org/lesson/1410494/step/2?unit=1428002 Файлы недели здесь]&lt;br /&gt;
|-&lt;br /&gt;
| style=&amp;quot;background:#eaecf0;&amp;quot; | &amp;#039;&amp;#039;&amp;#039;4 (Вебинары 2,3)&amp;#039;&amp;#039;&amp;#039; ||   MLFlow&lt;br /&gt;
 || 01.10 || [https://stepik.org/lesson/1410495/step/2?unit=1428003 Файлы недели здесь]&lt;br /&gt;
|-&lt;br /&gt;
| style=&amp;quot;background:#eaecf0;&amp;quot; | &amp;#039;&amp;#039;&amp;#039;5 (Вебинар 3)&amp;#039;&amp;#039;&amp;#039;  ||   Проект&lt;br /&gt;
 || 15.10 || [https://stepik.org/lesson/1435619/step/4?unit=1454131 Описание]&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
==Формула оценивания==&lt;br /&gt;
&lt;br /&gt;
Оценка = 0.4 * (О&amp;lt;sub&amp;gt;ДЗ1&amp;lt;/sub&amp;gt; + О&amp;lt;sub&amp;gt;ДЗ2&amp;lt;/sub&amp;gt; )  + 0.6 * О&amp;lt;sub&amp;gt;Проект&amp;lt;/sub&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Домашние задания ==&lt;br /&gt;
[https://stepik.org/lesson/1435619/step/1?unit=1454131 &amp;gt;&amp;gt;Подробные описания домашних заданий и сроков сдачи на степике&amp;lt;&amp;lt;]&lt;br /&gt;
&lt;br /&gt;
Домашнее задание 1 - 20%: Написать 3 DAGа обучения разных моделей со сбором метрик в рамках одного файла. Пайплайн должен состоять из следующих шагов: &lt;br /&gt;
инициализация. В качестве метрик собираем название модели и время запуска.&lt;br /&gt;
загрузка данных (любые данные с загрузкой из интернета, без БД). В качестве метрик собираем начало и конец загрузки по времени, размеры датасета.&lt;br /&gt;
обработка данных (соответствующая решаемой задаче). В качестве метрик собираем время работы шага, размеры обработанного датасета.&lt;br /&gt;
обучение модели. В качестве метрик собираем время обучения модели и метрики модели.&lt;br /&gt;
сохранение результатов на S3. Выгружаем все собранные за пайплайн метрики на S3.&lt;br /&gt;
&lt;br /&gt;
Домашнее задание 2 - 20%: Обучить 3 модели в Python и залогировать эксперимент с помощью MLFlow.&lt;br /&gt;
реализовать обучение 3 любых моделей в Python, состоящее из шагов: чтение данных (любые из интернета), предобработка данных, обучение моделей, сохранение результатов.&lt;br /&gt;
необходимо создать новый эксперимент в MLFLow (подсказка: а что если эксперимент уже есть?)&lt;br /&gt;
обучать модели необходимо в рамках одно parent run. Один сhild run - это одна модель. &lt;br /&gt;
собирать метрики необходимо с помощью MLFlow!&lt;br /&gt;
&lt;br /&gt;
Проект - это совмещение ДЗ 1 и 2 - 60%. Необходимо обучить 3 модели в рамках одного DAG, и залогировать эти обучения с помощью MLFlow.  Подробное описание проекта [https://stepik.org/lesson/1435619/step/4?unit=1454131 здесь].&lt;br /&gt;
&lt;br /&gt;
Минимальные требования к проекту:&lt;br /&gt;
* используется датасет из sklearn&lt;br /&gt;
*  используются лог/лин рег + дерево решений + случайный лес&lt;br /&gt;
*  предобработка - это стандартизация&lt;br /&gt;
*  отбора признаков не происходит&lt;br /&gt;
*  и все требуемые шаги из описания выше выполнены&lt;/div&gt;</summary>
		<author><name>imported&gt;Saprokhorov 1</name></author>
	</entry>
</feed>