<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
	<id>https://www.wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%92%D0%B2%D0%B5%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B2_%D0%B0%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85</id>
	<title>Введение в анализ данных - История изменений</title>
	<link rel="self" type="application/atom+xml" href="https://www.wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%92%D0%B2%D0%B5%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B2_%D0%B0%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85"/>
	<link rel="alternate" type="text/html" href="https://www.wikicshse.ru/index.php?title=%D0%92%D0%B2%D0%B5%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B2_%D0%B0%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85&amp;action=history"/>
	<updated>2026-06-06T12:35:19Z</updated>
	<subtitle>История изменений этой страницы в вики</subtitle>
	<generator>MediaWiki 1.45.3</generator>
	<entry>
		<id>https://www.wikicshse.ru/index.php?title=%D0%92%D0%B2%D0%B5%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B2_%D0%B0%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85&amp;diff=2073&amp;oldid=prev</id>
		<title>imported&gt;Esokolov: /* Экзамен */</title>
		<link rel="alternate" type="text/html" href="https://www.wikicshse.ru/index.php?title=%D0%92%D0%B2%D0%B5%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B2_%D0%B0%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85&amp;diff=2073&amp;oldid=prev"/>
		<updated>2021-06-08T20:19:48Z</updated>

		<summary type="html">&lt;p&gt;&lt;span class=&quot;autocomment&quot;&gt;Экзамен&lt;/span&gt;&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Новая страница&lt;/b&gt;&lt;/p&gt;&lt;div&gt;== О курсе ==&lt;br /&gt;
&lt;br /&gt;
Курс читается для студентов 2-го курса [https://electives.hse.ru/minor_intel/ майнора ИАД] в 3-4 модулях.&lt;br /&gt;
&lt;br /&gt;
Проводится с 2015 года.&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Лектор:&amp;#039;&amp;#039;&amp;#039; [http://www.hse.ru/staff/esokolov Соколов Евгений Андреевич]&lt;br /&gt;
&lt;br /&gt;
Лекции проходят онлайн по средам в 11:10.&lt;br /&gt;
&lt;br /&gt;
=== Полезные ссылки ===&lt;br /&gt;
&lt;br /&gt;
[https://www.hse.ru/edu/courses/416021030 Карточка курса и программа]&lt;br /&gt;
&lt;br /&gt;
[https://github.com/hse-ds/iad-intro-ds Репозиторий с материалами на GitHub]&lt;br /&gt;
&lt;br /&gt;
[https://www.youtube.com/playlist?list=PLEwK9wdS5g0pja3STykphSiuXzNEx5Gkw Записи занятий]&lt;br /&gt;
&lt;br /&gt;
Почта для сдачи домашних заданий (на самом деле задания сдаются в AnyTask, но если он не работает, то присылайте на почту): hse.minor.dm+&amp;lt;номер группы&amp;gt;@gmail.com (например, hse.minor.dm+3@gmail.com)&lt;br /&gt;
&lt;br /&gt;
Канал в telegram для объявлений: https://t.me/hs_iad_2021&lt;br /&gt;
&lt;br /&gt;
Чат в telegram для флуда: https://t.me/joinchat/Vuq4Lgi98RG22fQP&lt;br /&gt;
&lt;br /&gt;
Ссылка на курс в Anytask: https://anytask.org/course/779&lt;br /&gt;
&lt;br /&gt;
Таблица с оценками: https://docs.google.com/spreadsheets/d/13aZ9aQAqa0QUTniqAkPMlirWqPq6DfLwpIra2HJLwhk/edit?usp=sharing&lt;br /&gt;
&lt;br /&gt;
=== Семинары ===&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Группа !! Преподаватель !! Учебные ассистенты !! Zoom-конференция !! Ссылка на чат !! Материалы семинаров !! Инвайт в anytask &lt;br /&gt;
|-&lt;br /&gt;
| ИАД-1 || Илья Косарев || Саночкин Юрий, Пащенко Анатолий || [https://zoom.us/j/95260607985?pwd=NTAxSVhGV1UzdHF2M0N6Q2dKWElOQT09 Zoom] ||  [https://t.me/joinchat/SrL1GYfpaLeFxs4J Чат]  || [https://github.com/PersDep/data-mining-intro-2021 Материалы] || GrodXoV&lt;br /&gt;
|-&lt;br /&gt;
| ИАД-2 || Надежда Чиркова || Екатерина Кострыкина, Александра Штарёва  || [https://zoom.us/j/97891126155?pwd=bXk0c2oxRm9jWUJuRUJtRDl1elB2QT09 Zoom] || [https://t.me/joinchat/GnnT0omle1UE7HQ1 Чат]   || [https://github.com/nadiinchi/iad2021 Материалы] || hHA6uvN&lt;br /&gt;
|-&lt;br /&gt;
| ИАД-3 || Елена Кантонистова ||  [https://t.me/mikezz_1 Михаил Олейник], [https://t.me/NikPatov Никита Патов ] || [https://zoom.us/j/93207072522?pwd=djlCL3pJc0JuNkJKZ3RvL21UQmFVQT09 Zoom]   || [https://t.me/joinchat/GWgn8k5yOx1s4qD3 Чат]  || || ewfZ2I8&lt;br /&gt;
|-&lt;br /&gt;
| ИАД-4 || Артём Филатов || Валерий Айхенвальд, Анастасия Бир || [https://zoom.us/j/95918149669?pwd=UUxuOEthSnVDZVU0WFhVNXM1UytEZz09 Zoom] || [https://t.me/joinchat/G3mbrYDFVm4gVitF Чат] || || 4TUKO0v&lt;br /&gt;
 |-&lt;br /&gt;
| ИАД-5 || [https://t.me/vsomelyusik Владимир Омелюсик] || [https://t.me/aksenysh Аня Аксенова], Александр Габиташвили || [https://zoom.us/j/95997234634?pwd=SHVjUGM1a2hFTDNnZ1RmMm1xakpTQT09 Zoom] ||  [https://t.me/joinchat/GRjeFvGs5HBiIm38 Чат]  || [https://github.com/V-Marco/hse_iad5_2021 Материалы] || Kre5emJ&lt;br /&gt;
|-&lt;br /&gt;
| ИАД-6 || Ася Карпова || Елена Гринкевич, Егор Масликов || [https://zoom.us/j/95210435451?pwd=UEZaR1FsTzZnclhDRnY2aEFEODJIQT09 Zoom]  ||  [https://t.me/joinchat/TeYBnyU8bpTw3j93 Чат] || || nSuRKac&lt;br /&gt;
|-&lt;br /&gt;
| ИАД-7 || [https://t.me/OnixinO Тамерлан Таболов] || [https://t.me/Debasering Николай Аверьянов], [https://t.me/greyworgen Сергей Тихонов], [https://t.me/userwaskicked Никита Крайко] || [https://zoom.us/j/93740294916?pwd=S20vN3loUytFVk1EamQ4MDhhY0V4UT09 Zoom] || [https://t.me/joinchat/RHVp06vSXeAmedPu Чат] || || HO7xViO&lt;br /&gt;
|-&lt;br /&gt;
| БИ-1 || Антон Семёнкин || [https://t.me/nichtdeinetraumfrau Дарья Морозова], [https://t.me/caesiummm Михаил Никифоров] || [https://zoom.us/j/92491827270?pwd=RGczZ0szUnVxVUJOb0U5c1AvbWdhdz09 Zoom] || [https://t.me/joinchat/TMyUB5mUxXsY8TLZ Чат] || || aQWW7It&lt;br /&gt;
|-&lt;br /&gt;
| БИ-2 || Илья Косарев || Гусева Полина, Такташева Екатерина || [https://zoom.us/j/94624466609?pwd=ZnRhYy8zZmF0OFRhaHNDTjlCVFZxQT09 Zoom] || [https://t.me/joinchat/HKbLF0ki_iPqUjnY Чат] || [https://github.com/PersDep/data-mining-intro-2021 Материалы] || QFII7j8&lt;br /&gt;
|-&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
=== Правила выставления оценок ===&lt;br /&gt;
&lt;br /&gt;
В курсе предусмотрено несколько форм контроля знания:&lt;br /&gt;
* Самостоятельные работы на семинарах, проверяющие знание основных фактов с лекций и семинаров&lt;br /&gt;
* Практические домашние работы на Python&lt;br /&gt;
* Контрольная где-то в середине курса&lt;br /&gt;
* Письменный экзамен&lt;br /&gt;
&lt;br /&gt;
Итоговая оценка вычисляется на основе оценки за работу в семестре и оценки за экзамен:&lt;br /&gt;
&lt;br /&gt;
O&amp;lt;sub&amp;gt;итоговая&amp;lt;/sub&amp;gt; = Округление(0.4 * ДЗ + 0.1 * ПР + 0.2 * КР + 0.3 * Э)&lt;br /&gt;
&lt;br /&gt;
ДЗ — средняя оценка за практические домашние задания&lt;br /&gt;
&lt;br /&gt;
ПР — средняя оценка за письменные проверочные работы на семинарах&lt;br /&gt;
&lt;br /&gt;
КР — оценка за контрольную работу&lt;br /&gt;
&lt;br /&gt;
Э — оценка за экзамен&lt;br /&gt;
&lt;br /&gt;
Округление арифметическое.&lt;br /&gt;
&lt;br /&gt;
=== Правила сдачи заданий ===&lt;br /&gt;
&lt;br /&gt;
За каждый день просрочки после мягкого дедлайна снимается 1 балл. После жёсткого дедлайна работы не принимаются. Даже при опоздании на одну секунду. Сдавайте заранее.&lt;br /&gt;
&lt;br /&gt;
При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента.&lt;br /&gt;
&lt;br /&gt;
При наличии уважительной причины пропущенную проверочную можно написать позднее, а дедлайн по домашнему заданию может быть перенесён. Дедлайн по домашнему заданию переносится на количество дней, равное продолжительности уважительной причины. Решение о том, является ли причина уважительной, принимает исключительно учебный офис.&lt;br /&gt;
&lt;br /&gt;
== Лекции ==&lt;br /&gt;
&lt;br /&gt;
Лекция 1 (20.01.2021). Введение в машинное обучение и анализ данных. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/lectures/lecture01-intro.pdf Слайды]] [[https://www.youtube.com/watch?v=77fwOymbP2Y Запись лекции]]&lt;br /&gt;
&lt;br /&gt;
Лекция 2 (27.01.2021). Основные постановки задач. Метод k ближайших соседей. Измерение ошибки в задачах классификации. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/lectures/lecture02-knn.pdf Слайды]] [[https://www.youtube.com/watch?v=_6sxGoimhZM Запись лекции]]&lt;br /&gt;
&lt;br /&gt;
Лекция 3 (03.02.2021). Переобучение и обобщающая способность. Проверка обобщающей способности: отложенная выборка и кросс-валидация. Метод k ближайших соседей с весами. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/lectures/lecture03-knn.pdf Слайды]] [[https://www.youtube.com/watch?v=FswSp9w21PQ Запись лекции]]&lt;br /&gt;
&lt;br /&gt;
Лекция 4 (10.02.2021). kNN для регрессии. Модель линейной регрессии. Подготовка данных для линейной регрессии. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/lectures/lecture04-linregr.pdf Слайды]] [[https://www.youtube.com/watch?v=EfD8ujQmnHw Запись лекции]]&lt;br /&gt;
&lt;br /&gt;
Лекция 5 (17.02.2021). MSE для линейной регрессии в матричной форме. Аналитическая формула для оптимального вектора весов, её недостатки. Регуляризация линейных моделей. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/lectures/lecture05-linregr.pdf Слайды]] [[https://www.youtube.com/watch?v=BQh1BUco5FY Запись лекции]]&lt;br /&gt;
&lt;br /&gt;
Лекция 6 (24.02.2021). Интерпретация весов из линейной модели. Градиентый спуск. Мультистарт. Выбор длины шага. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/lectures/lecture06-linregr.pdf Слайды]] [[https://www.youtube.com/watch?v=wg51b2Wt96I Запись лекции]]&lt;br /&gt;
&lt;br /&gt;
Лекция 7 (3.03.2021). Стохастический градиентный спуск. Функции потерь в задачах регрессии. Линейный классификатор. Отступ. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/lectures/lecture07-linclass.pdf Слайды]] [[https://www.youtube.com/watch?v=zTWN_8hLDQw Запись лекции]]&lt;br /&gt;
&lt;br /&gt;
Лекция 7.5 (в записи). Относительная ошибка в регрессии (MAPE, SMAPE). Метрики качества классификации: доля верных ответов, точность, полнота. Объединение точности и полноты, F-мера. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/lectures/lecture07-linclass-part2.pdf Слайды]] [[https://www.youtube.com/watch?v=J5pdWQvgjgM Запись лекции]]&lt;br /&gt;
&lt;br /&gt;
Лекция 8 (10.03.2021). Обучение линейных классификаторов через верхние оценки на функцию потерь. Метрики качества ранжирования: PR-кривая и ROC-кривая, площади под ними. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/lectures/lecture08-linclass.pdf Слайды]] [[https://www.youtube.com/watch?v=RM2OYu3kqG4 Запись лекции]]&lt;br /&gt;
&lt;br /&gt;
Лекция 9 (17.03.2021). Логистическая регрессия. Оценивание вероятностей. Логистическая функция потерь. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/lectures/lecture09-linclass.pdf Слайды]] [[https://www.youtube.com/watch?v=2J0_oMRUxoA Запись лекции]]&lt;br /&gt;
&lt;br /&gt;
Лекция 10 (24.03.2021). Метод опорных векторов. Многоклассовая классификация. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/lectures/lecture10-linclass.pdf Слайды]] [[https://www.youtube.com/watch?v=eLze-Mo6uaw Запись лекции]]&lt;br /&gt;
&lt;br /&gt;
Лекция 11 (07.04.2021). Решающие деревья. Поиск лучших предикатов и критерии информативности. Жадный алгоритм построения дерева. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/lectures/lecture11-trees.pdf Слайды]] [[https://www.youtube.com/watch?v=H-xIuocK4oY Запись лекции]]&lt;br /&gt;
&lt;br /&gt;
Лекция 12 (14.04.2021). Неустойчивость решающих деревьев. Разложение ошибки на смещение и разброс. Бэггинг. Случайный лес. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/lectures/lecture12-ensembles.pdf Слайды]] [[https://www.youtube.com/watch?v=JrA7O0Q_BFU Запись лекции]]&lt;br /&gt;
&lt;br /&gt;
Лекция 13 (21.04.2021). Градиентный бустинг. Последовательное обучение моделей на MSE. Общий вид градиентного бустинга. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/lectures/lecture13-ensembles.pdf Слайды]] [[https://www.youtube.com/watch?v=E6o-gwhs1ek Запись лекции]]&lt;br /&gt;
&lt;br /&gt;
Лекция 14 (12.05.2021). Градиентный бустинг. Регуляризация. Основные гиперпараметры. Вариации бустинга. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/lectures/lecture14-ensembles.pdf Слайды]] [[https://www.youtube.com/watch?v=HjZ8uQUxXpo Запись лекции]]&lt;br /&gt;
&lt;br /&gt;
Лекция 15 (19.05.2021). Отбор признаков. Одномерные методы. Отбор на основе моделей. Метод главных компонент. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/lectures/lecture15-reduction.pdf Слайды]] [[https://www.youtube.com/watch?v=6Zn6BSClyno Запись лекции]]&lt;br /&gt;
&lt;br /&gt;
Лекция 16 (26.05.2021). Кластеризация. K-Means. DBSCAN. Представления слов. Тематическое моделирование. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/lectures/lecture16-clustering.pdf Слайды]] [[https://www.youtube.com/watch?v=j_1F7eo_stE Запись лекции]]&lt;br /&gt;
&lt;br /&gt;
== Семинары ==&lt;br /&gt;
&lt;br /&gt;
Семинар 1: pandas; основы работы с таблицами, вычисление статистик, устранение пропусков. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/seminars/sem01_pandas.ipynb Ноутбук]]&lt;br /&gt;
&lt;br /&gt;
Семинар 2: numpy и основы линейной алгебры. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/seminars/sem02_numpy.ipynb Ноутбук]]&lt;br /&gt;
&lt;br /&gt;
Семинар 3: Визуализация данных. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/seminars/sem03_EDA.ipynb Ноутбук]]&lt;br /&gt;
&lt;br /&gt;
Семинар 4: Объектно-ориентированное программирование в Python. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/seminars/sem04_oop.ipynb Ноутбук]]&lt;br /&gt;
&lt;br /&gt;
Семинар 5: Введение в sklearn. KNN. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/seminars/sem05_sklearn_knn/sem05-sklearn-knn.ipynb Ноутбук]]&lt;br /&gt;
&lt;br /&gt;
Семинар 6: Линейная регрессия, функции потерь регресии, регуляризация. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/seminars/sem06_linreg/sem06_linreg_unsolved.ipynb Ноутбук]]&lt;br /&gt;
&lt;br /&gt;
Семинар 7: Градиентный спуск. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/seminars/sem07_grad.ipynb Ноутбук]]&lt;br /&gt;
&lt;br /&gt;
Семинар 8: Линейная классификация. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/seminars/sem08_linclass.ipynb Ноутбук]]&lt;br /&gt;
&lt;br /&gt;
Семинар 9: Логистическая регрессия и SVM. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/seminars/sem09_logit_svm/sem09_logit_svm.ipynb Ноутбук]]&lt;br /&gt;
&lt;br /&gt;
Семинар 10: Обработка текстов. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/seminars/sem10_texts.ipynb Ноутбук]]&lt;br /&gt;
&lt;br /&gt;
Семинар 11: Калибровка вероятностей. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/seminars/sem11_multiclass_calibration.ipynb Ноутбук]]&lt;br /&gt;
&lt;br /&gt;
Семинар 12: Решающие деревья. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/seminars/sem12_trees/sem12_trees.ipynb Ноутбук]]&lt;br /&gt;
&lt;br /&gt;
Семинар 13: Случайный лес. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/seminars/sem13_rf.ipynb Ноутбук]]&lt;br /&gt;
&lt;br /&gt;
Семинар 14: Бустинг, часть 1. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/seminars/sem14_boosting_part1.ipynb Ноутбук]]&lt;br /&gt;
&lt;br /&gt;
Семинар 15: Бустинг, часть 2. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/seminars/sem15_boostings/sem15_boostings_part2.ipynb Ноутбук]]&lt;br /&gt;
&lt;br /&gt;
Семинар 16: Задача понижения размерности. Генерация признаков. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/seminars/sem16_features/sem16_pca_features.ipynb Ноутбук]]&lt;br /&gt;
&lt;br /&gt;
Семинар 17: Кластеризация. [[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/seminars/sem17_clustering.ipynb Ноутбук]]&lt;br /&gt;
&lt;br /&gt;
== Практические задания ==&lt;br /&gt;
&lt;br /&gt;
За каждый день просрочки после мягкого дедлайна снимается 1 балл. После жёсткого дедлайна работы не принимаются, но есть исключение. В течение семестра каждый студент может не более 2 раз сдать задание после жёсткого дедлайна — в этом случае за каждый день просрочки продолжает вычитаться по одному баллу (если не оговорено иное).&lt;br /&gt;
&lt;br /&gt;
В некоторых группах домашние задания могут отличаться. Уточняйте у семинариста.&lt;br /&gt;
&lt;br /&gt;
==== ДЗ 1. pandas ====&lt;br /&gt;
&lt;br /&gt;
[[https://github.com/hse-ds/iad-intro-ds/tree/master/2021/homeworks/hw01-pandas Ноутбук для заполнения и данные]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Дедлайн&amp;#039;&amp;#039;&amp;#039;: мягкий дедлайн 26 января 23:59, жесткий дедлайн 30 января 23:59.&lt;br /&gt;
&lt;br /&gt;
==== ДЗ 2. numpy ====&lt;br /&gt;
&lt;br /&gt;
[[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/homeworks/hw02-numpy.ipynb Ноутбук для заполнения]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Дедлайн&amp;#039;&amp;#039;&amp;#039;: мягкий дедлайн 2 февраля 23:59, жёсткий дедлайн 6 февраля 23:59.&lt;br /&gt;
&lt;br /&gt;
==== ДЗ 3. EDA и подготовка данных ====&lt;br /&gt;
&lt;br /&gt;
[[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/homeworks/hw03-EDA/hw03-EDA.ipynb Ноутбук для заполнения]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Дедлайн&amp;#039;&amp;#039;&amp;#039;: мягкий дедлайн 17 февраля 23:59, жёсткий дедлайн 21 февраля 23:59.&lt;br /&gt;
&lt;br /&gt;
==== ДЗ 4. kNN и линейная регрессия ====&lt;br /&gt;
&lt;br /&gt;
[[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/homeworks/hw04-knn_linreg/hw04.ipynb Ноутбук для заполнения]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Дедлайн&amp;#039;&amp;#039;&amp;#039;: мягкий дедлайн 10 марта 23:59, жёсткий дедлайн 14 марта 23:59.&lt;br /&gt;
&lt;br /&gt;
==== ДЗ 5. Градиентный спуск ====&lt;br /&gt;
&lt;br /&gt;
[[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/homeworks/hw05_gd.ipynb Ноутбук для заполнения]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Дедлайн&amp;#039;&amp;#039;&amp;#039;: мягкий дедлайн 6 апреля 23:59, жёсткий дедлайн 10 апреля 23:59.&lt;br /&gt;
&lt;br /&gt;
==== ДЗ 6. Работа с текстами ====&lt;br /&gt;
&lt;br /&gt;
[[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/homeworks/hw06-text/hw06.ipynb Ноутбук для заполнения]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Дедлайн&amp;#039;&amp;#039;&amp;#039;: мягкий дедлайн 23 апреля 23:59, жёсткий дедлайн 28 апреля 23:59.&lt;br /&gt;
&lt;br /&gt;
==== ДЗ 7. Деревья ====&lt;br /&gt;
&lt;br /&gt;
[[https://github.com/hse-ds/iad-intro-ds/tree/master/2021/homeworks/hw07-trees-rf Ноутбук для заполнения]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Дедлайн&amp;#039;&amp;#039;&amp;#039;: мягкий дедлайн 1 июня 23:59, жёсткий дедлайн 8 июня 23:59.&lt;br /&gt;
&lt;br /&gt;
==== ДЗ 8. Бустинг и кластеризация ====&lt;br /&gt;
&lt;br /&gt;
[[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/homeworks/hw08_boosting_clustering.ipynb Ноутбук для заполнения]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Дедлайн&amp;#039;&amp;#039;&amp;#039;: мягкий дедлайн 16 июня 23:59, жёсткий дедлайн 19 июня 23:59.&lt;br /&gt;
&lt;br /&gt;
== Соревнования ==&lt;br /&gt;
&lt;br /&gt;
===Правила участия и оценивания===&lt;br /&gt;
В соревновании по анализу данных вам предлагается по имеющимся данным решить некоторую задачу, оптимизируя указанную метрику, и отправить ответы для заданного тестового множества. Максимальное количество посылок в сутки ограничено (как правило, разрешается сделать 2 посылки), ближе к концу соревнования вам будем необходимо выбрать 2 посылки, которые вы считаете лучшими. Тестовые данные делятся на публичные и приватные в некотором соотношении, на основе которых строятся публичный и приватный лидерборды соответственно, при этом публичный лидерборд доступен в течение всего соревнования, а приватный строится после его окончания для выбранных вами посылок.&lt;br /&gt;
&lt;br /&gt;
Студент, занявший в соревновании место i, получает оценку&lt;br /&gt;
&lt;br /&gt;
10 - 10 * (i - 1)  / M,&lt;br /&gt;
&lt;br /&gt;
где M — количество студентов, принявших участие в соревновании;&lt;br /&gt;
&lt;br /&gt;
i — место (начиная с 1) студента в приватном лидерборде среди всех таких студентов.&lt;br /&gt;
&lt;br /&gt;
Чтобы вас не пропустили при проверке решений соревнования, &amp;#039;&amp;#039;&amp;#039;необходимо&amp;#039;&amp;#039;&amp;#039; использовать следующий формат для имени команды (вкладка Team): &lt;br /&gt;
&lt;br /&gt;
«Имя Фамилия номер_группы»&lt;br /&gt;
&lt;br /&gt;
В течение 3 суток после окончания соревнования в соответствующее задание на anytask необходимо прислать код, воспроизводящий ответы для посылки, фигурирующей в приватном лидерборде. В случае отсутствия кода, воспроизводящего результат, в установленный срок студенту выставляется 0 в качестве оценки за соревнование. Если не оговорено иное, использовать любые внешние данные в соревнованиях &amp;#039;&amp;#039;&amp;#039;запрещено&amp;#039;&amp;#039;&amp;#039;. Под внешними данными понимаются размеченные данные, где разметка имеет прямое отношение к решаемой задаче. Грубо говоря, сборник текстов с википедии не считается внешними данными.&lt;br /&gt;
&lt;br /&gt;
== Контрольная работа ==&lt;br /&gt;
&lt;br /&gt;
Контрольная работа состоится 21 апреля на лекции в 11:10.&lt;br /&gt;
&lt;br /&gt;
Вопросы для подготовки: https://docs.google.com/document/d/1RJ0P-XcpWRqmXW4mD9uSHKTJBcQiEp1nMoTCCqIO-Hg/edit?usp=sharing&lt;br /&gt;
&lt;br /&gt;
[https://github.com/hse-ds/iad-intro-ds/blob/master/2021/kr/kr2021-var0.pdf Демо-вариант]&lt;br /&gt;
&lt;br /&gt;
На контрольной будет 4 вопроса. Два из них — по теории, где нужно будет объяснить одну из тем, разобранных на лекциях, или ответить на вопросы на понимание. Два вопроса — это задачи, примеры приведены ниже (но это просто для тренировки, список не исчерпывающий).&lt;br /&gt;
&lt;br /&gt;
Примеры задач:&lt;br /&gt;
* Метрические методы, kNN [[http://nbviewer.jupyter.org/github/shestakoff/minor_da_2017/blob/master/colloc_knn.ipynb Примеры задач]]&lt;br /&gt;
* Линейные методы [[https://github.com/esokolov/ml-minor-hse/blob/master/colloquium-2017/colloquium_minor_problems_linear.pdf Примеры задач]]&lt;br /&gt;
* Решающие деревья [[https://github.com/esokolov/ml-minor-hse/blob/master/colloquium-2017/colloquium_minor_problems_trees.ipynb Примеры задач]]&lt;br /&gt;
* Метрики качества [[https://github.com/esokolov/ml-minor-hse/blob/master/colloquium-2017/colloquium_minor_problems_metrics.ipynb Примеры задач]]&lt;br /&gt;
&lt;br /&gt;
== Экзамен ==&lt;br /&gt;
&lt;br /&gt;
Вопросы: https://docs.google.com/document/d/1VLDHSRsivy9KjzpBviErTq73rHpeRy_m1jXW6F_YFbg/edit?usp=sharing&lt;br /&gt;
&lt;br /&gt;
[https://github.com/esokolov/ml-minor-hse/blob/master/exam-2017/exam_problems_example.pdf Примеры задач прошлого года] (также могут войти задачи из коллоквиума)&lt;br /&gt;
&lt;br /&gt;
==Полезные материалы==&lt;br /&gt;
===Курсы по машинному обучению и анализу данных===&lt;br /&gt;
Максимально близко к материалам курса: [https://www.coursera.org/specializations/machine-learning-from-statistics-to-neural-networks Специализация &amp;quot;Машинное обучение: от статистики до нейросетей&amp;quot;] (речь про два курса: &amp;quot;Основы машинного обучения&amp;quot; и &amp;quot;Продвинутые методы машинного обучения&amp;quot;)&lt;br /&gt;
&lt;br /&gt;
Для тех, кто хочет подтянуть математику: [https://www.coursera.org/specializations/maths-for-data-analysis Специализация &amp;quot;Математика для анализа данных&amp;quot;]&lt;br /&gt;
&lt;br /&gt;
Более сложная версия этого курса с ПМИ: [[Машинное обучение 1]]&lt;br /&gt;
&lt;br /&gt;
Ещё материалы:&lt;br /&gt;
* [http://www.machinelearning.ru/wiki/index.php?title=Машинное_обучение_%28курс_лекций%2C_К.В.Воронцов%29 Курс по машинному обучению К.В. Воронцова]&lt;br /&gt;
* [https://yandexdataschool.ru/edu-process/courses/machine-learning Видеозаписи лекций курса Школы Анализа Данных, К.В. Воронцов]&lt;br /&gt;
* [https://www.coursera.org/specializations/machine-learning-data-analysis Coursera: Машинное обучение и анализ данных (специализация)]&lt;br /&gt;
* [https://www.coursera.org/learn/introduction-machine-learning Coursera: Введение в машинное обучение, К.В. Воронцов]&lt;br /&gt;
* [https://www.coursera.org/learn/machine-learning Coursera: Machine Learning, Andrew Ng]&lt;br /&gt;
&lt;br /&gt;
===Статьи===&lt;br /&gt;
* [http://www.toptal.com/machine-learning/machine-learning-theory-an-introductory-primer An Introduction to Machine Learning Theory and Its Applications: A Visual Tutorial with Examples]&lt;br /&gt;
* [http://www.r2d3.us/visual-intro-to-machine-learning-part-1/ A Visual Introduction to Machine Learning]&lt;br /&gt;
&lt;br /&gt;
===Книги===&lt;br /&gt;
* Mohammed J. Zaki, Wagner Meira Jr. Data Mining and Analysis. Fundamental Concepts and Algorithms. Cambridge University Press, 2014.&lt;br /&gt;
* Boris Mirkin. Core Concepts in Data Analysis: Summarization, Correlation, Visualization. 2010.&lt;br /&gt;
* James, Witten, Hastie, Tibshirani. An Introduction to Statistical Learning. 2013.&lt;br /&gt;
&lt;br /&gt;
== Страницы прошлых лет ==&lt;br /&gt;
&lt;br /&gt;
[[Введение_в_анализ_данных_(майнор_ИАД)_2019/2020 | 2019/20 учебный год]]&lt;br /&gt;
&lt;br /&gt;
[[Майнор_Интеллектуальный_анализ_данных/Введение_в_анализ_данных | 2018/19 учебный год ]]&lt;br /&gt;
&lt;br /&gt;
[[Майнор_Интеллектуальный_анализ_данных/Введение_в_анализ_данных/2017-2018 | 2017/18 учебный год ]]&lt;br /&gt;
&lt;br /&gt;
[[Майнор_Интеллектуальный_анализ_данных/Введение_в_анализ_данных/2016-2017 | 2016/17 учебный год ]]&lt;br /&gt;
&lt;br /&gt;
[[Майнор_Интеллектуальный_анализ_данных/Введение_в_анализ_данных/2015-2016 | 2015/16 учебный год ]]&lt;br /&gt;
&lt;br /&gt;
[[Category:Майнор &amp;quot;Интеллектуальный анализ данных&amp;quot;]]&lt;/div&gt;</summary>
		<author><name>imported&gt;Esokolov</name></author>
	</entry>
</feed>