<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
	<id>https://www.wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%90%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85_%D0%B2_Python_2020-2021</id>
	<title>Анализ данных в Python 2020-2021 - История изменений</title>
	<link rel="self" type="application/atom+xml" href="https://www.wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%90%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85_%D0%B2_Python_2020-2021"/>
	<link rel="alternate" type="text/html" href="https://www.wikicshse.ru/index.php?title=%D0%90%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85_%D0%B2_Python_2020-2021&amp;action=history"/>
	<updated>2026-06-06T12:29:44Z</updated>
	<subtitle>История изменений этой страницы в вики</subtitle>
	<generator>MediaWiki 1.45.3</generator>
	<entry>
		<id>https://www.wikicshse.ru/index.php?title=%D0%90%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85_%D0%B2_Python_2020-2021&amp;diff=807&amp;oldid=prev</id>
		<title>imported&gt;Rogovich: Migrated current public revision from wiki.cs.hse.ru</title>
		<link rel="alternate" type="text/html" href="https://www.wikicshse.ru/index.php?title=%D0%90%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85_%D0%B2_Python_2020-2021&amp;diff=807&amp;oldid=prev"/>
		<updated>2020-12-15T11:28:45Z</updated>

		<summary type="html">&lt;p&gt;Migrated current public revision from wiki.cs.hse.ru&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Новая страница&lt;/b&gt;&lt;/p&gt;&lt;div&gt;== О курсе ==&lt;br /&gt;
&amp;quot;Анализ данных в Python&amp;quot; читается на 4 курсе, в 1 и 2 модуле.&lt;br /&gt;
&lt;br /&gt;
* [https://www.hse.ru/ba/political/courses/375301964.html Программа]&lt;br /&gt;
* [https://t.me/joinchat/BVSknBmorE6t6qtUtwhucA Чат курса в Telegram]&lt;br /&gt;
* [https://docs.google.com/spreadsheets/d/1cBEsiEBY86Fu6BgwXrOXBpI00FnRfT0rG96m8Ltp8p4/edit#gid=0 Ведомость]&lt;br /&gt;
&lt;br /&gt;
==Преподаватель==&lt;br /&gt;
Рогович Татьяна Владимировна&lt;br /&gt;
* [mailto:rogovich@gmail.com E-mail]&lt;br /&gt;
&lt;br /&gt;
==Ассистент==&lt;br /&gt;
Инсан-Александр Латыпов&lt;br /&gt;
* @Le_Figaro в Telegram&lt;br /&gt;
&lt;br /&gt;
== Материалы курса ==&lt;br /&gt;
[https://www.anaconda.com/distribution/#download-section Дистрибутив для установки Anaconda на собственные компьютеры]&lt;br /&gt;
Пожалуйста, устанавливайте версию Python 3.7 и выше.&lt;br /&gt;
&lt;br /&gt;
== Лекции и семинары ==&lt;br /&gt;
Записи занятий на youtube: [https://www.youtube.com/playlist?list=PLEwK9wdS5g0pQEYHkLoQRynJM5UmICCAW жмяк]&lt;br /&gt;
===Лекции и семинары===&lt;br /&gt;
Все блокноты и семинары: [https://github.com/rogovich/2020_POL_Data_Analysis_in_Python репозиторий]&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Дата !! № !! Блокноты и презентации !! Данные !! Доп. материалы&lt;br /&gt;
|-&lt;br /&gt;
|| 17.09, 24.09 || Python Refresher ||  [https://github.com/rogovich/2020_POL_Data_Analysis_in_Python/tree/master/01_Python_Refresher Блокноты] || || [https://github.com/rogovich/2020_POL_Data_Analysis_in_Python/tree/master/01_Python_Refresher/%40Problems Задачи и решения]&lt;br /&gt;
|-&lt;br /&gt;
|| 1.10 || Numpy ||  [https://github.com/rogovich/2020_POL_Data_Analysis_in_Python/blob/master/02_Numpy/2_1_Numpy.ipynb Блокнот] ||  || [https://github.com/rogovich/2020_POL_Data_Analysis_in_Python/blob/master/02_Numpy/2_2_Numpy_Problems.ipynb Задачи для самопроверки]&lt;br /&gt;
|-&lt;br /&gt;
|| 15.10, 27.10 || Intro to Pandas (Titanic) ||  [https://github.com/rogovich/2020_POL_Data_Analysis_in_Python/blob/master/03_Pandas/3_1_Pandas_Intro.ipynb Блокнот] || [https://raw.githubusercontent.com/rogovich/Data/master/data/titanic/train.csv train.csv] || [https://github.com/rogovich/2020_POL_Data_Analysis_in_Python/blob/master/03_Pandas/3_2_Pandas_Problems.ipynb Задачи для самопроверки]&lt;br /&gt;
|-&lt;br /&gt;
|| 3.11 || Pandas DateTime. Визуализация с Matplotlib || [https://github.com/rogovich/2020_POL_Data_Analysis_in_Python/blob/master/03_Pandas/3_3_Pandas_Datetime.ipynb DataTime блокнот] [https://github.com/rogovich/2020_POL_Data_Analysis_in_Python/blob/master/04_VIZ_Matplotlib/4_1_Viz_Matplotlib.ipynb Matplotlib блокнот]&lt;br /&gt;
|| [https://raw.githubusercontent.com/rogovich/Data/master/data/ufo/ufo.csv ufo.csv] [https://raw.githubusercontent.com/rogovich/Data/master/data/populations.txt populations.csv] [https://raw.githubusercontent.com/rogovich/Data/master/data/crimeRatesByState2005.tsv crimeRatesByState2005.tsv] [https://raw.githubusercontent.com/rogovich/Data/master/data/gapminderData.csv gapminderData.csv] [https://raw.githubusercontent.com/rogovich/Data/master/data/bodycount_Directors_Genra.csv Films] || &lt;br /&gt;
|-&lt;br /&gt;
|| 10.11 || Визуализация в Plotly. || [https://github.com/rogovich/2020_POL_Data_Analysis_in_Python/blob/master/05_VIZ_Plotly/5_1_Plotly.ipynb Plotly блокнот]&lt;br /&gt;
[https://github.com/rogovich/2020_POL_Data_Analysis_in_Python/blob/master/05_VIZ_Plotly/5_2_Plotly_Spiderchart.ipynb Spiderchart блокнот] &lt;br /&gt;
|| [https://raw.githubusercontent.com/rogovich/Data/master/data/countries_radar_plot.txt Spidertchart data] [https://raw.githubusercontent.com/rogovich/Data/master/data/iris.csv iris data] [https://raw.githubusercontent.com/rogovich/Data/master/data/biggest_tests.csv Nuclear tests] [https://raw.githubusercontent.com/rogovich/Data/master/data/tests_coor.csv Coordinates] ||&lt;br /&gt;
|-&lt;br /&gt;
|| 17.11 || Web-scraping ||[https://github.com/rogovich/2020_POL_Data_Analysis_in_Python/tree/master/06_Scraping Блокноты] || || &lt;br /&gt;
|-&lt;br /&gt;
|| 20.11 || Введение в ML || [https://docs.google.com/presentation/d/1iz_64A_nWXcFhHi0_rv931SPKQ-ONI28AvUKMey1BCo/edit?usp=sharing Что такое данные и какие задачи может решать ML? Презентация]  || ||&lt;br /&gt;
|-&lt;br /&gt;
|| 24.11 || Логика решения задач ML || [https://docs.google.com/presentation/d/1bgDLXdZy2FIh1D-OhvrmCT5E6wQ1-hAu5b4y0UWccPs/edit?usp=sharing Презентация] [https://github.com/rogovich/2020_POL_Data_Analysis_in_Python/blob/master/07_ML_Intro/7_1_Titanic_Kaggle_Predictions.ipynb Kaggle блокнот] || [https://raw.githubusercontent.com/rogovich/Data/master/data/titanic/gender_submission.csv gender_submission] [https://raw.githubusercontent.com/rogovich/Data/master/data/titanic/train.csv train.csv] [https://raw.githubusercontent.com/rogovich/Data/master/data/titanic/test.csv test.csv] ||&lt;br /&gt;
|-&lt;br /&gt;
|| 1.12 - 4.12 || Логика машинного обучения. Решающее дерево и случайный лес || [https://docs.google.com/presentation/d/10FrEl-4Qrz41c3-g-EtgAS8O6VDxOKojZKbcw2cpp7g/edit?usp=sharing Презентация] [https://github.com/rogovich/2020_POL_Data_Analysis_in_Python/blob/master/07_ML_Intro/7_2_Houses_EDA.ipynb EDA Блокнот] [https://github.com/rogovich/2020_POL_Data_Analysis_in_Python/blob/master/07_ML_Intro/7_3_Houses_ML.ipynb Предсказываем цену домов. Блокнот] [https://github.com/rogovich/2020_POL_Data_Analysis_in_Python/blob/master/07_ML_Intro/7_3_Houses_ML.ipynb Дома. Для урока] || [https://raw.githubusercontent.com/rogovich/Data/master/data/house_data.csv Дома. Данные] ||&lt;br /&gt;
|-&lt;br /&gt;
|| 8.12 || ML: задача классификации. Cross validation и grid search || [https://github.com/rogovich/2020_POL_Data_Analysis_in_Python/blob/master/07_ML_Intro/7_5_Titanic_Kaggle.ipynb Титаник: блокнот для занятия]  || ||&lt;br /&gt;
|-&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
===Домашние задания===&lt;br /&gt;
Домашние задания находим в проектах в ЛМС и там же сдаем.&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! ДЗ !! Дедлайн !! Файлы &lt;br /&gt;
|-&lt;br /&gt;
|| ДЗ1: Python || 1.10 23.59 ||&lt;br /&gt;
|-&lt;br /&gt;
|| ДЗ2: Pandas &amp;amp; Viz || 1.12 23.59 || [https://docs.google.com/document/d/1cYtkPh11xbMIT6wEsgamx9T_n7gr2zsDro_rpd_sRMs/edit?usp=sharing ДЗ]&lt;br /&gt;
|-&lt;br /&gt;
|| ДЗ3: KNN || 11.12 23.59 || [https://github.com/rogovich/2020_POL_Data_Analysis_in_Python/blob/master/%40HW/3HW/HW_3_KNN.ipynb ДЗ3]&lt;br /&gt;
|-&lt;br /&gt;
|| ДЗ4: ML || 15.12 23.59 || Демо-вариант КР&lt;br /&gt;
|-&lt;br /&gt;
&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
===Контрольные работы===&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! КР !! ДАТА !! Тестовый вариант&lt;br /&gt;
|-&lt;br /&gt;
|| КР1: Python || 8.10 11:10 || [https://online.hse.ru/mod/quiz/view.php?id=156049 Жмяк]&lt;br /&gt;
|-&lt;br /&gt;
|| КР2: Анализ данных и ML || 18.12 || &lt;br /&gt;
|-&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;КР1&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
*  Проводится во время занятия по расписанию. &lt;br /&gt;
*  Тест и задачи будут опубликованы на online.hse.ru (проверьте логины заранее, мы не сможем вам оперативно помочь!)&lt;br /&gt;
*  Задания по типу и количеству аналогичны демонстрационному варианту.&lt;br /&gt;
*  Во время контрольной у вас должна быть включена камера в zoom и предоставлен доступ к экрану (прокторинг нашими силами на минималках).&lt;br /&gt;
&lt;br /&gt;
===Дополнительные баллы===&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Дополнительные баллы рассчитываются по следующей формуле:&lt;br /&gt;
&lt;br /&gt;
* 8+ заданий: 1.5 балла&lt;br /&gt;
* 5-7 заданий: 1 балл&lt;br /&gt;
* &amp;lt;5 заданий: 0 баллов&lt;br /&gt;
&lt;br /&gt;
Баллы прибавляются к итоговой оценке до округления.&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Номер !! Платформа !! Дедлайн&lt;br /&gt;
|-&lt;br /&gt;
| 1 || DataCamp. Pandas || 3 ноября 23.59&lt;br /&gt;
|-&lt;br /&gt;
| 2 || LMS. Pandas || 11 ноября 23.59&lt;br /&gt;
|-&lt;br /&gt;
| 3 || DataCamp. Viz || 18 ноября 23.59&lt;br /&gt;
|-&lt;br /&gt;
| 4 || DataCamp. Project || 25 ноября 23.59&lt;br /&gt;
|-&lt;br /&gt;
| 5 || Scraping || 3 декабря 23.59&lt;br /&gt;
|-&lt;br /&gt;
| 6 || KNN (ДЗ) + 2 балла || 11 декабря 23.59&lt;br /&gt;
|-&lt;br /&gt;
| 7 || DC || 20 декабря 23.59&lt;br /&gt;
|-&lt;br /&gt;
| 8 || DC + 2 балла || 27 декабря 23.59&lt;br /&gt;
|-&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
У студентов есть возможность получить до полутора&lt;br /&gt;
дополнительных баллов за выполнение необязательных заданий в течение&lt;br /&gt;
семестра. Дополнительные баллы учитываются в итоговой оценке до&lt;br /&gt;
округления с весом 1. Обратите внимания, что дополнительные задания,&lt;br /&gt;
выполненные в рамках онлайн курса засчитываются только при условии&lt;br /&gt;
прохождения исключительно с корпоративного почтового адреса студента.&lt;br /&gt;
Подключение студентов к онлайн курсу на платформе НПОО&lt;br /&gt;
(https://openedu.ru/) производит Дирекция по онлайн обучению НИУ ВШЭ&lt;br /&gt;
по заявке администратора учебного офиса образовательной программы.&lt;br /&gt;
Скрытая сессия для студентов ВШЭ автоматически появляется в личном&lt;br /&gt;
аккаунте на платформе. Регистрироваться на открытую сессию для всех&lt;br /&gt;
желающих слушателей нельзя. На платформе DataCamp слушатели&lt;br /&gt;
приглашаются в специальную сессию, созданную преподавателем курса.&lt;br /&gt;
&lt;br /&gt;
Всего за семестр будет дано 10 небольших заданий. У каждого свой дедлайн. &lt;br /&gt;
Задания будут выложены на вики и в ЛМС, решенные блокноты принимаются в ЛМС. После дедлайна задания не принимаются.&lt;br /&gt;
В качестве некоторых заданий будет предложено пройти часть онлайн курса или выполнить его задания.&lt;br /&gt;
Оценка за задание не ставится, задание считается выполненным, если оно выполнено на 100% (допускаются небольшие помарки, в этом случае выполнение засчитывается на усмотрение преподавателя).&lt;br /&gt;
&lt;br /&gt;
===Экзамен===&lt;br /&gt;
[https://docs.google.com/document/d/1va0obkBPIpdLTZa4vT_RO0nFKjFUiuTV1neuBItFdoE/edit?usp=sharing Описание экзамена и требования]&lt;br /&gt;
&lt;br /&gt;
===Оценка===&lt;br /&gt;
Окончательная оценка = Округление(0.35 * среднее(Домашние задания) + 0.35 * среднее(Контрольные работы) + 0.3 * Экзамен)&lt;br /&gt;
&lt;br /&gt;
Домашние задания выдаются по темам: программирование на Python, скрейпинг, визуализация, реализация алгоритма kNN.&lt;br /&gt;
Контрольные работы по темам: программирование на Python, работа с данными Pandas.&lt;br /&gt;
&lt;br /&gt;
Формат контрольных работ пока не определен (очно или дистанционно), будет сообщено позднее.&lt;br /&gt;
&lt;br /&gt;
Преподаватель оставляет за собой право изменить темы домашних и контрольных работы, а также устроить устную защиту любой из&lt;br /&gt;
форм контроля.&lt;br /&gt;
&lt;br /&gt;
Домашнее задание должно быть сдано до установленного дедлайна. В случае&lt;br /&gt;
сдачи в течение суток после дедлайна, оценка снижается на 1 балл. В случае&lt;br /&gt;
сдачи в течение недели после дедлайна, оценка снижается на 2 балла. Работы,&lt;br /&gt;
сданные позже, не принимаются и за них выставляется оценка «0».&lt;br /&gt;
&lt;br /&gt;
== Список рекомендуемых материалов ==&lt;br /&gt;
&lt;br /&gt;
==== Линейная алгебра и статистика ====&lt;br /&gt;
* [https://web.stanford.edu/~hastie/ElemStatLearn/ Hastie, Tibshirani, Friedman. (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction.]&lt;br /&gt;
* [http://people.math.umass.edu/~lavine/Book/book.pdf Lavine. (2013). Introduction to Statistical Thought]&lt;br /&gt;
* [https://ocw.mit.edu/courses/mathematics/18-06-linear-algebra-spring-2010/ MIT Open course: Linear Algebra by Strang]&lt;br /&gt;
&lt;br /&gt;
====Python====&lt;br /&gt;
* [https://github.com/pandas-dev/pandas/blob/master/doc/cheatsheet/Pandas_Cheat_Sheet.pdf Pandas Cheat Sheet]&lt;br /&gt;
* [http://www.pyregex.com/ Python RegExp Cheat Sheet]&lt;br /&gt;
* [http://opencarts.org/sachlaptrinh/pdf/28232.pdf O&amp;#039;Reilly: Python for Data Analysis]&lt;br /&gt;
* [https://stepik.org/course/67/syllabus Базовый курс по программированию на Stepik]&lt;br /&gt;
&lt;br /&gt;
==== Machine learning ====&lt;br /&gt;
* [http://users.isr.ist.utl.pt/~wurmd/Livros/school/Bishop%20-%20Pattern%20Recognition%20And%20Machine%20Learning%20-%20Springer%20%202006.pdf Bishop. (2006). Pattern Recognition and Machine Learning]&lt;br /&gt;
* [http://www.machinelearning.ru/wiki/index.php?title=Машинное_обучение_%28курс_лекций%2C_К.В.Воронцов%29 Курс по машинному обучению К.В. Воронцова]&lt;br /&gt;
* [https://www.coursera.org/learn/machine-learning Coursera: Machine Learning by Andrew Ng]&lt;br /&gt;
* [http://shop.oreilly.com/product/0636920018483.do O&amp;#039;Reilly: Machine Learning for Hackers]&lt;br /&gt;
&lt;br /&gt;
==== Материала по ML ====&lt;br /&gt;
* [https://www.kaggle.com/learn/machine-learning Simple Decision Tree]&lt;br /&gt;
* [https://books.google.ru/books?id=vbQlDQAAQBAJ&amp;amp;dq=Introduction+to+Machine+Learning+with+Python:+A+Guide+for+Data+Scientists&amp;amp;hl=ru&amp;amp;source=gbs_navlinks_s Andreas C. Müller, Sarah Guido. Introduction to Machine Learning with Python: A Guide for Data Scientists]&lt;br /&gt;
&lt;br /&gt;
====Статистика====&lt;br /&gt;
* Бослав С. Статистика для всех (Есть в библиотеке)&lt;br /&gt;
* Gravetter F, Wallnau L. Statistics for behavioral sciences (Есть в библиотеке)&lt;br /&gt;
&lt;br /&gt;
==== Web scraping ====&lt;br /&gt;
* [http://shop.oreilly.com/product/0636920028468.do O&amp;#039;Reilly: RESTful Web APIs]&lt;/div&gt;</summary>
		<author><name>imported&gt;Rogovich</name></author>
	</entry>
</feed>