<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
	<id>https://www.wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%9C%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_%D0%BD%D0%B0_%D0%B1%D0%BE%D0%BB%D1%8C%D1%88%D0%B8%D1%85_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85_145</id>
	<title>Машинное обучение на больших данных 145 - История изменений</title>
	<link rel="self" type="application/atom+xml" href="https://www.wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%9C%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_%D0%BD%D0%B0_%D0%B1%D0%BE%D0%BB%D1%8C%D1%88%D0%B8%D1%85_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85_145"/>
	<link rel="alternate" type="text/html" href="https://www.wikicshse.ru/index.php?title=%D0%9C%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_%D0%BD%D0%B0_%D0%B1%D0%BE%D0%BB%D1%8C%D1%88%D0%B8%D1%85_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85_145&amp;action=history"/>
	<updated>2026-06-07T02:30:28Z</updated>
	<subtitle>История изменений этой страницы в вики</subtitle>
	<generator>MediaWiki 1.45.3</generator>
	<entry>
		<id>https://www.wikicshse.ru/index.php?title=%D0%9C%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_%D0%BD%D0%B0_%D0%B1%D0%BE%D0%BB%D1%8C%D1%88%D0%B8%D1%85_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85_145&amp;diff=1450&amp;oldid=prev</id>
		<title>imported&gt;Aumnov: /* Семинары */</title>
		<link rel="alternate" type="text/html" href="https://www.wikicshse.ru/index.php?title=%D0%9C%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_%D0%BD%D0%B0_%D0%B1%D0%BE%D0%BB%D1%8C%D1%88%D0%B8%D1%85_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85_145&amp;diff=1450&amp;oldid=prev"/>
		<updated>2017-05-29T10:39:19Z</updated>

		<summary type="html">&lt;p&gt;&lt;span class=&quot;autocomment&quot;&gt;Семинары&lt;/span&gt;&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Новая страница&lt;/b&gt;&lt;/p&gt;&lt;div&gt;&lt;br /&gt;
=== Семинары ===&lt;br /&gt;
&lt;br /&gt;
==== Сверточные сети, продолжение (29.05) ====&lt;br /&gt;
&lt;br /&gt;
[https://www.dropbox.com/s/sgqmzena6a5miw1/test02.pdf?dl=0 Проверочная]&lt;br /&gt;
&lt;br /&gt;
==== Сверточные сети (22.05) ====&lt;br /&gt;
&lt;br /&gt;
==== Tensorflow (15.05) ====&lt;br /&gt;
&lt;br /&gt;
Для работы с Tensorflow нужно поднять машину с GPU (см. инструкцию на гитхабе). Там же уже лежат примеры кода на Tensorflow. На семинаре разбирались с синтаксисом и реализовывали логистическую регрессию и двухслойную нейронную сеть с L2-регуляризацией.&lt;br /&gt;
&lt;br /&gt;
==== Бустинг (24.04) ====&lt;br /&gt;
&lt;br /&gt;
Нужно обучить на данных модели для градиентного бустинга из Spark.Mllib и xgboost (опционально еще sklearn) и сравнить их время работы и качество. Вот данные: [https://www.dropbox.com/s/5yw1q7sjhw8sp5n/train.txt.zip?dl=0 train], [https://www.dropbox.com/s/w0dqf59ad7wci35/test.txt.zip?dl=0 test].&lt;br /&gt;
&lt;br /&gt;
==== Spark Mllib (17.04) ====&lt;br /&gt;
&lt;br /&gt;
Полезнцые ссылки:&lt;br /&gt;
* [http://spark.apache.org/docs/latest/ml-guide.html Общий гайд]&lt;br /&gt;
* [http://spark.apache.org/docs/latest/ml-pipeline.html Как делать пайплайны]&lt;br /&gt;
* [http://spark.apache.org/docs/latest/ml-tuning.html Как оптимизировать гиперпараметры]&lt;br /&gt;
&lt;br /&gt;
[https://www.dropbox.com/s/f2lxghgviaayjje/test01.pdf?dl=0 Проверочная].&lt;br /&gt;
&lt;br /&gt;
==== Azure, Spark (10.04) ====&lt;br /&gt;
&lt;br /&gt;
Полезные ссылки&lt;br /&gt;
&lt;br /&gt;
* [https://docs.microsoft.com/en-us/cli/azure/overview Документация по azure CLI]&lt;br /&gt;
* [https://docs.microsoft.com/en-us/azure/virtual-machines/linux/mac-create-ssh-keys Генерация ключей для Linux/Mac] и [https://docs.microsoft.com/en-us/azure/virtual-machines/linux/ssh-from-windows для Windows].&lt;br /&gt;
&lt;br /&gt;
Задачи на Spark (map-reduce):&lt;br /&gt;
&lt;br /&gt;
# Формат таблицы: (название города, (температура, день)). Найдите среднюю температуру по каждому городу.&lt;br /&gt;
# Формат таблицы: (название города, (температура, день)). Для каждого дня выведите список городов, где температура была выше средней в этот день.&lt;br /&gt;
# Формат таблицы: (ID человека, рост человека). Построить гистограмму средних значений роста при бутстрепе с числом выборок N.&lt;br /&gt;
# Формат таблицы: (ID, вектор). Посчитать косинус угла между всеми парами векторов. Известно, что у векторов очень большая размерность, но они являются разреженными.&lt;br /&gt;
# Формат таблицы: (ID вершины, список ID соседей вершины). Для вершины с заданным номером найти кратчайшие расстояния до всех остальных вершин.&lt;br /&gt;
&lt;br /&gt;
==== Vowpal Wabbit, Azure (03.04) ====&lt;br /&gt;
&lt;br /&gt;
Задание на Vowpal Wabbit:&lt;br /&gt;
&lt;br /&gt;
* Скачайте данные, разберитесь с форматом, конвертируйте его в формат VW&lt;br /&gt;
* Обучите линейную модель на обучающих данных, проверьте на тестовых&lt;br /&gt;
* Обучите модель с логистической функцией потерь&lt;br /&gt;
* (доп.) Обучите нелинейную модель и добейтесь с ее помощью более высокого качества&lt;br /&gt;
&lt;br /&gt;
[https://www.dropbox.com/s/8bv4xn7qbnbg8ql/train1kk.raw.gz?dl=0 Данные для обучения], [https://www.dropbox.com/s/trrxrjynnmbs3ba/test100k.raw.gz?dl=0 данные для тестирования],&lt;br /&gt;
[https://www.kaggle.com/c/avazu-ctr-prediction/data формат данных]&lt;br /&gt;
&lt;br /&gt;
По Azure:&lt;br /&gt;
&lt;br /&gt;
* На семинаре вы получили логин вида studentN и пароль к нему.&lt;br /&gt;
* Залогиньтесь на portal.azure.com с логином studentN@zimovnovgmail.onmicrosoft.com . Там пока ничего делать не нужно.&lt;br /&gt;
* Установите себе Azure CLI. &amp;#039;&amp;#039;Если его не получается установить, установите хотя бы генератор ssh-ключей: ssh-keygen для Unix или [https://docs.microsoft.com/ru-ru/azure/virtual-machines/virtual-machines-linux-ssh-from-windows см. тут] для Windows. На семинаре будем разбираться&amp;#039;&amp;#039;.&lt;br /&gt;
* Установите какую-нибудь утилиту для ssh-подключений: ssh для Unix или, например, PuTTY для Windows.&lt;/div&gt;</summary>
		<author><name>imported&gt;Aumnov</name></author>
	</entry>
</feed>