<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
	<id>https://www.wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%93%D0%BB%D1%83%D0%B1%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B4%D0%BB%D1%8F_%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%BE%D0%B2%D1%8B%D1%85_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85_23%2F24</id>
	<title>Глубинное обучение для текстовых данных 23/24 - История изменений</title>
	<link rel="self" type="application/atom+xml" href="https://www.wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%93%D0%BB%D1%83%D0%B1%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B4%D0%BB%D1%8F_%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%BE%D0%B2%D1%8B%D1%85_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85_23%2F24"/>
	<link rel="alternate" type="text/html" href="https://www.wikicshse.ru/index.php?title=%D0%93%D0%BB%D1%83%D0%B1%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B4%D0%BB%D1%8F_%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%BE%D0%B2%D1%8B%D1%85_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85_23/24&amp;action=history"/>
	<updated>2026-06-06T12:38:59Z</updated>
	<subtitle>История изменений этой страницы в вики</subtitle>
	<generator>MediaWiki 1.45.3</generator>
	<entry>
		<id>https://www.wikicshse.ru/index.php?title=%D0%93%D0%BB%D1%83%D0%B1%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B4%D0%BB%D1%8F_%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%BE%D0%B2%D1%8B%D1%85_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85_23/24&amp;diff=2141&amp;oldid=prev</id>
		<title>imported&gt;Amshabalin: Migrated current public revision from wiki.cs.hse.ru</title>
		<link rel="alternate" type="text/html" href="https://www.wikicshse.ru/index.php?title=%D0%93%D0%BB%D1%83%D0%B1%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B4%D0%BB%D1%8F_%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%BE%D0%B2%D1%8B%D1%85_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85_23/24&amp;diff=2141&amp;oldid=prev"/>
		<updated>2023-12-06T21:55:31Z</updated>

		<summary type="html">&lt;p&gt;Migrated current public revision from wiki.cs.hse.ru&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Новая страница&lt;/b&gt;&lt;/p&gt;&lt;div&gt;== О курсе ==&lt;br /&gt;
&lt;br /&gt;
NLP (Natural Language Processing) — это область машинного обучения, которая пытается научить компьютер понимать и обрабатывать текстовые данные. NLP лежит в основе множества технологий, таких как системы перевода и генерации текстов, голосовые помощники, суммаризаторы текстов, спам детекторы и так далее. В настоящее время такие технологии не только облегчают жизнь людям, решая несложные задачи быстрее них. Часто модели машинного обучения позволяют достигать более высокого качества и оказываются “умнее” многих людей. Примером такой модели может стать нашумевшая ChatGPT, способная корректно отвечать на вопросы по самым различным темам.&lt;br /&gt;
&lt;br /&gt;
В курсе мы постараемся дать вам понять и прочувствовать, что происходит в мире естественной обработки языка. Какие задачи бывают, какие проблемы встречаются в ходе их решения. Мы покажем, что NLP — это не набор пар (задача, решение), а общие идеи, которые применимы для решения множества задач и отражают некоторую общую концепцию.&lt;br /&gt;
&lt;br /&gt;
== Расписание ==&lt;br /&gt;
&lt;br /&gt;
Лекции: каждый четверг в 13:00. [https://us06web.zoom.us/j/82787261695?pwd=NMn5vbXnRMZyYUwWUupRt3fuku9dEI.1 Ссылка на зум.]&lt;br /&gt;
&lt;br /&gt;
Семинары: каждый четверг в 14:40. [https://us06web.zoom.us/j/87691588564?pwd=sjjlq6PGnfytOblOabfCenyj3HeoHA.1 Сашин зум], [https://us06web.zoom.us/j/89472421221?pwd=KJSmLyd4tRD1EMkTTGOWYdBGSNDtvv.1 Славин зум].&lt;br /&gt;
&lt;br /&gt;
== Полезные ссылки ==&lt;br /&gt;
&lt;br /&gt;
Общий чат курса в telegram: https://t.me/+Nc5s_kMhUE44MWM6&lt;br /&gt;
&lt;br /&gt;
Репозиторий курса на github: https://github.com/ashaba1in/hse-nlp&lt;br /&gt;
&lt;br /&gt;
Плейлист с записями лекций: https://www.youtube.com/playlist?list=PLEwK9wdS5g0pc4NeOQqGLPcxmBHGUjnWB&lt;br /&gt;
&lt;br /&gt;
Ссылка на anytask: https://anytask.org/course/1053&lt;br /&gt;
&lt;br /&gt;
Инвайты: Сашина группа - &amp;#039;&amp;#039;&amp;#039;Vai3xuK&amp;#039;&amp;#039;&amp;#039;, Славина группа - &amp;#039;&amp;#039;&amp;#039;Kutq97v&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
[https://docs.google.com/spreadsheets/d/1J7zVSrdglNnnVgoTmrgC1YlPBlY1M8LViqjRlLdC0MY/edit?usp=sharing Табличка] с оценками.&lt;br /&gt;
&lt;br /&gt;
== Преподаватели и ассистенты ==&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Преподаватели !! Ассистенты&lt;br /&gt;
|-&lt;br /&gt;
| [https://t.me/amshabalin Александр Шабалин] || [https://t.me/leksious Алексей Панков]&lt;br /&gt;
|-&lt;br /&gt;
| [https://t.me/meshchaninov01 Вячеслав Мещанинов] ||&lt;br /&gt;
|-&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
== Темы курса ==&lt;br /&gt;
&lt;br /&gt;
1. Методы получения эмбеддингов слов: Счетные методы, Word2vec, GLOVE. Записи: [https://www.youtube.com/watch?v=Ji68egxAWgw лекция], [https://www.youtube.com/watch?v=My80O5Vx6fs&amp;amp;list=PLEwK9wdS5g0pc4NeOQqGLPcxmBHGUjnWB&amp;amp;index=2 семинар]&lt;br /&gt;
&lt;br /&gt;
2. Классификация текста. Записи: [https://www.youtube.com/watch?v=mNs0_icYp4I лекция], [https://www.youtube.com/watch?v=FFmsejByamQ&amp;amp;list=PLEwK9wdS5g0pc4NeOQqGLPcxmBHGUjnWB&amp;amp;index=4 семинар]&lt;br /&gt;
&lt;br /&gt;
3. Токенизация, языковые модели. Записи: [https://www.youtube.com/watch?v=_WPXfEAsbTE лекция], [https://www.youtube.com/watch?v=RrdYiCs2-zI&amp;amp;list=PLEwK9wdS5g0pc4NeOQqGLPcxmBHGUjnWB&amp;amp;index=6 семинар]&lt;br /&gt;
&lt;br /&gt;
4. Рекуррентные нейронные сети. Записи: [https://www.youtube.com/watch?v=9BBGEMI50O8&amp;amp;list=PLEwK9wdS5g0pc4NeOQqGLPcxmBHGUjnWB&amp;amp;index=7 лекция], [https://www.youtube.com/watch?v=6ojpRmCea0M&amp;amp;list=PLEwK9wdS5g0pc4NeOQqGLPcxmBHGUjnWB&amp;amp;index=8 семинар]&lt;br /&gt;
&lt;br /&gt;
5. Seq2seq задача, механизм внимания, трансформер. Записи: [https://www.youtube.com/watch?v=0_t0-uvihJ0&amp;amp;list=PLEwK9wdS5g0pc4NeOQqGLPcxmBHGUjnWB&amp;amp;index=10 лекция], [https://www.youtube.com/watch?v=E1btQgjPt2o&amp;amp;list=PLEwK9wdS5g0pc4NeOQqGLPcxmBHGUjnWB&amp;amp;index=9 семинар]&lt;br /&gt;
&lt;br /&gt;
6. Трансформерные модели: GPT, BERT. Записи: [https://www.youtube.com/watch?v=rZFu1UoOejo&amp;amp;list=PLEwK9wdS5g0pc4NeOQqGLPcxmBHGUjnWB&amp;amp;index=11 лекция], [https://www.youtube.com/watch?v=iMuqGlDyxLQ&amp;amp;list=PLEwK9wdS5g0pc4NeOQqGLPcxmBHGUjnWB&amp;amp;index=12 семинар]&lt;br /&gt;
&lt;br /&gt;
7. Как дообучать предобученные модели? Почему дообучать модель целиком не всегда хорошо? Parameter-Efficient Fine-Tunning (PEFT). Записи: [https://www.youtube.com/watch?v=Ylj9M_Ufy64&amp;amp;list=PLEwK9wdS5g0pc4NeOQqGLPcxmBHGUjnWB&amp;amp;index=14 лекция], [https://www.youtube.com/watch?v=qlyTrdLMrKs&amp;amp;list=PLEwK9wdS5g0pc4NeOQqGLPcxmBHGUjnWB&amp;amp;index=15 семинар]&lt;br /&gt;
&lt;br /&gt;
8. Ускорение и сжатие модели. Дистилляция знаний, Квантизация. Записи: [https://www.youtube.com/watch?v=dUMZvLLtKPI&amp;amp;list=PLEwK9wdS5g0pc4NeOQqGLPcxmBHGUjnWB&amp;amp;index=17 лекция], [https://www.youtube.com/watch?v=32IrfjUlp3U&amp;amp;list=PLEwK9wdS5g0pc4NeOQqGLPcxmBHGUjnWB&amp;amp;index=17 семинар]&lt;br /&gt;
&lt;br /&gt;
9. Трюки для обучения трансформеров, работа с длинным контекстом. Записи: [https://www.youtube.com/watch?v=gIya8SHsX2s&amp;amp;list=PLEwK9wdS5g0pc4NeOQqGLPcxmBHGUjnWB&amp;amp;index=18 лекция], [https://www.youtube.com/watch?v=C8Rw99tdqqc&amp;amp;list=PLEwK9wdS5g0pc4NeOQqGLPcxmBHGUjnWB&amp;amp;index=19 семинар]&lt;br /&gt;
&lt;br /&gt;
10. Text style transfer. Записи: лекция (будет), семинар не проводился.&lt;br /&gt;
&lt;br /&gt;
== Домашние задания ==&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Домашнее задание 1&amp;#039;&amp;#039;&amp;#039;: Задание посвящено обучению векторных представлений слов.&lt;br /&gt;
&lt;br /&gt;
Ссылка на [https://github.com/ashaba1in/hse-nlp/blob/main/homeworks/hw1/hw1.ipynb ноутбук] с заданием.&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Домашнее задание 2&amp;#039;&amp;#039;&amp;#039;: Задание посвящено обучению сверточных и рекуррентных нейронных сетей для задачи бинарной классификации.&lt;br /&gt;
&lt;br /&gt;
Ссылка на [https://github.com/ashaba1in/hse-nlp/blob/main/homeworks/hw2/hw2.ipynb ноутбук] с заданием.&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Домашнее задание 3&amp;#039;&amp;#039;&amp;#039;: Задание посвящено обучению моделей на основе архитектуры Трансформер для задачи генерации текста, а так же методам семплирования токенов.&lt;br /&gt;
&lt;br /&gt;
Ссылка на [https://github.com/ashaba1in/hse-nlp/blob/main/homeworks/hw3/hw3.ipynb ноутбук] с заданием.&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Домашнее задание 4&amp;#039;&amp;#039;&amp;#039;: Задание посвящено уменьшению размеров предобученной модели при дообучении на downstream задачу.&lt;br /&gt;
&lt;br /&gt;
Ссылка на [https://github.com/ashaba1in/hse-nlp/blob/main/homeworks/hw4/hw4.ipynb ноутбук] с заданием.&lt;br /&gt;
&lt;br /&gt;
== Контрольная работа ==&lt;br /&gt;
Контрольная работа пройдет 02.11.2023 на лекции в формате письменной работы на 80 минут. [https://docs.google.com/document/d/15jkjm8w-TaTSzztuOCLjOeIh2SaABh6a4t2J0Aho31I/edit?usp=sharing Вопросы для подготовки].&lt;br /&gt;
&lt;br /&gt;
== Формула оценок ==&lt;br /&gt;
&lt;br /&gt;
Определим накопленную оценку как &amp;#039;&amp;#039;Накоп&amp;#039;&amp;#039; = (0.4 * ДЗ + 0.3 * КР) / 0.7.&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;Итог&amp;#039;&amp;#039; = &amp;#039;&amp;#039;Округление&amp;#039;&amp;#039;(0.7 * Накоп + 0.3 * Э). Округление арифметическое.&lt;br /&gt;
&lt;br /&gt;
* ДЗ — средняя оценка за домашние задания&lt;br /&gt;
* КР — оценка за контрольную работу&lt;br /&gt;
* Э — оценка за экзамен&lt;br /&gt;
&lt;br /&gt;
Если &amp;#039;&amp;#039;Накоп&amp;#039;&amp;#039; &amp;gt;= 8, то студент может получить &amp;#039;&amp;#039;Округление&amp;#039;&amp;#039;(&amp;#039;&amp;#039;Накоп&amp;#039;&amp;#039;) в качестве итоговой оценки, не приходя на экзамен.&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Формат экзамена&amp;#039;&amp;#039;&amp;#039;: устный.&lt;/div&gt;</summary>
		<author><name>imported&gt;Amshabalin</name></author>
	</entry>
</feed>