<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
	<id>https://www.wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%9C%D0%9E%D0%92%D0%A1_%D0%A2%D1%80%D0%B0%D0%BD%D1%81%D1%84%D0%BE%D1%80%D0%BC%D0%B5%D1%80%D1%8B_%28%D0%9C%D0%9C%D0%9E%D0%92%D0%A123%2C_5_%D0%BC%D0%BE%D0%B4%D1%83%D0%BB%D1%8C%29</id>
	<title>МОВС Трансформеры (ММОВС23, 5 модуль) - История изменений</title>
	<link rel="self" type="application/atom+xml" href="https://www.wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%9C%D0%9E%D0%92%D0%A1_%D0%A2%D1%80%D0%B0%D0%BD%D1%81%D1%84%D0%BE%D1%80%D0%BC%D0%B5%D1%80%D1%8B_%28%D0%9C%D0%9C%D0%9E%D0%92%D0%A123%2C_5_%D0%BC%D0%BE%D0%B4%D1%83%D0%BB%D1%8C%29"/>
	<link rel="alternate" type="text/html" href="https://www.wikicshse.ru/index.php?title=%D0%9C%D0%9E%D0%92%D0%A1_%D0%A2%D1%80%D0%B0%D0%BD%D1%81%D1%84%D0%BE%D1%80%D0%BC%D0%B5%D1%80%D1%8B_(%D0%9C%D0%9C%D0%9E%D0%92%D0%A123,_5_%D0%BC%D0%BE%D0%B4%D1%83%D0%BB%D1%8C)&amp;action=history"/>
	<updated>2026-06-08T15:51:58Z</updated>
	<subtitle>История изменений этой страницы в вики</subtitle>
	<generator>MediaWiki 1.45.3</generator>
	<entry>
		<id>https://www.wikicshse.ru/index.php?title=%D0%9C%D0%9E%D0%92%D0%A1_%D0%A2%D1%80%D0%B0%D0%BD%D1%81%D1%84%D0%BE%D1%80%D0%BC%D0%B5%D1%80%D1%8B_(%D0%9C%D0%9C%D0%9E%D0%92%D0%A123,_5_%D0%BC%D0%BE%D0%B4%D1%83%D0%BB%D1%8C)&amp;diff=1247&amp;oldid=prev</id>
		<title>imported&gt;Murrcha: Migrated current public revision from wiki.cs.hse.ru</title>
		<link rel="alternate" type="text/html" href="https://www.wikicshse.ru/index.php?title=%D0%9C%D0%9E%D0%92%D0%A1_%D0%A2%D1%80%D0%B0%D0%BD%D1%81%D1%84%D0%BE%D1%80%D0%BC%D0%B5%D1%80%D1%8B_(%D0%9C%D0%9C%D0%9E%D0%92%D0%A123,_5_%D0%BC%D0%BE%D0%B4%D1%83%D0%BB%D1%8C)&amp;diff=1247&amp;oldid=prev"/>
		<updated>2024-09-04T09:23:55Z</updated>

		<summary type="html">&lt;p&gt;Migrated current public revision from wiki.cs.hse.ru&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Новая страница&lt;/b&gt;&lt;/p&gt;&lt;div&gt;==О курсе==&lt;br /&gt;
&lt;br /&gt;
Курс читается для студентов 2 курса магистратуры &amp;quot;Машинное обучение и высоконагруженные системы&amp;quot; в 1 модуле 2024/2025 учебного года (5 модуль).&lt;br /&gt;
&lt;br /&gt;
Разберём основные вехи развития трансформеров и механизмы их функционирования, рассмотрим разные концепции задач, решаемых с помощью трансформерных моделей, отдельно остановимся на предлагаемых в разное время модификациях «ванильной» архитектуры, сфокусируемся на decoder-only вариации вообще и современных LLM в частности.&lt;br /&gt;
 &lt;br /&gt;
Время занятий: TBD&lt;br /&gt;
&lt;br /&gt;
==Контакты==&lt;br /&gt;
&lt;br /&gt;
Преподаватель: Валерий Терновский &lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Ассистент !! Telegram&lt;br /&gt;
|-&lt;br /&gt;
| style=&amp;quot;background:#eaecf0;&amp;quot; | Григорий Кузнецов || @growa&lt;br /&gt;
|-&lt;br /&gt;
| style=&amp;quot;background:#eaecf0;&amp;quot; | Даниил Охотин || @danokil&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
==Программа==&lt;br /&gt;
&lt;br /&gt;
1. The Transformer — «ванильная» архитектура, механизм внимания (attention), мотивация и импликации.&lt;br /&gt;
&lt;br /&gt;
2. Решение Sequence-to-sequence (seq2seq) задач с помощью трансформеров: машинный перевод, QA, диалоговые модели. ДЗ&lt;br /&gt;
&lt;br /&gt;
3. Энкодеры — Masked Language Modeling, BERT и его наиболее удачные модификации. решение NLU-задач с помощью трансформеров.&lt;br /&gt;
&lt;br /&gt;
4. Декодеры — causal language modeling, авторегрессионная генерация, GPT-архитектура. ДЗ сдача&lt;br /&gt;
&lt;br /&gt;
5. Pretraining — разбор этапа с точки зрения данных, функций потерь, валидации для трёх типов трансформеров (энкодеры, энкодер-декодеры, декодеры). Проект&lt;br /&gt;
&lt;br /&gt;
6. Post-Training: SFT, RLHF, DPO — разбор этапа, бенчмарки и оценивание моделей.&lt;br /&gt;
&lt;br /&gt;
7. Cutting-edge transformers research: модификации attention, эффективность обучения etc., разбор статей.&lt;br /&gt;
&lt;br /&gt;
8. Защита проектов, обсуждение&lt;br /&gt;
&lt;br /&gt;
==Материалы курса==&lt;br /&gt;
Ссылка на плейлист курса на YouTube: TBD&lt;br /&gt;
&lt;br /&gt;
Ссылка на GitHub с материалами курса: TBD&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Занятие !! Тема !! Дата !! Ссылки&lt;br /&gt;
|-&lt;br /&gt;
| style=&amp;quot;background:#eaecf0;&amp;quot; | &amp;#039;&amp;#039;&amp;#039;1&amp;#039;&amp;#039;&amp;#039;  ||  ... &lt;br /&gt;
 || ?.09.24 ||&lt;br /&gt;
|-&lt;br /&gt;
| style=&amp;quot;background:#eaecf0;&amp;quot; | &amp;#039;&amp;#039;&amp;#039;2&amp;#039;&amp;#039;&amp;#039;  ||  ...&lt;br /&gt;
 || ?.09.24 ||&lt;br /&gt;
|-&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
=== Записи консультаций ===&lt;br /&gt;
&lt;br /&gt;
==Формула оценивания==&lt;br /&gt;
&lt;br /&gt;
Оценка = 0.3*О&amp;lt;sub&amp;gt;ДЗ&amp;lt;/sub&amp;gt; +0.7*О&amp;lt;sub&amp;gt;Проект&amp;lt;/sub&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== Домашние задания ==&lt;br /&gt;
&lt;br /&gt;
1. «Лабораторный мини-проект» на модификацию стандартного пайплайна обучения causal decoder — внедряем (как вариант) PrefixLM в стандартный код huggingface, настраиваем валидацию, делаем выводы. &lt;br /&gt;
&lt;br /&gt;
2. Проект — делимся на мини-группы, берём одну из задач/предлагаем свою заранее (список задач будет дан позднее), строим:&lt;br /&gt;
* базовый пайплайн решения на open-source моделях&lt;br /&gt;
* пайплайн SFT/RLHF на открытых данных&lt;br /&gt;
* формулируем исследовательские гипотезы, готовим кодовую базу для их запуска и проверки (обучать или нет будет зависеть от гипотез).&lt;br /&gt;
&lt;br /&gt;
Цель проекта — получить представление о работе R&amp;amp;D-команды в условиях, приближенных к реальным, разобраться в нюансах построения исследовательских пайплайнов в ML-проектах, научиться формировать roadmap проекта и демонстрировать промежуточные результаты.&lt;br /&gt;
&lt;br /&gt;
== Литература ==&lt;/div&gt;</summary>
		<author><name>imported&gt;Murrcha</name></author>
	</entry>
</feed>