Открыть меню
683
286
3
15 тыс.
Wiki - Факультет компьютерных наук
Переключить меню настроек
Открыть персональное меню
Вы не представились системе
Ваш IP-адрес будет виден всем, если вы внесёте какие-либо изменения.

Современный NLP и большие языковые модели 26

Материал из Wiki - Факультет компьютерных наук
Версия от 23:57, 9 марта 2026; imported>Ekononova (ДЗ 2 и 3)
(разн.) ← Предыдущая версия | Текущая версия (разн.) | Следующая версия → (разн.)

О курсе

Расскажем, как от теории с курса по NLP перейти к практическому применению больших языковых моделей, научимся обсуждать требования к разного уровня решениям и соберём собственный проект по ходу курса.

1. Современные LLM (тюнинг, квантизация)

2. RAG и пререквизиты (методы поиска, выбор энкодеров)

3. Агентные системы (простые и мультиагентные)

4. Инфраструктура вокруг LLM (хостинг LLM, эмбеддингов, observing)

5. Системный дизайн LLM-based продукта

Расписание

Лекция: Понедельник 19:40. Ссылка на занятие.

Семинары: Четверг 18:10. Ссылка на занятие.

Полезные ссылки

  • Таблица с оценками: TBA

Темы курса

1. Развитие моделей. Записи: лекция, семинар

2. Эмбеддеры и энкодеры. Записи: лекция,семинар

3. RAG. Записи: лекция, семинар

4. Мультимодальные модели и MultimodalRAG: лекция (запись не смогла), семинар

5. Агенты (начало): лекция

Домашние задания

Домашние задания выполняются в командах по 2-4 человека. Записаться как команда можно здесь: https://forms.gle/2HpdGvXWHJdmhLA88

Форма будет закрыта 1 марта и заявки перестанут приниматься.

Общая идея домашних заданий: в рамках четырёх домашних заданий вам предлагается собрать LLM-based проект (будь то RAG, агент, etc) и защитить его в конце курса для получения итоговой оценки.

Задание 1: выбор темы проекта

В рамках первого задания вам предлагается: определиться с темой проекта, заполнить дизайн-документ о проекте и найти данные, необходимые для реализации проекта.

Решение оформите в виде ссылки на PR, содержащий дизайн-док и readme файл с кратким описанием проекта, команды и данных.

Выдано: 18.02.2026

Дедлайн: 02.03.2026

Задание 2: MVP проекта

В рамках второго задания предлагаем воспроизвести кор-функционал проекта (закодить MVP-версию). В качестве артефакта по выполнению ДЗ ожидаем получить:

  • Код проекта
  • readme.md файл с описанием проекта: пару слов о чем проект, структура проекта, как его запустить, ключевые фичи
  • Отчёт по результатам выполнения этапа: почему вами были приняты те или иные решения, чем обусловлен выбор технического стека, с какими сложностями столкнулись, и как решили их (или планируете решить).

Разрешается использовать в работе LLM и кодовые ассистенты, однако мы очень просим: оценить количество времени, затраченное на проект, при использовании генеративных моделей и примерную стоимость данного этапа проекта (подписка / количество токенов / непосредственно деньги / другое), укажите эту информацию в своём отчёте.

Решение оформите в виде ссылки на PR, содержащий код, отчёт и обновлённый readme файл с добавлением новых вводных.

Выдано: 9.03.2026

Дедлайн: 23.03.2026

Задание 3: инфраструктура проекта

В рамках третьего задания предлагаем добавить необходимую для деплоя проекта обвязку + другие сервисы, инфраструктурно необходимые для проекта (мониторинги, хранилища, etc). В качестве артефакта по выполнению ДЗ ожидаем получить:

  • Код проекта
  • readme.md файл с обновлениями проекта на новой стадии
  • Отчёт по результатам выполнения этапа: почему вами были приняты те или иные решения, чем обусловлен выбор технического стека, с какими сложностями столкнулись, и как решили их (или планируете решить).

Разрешается использовать в работе LLM и кодовые ассистенты, однако мы очень просим: оценить количество времени, затраченное на проект, при использовании генеративных моделей и примерную стоимость данного этапа проекта (подписка / количество токенов / непосредственно деньги / другое), укажите эту информацию в своём отчёте.

Решение оформите в виде ссылки на PR, содержащий код, отчёт и обновлённый readme файл с добавлением новых вводных.

Выдано: 9.03.2026

Дедлайн: 23.03.2026

Преподаватели

Преподаватели
Дарья Андреева
Роман Соломатин
Александр Потехин

Формула оценок

Итог = SUM(О_ДЗ_i) *0.125 + О_проект * 0.5

  • ДЗ — оценка за домашнее задание
  • Проект — оценка за проект

Формат экзамена: защита проекта.