<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
	<id>https://www.wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA%3AKatya</id>
	<title>Участник:Katya - История изменений</title>
	<link rel="self" type="application/atom+xml" href="https://www.wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA%3AKatya"/>
	<link rel="alternate" type="text/html" href="https://www.wikicshse.ru/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Katya&amp;action=history"/>
	<updated>2026-06-06T19:19:00Z</updated>
	<subtitle>История изменений этой страницы в вики</subtitle>
	<generator>MediaWiki 1.45.3</generator>
	<entry>
		<id>https://www.wikicshse.ru/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Katya&amp;diff=6376&amp;oldid=prev</id>
		<title>imported&gt;Katya: Migrated current public revision from wiki.cs.hse.ru</title>
		<link rel="alternate" type="text/html" href="https://www.wikicshse.ru/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Katya&amp;diff=6376&amp;oldid=prev"/>
		<updated>2016-11-08T09:45:24Z</updated>

		<summary type="html">&lt;p&gt;Migrated current public revision from wiki.cs.hse.ru&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Новая страница&lt;/b&gt;&lt;/p&gt;&lt;div&gt;Моя страничка на сайте ВШЭ: [http://www.hse.ru/org/persons/14305157 Екатерина Черняк].&lt;br /&gt;
&lt;br /&gt;
Меня интересуют исследования в области автоматической обработки текстов (natural language processing). В 2016/17 уч. году мне хотелось бы предложить темы, связанные со следующими направлениями:&lt;br /&gt;
&lt;br /&gt;
* анализ темпоральных текстовых данных. Речь идет о текстовых данных общего происхождения (новостных лентах, отзывов на какие-то продукты, твиттах, блогах), публикуемых достаточно долгое время. В  этом направлении существуют следующие задачи: &lt;br /&gt;
# Извлечение сюжетов (как развивается новостной сюжет, например, какие события связаны с Сирийским конфликтом)&lt;br /&gt;
# Извлечение темпоральных ассоциативных правил (например, как упоминание нового назначения омбудсмена вчера связано с упоминанием телегонии сегодня)&lt;br /&gt;
# Анализ изменений отношения к какому-то товару со временем (например, почему оценки на Кинопоиске со временем становятся ниже, можно ли найти какие-то причины этому в текстах отзывов)&lt;br /&gt;
# Визуализация (например, построить облако тегов и мультфильм про его изменение в динамике)&lt;br /&gt;
# Извлечение трендов из научных публикаций (о чем пишут современные исследователи, о чем писали 5 лет назад и сейчас уже забыли, можно ли предсказать, что будет популярно в ближайшие пять лет?).&lt;br /&gt;
* использование строковых структур для анализа текстов. В основном для анализа тексты разбивают на слова, пары слов или последовательности символов фиксированной длины (например, пятерки символов). Мне кажется, что можно было бы ослабить ограничение на длину последовательности и использовать сууфиксные или префиксные деревья для того, чтобы выбирать длину символьной последовательности автоматически. Подобный метод был бы полезен для тех задач, где конечный результат не имеет текстового представления, например в задачах&lt;br /&gt;
# кластеризации текстов (конечный результат - кластеры и неважно, какое представление текста было использовано)&lt;br /&gt;
# тематической классификации &lt;br /&gt;
# классификации по жанрам&lt;br /&gt;
* некоторые стандартные задачи и не совсем стандратные способы их решения или источники данных (список пополняется):&lt;br /&gt;
# Использование сверточных сетей для извлечения фактов (см. соревнование Диалога 2016 года)&lt;br /&gt;
# Иерархическая классификация на данных Яндекс.Категоризатора&lt;br /&gt;
# Извлечение социальных сетей из новостей / художественной литературы и их визуализация&lt;br /&gt;
# ПриВедЕНие теКСТа К прАвиЛЬноМу реГистРУ&lt;/div&gt;</summary>
		<author><name>imported&gt;Katya</name></author>
	</entry>
</feed>