Определение жанра и автора литературного произведения статистическими методами

2010

Описание

В работе решается задача кластеризации литературных текстов по авторам и жанрам статистическими методами. Основным инструментом анализа являются функции распределения текста по буквам и буквосочетаниям, а также выборочные буквенные распределения, построенные по фрагментам текстов. Для набора текстов, объём наименьшего из которых достаточен для того, чтобы считать буквенное распределение каждого из них стационарным с ошибкой не более 3%, вычисляются расстояния между распределениями букв в пространстве суммируемых функций. Критерий кластеризации, основанный на близости между двухбуквенными распределениями текстов, позволяет правильно идентифицировать автора с ошибкой не более 5%, а жанр – с ошибкой не более 15%. Однобуквенные распределения дают ошибку 15% и 25% соответственно.

0,0 (0 оценок)

Купить книгу Определение жанра и автора литературного произведения статистическими методами, Константин Павлович Осминин


Интересные факты

Цитаты из книги

С этой книгой читают:

Гарри Поттер и Орден Феникса
Июль - Август, 2015
Заметки - это удобный и простой способ хранить нужную информацию
или мысли о книге для личного использования. Ваша заметка будет видна только вам.
Помоги Ридли!
Мы вкладываем душу в Ридли. Спасибо, что вы с нами! Расскажите о нас друзьям, чтобы они могли присоединиться к нашей дружной семье книголюбов.
Зарегистрируйтесь, и вы сможете:
Получать персональные рекомендации книг
Создать собственную виртуальную библиотеку
Следить за тем, что читают Ваши друзья
Данное действие доступно только для зарегистрированных пользователей Регистрация Войти на сайт