SMALT

Проект предполагает разработку информационной системы «Статистические методы анализа литературного текста» (ИС «СМАЛТ»), которая в своей основе будет иметь БД литературных произведений (требуется шрифт Arial Unicode) с морфологическим и синтаксическим параметрами, объемом до 300 текстов из публицистики 60-70 гг. 19 века («Время», «Эпоха», «Светоч», «Современник», «Молва», «Библиотека для чтения», «Заря», «Гражданин» и др.).

Предполагается реализация следующих задач: переработка и совершенствование комплекса компьютерных программ для автоматизации морфологического и синтаксического анализа текстов; разработка и анализ инструментария для выявления статистических признаков литературных текстов по жанру и авторству и его программная реализация, наполнение БД литературными текстами.

Разработка ИС будет основана на технологии «Клиент – Сервер» с использованием Интернет технологии. Таким образом, целью данного проекта является представление механизма, который содержал бы многое из того, что необходимо специалисту для проведения исследований по анализу литературных текстов на основе выбранных параметров и статистических методов: БД, содержащая литературные тексты и их морфологические и синтаксические параметры; реализованные в виде программных модулей различные эмпирико-статистические методы для обработки текстов по этим параметрам.

Важным обстоятельством является то, что пользователями системы будут не только исследователи, которые имеют доступ в локальную сеть ПетрГУ, но и пользователи практически с любой точки планеты. Это будет возможно благодаря Интернет-версии аналитического блока ИС.