Минимизация ошибок идентификации лексем в текстах, написанных на естественном языке
Опубликовано: 03.11.2012
Авторы: Тихомирова Е.А.
Опубликовано в выпуске: #3(3)/2012
DOI: 10.18698/2308-6033-2012-3-113
Раздел: Информационные технологии
Представлен метод автоматизированной минимизации ошибок идентификации лексем в текстах, написанных на естественном языке. Метод основан на совместном использовании словарной морфологии и аналитического метода. Применение метода позволит улучшить качество автороведческой экспертизы, что повысит вероятность идентификации автора по написанным им текстам.
Литература
[1] Архив форума «Говорим по-русски» // http://speakrus.ru URL: http://speakrus.ru/dict/#proling Дата обращения 20.04.2012
[2] Архив форума «Говорим по-русски» // http://speakrus.ru URL: http://speakrus.ru/dict/#paradigma Дата обращения 13.04.2012
[3] Шаров С.А. Частотный словарь русского языка [Электронный ресурс]. URL: http://www.artint.ru/projects/frqlist.asp Дата обращения 8.09.2011
[4] Snowball // http://snowball.tartarus.org/ URL: http://snowball.tartarus.org/algorithms/russian/stemmer.html Дата обращения 11.05.2011