Метод определения неестественных текстов на основе характеристик тематического разнообразия

Павлов, А.С. (2011) Метод определения неестественных текстов на основе характеристик тематического разнообразия. Вестник ТвГУ. Серия: Прикладная математика (22). pp. 135-143. ISSN 1995-0136

[thumbnail of 19950136_2011_3_pavlov.pdf]
Preview
PDF - Published Version
368kB

Abstract

В данной работе предлагается новый метод определение неестественных текстов, основанный на анализе разнообразия тематической структуры текстов и применении методов машинного обучения. Эффективность предложенного метода подтверждается экспериментально.

Abstract (en)

This article is dedicated to a new method for unnatural texts detection. The method is based on topical diversity analysis and machine learning. Efficiency of proposed method is proved empirically.

Item Type:Article
Uncontrolled Keywords:неестественные тексты, поисковый спам, тематическая структура текстов
Keywords (en):unnatural texts, search spam, topical structure
Subjects:6 Прикладные науки. Медицина. Техника > 68 Различные отрасли промышленности и ремесла, производящие конечную продукцию. Точная механика. Легкая промышленность > 681 Точная механика > 681.5 Автоматика. Теория, методы расчета и аппаратура систем автоматического управления и регулирования. Техническая кибернетика. > 681.51 Системы автоматического управления (САУ). Кибернетические характеристики систем > 681.513 Системы с детерминированными входными воздействиями > 681.513.7 Самообучающиеся, самонастраивающиеся системы (детерминированные)
Divisions:Университеты > Московский государственный университет им. М. В. Ломоносова
ID Code:1597
Deposited On:08 Jan 2017 08:17
Last Modified:08 Jan 2017 08:17

Repository Staff Only: item control page