Метод определения неестественных текстов на основе характеристик тематического разнообразия

Павлов, А.С. (2011) Метод определения неестественных текстов на основе характеристик тематического разнообразия. Вестник ТвГУ. Серия: Прикладная математика (22). С. 135-143. ISSN 1995-0136

[thumbnail of 19950136_2011_3_pavlov.pdf]
Предварительный просмотр
PDF - Опубликованная версия
368kB

Абстракт

В данной работе предлагается новый метод определение неестественных текстов, основанный на анализе разнообразия тематической структуры текстов и применении методов машинного обучения. Эффективность предложенного метода подтверждается экспериментально.

Абстракт (англ.)

This article is dedicated to a new method for unnatural texts detection. The method is based on topical diversity analysis and machine learning. Efficiency of proposed method is proved empirically.

Тип объекта:Статья
Ключевые слова:неестественные тексты, поисковый спам, тематическая структура текстов
Ключевые слова (англ.):unnatural texts, search spam, topical structure
Категории:6 Прикладные науки. Медицина. Техника > 68 Различные отрасли промышленности и ремесла, производящие конечную продукцию. Точная механика. Легкая промышленность > 681 Точная механика > 681.5 Автоматика. Теория, методы расчета и аппаратура систем автоматического управления и регулирования. Техническая кибернетика. > 681.51 Системы автоматического управления (САУ). Кибернетические характеристики систем > 681.513 Системы с детерминированными входными воздействиями > 681.513.7 Самообучающиеся, самонастраивающиеся системы (детерминированные)
Подразделения:Университеты > Московский государственный университет им. М. В. Ломоносова
ID Code:1597
Deposited On:08 Янв 2017 08:17
Последнее изменение:08 Янв 2017 08:17

Repository Staff Only: item control page