Построение ассоциативных правил для базы данных с целевым параметром

Биллиг, В.А. (2024) Построение ассоциативных правил для базы данных с целевым параметром. Вестник ТвГУ. Серия: Прикладная математика (1). С. 94-107. ISSN 1995-0136

[thumbnail of ПРИКЛАДНАЯ МАТЕМАТИКА_1_2024-94-107.pdf] PDF - Опубликованная версия
353kB

Абстракт

Предлагается новый эффективный алгоритм GoalApriori, позволяющий строить ассоциативные правила для частного, но важного случая, когда исходная реляционная база данных имеет целевой параметр. Классическим примером таких баз данных являются медицинские базы данных, где в роли целевого параметра выступает диагноз, устанавливаемый врачами. Без потери общности можно считать, что целевой параметр является параметром дискретного типа с фиксированным множеством значений. Алгоритм строит ассоциативные правила, заключением которых является конкретное значение целевого параметра. Посылка правил задает набор свойств входных параметров базы данных. Исходная база данных приводится к специальному формату, в котором запись приведенной базы данных задается одним целым числом независимо от размера записи исходной базы данных. Помимо экономии памяти, такой формат позволяет полностью сохранять информацию о параметрах, представляющих исходную запись. Более важно то, что вычислительно сложные операции над записями, требуемые при вычислении характеристик правил, в этом формате выполняются практически мгновенно парой логических операций над целыми числами. Рассматриваются задачи и свойства алгоритма. Доказывается ряд утверждений относительно свойств алгоритма. Вводится понятие обобщенного критерия качества правил, что позволяет проводить ранжирование правил

Абстракт (англ.)

A new efficient algorithm GoalApriori is proposed, which allows you to build associative rules for a special but important case when the original relational database has a target parameter. A classic example of such databases is medical databases, where the diagnosis made by doctors acts as a target parameter. Without loss of generality, we can assume that the target parameter is a discrete type parameter with a fixed set of values. The algorithm builds associative rules, the conclusion of which is the specific value of the target parameter. Premise of rules represents a set of properties of the database input parameters. The source database is reduced to a special format in which the resulting database record is specified as a single integer, regardless of the size of the source database record. In addition to saving memory, this format allows you to fully preserve information about the parameters representing the original record. More importantly, the computationally complex operations on records required to calculate the characteristics of rules are performed in this format almost instantly by a pair of logical operations on integers. The tasks and properties of the algorithm are considered. A number of statements regarding the properties of the algorithm are proved. The concept of a generalized criterion for the quality of rules is introduced, which allows for the ranking of rules

Тип объекта:Статья
Сведения об авторах:Биллиг Владимир Арнольдович профессор кафедры ПО факультета ИТ Тверского государственного технического университета. Россия, 170026, г. Тверь, наб. Афанасия Никитина, д. 22
Ключевые слова:ассоциативные правила, алгоритм Априори, Data Mining, базы данных
Ключевые слова (англ.):Association rules, Apriori algorithm, Data Mining, databases
Категории:0 Общий отдел
0 Общий отдел > 00 Общие вопросы науки и культуры
0 Общий отдел > 00 Общие вопросы науки и культуры > 004 Информационные технологии. Вычислительная техника
Подразделения:Университеты > Тверской государственный технический университет
ID Code:12723
Deposited On:13 Май 2024 08:30
Последнее изменение:13 Май 2024 08:30

Repository Staff Only: item control page