Алгебраические байесовские сети: изолированное слияние фрагментов знаний в условиях дефицита информации

Рис. 1. Схема априорного вывода (p — вероятность формулы; x1, x2, x3, x4 — атомарные пропозициональные формулы, над которыми построена сеть)
Ранее в работе [20] были выдвинуты тезисы о возможности слияния алгебраических байесовских сетей. Однако, насколько известно авторам, теоретических исследований в области слияния алгебраических байесовских сетей, построенных над данными, полученными из различных источников и имеющими пересечения по элементам сети, не производились, исключая вопросы инкрементального синтеза вторичной структуры [4, 21].
Знания с неопределенностью
В рамках исследования делается предположение о наличии выборки некоторого числа логических означиваний набора пропозициональных переменных. В идеальной ситуации каждая из переменных имеет означивание true (истина) или false (ложь). Однако в большинстве реальных задач в элементах выборки имеются пропуски: например, если значение элемента получается на основании утверждения «x1 -> x2 истинно», то однозначно можно установить истинность только переменной x2, в то время как x1 может принимать как значение true, так и значение false. Пример такой выборки представлен в табл. 1.
Таблица 1. Пример набора значений переменных x1, x2 с пропусками. Значение x1^x2 получено путем применения операции конъюнкции к данным с пропусками.
Таким образом, фактически речь идет о трехзначной логике Клини [22], где помимо констант true (1) и false (0) рассматривается третья константа unknow (*). Ниже приведены таблицы истинности над этими переменными для основных логических операций (отрицание, конъюнкция и дизъюнкция) (табл. 2).
Таблица 2. Таблицы истинности в трехзначной логике Клини
Фактически за набором данных об означивании логических переменных стоит информация о вероятности их истинности. При этом различные модели позволяют по-разному обработать имеющуюся информацию. В данной работе будут рассмотрены алгебраические байесовские сети (рис. 2).

<•••>
Заключение
Одной из основных задач машинного обучения является построение наиболее точных и корректных суждений с максимальным учетом доступной информации. Вопросы слияния моделей, обученных на неполной информации из различных каналов данных, тесно ассоциированы с данной задачей.
В статье были сформулированы подходы к изолированным слияниям фрагментов знаний, утверждения о числе элементов в получаемой сети и сложности поддержания ее интернальной непротиворечивости. Дальнейшими работами в данном направлении является изучение путей слияния структурно более сложных сетей, а также возможности использования описанных подходов в рамках применения алгебраических байесовских сетей в исследованиях, посвященных социоинженерным атакам [23, 24].
Харитонов Н.А., Тулупьев А.Л. Алгебраические байесовские сети: изолированное слияние фрагментов знаний в условиях дефицита информации // Научно-технический вестник информационных технологий, механики и оптики. 2019. Т. 19. № 4. с.641-649
https://cyberleninka.ru/article/n/algebraicheskie-...




17. Тулупьев А.Л., Николенко С.И., Сироткин А.В. Основы теории байесовских сетей: учебник. СПб.: СПбГУ, 2019. 399 с.
https://vk.com/s/v1/doc/SIEk4i9QghO79u3gMZuIkGIDpq... pdf содержание