Сект, Ханс фон
- 1 year ago
- 0
- 0
ДСМ-метод — метод автоматического порождения гипотез . Формализует схему правдоподобного и достоверного вывода, называемую ДСМ-рассуждением.
ДСМ-рассуждение является синтезом познавательных процедур: индукции , аналогии и абдукции . ДСМ-метод был создан как средство автоматизированного построения формализации знаний о предметной области средствами так называемых квазиаксиоматических теорий (КАТ).
ДСМ-метод автоматического порождения гипотез был предложен В. К. Финном в конце семидесятых годов. Название метода составляют инициалы известного английского философа, логика и экономиста Джона Стюарта Милля , чьи «методы здравомыслящего естествоиспытателя» частично формализованы в ДСМ-методе.
Исторически, первым примером задач, для решения которых применялись ДСМ-системы, является выявление причинно-следственных закономерностей вида структура-активность в фармакологии . В 1997 — 1998 годах был проведён ряд компьютерных экспериментов , целью которых являлась оценка возможности создания интеллектуальной системы , которая позволяла бы определить степень риска возникновения у больного рецидива аденомы гипофиза после её удаления. На основе количественного ДСМ-метода была разработана экспериментальная система прогнозирования рецидива аденомы гипофиза, которая носит рабочее название HTRD (Hypophisis tumor relapse diagnostics). Кроме этого, ДСМ-системы успешно применялись в задачах технической диагностики и в исследовании детерминант социологического поведения.
В настоящее время разработками ДСМ-систем занимаются в ВИНИТИ РАН и на РГГУ под руководством В. К. Финна.
ДСМ-метод оперирует сущностями трёх сортов: объекты предметной области, свойства этих объектов, возможные причины свойств.
Предполагается, что объекты имеют структуру и причинами свойств объектов являются фрагменты этой структуры.
Пример:
На вход ДСМ-метод получает некоторое множество изучаемых объектов и сведения об их структуре, о наличии или отсутствии у них определённых свойств, а также, в некоторых случаях, о связи между структурой объектов и их свойств. Кроме того имеется ряд целевых признаков, каждый из которых разбивает исходное множество объектов на четыре непересекающихся подмножества:
Результатом применения ДСМ-метода являются гипотезы двух типов:
Рассмотрим один шаг ДСМ-метода в его самом простом варианте.
Имеется функция P: O→ , которая сопоставляет каждому объекту о подмножество фрагментов (элементов структуры), встречающихся в объекте о.
Введём функцию F: O×P→V , представляющую начальную ситуацию.
Функция F может быть представлена в виде матрицы:
Если f ij = , то говорят, что для пары (o i , p j ) функция F(o i , p j ) недоопределена. Задача ДСМ-метода состоит в том, чтобы с помощью формирования гипотез доопределить исходную матрицу .
Сформируем гипотезы о возможных причинах свойств. В результате получим функцию H: C×P→V.
Значения функции H для каждой пары (c, p) находятся с помощью правил правдоподобного вывода. Эти правила называются правилами первого рода. Сокращённое обозначение —
PIR
1
(от Plausible Inference Rules). Правила первого рода можно рассматривать как функцию, использующую матрицу F для получения матрицы H, то есть
H = PIR
1
(F)
.
Пусть p — некоторое свойство.
Объект o является:
Через F + [p], F - [p], F 0 [p] будем обозначать множество всех положительных, отрицательных и противоречивых примеров для p относительно F, соответственно.
В качестве возможных причин наличия/отсутствия свойств объектов рассматриваются подмножества набора фрагментов С . Множество С' ⊆ C удовлетворяет (+)-условию для p относительно F, если существует Ω ⊆ F + [p] такое, что:
(-)- и (0)-условия — аналогично.
Через
M
+
(F, c, p)
будем обозначать тот факт, что c удовлетворяет (+)-условию для p относительно F .
Через
M
-
(F, c, p)
— тот факт, что c удовлетворяет (-)-условию для p относительно F .
Через
M
0
(F, c, p)
— тот факт, что c удовлетворяет (0)-условию для p относительно F .
Теперь определим функцию H . Положим:
Иначе говоря, множество фрагментов C i ⊆C, доопределяется как
Используя матрицу гипотез о возможных причинах, можно сформировать гипотезы о наличии или отсутствии свойства p у тех объектов из O , для которых изначально не было известно, обладают они этим свойством или нет, то есть для тех o O , для которых F(o, p) = .
В результате мы получим функцию F’: O×P→V. F’(o, p) = F(o, p) , если F(o, p) ≠ . Если же F(o, p) = , то F’(o, p) может принимать любое значение из V :
Значения функции F' находятся с помощью правил правдоподобного вывода. Эти правила называются правилами второго рода. Сокращённое обозначение — PIR 2 . Правила второго рода можно рассматривать как функцию, использующую матрицы F и Н для получения матрицы F', то есть F' = PIR 2 (F, H) .
Пусть o — объект, p — свойство. Будем говорить, что объект o удовлетворяет
Через + (H, o, p), - (H, o, p), 0 (H, o, p) будем обозначать тот факт, что объект o для свойства p относительно H удовлетворяет (+)-условию, (-)-условию и 0-условию, соответственно. Положим: F'(o, p) = F(o, p) , если F(o, p) ≠ ; в противном случае
Правила первого рода (процедура индукции) и правила второго рода (процедура аналогии) последовательно применяются до тех пор, пока в результате их работы порождается хотя бы одна новая гипотеза, то есть применение правил первого рода приводит к изменению матрицы гипотез о возможных причинах свойств объектов, а применение правил второго рода — к изменению матрицы гипотез о возможном наличии или отсутствии свойства p у объектов. При этом номер шага является показателем правдоподобия рассуждений.
Следующим шагом работы ДСМ-метода является проверка условия каузальной полноты. Проверка этого условия интерпретируется, как рассуждение по абдукции — условие выполняется, если полученные гипотезы объясняют исходные данные, то есть если гипотезы о возможных причинах свойств объектов, полученные в результате применения правил первого рода, могут объяснить наличие или отсутствие свойства p у объектов для которых было изначально (до применения процедур индукции и аналогии) известно, что они обладают или не обладают свойством p.
Цель проверки условия состоит в том, чтобы определить, можно ли принимать полученные в результате работы метода гипотезы. Если условие каузальной полноты не выполняется, необходимо изменить применяемую когнитивную технику (например, выбрать другой способ кодирования структуры объектов) или входной набор объектов (как правило, набор расширяется).
Попытаемся, используя ДСМ-метод, дать ответ на следующий вопрос: какими свойствами должен обладать выпуклый четырёхугольник с нетривиальной симметрией , чтобы вокруг него можно было описать окружность , или напротив, нельзя было описать окружность.
Рассмотрим следующий набор объектов предметной области:
Для этих объектов выберем следующий набор структурных фрагментов C:
множество целевых признаков в данном случае состоит всего из одного признака:
Представим исходные данные в виде таблицы:
p | c 1 | c 2 | c 3 | c 4 | c 5 | c 6 | c 7 | c 8 | c 9 | |
---|---|---|---|---|---|---|---|---|---|---|
o 1 (квадрат) |
|
|
|
|
|
|
|
|
|
|
o 2 (прямоугольник) |
|
|
|
|
|
|
|
|
|
|
o 3 (ромб) |
|
|
|
|
|
|
|
|
|
|
o 4 (параллелограмм) |
|
|
|
|
|
|
|
|
|
|
o 5 (равнобокая трапеция) |
|
|
|
|
|
|
|
|
|
|
o 6 (дельтоид) |
|
|
|
|
|
|
|
|
|
|
o 7 (прямоугольный дельтоид) |
|
|
|
|
|
|
|
|
|
|
Представим каждый из объектов набором структурных компонентов, которыми этот объект обладает:
В нашем случае положительными примерами для целевого свойства p являются объекты о 1 , о 5 и о 7 , отрицательными — о 3 , о 4 и о 6 . Также имеется один ( )-пример — o 2 .
Наша задача состоит в том, чтобы, используя правдоподобные рассуждения, выяснить, обладают ( )-примеры целевым свойством p или нет.
Здесь в качестве возможных причин наличия/отсутствия свойства p у объектов будем рассматривать некоторые непустые подмножества множества структурных фрагментов C. (+)-условию удовлетворяют множества:
(-)-условию удовлетворяют множества:
Теперь необходимо выяснить, являются ли найденные множества возможными причинами наличия или отсутствия целевого свойства p у объектов, то есть определить функцию H для данного шага. Как говорилось ранее, правила определения данной функции могут иметь различный вид в зависимости от выбранной стратегии — с запретом (или без запрета) на контр-примеры.
Множество C i C будем доопределять как
Анализируя наши данные, мы получаем две возможные причины наличия свойства p :
Множество фрагментов C 4 = {с 2 , с 6 } становится (+)-гипотезой или противоречивой гипотезой в зависимости от стратегии.
Все множества, удовлетворяющие (-)-условию для p , доопределяются как возможные причины отсутствия свойства p .
То есть,
Используем полученные на предыдущем шаге (+)- и (-)-гипотезы для определения -примеров. В нашем случае такой пример всего один: o 2 {с 1 , с 2 , с 4 , с 5 , с 7 }.
В него вкладывается одна возможная причина наличия свойства p (C 1 = {с 2 , с 4 }) и не вкладывается ни одной возможной причины отсутствия свойства p , поэтому в стратегии с запретом на контр-примеры мы доопределяем o 2 как (+)-пример .
К полученному на n-м шаге набору примеров опять применяются правила первого, а затем второго рода. Этот процесс продолжается до тех пор, пока не будут доопределены все -примеры.
Проверка каузальной полноты осуществляется, как говорилось ранее, при помощи абдуктивных рассуждений. Условие каузальной полноты выполняется, если в каждый исходный (+)-пример вкладывается хотя бы одна возможная причина наличия целевого свойства p , а в каждый (-)-пример — хотя бы одна возможная причина его отсутствия.
В нашем случае каждый исходный положительный и отрицательный пример является объяснённым.
Таким образом, мы получили следующие правдоподобные (а фактически — действительные) достаточные условия для того, чтобы вокруг выпуклого четырёхугольника , обладающего нетривиальной симметрией , можно было описать окружность: