Разделы
Партнеры
Счетчики
7.2. Объект класса 3.2
Интегральная теория создания ИИ
Еще в пункте "Принципы построения объектов 3-го порядка. Условие существования универсального интерфейса. Что такое знания" мы говорили о том, что знания можно получить в принципе 3-мя способами: случайным перебором, по аналогии и путем логического вывода. Объект 3.1 реализует 1-й путь. Объект 3.2 получает знания 2-м способом. Что это означает? Это означает что он отслеживает и запоминает явления, происходящие во внешнем мире (независимо от того, связаны они с C->Y->D напрямую, подобно обратной связи, или нет), а затем использует эту информацию для достижения цели. Не вдаваясь в подробности, о которых будет рассказано ниже, обрисуем в общих чертах принцип работы объекта 3.2. Он построен на основе объекта 3.1 путем добавления памяти и средств ее управления: 1. Берется объект 3.1: ┌───────────┐ │ 3.1 │ ├-----------┤ │ A->X->B │ │Uпредыдущее│ │Zпредыдущее│ │Zтекущее │ └──┬─────┬──┘ _ _ ┌----┼-----┼----┐ | ┌┴┐ ┌┴┐ | | │U│ │Z│ | | └─┘ └─┘ | | ┌─┐ ╔═╗ ┌─┐ | | │C├─>╢Y╟─>┤D│ | | └─┘ ╚═╝ └─┘ | └---------------┘ 2. Добавляются рецепторы (устройства для сканирования состояния окружающей среды), память и средства ее заполнения (объект 2-го порядка под названием M2.1): ┌───────────┐ │ 3.1 │ ├-----------┤ │ A->X->B │ │Uпредыдущее│ │Zпредыдущее│ │Zтекущее │ └──┬─────┬──┘ │ │ ┌──────┐ │ │ │Память│ │ │ └──┬───┘ │ │ _ │ │ ╔══╧═╗ │ │ ║M2.1║ │ │ ╚══╤═╝ _ _ _ ┌----┼-----┼-----┼---┐ | ┌┴┐ ┌┴┐ ┌┴┐ | | │U│ │Z│ │R│ | | └─┘ └─┘ └─┘ | | ┌─┐ ╔═╗ ┌─┐ | | │C├─>╢Y╟─>┤D│ | | └─┘ ╚═╝ └─┘ | └--------------------┘ 3. Добавляются эффекторы (в противоположность рецепторам их задачей является воздействие на среду функционирования) и средства управления ими, использующие информацию из памяти (объект 2-го порядка M2.2): ┌───────────┐ │ 3.1 │ ├-----------┤ │ A->X->B │ │Uпредыдущее│ │Zпредыдущее│ │Zтекущее │ └──┬─────┬──┘ │ │ ┌───────────┐ │ │ │ Память │ │ │ └──┬─────┬──┘ │ │ _ _ │ │ ╔══╧═╗ ╔═╧══╗ │ │ ║M2.1║ ║M2.2║ │ │ ╚══╤═╝ ╚═╤══╝ _ _ _ _ ┌----┼-----┼-----┼-----┼---┐ | ┌┴┐ ┌┴┐ ┌┴┐ ┌┴┐ | | │U│ │Z│ │R│ │E│ | | └─┘ └─┘ └─┘ └─┘ | | ┌─┐ ╔═╗ ┌─┐ | | │C├─>╢Y╟─>┤D│ | | └─┘ ╚═╝ └─┘ | └--------------------------┘ 4. Производится связывание логики работы 3.1 и модулей управления памятью M2.1 и M2.2, а Z войдет в состав E: ┌───────────┐ │ 3.1 │ ├-----------┤ │ A->X->B │ │Uпредыдущее│ │Eпредыдущее│ ┌─>┤Eтекущее │ │ └──┬─────┬──┘ │┌────┘ └────┐ ││ ┌───────────┐ │ ││ │ Память │ │ ││ └──┬─────┬──┘ │ ││ _ _ │ ││ ╔══╧═╗ ╔═╧══╗ │ │└<╢ ║ ║ ╟<┘ │ ║M2.2║ ║M2.1║ ├─>╢ ║ ║ ║ │ ╚══╤═╝ ╚═╤══╝ _ _ _ ┌----┼-----┼-----┼----┐ | ┌┴┐ ┌┴┐ ┌┴┐ | | │U│ │E│ │R│ | | └─┘ └─┘ └─┘ | | ┌─┐ ╔═╗ ┌─┐ | | │C├─>╢Y╟─>┤D│ | | └─┘ ╚═╝ └─┘ | └---------------------┘ 5. Получается следующая конструкция - воздействие 3.1 на C->Y->D происходит через модули M2.1 и M2.2, корректирующие управление со стороны 3.1 при помощи информации из памяти: ┌───────────┐ │ 3.1 │ └─────┬─────┘ _ │ _ ╔═════╧═════╗ ┌──────┐ ║M2.1 и M2.2╟<─>┤Память│ ╚═════╤═════╝ └──────┘ _ │ _ ┌----------┴----------┐ | ┌─┐ ╔═╗ ┌─┐ | | │C├─>╢Y╟─>┤D│ | | └─┘ ╚═╝ └─┘ | └---------------------┘ Теперь подробнее. Явления, протекающие во внешнем мире, являются объектами 2.2, изменяющими объекты 1.1. Непосредственно работать с интерпретаторами объектов 2.2 мы не можем. Значит, остается один вариант - отслеживать изменения состояний объектов 1.1. Это можно сделать лишь одним способом - при помощи т.н. СЛЕДЯЩИХ объектов 2-го порядка. На их входах будут объекты 1-го порядка среды функционирования, состояние которых необходимо отслеживать. Таким образом возникает множество РЕЦЕПТОРОВ - устройства сбора информации о внешнем мире. На выходе у устройства сбора информации находится МАТРИЦА РЕЦЕПТОРОВ - множество непрерывно меняющих свое состояние объектов 1.1, каждый из которых служит входом следящего объекта 2.2. В рамках 3.2 объект 2-го порядка, обслуживающий состояние U называется ГЛАВНЫМ РЕЦЕПТОРОМ. Основное отличие главного рецептора от всех остальных рецепторов заключено в его неизменности на всем протяжении времени существования 3.2 (поскольку любое изменение означает искажение передаваемой по обратной связи информации о достижении цели, влекущее за собой крайне нежелательные последствия). Дело в том, что в 3.2 существует эволюционный процесс. В результате его протекания матрица рецепторов постоянно меняется. В объекте 3.1 инструментом воздействия на среду функционирования служит объект 1-го порядка Z. Как уже говорилось, он может быть составлен из нескольких физически элементарных объектов 1-го порядка. И если в относительно небольшой среде функционирования объекта 3.1, Z еще может быть элементарным объектом, то в случае со средой функционирования 3.2 такое уже вряд ли возможно. Чем больше и сложнее среда функционирования, тем труднее отыскать элементарный объект 1-го порядка, способный эффективно на нее воздействовать. Приходится применять несколько физически элементарных объектов 1-го порядка. Близкие по своим свойствам физически элементарные объекты объединяются в ЭФФЕКТОР. А несколько эффекторов образуют ЭФФЕКТОРНУЮ МАТРИЦУ. Третий компонент, необходимый для работы механизма запоминания 3.2 - это величина dU=Uпредыдущее-U. По ее значению можно определить удачность сделанного шага: удачный шаг будет обладать dU>0, неудачный dU<0, нейтральный dU=0. Чем больше dU, тем удачнее шаг. Соответственно для i-го блока памяти получаем dUi=Uiпредыдущее-Ui. Итак, информация получена, теперь ее необходимо запомнить. Однако это не так-то просто как кажется. Число рецепторов и эффекторов в матрицах велико, состояний у каждого из них много. И если запоминать каждый образ матриц, отличающийся один от другого состоянием одного рецептора или эффектора, то потребуется колоссальное количество памяти. Конечно, в реальности это невозможно. Поэтому тут используется следующий прием: запоминаются не все подряд состояния, а только те, что привели к уменьшению значения U, т.е для которых dU>0. Вначале память пуста и в нее заносятся все следующие друг за другом состояния матриц рецепторов, эффекторов и соответствующие значения dUi, пока память не заполнится полностью. После того, как память заполнена, начинает действовать правило - запоминаются а лишь те состояния рецепторно-эффекторных матриц, которые имеют dUi больше минимального значения уже запомненных dUi. В процессе функционирования 3.2 будут встречаться ситуации, в которых значение dUi будет очень мало. И если срок существования объекта 3.2 значителен, то в итоге вся память будет заполнена такого рода уже устаревшей информацией еще задолго до достижения цели. При этом более новую информацию, хотя и с меньшим dUi, но более важную ввиду своей новизны некуда будет записывать. Поэтому с течением времени все значения dUi должны самопроизвольно постепенно уменьшаться. В этом случае мы имеем дело с процессом забывания. Опуская подробности построения блока памяти, о которых будет еще рассказано, перейдем к последней стадии - принципу обработки имеющейся информации. Что мы имеем: блоки памяти с образами рецепторно-эффекторных матриц и dUi, текущее состояние рецепторов и эффекторов. Записанные в памяти шаги уже привели к уменьшению U - приблизили к цели. Если текущее состояние матрицы рецепторов похоже на состояние записанное в i-м блоке, то значит для уменьшения U можно просто привести эффекторную матрицу в записанное в этом блоке состояние, а не искать его случайным способом как в 3.1! Но объект 3.2 должен стремиться к достижению цели, и если в памяти нет шагов, при которых она была достигнута, то простое копирование память->эффекторы не приведет к цели. Поэтому кроме копирования должен быть и процесс случайного поиска, позволяющий создавать новые состояния эффекторной матрицы. Для этого перед каждым копированием память->эффекторы в копируемый образ вносятся небольшие случайные изменения. Введем переменную Ki - коэффициент отличия, показывающий насколько похоже текущее состояние матрицы рецепторов на образ матрицы рецепторов, отраженную в i-м блоке памяти. Состояние матрицы эффекторов при этом будет формироваться по принципу суперпозиции - чем больше у данного блока памяти значение Ki и чем меньше dUi (если 2 блока памяти похожи, то лучше применить тот у которого dUi меньше), тем больше будет похоже текущее состояние матрицы эффекторов на свой образ из данного банка памяти. Естественно, полностью похожих ситуаций практически не бывает. Чем меньше имеется похожих состояний, тем больше в формировании эффекторной матрицы доля генератора случайности. Таким образом, с учетом вышеописанных процессов заполнения блоков памяти, объект класса 3.2 использует весь предыдущий опыт своего существования и способен выискивать аналогию в текущих ситуациях, если они хотя бы чем-то напоминают уже пережитое. Все это позволяет достигать цели гораздо эффективнее чем объект 3.1. Процесс мышления при этом отсутствует. Действия объекта 3.2 происходят по аналогии с его же действиями в более ранних похожих ситуациях. Если представить внешний мир в виде функции R=M(E,F), где R - матрица рецепторов, E - матрица эффекторов, F - другие объекты класса 1.1 (отличные от E), M - внешний мир, то фактически объект 3.2 проводит интерполяцию/экстраполяцию функции R=M(E,F). Необходимо также отметить один важный момент - казалось бы, стоит записывать в память не только состояния матриц приблизивших к цели, но и отдаливших от нее. Затем их обработка происходит по принципу обратного знака - если допустим записанное состояние какого-то эффектора было равно 10, то на этот эффектор посылается значение -10, аналогично и для других эффекторов. При этом якобы мы приблизимся к цели. Это ошибка. Такие рассуждения верны только для случая, когда функция R=M(E,F) нечетная, т.е. M(-E,F)=-M(E,F) при условии неизменности состояния объектов F. Естественно, это далеко не всегда так. Но в эпсилон-окрестности точки E можно утверждать, что свойства функции M(E,F) будут изменяться сообразно изменению аргумента E. И это следует учитывать при формировании состояния эффекторной матрицы. Таков принцип работы объекта 3.2. Однако, являясь надмножеством объекта 3.1, он добавляет массу новых возможностей принципиального характера. И они уже не могут быть выполнены в рамках тех свойств среды функционирования, которые характерны для 3.1. Требуется дополнительное требование к среде функционирования.
newpoisk.narod.ru, 21 марта 2005 года