Архитектура и функционирование когнитивных сетей 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Архитектура и функционирование когнитивных сетей



 

Чтобы понять, как работают когнитивные сети, уделим им больше внимания. Первые исследования[63]и попытки теоретического обоснования в этой области были предприняты психологами Джеймсом Макклелландом и Дэвидом Румельхартом[64]; со временем за ними последовали и другие. Существуют различные теории по поводу того, как функционируют подобные системы; но все эти теории принадлежат к одному главному направлению, и называется оно «коннекционизм» или «параллельная (распределенная) обработка данных».

Приверженцы коннекционизма рассматривают интеллект как огромный массив, состоящий из миллионов взаимосвязанных элементов. Очень упрощенно такая сеть изображена на рисунке 6.1. В нижней ее части расположены отдельные элементы – входные модули, реагирующие на конкретные воздействия окружающей среды (изображения, звуки, запахи и т. д.). Входные модули соединены многочисленными связями с другим, промежуточным набором скрытых модулей (в средней части рисунка), а те, в свою очередь, таким же образом связаны с выходными модулями, которые инициируют речь, мимику лица и движения тела. Когда один входной элемент активируется, он через множество соединений активирует промежуточный уровень скрытых модулей. Сила этих связей может меняться: если модули активируются одновременно, связи между ними укрепляются; в противном случае связи будут ослабевать. Кроме того, прочность соединений корректируется за счет воздействия обратной связи от среды – например, когда вы неправильно произносите слово или ошибочно идентифицируете скалу как мину, и вас поправляют.

 

Рисунок 6.1. Схематическое изображение коннекционистской модели работы интеллекта

 

Теоретики когнитивных сетей выдвигают гипотезу, что превращение наивного ребенка в опытного, способного распознавать паттерны взрослого – не что иное, как настройка обширной сети связей в процессе приобретения опыта. И большая часть этой настройки происходит за счет изменения паттерна и усиления связей на промежуточном уровне – уровне скрытых модулей. Настроенная сеть – вот что позволяет мгновенно распознавать паттерны.

Почему распознавание происходит мгновенно? Потому что элементы сетей способны работать параллельно, все разом. Вам не нужно ждать, пока один модуль передаст информацию другому, который затем отправит ее третьему, и так далее. Каждый элемент, активируясь, начинает посылать сигналы другим. Те, также активируясь, могут начать посылать ответные сигналы. В итоге каждый элемент воздействует на множество других и, в свою очередь, испытывает их воздействие. Кроме того, модули многократно продублированы и распределены по всей сети; дело не обстоит так, что только один из них воспринимает красный цвет, а другой – звук до-диез. Вот почему подобные теории называются теориями параллельной распределенной обработки данных.

Получить представление о том, что в данном контексте означает «параллельная», мы можем, рассмотрев рисунок 6.2.а. На нем изображены три буквы, скрытые чернильными кляксами. Что это за буквы: «R» или «Р», «E» или «F», «D» или «В»? Если смотреть на каждую по отдельности, их невозможно истолковать однозначно. Тем не менее у вас не возникает проблем с интерпретацией всей строки как «R-E-D». Да, но каким образом? Вы же не говорите себе: «Так. Там у нас R и D – значит, посередине должна быть E», – хотя именно так происходит, когда вы рассматриваете рисунок 6.2.b, где только одна буква воспринимается неоднозначно. Единственное, что устраняет двусмысленность, – цельность паттерна активированных модулей. Ваша сеть одновременно обрабатывает все варианты и находит наиболее вероятный – а следовательно, максимально правдоподобный – ответ.

 

Рисунок 6.2. Сеть как система параллельной распределенной обработки данных

 

Важно, что общее функционирование сети не зависит от некоего «начальника», сидящего в углу офиса и указывающего отдельным модулям-«сотрудникам», что им делать. Никто и ничто внутри сети не дает ей команду быть готовой к началу работы или начать работать, когда возникает необходимость. Активация происходит со стороны окружающей среды, а не со стороны «главнокомандующего».

И наконец, элементы сети, как правило, являются частью механизма, представляющего собой нечто большее, чем просто один хорошо настроенный паттерн. Да, конкретное свойство окружающей среды может активировать какой-то модуль. Но какая именно часть сети активируется, зависит и от того, какие еще модули активированы. Например, средняя буква на рисунке 6.2.с – «H» или «A»? Тут возможны варианты. В слове слева («THE») это «H», а в слове справа («CAT») – «A». Фактически мы имеем в обоих случаях один и тот же набор обозначений, которые активируют одни и те же модули. Сеть на самом деле допускает, чтобы вы видели сходство между «H» и «A», даже если используете эти обозначения как разные буквы (в конце концов, только определенные виды «H» и «A» выглядят подобными). Активированные модули будут связаны как с частями сети, дающими возможность выбрать «THE», так и с позволяющими прочесть «CAT». Но контекст, в котором появляются на странице эти знаки, будет влиять на то, какие части сети активируются, и, соответственно, на интерпретацию самих знаков.

Действительно, архитектура сетей может содержать паттерны связей, направленные на то, чтобы установить, в чем состоит разница между внешне сходными вещами («А» в «CAT» и «Н» в «THE»). Подумайте о том, насколько оттенки красного могут быть сходны с оттенками оранжевого. Вы можете воспринимать их почти одинаково, но в то же время категории красный и оранжевый существуют, и это – разные категории. Заметим, что классические образцы красного и оранжевого отличаются друг от друга куда больше, чем те конкретные цвета, с которыми вы сталкиваетесь в жизни. Существование этих категорий позволяет тонко воспринимать оттенки красного и оранжевого, сличая каждый из них с основным, базовым образцом.

А вот пример посложнее. Вы видите хорошо одетого, по-видимому состоятельного человека, который протягивает деньги человеку, одетому очень бедно. Сцену можно в равной степени истолковать как «человек подает нищему» или как «человек отдает деньги грабителю», но существование категорий «нищего» и «грабителя» позволяет вам разглядеть различия между двумя ее вариантами. Сети сконструированы так, что на одном уровне они четко отразят сходство в восприятии, а на другом среагируют на концептуальное или категорийное различие. Используя ранее принятую нами терминологию, можно сказать, что категории, которыми мы пользуемся для фрейминга, влияют на то, как мы интерпретируем, и даже на то, как воспринимаем результаты работы сети. И что сами эти категории или фреймы могут отражать эту работу на более высоком уровне, отстраиваясь от деталей, полученных визуально при восприятии окружающего мира.

Исследования когнитивных сетей с целью выяснить, таким ли образом интеллект действительно распознает паттерны, по большей части основываются не на экспериментах с реальными людьми в естественных условиях. Чаще исследователи вместо этого создают модели – компьютерные программы, построенные по принципу когнитивных сетей. Исследователи закладывают в такие программы «опыт» (некую сумму вводных данных), которым обладают люди, и смотрят, выдаст ли программа такие же результаты, как человек, помещенный в соответствующие лабораторные условия. Таким образом, компьютерное моделирование используется для повышения репрезентативности результатов исследований поведения людей, решающих те или иные задачи.

Компьютерные модели когнитивных сетей создаются для того, чтобы внутренне согласовать наши сегодняшние знания о мозге и нервной системе. То, что мы называем модулями, элементами сети, в той или иной степени соответствует отдельным нейронам или небольшим группам нейронов. Мы знаем, что нервная система содержит миллионы и миллионы нейронов, каждый из которых соединен с другими бесчисленным количеством связей. И мы знаем, что опыт меняет как прочность, так и архитектуру этих связей (новые формируются, а старые, но бесполезные разрушаются). Наиболее важным, ключевым для нервной деятельности является тот факт, что нейроны «немы». Сами по себе они не несут никакой информации и «умеют» только одно: активироваться, когда внешнее воздействие достигает определенного порога, и дезактивироваться, когда воздействие прекращается. Чем конкретно вызвана активация или отключение – это «не в компетенции» нейронов. Мыслительный процесс состоит не в них самих, но является продуктом организации их взаимосвязей. То же самое можно сказать и о компьютерных моделях сетей: их элементы сами по себе ничего не производят; но их активация и объединение в паттерны способны давать мощный результат.

Компьютерные модели значительно проще нейронных сетей: вместо миллионов компонентов они могут содержать их десятки или, возможно, сотни. В отличие от людей, ежедневно сталкивающихся с огромным количеством объектов и событий, компьютерные программы подвергаются воздействию весьма ограниченного набора параметров. Важнейшим моментом в этих моделях является то, что они, подобно нейронным сетям, начинают функционировать как множество «немых» элементов, которые взаимосвязаны, но лишены какой-либо информации о той сфере и поле деятельности, в которой им предстоит существовать. Далее исследователи обучают смоделированную сеть, чтобы понять, смогут ли они превратить этот набор отдельных примитивных элементов в умную систему.

Можно представить себе подобную сеть как аналог систем, используемых веб-сайтами вроде Netflix[65], для рекомендаций пользователям. Вы вводите название фильма – скажем, «The Godfather» («Крестный отец»). Информация о фильме появляется на экране, но Netflix готов порекомендовать вам и другие фильмы. Какие? Это зависит от целого ряда факторов. Частично – от того, какие еще фильмы предпочли другие пользователи Netflix, ранее уже выбравшие и высоко оценившие «The Godfather» (Netflix накапливает и хранит информацию обо всех сделанных клиентами выборах и оценках). Кроме того, предложение сайта может зависеть от ваших собственных запросов, просмотров и оценок. Если вы фанат гангстерских боевиков, вам, скорее всего, выложат список других фильмов о гангстерах. Но если история ваших запросов свидетельствует о том, что вы поклонник Аль Пачино, вы получите список лент с его участием – причем не любых, а тех, которые понравились пользователям, чьи вкусы сходны с вашими. А если в течение некоторого времени вы заказываете и смотрите исключительно фильмы, получившие «Оскара», вам предложат третий список рекомендаций.

И вам не нужно подробно объяснять, каковы ваши вкусы. У Netflix уже есть свое четкое представление, основанное на ваших прошлых заказах и на обратной связи от других клиентов, выбирающих те же фильмы, что и вы. Каждый раз, когда вы взаимодействуете с Netflix, программа, которая используется для подбора рекомендаций, обновляется. На самом деле она обновляется всякий раз, когда кто бы то ни было заходит на сайт. Так формируются связи между фильмами, и прочность связей меняется в зависимости от накопленного опыта пользователей Netflix. Это похоже на то, как если бы все пользователи сайта были участниками одной гигантской сети, для которой ни один посетитель не является полностью уникальным, но в то же время не повторяет в точности другого.

Система рекомендаций, используемая Netflix, не знает ничего о фильмах. Она создана для обнаружения паттернов предпочтений пользователей и делает это тем лучше (связи между ее элементами настраиваются все точнее), чем дольше получает обратную связь от прошлых рекомендаций и учится на собственных ошибках. С точки зрения современной когнитивной науки, способность человека распознавать паттерны развивается примерно таким же образом.

 



Поделиться:


Последнее изменение этой страницы: 2017-02-21; просмотров: 212; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.141.24.134 (0.011 с.)