Типы сред в ИИ

Опубликовано: 19 Июля, 2021

Среда в искусственном интеллекте - это окружение агента. Агент принимает входные данные из окружающей среды с помощью датчиков и передает выходные данные в среду с помощью исполнительных механизмов. Есть несколько типов сред:

  • Полностью наблюдаемое против частично наблюдаемого
  • Детерминированный против стохастического
  • Соревнование против сотрудничества
  • Один агент против мультиагента
  • Статический против динамического
  • Дискретный против непрерывного

1. Полностью наблюдаемое против частично наблюдаемого

  • Когда датчик агента способен обнаруживать или получать доступ к полному состоянию агента в каждый момент времени, говорят, что это полностью наблюдаемая среда, в противном случае - частично.
  • Поддерживать полностью наблюдаемую окружающую среду легко, поскольку нет необходимости отслеживать историю окружающей среды.
  • Среда называется ненаблюдаемой, если у агента нет датчиков во всех средах.
  • Пример:
    • Шахматы - доска полностью просматривается, как и ходы соперника.
    • Вождение - окружающая среда частично наблюдаема, потому что неизвестно, что находится за углом.

2. Детерминированный против стохастического

  • Когда уникальность текущего состояния агента полностью определяет следующее состояние агента, среда называется детерминированной.
  • Стохастическая среда является случайной по своей природе, которая не уникальна и не может быть полностью определена агентом.
  • Пример:
    Шахматы - для монеты в текущем состоянии будет только несколько возможных ходов, и эти ходы можно определить.
    Self Driving Cars - действия беспилотного автомобиля не уникальны, время от времени они меняются.

3. Соревнование против сотрудничества

  • Говорят, что агент находится в конкурентной среде, когда он конкурирует с другим агентом, чтобы оптимизировать результат.
  • Игра в шахматы является соревновательной, поскольку агенты соревнуются друг с другом, чтобы выиграть игру, которая является результатом.
  • Говорят, что агент находится в среде для совместной работы, когда несколько агентов взаимодействуют для получения желаемого результата.
  • Когда на дорогах обнаруживается несколько беспилотных автомобилей, они взаимодействуют друг с другом, чтобы избежать столкновений и добраться до места назначения, которое является желаемым результатом.

4. Один агент против мультиагентности

  • Среда, состоящая только из одного агента, называется средой с одним агентом.
  • Человек, оставшийся один в лабиринте, является примером системы с одним агентом.
  • Среда, в которой задействовано более одного агента, является многоагентной средой.
  • Игра в футбол является мультиагентной, так как в каждой команде участвуют 11 игроков.

5. Динамический против статического

  • Среда, которая постоянно меняется, когда агент выполняет какое-либо действие, называется динамической.
  • Поездка на американских горках динамична, поскольку она приводится в движение, а окружающая среда постоянно меняется.
  • Неактивная среда без изменения своего состояния называется статической средой.
  • Пустой дом статичен, так как при входе агента в окружении не происходит никаких изменений.

6. Дискретный против непрерывного

  • Если среда состоит из конечного числа действий, которые могут быть продуманы в среде для получения выходных данных, это называется дискретной средой.
  • Игра в шахматы дискретна, поскольку в ней есть только конечное число ходов. Количество ходов может меняться в зависимости от игры, но все же оно конечно.
  • Среда, в которой выполняются действия, не может быть пронумерована, т.е. не дискретна, называется непрерывной.
  • Беспилотные автомобили являются примером непрерывной среды, поскольку их действиями являются вождение, парковка и т. Д., Которые не могут быть подсчитаны.