Журнал "1 сентября"

Педагогические и образовательные статьи
  • lu_res@mail.ru
  • Статьи в следующий номер журнала принимаются по 30.04.2024г.

Регистрация СМИ: ЭЛ № ФС 77 - 77018 от 06.11.2019г. Смотреть

Регистрация периодического издания: ISSN 2713-1416 Смотреть

         
kn publ 1   kn publ 2   kn publ E
         
         
kn publ 5   kn publ 3   kn publ 4
         

Применение теории игр

Дата публикации: 2023-10-07 15:40:32
Статью разместил(а):
Гасанова Елена Николаевна

Применение теории игр

Автор: Гасанова Елена Николаевна

МБОУ "СОШ № 35 имени Героя Советского Союза Д.Ф. Чеботарева", г. Воронеж

 

Аннотация: В статье продемонстрирована возможность теории игр при решении определенных жизненных задач.

Ключевые слова: теория игр, средняя школа.

Тематическая рубрика: Средняя школа, СПО.

 

Математика тесно соприкасается с обыденной жизнью. Мир промышленности, страховые компании, лотереи, азартные игры, выборные кампании в большой степени являются заложниками вероятностных законов. Предсказать исход ряда событий помогает теория игр.

Цель работы: Продемонстрировать возможности теории игр при решении определенных жизненных задач.

Задачи: 

1. Подобрать необходимую литературу.

2. Выбрать интересную, понятную информацию.

3. Проанализировать и систематизировать полученную информацию.

4. Выяснить, можно ли с помощью теории игр предсказать исход ряда событий.

5. Используя теорию игр, определить оптимальную стратегию предприятия, выпускающего швейную продукцию.

1. Теоретическая часть проекта.

1.1. История возникновения теории игр.

Теория игр — это логико-математический метод изучения оптимальных стратегий в играх. Под игрой понимается процесс, в котором участвуют две и более сторон, ведущих борьбу за реализацию своих интересов. Каждая из сторон имеет свою цель и использует некоторую стратегию, которая может вести к выигрышу или проигрышу - в зависимости от поведения других игроков. Теория игр помогает выбрать лучшие стратегии с учётом представлений о других участниках, их ресурсах и их возможных поступках.

Оптимальные решения или стратегии в математическом моделировании предлагались ещё в XVIII в. Автор теории игр — физик, математик и инженер Джон фон Нейман. Впервые математические аспекты и приложения теории были изложены в классической книге 1944 года Джона фон Неймана и Оскара Моргенштерна “Теория игр и экономическое поведение”. Изначально фон Нейман рассматривал игру в покер и пытался вывести универсальные стратегии, которые приводили бы к выигрышу (отсюда и название теории). Но потом он расширил применение своей теории на все подобные ситуации, где поведение одного участника влияет как на его собственные позиции, так и на поведение остальных.

Ученик Джон фон Неймана, американский математик Дж. Нэш, в 1949 году написал диссертацию по теории игр, а через 45 лет получил Нобелевскую премию по экономике.

Хотя теория игр первоначально и рассматривала экономические модели, вплоть до 1950-х она оставалась формальной теорией в рамках математики. Но уже с 1950-х гг. начинаются попытки применить методы теории игр не только в экономике, но в биологии, кибернетике, технике, антропологии. Во время Второй мировой войны и сразу после нее теорией игр серьёзно заинтересовались военные, которые увидели в ней мощный аппарат для исследования стратегических решений. Дж. Нэш, благодаря своим исследованиям в теории игр, стал одним из ведущих специалистов в области ведения “холодной войны”, что подтверждает масштабность задач, которыми занимается теория игр.

С середины 1980-х гг. начинается активное практическое использование теории игр, особенно в экономике и менеджменте. За последние десятилетия значение теории игр и интерес значительно растет, некоторые направления современной экономической теории невозможно изложить без применения теории игр [3].

1.2. Основные понятия теории игр.

Под игрой Джон фон Нейман понимал любую ситуацию, в которой выполняются такие условия:

1. В ней не меньше двух участников.

2. У каждого участника свой интерес.

3. У каждого участника есть несколько вариантов действий.

4. Каждый принимает решения на основании информации о действиях других.

5. Есть какие-то общие правила, которые известны всем. Они могут меняться, сокращаться или расширяться, но они быстро становятся известны всем.

С этой точки зрения большинство наших бытовых ситуаций попадает под действие теории игр. Даже в обычных переговорах о зарплате или о том, где провести отпуск действует теория игр.

Смысл теории игр — найти максимально выигрышную стратегию для конкретного игрока. Стратегия — это последовательность действий игрока: что он делает и какие сообщения отправляет тем самым другим игрокам.

В некоторых играх невозможно выиграть. В этом случае лучшей стратегией будет проиграть как можно меньше или находиться в игре как можно дольше.

Исход — комбинация выбранных стратегий.

Ход - выбор игроком одного из предусмотренных правилами игры действий и его осуществление.

Ходы бывают личные и случайные.

При личном ходе игрок сознательно выбирает и осуществляет тот или другой вариант действий (пример — любой ход в шахматах).

При случайном ходе выбор осуществляется не волей игрока, а каким-то механизмом случайного выбора (бросание монеты, игральной кости, вынимание карты из колоды и т.п.

1.3. Классификация игр.

По количеству игроков:

· игра двух лиц (шахматы, две конкурирующие фирмы);

· игра трех лиц (преферанс, три фирмы на рынке) и т.д.

По выигрышу:

· антагонистические игры;

· игры с нулевой суммой.

По количеству стратегий:

· конечные игры;

· бесконечные игры.

По характеру получения информации:

· игры в нормальной форме (игроки получают всю информацию до начала игры);

· динамические игры (информация поступает в процессе игры).

1.4. Виды игр. В зависимости от поведения участников и правил, игры можно поделить на несколько категорий. Они могут пересекаться между собой.

1.4.1. Кооперативная и некооперативная игра.

Игра называется кооперативной, или коалиционной, если игроки могут объединяться в группы, взяв на себя некоторые обязательства перед другими игроками и координируя свои действия. Этим она отличается от некооперативной игры, в которой каждый обязан играть за себя. Развлекательные игры редко являются кооперативными, однако такие механизмы нередки в повседневной жизни.

Часто предполагают, что кооперативные игры отличаются именно возможностью общения игроков друг с другом. В общем случае это неверно. Существуют игры, где коммуникация разрешена, но игроки преследуют личные цели, и наоборот.

Гибридные игры включают в себя элементы кооперативных и некооперативных игр. Например, игроки могут образовывать группы, но игра будет вестись в некооперативном стиле. Это значит, что каждый игрок будет преследовать интересы своей группы, вместе с тем стараясь достичь личной выгоды.

1.4.2. Симметричная и несимметричная игра.

Игра будет симметричной тогда, когда соответствующие стратегии у игроков будут равны, то есть иметь одинаковые платежи. Иначе говоря, если игроки могут поменяться местами и при этом их выигрыши за одни и те же ходы не изменятся. Многие изучаемые игры для двух игроков — симметричные. В частности, таковыми являются: “Дилемма заключённого”, “Охота на оленя”, “Ястребы и голуби”. В качестве несимметричных игр можно привести “Ультиматум” или “Диктатор”.

В примере ниже игра на первый взгляд может показаться симметричной из-за похожих стратегий, но это не так — ведь выигрыш второго игрока при профилях стратегий (А, А) и (Б, Б) будет больше, чем у первого.

 

 

А

Б

А

1, 2

0, 0

Б

0, 0

1, 2

 

1.4.3. С нулевой и с ненулевой суммой

 

А

Б

А

−1, 1

3, −3

Б

0, 0

−2, 2

Игра с нулевой суммой - особая разновидность игр с постоянной суммой, то есть таких, где игроки не могут увеличить или уменьшить имеющиеся ресурсы, или фонд игры. В этом случае сумма всех выигрышей равна сумме всех проигрышей при любом ходе.

Примерами таких игр может служить покер, где один выигрывает все ставки других; реверси, где захватываются фишки противника; либо банальное воровство.

Многие изучаемые математиками игры, в том числе уже упоминавшаяся “Дилемма заключённого”, иного рода: в играх с ненулевой суммой выигрыш какого-то игрока не обязательно означает проигрыш другого, и наоборот. Исход такой игры может быть меньше или больше нуля. Такие игры могут быть преобразованы к нулевой сумме — это делается введением фиктивного игрока, который “присваивает себе” излишек или восполняет недостаток средств.

Ещё игрой с отличной от нуля суммой является торговля, где каждый участник извлекает выгоду. Сюда также относятся го, шашки и шахматы; в двух последних игрок может превратить свою рядовую фигуру в более сильную, получив преимущество. Во всех этих случаях сумма игры увеличивается. Широко известным примером, где она уменьшается, является война.

1.4.4. Параллельная и последовательная игра.

В параллельных играх игроки ходят одновременно, или, по крайней мере, они не осведомлены о выборе других до тех пор, пока все не сделают свой ход. В последовательных или динамических играх участники могут делать ходы в заранее установленном либо случайном порядке, но при этом они получают некоторую информацию о предшествующих действиях других. Эта информация может быть даже не совсем полной, например, игрок может узнать, что его противник из десяти своих стратегий точно не выбрал пятую, ничего не узнав о других.

1.4.5. Игра с полной и неполной информацией.

Важное подмножество последовательных игр составляют игры с полной информацией. В такой игре участники знают все ходы, сделанные до текущего момента, равно как и возможные стратегии противников, что позволяет им в некоторой степени предсказать последующее развитие игры. Полная информация не доступна в параллельных играх, так как в них неизвестны текущие ходы противников. Большинство изучаемых в математике игр — с неполной информацией. Например, вся “соль” "Дилеммы заключённого" или "Сравнения монеток" заключается в их неполноте.

В то же время есть примеры игр с полной информацией: шахматы, шашки, го, и другие.

1.5. Равновесие Нэша.

В своих трудах Дж. Нэш разработал принципы “управленческой динамики”. Первые концепции теории игр анализировали антагонистические игры, когда есть проигравшие и выигравшие за их счет игроки. Нэш разрабатывает методы анализа, в которых все участники или выигрывают, или терпят поражение. Эти ситуации получили названия “равновесие по Нэшу” или “некооперативное равновесие”. Игрокам выгодно сохранять это равновесие, так как любое изменение ухудшит их положение. Эти работы Дж. Нэша сделали серьёзный вклад в развитие теории игр, были пересмотрены математические инструменты экономического моделирования. Дж. Нэш показывает, что классический подход к конкуренции, когда каждый сам за себя, не оптимален. Более оптимальными являются такие стратегии, когда каждый старается сделать лучше для себя, делая лучше для других.

Рассмотрим пример: необходимо на двоих поделить 100$. Каждый выбирает для себя сумму и оба одновременно озвучивают свою. Если общая сумма окажется меньше ста, каждый получает то, что хотел. Если общее количество больше ста, тот, кто попросил наименьшее количество, получает желаемую сумму, а более жадный человек получает то, что осталось. Если они просят одинаковую сумму, каждый получает 50 $.

Существует единственный выигрышный ход. Требование 51 $ дает максимальную сумму независимо от того, что выбирает противник. Если он попросит больше, вы получите 51 $. Если он попросит 50 $ или 51 $, вы получите 50 $. И если он попросит меньше 50 $, вы получите 51 $. В любом случае нет никакого другого варианта, который принесет вам больше денег, чем этот. Равновесие Нэша — ситуация, в которой оба выбирают 51 $ [1, 2, 5].

1.6. Примеры игр.

1.6.1. «Камень, ножницы, бумага».

Рассмотрим другие игры на предмет равновесия. Например, в «Камне, ножницах, бумаге» нет равновесия по Нэшу: во всех ее вероятных исходах нет варианта, в котором оба участника были бы довольны своим выбором. Тем не менее, существует Чемпионат мира и World Rock Paper Scissors Society, собирающее игровую статистику. Очевидно, что вы можете повысить свои шансы на победу, если будете что-то знать об обычном поведении людей в этой игре.

Чистая стратегия в игре — это такая стратегия, при которой человек всегда играет одинаково, выбирая одни и те же ходы.

По данным World RPS Society, камень является самым часто выбираемым ходом (37,8%). Бумагу ставят 32,6%, ножницы — 29,6%. Теперь вы знаете, что нужно выбирать бумагу.

Однако, если вы играете с тем, кто тоже это знает, вам уже не надо выбирать бумагу, потому что от вас ожидается то же самое. Есть знаменитый случай: в 2005 году два аукционных дома Sotheby“s и Christie”s решали, кому достанется очень крупный лот — коллекция Пикассо и Ван Гога со стартовой ценой в 20 миллионов долларов. Собственник предложил им сыграть в «Камень, ножницы, бумагу», и представители домов отправили ему свои варианты по электронной почте. Sotheby“s, как они позже рассказали, особо не задумываясь, выбрали бумагу. Выиграл Christie”s. Принимая решение, они обратились к эксперту — 11-летней дочери одного из топ-менеджеров. Она сказала: «Камень кажется самым сильным, поэтому большинство людей его выбирают. Но если мы играем не с совсем глупым новичком, он камень не выбросит, будет ожидать, что это сделаем мы, и сам выбросит бумагу. Но мы будем думать на ход вперед, и выбросим ножницы».

Таким образом, вы можете думать на ход вперед, но это не обязательно приведет вас к победе, ведь вы можете не знать о компетенции вашего соперника. Поэтому иногда вместо чистых стратегий правильнее выбирать смешанные, то есть принимать решения случайно. Так, в «Камне, ножницах, бумаге» равновесие, которое мы до этого не нашли, находится как раз в смешанных стратегиях: выбирать каждый из трех вариантов хода с вероятностью в одну третью. Если вы будете выбирать камень чаще, соперник скорректирует свой выбор. Зная это, вы скорректируете свой, и равновесия не выйдет. Но никто из вас не начнет менять поведение, если каждый просто будет выбирать камень, ножницы или бумагу с одинаковой вероятностью. Все потому, что в смешанных стратегиях по предыдущим действиям невозможно предугадать ваш следующий ход.

1.6.2. «Дилемма заключенного».

По легенде двух подозреваемых в серьезном преступлении поймали и заперли в разные камеры. Есть доказательство, что они хранили оружие, и это позволяет посадить их на какой-то небольшой срок. Однако доказательств, что они совершили это страшное преступление, нет. Каждому по отдельности следователь рассказывает об условиях игры. Если оба преступника сознаются, оба же сядут на три года. Если сознается один, а подельник будет молчать, сознавшийся выйдет сразу, а второго посадят на пять лет. Если, наоборот, первый не сознается, а второй его сдаст, первый сядет на пять лет, а второй выйдет сразу. Если же не сознается никто, оба сядут на год за хранение оружия.

Равновесие по Нэшу здесь заключается в первой комбинации, когда оба подозреваемых не молчат и оба садятся на три года. Рассуждения каждого таковы: «если я буду говорить, я сяду на три года, если молчать — на пять лет. Если второй будет молчать, мне тоже лучше говорить: не сесть лучше, чем сесть на год». Это доминирующая стратегия: говорить выгодно, независимо от того, что делает другой. Однако в ней есть проблема — наличие варианта получше, ведь сесть на три года хуже, чем сесть на год (если рассматривать историю только с точки зрения участников и не учитывать вопросы морали). Но сесть на год невозможно, ведь, как мы поняли выше, молчать обоим преступникам невыгодно.

 

Молчите

Сознаётесь

Молчит

(1;1)

(5;0)

Сознаётся

(0;5)

(3;3)

Найти схожие ситуация очень просто в реальной жизни. Самый известный пример — это ситуация «холодной войны» между США и СССР. Обе державы были поставлены перед выбором — либо наращивать военные расходы, либо наконец пустить средства на мирное развитие. Но выбор второго варианта всегда упирался в то, что в этом случае преимущество мог перехватить соперник, продолжающий наращивание вооружений. В результате, обе стороны всегда продолжали увеличивать траты на военщину. Кстати говоря, американцы использовали своих лучших специалистов по теории игр в ходе холодной войны для разработки стратегических решений. В частности, как уже упоминалось выше, на Пентагон работал сам создатель теории Джон Нэш.

1.6.3. QWERTY-эффект.

Иногда бывает очень сложно перейти из одного равновесия в другое, даже если оно означает пользу для всех. Раскладка QWERTY на клавиатуре была создана, чтобы замедлить скорость печати. Поскольку если бы все печатали слишком быстро, головки печатной машинки, которые бьют по бумаге, цеплялись бы друг за друга. Поэтому Кристофер Шоулз разместил часто стоящие рядом буквы на максимально далеком расстоянии. Если зайти в настройки клавиатуры на компьютере, то можно выбрать там раскладку Dvorak и печатать гораздо быстрее, так как сейчас нет проблемы аналоговых печатных машин. Дворак рассчитывал, что мир перейдет на его клавиатуру, но мы по-прежнему живем с QWERTY. Если бы все приложили усилия, переучились и перешли на раскладку Дворака, в результате вышло бы равновесие, в котором все печатают быстро. Сейчас мы тоже в равновесии — в плохом. Но никому не выгодно быть единственным, кто переучится, потому что за любым компьютером, кроме личного, работать будет неудобно.

1.6.4. «Орел и решка».

Игра с подбрасыванием монеты называется «Орлянка».

Нет ничего проще, чем игра в орел и решку. Игрок1 подкидывает монету и просить Игрока2 угадать, какой стороной она выпала. Если Игрок2 угадывает, то Игрок1 отдает ему монету. Если не угадывает — Игрок2 отдает свою монету Игроку1.

 

Орёл

Решка

Орёл

(1; -1)

(-1;1)

Решка

(-1;1)

(1; -1)

Такая игра называется в теории антагонистической, так как выигрыши двух игроков противоположны — если один выигрывает, второй всегда проигрывает. Матрица такой игры чрезвычайно проста, как проста и наиболее оптимальная стратегия. Она заключается в том, чтобы играть полностью случайно. То есть называть орел или решку максимально наугад. Если вы будете тяготеть к одному из результатов, ваш оппонент может это заметить и использовать в своих интересах.

1.7. Теория игр в экономике.

В настоящее время многие экономисты сталкиваются с различными проблемами. Большинство из этих проблем зависят от различных факторов, в большинстве своем противоречащих друг другу. И с течением времени происходит так, что из-за них возникают существенные экономические сбои, негативные процессы в экономике. Именно по этой причине, для решения этих проблем на стыке экономики и математики существуют особые экономико-математические методы, позволяющие быстро и без особых усилий решить большинство возникших проблем. Почти все математические модели отражают проблемы в абстрактной форме, они позволяют учитывать большее количество характеристик, от которых зависят решения данных проблем.

Во многих игровых задачах в сфере экономики неопределенность вызвана неосведомленностью в условиях задачи. Так бывает, когда одним из игроков выступает природа. Например, когда заранее не известно состояние погоды [4, 7].

2. Практическая часть проекта.

2.1. Определение оптимальной стратегии предприятия, выпускающего швейную продукцию 

Рассмотрим применение теории игр на практике. Допустим, что существует некоторое швейное предприятие, выпускающее женские платья и костюмы и реализующее свою продукцию через фирменный магазин. Сбыт продукции зависит от состояния погоды. На основе данных, полученных при проведении исследования, предприятие в течении апреля – мая в условиях теплой погоды может реализовать 600 костюмов и 1975 платьев, а при прохладной погоде 1000 костюмов и 625 платьев. Известно, что затраты на единицу продукции составили для костюмов 3000 руб., для платьев 700 руб., а цена реализации равна соответственно 5100 руб. и 1500 руб. Перед нами стоит задача - определить такую стратегию для данного предприятия, которая обеспечила бы фирме среднюю прибыль, покрывающую все затраты при любых погодных условиях.

По условиям задачи видно, что она относится к категории игр с природой. Предприятие располагает двумя чистыми стратегиями:

А – при теплой погоде;

Б – при холодной погоде.

Природу будем рассматриваться с точки зрения игрока, имеющего тоже 2 стратегии:

В - прохладная погода;

Г - теплая погода.

Если предприятие выберет стратегию А, то в случае прохладной погоды (стратегия природы В) средняя прибыль будет ... рублей.

А в случае теплой погоды (стратегия природы Г) доход равен ... рублям.

Если предприятие выберет стратегию Б, доход от реализации в условиях прохладной погоды составит ... рублей,

А в условиях теплой погоды: ...

Следовательно, матрица данной игры имеет вид: первая и вторая строки этой матрицы соответствуют стратегиям А и Б предприятия, а первый и второй столбец стратегиям В и Г природы. По платежной матрице видно, что первый игрок (предприятие) никогда не получит доход меньше 560000. Однако, если погодные условия совпадают с выбранной предприятием стратегией, то выручка составит 2600000 или 2840000. Отсюда можно сделать вывод, что, если погодные условия не известны заранее, самым оптимальным решением для предприятия будет попеременное применение стратегии А, а затем стратегии Б, для того чтобы обеспечить гарантированный доход. Такая стратегия называется смешанной, она позволяет первому игроку всегда оставаться в выигрыше, независимо от того, какую стратегию выбрал второй игрок. Пусть y означает частоту применения первым игроком стратегии А, тогда частота применения им стратегии Б равна (1–y). В случае оптимальной смешанной стратегии предприятие получит и при стратегии В (холодная погода), и при стратегии Г (теплая погода) второго игрока одинаковый средний доход.

Следовательно, если предприятие будет применять чистые стратеги А и Б в соотношении 632:405, оно обеспечивает себя оптимальной смешанной стратегией, гарантирующей ему при любых условиях средний доход в сумме ... рублей

Эта величина и будет в данном случае ценой игры. Легко рассчитать, какое количество костюмов и платьев необходимо выпускать предприятию при оптимальной стратегии.

Следовательно, оптимальная стратегия предприятия заключается в выпуске 635 костюмов и 1570 платьев, что обеспечит при любой погоде средний доход в сумме 1512131 рублей.

 

Список литературы:

1. Писарук Н.Н. Введение в теорию игр. — Минск: БГУ, 2016. — 256 c.

2. Дюбин Г.Н. Введение в прикладную теорию игр. — М.: Наука. Главная редакция физико-математической литературы, 1981.— 338.

3. Шеллинг Т. Стратегия конфликта. — Киев: Изд. «КНТ», 2021. — 384 с.

4. Нейман Дж. Фон, Моргенштерн О. Теория игр и экономическое поведение. —М., Наука, 1970 г.— 708 с.

5. Оуэн Г. Теория игр. Пер. с англ. под ред. А. А. Корбута со вступ. статьей Н. Н. Воробьева — М.: Мир, 1971. —230 с.

6. Наголова А.Д., Долгополова А.Ф. Практическое применение теории игр при решении задач экономического характера. — Современные наукоемкие технологии, 2014. – № 5-2. – 166-168с. 

 

. . . . .