Какая математическая модель относится к стохастическим. Теоретико-вероятностные (стохастические) модели и методы исследований. Применение стохастических уравнений

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

1. Пример построения стохастической модели процесса

В процессе функционирования банка очень часто возникает необходимость в решении проблемы выбора вектора активов, т.е. инвестиционного портфеля банка, и неопределенные параметры, которые необходимо учитывать в этой задаче, связаны в первую очередь с неопределенностью цен на активы (ценные бумаги, реальные вложения и т.д.). В качестве иллюстрации можно привести пример с формированием портфеля государственных краткосрочных обязательств.

Для задач данного класса принципиальный вопрос - это построение модели стохастического процесса изменения цен, поскольку в распоряжении исследователя операции, естественно, имеется только конечный ряд наблюдений реализаций случайных величин - цен. Далее излагается один из подходов к решению этой проблемы, который развивается в ВЦ РАН в связи с решением задач управления стохастическими марковскими процессами.

Рассматриваются М видов ценных бумаг, i =1,… , M , которые торгуются на специальных биржевых сессиях. Бумаги характеризуются величинами - выраженными в процентах доходностями в течение текущей сессии. Если бумага вида в конце сессии покупается по цене и продается в конце сессии по цене, то.

Доходности - это случайные величины, формирующиеся следующим образом. Предполагается существование базовых доходностей - случайных величин, образующих марковский процесс и определяемых по следующей формуле:

Здесь, - константы, а - стандартные нормально распределенные случайные величины (т.е. с нулевым математическим ожиданием и единичной дисперсией).

где - некоторый масштабный коэффициент равный (), а - случайная величина, имеющая смысл отклонения от базового значения и определяемая аналогично:

где - также, стандартные нормально распределенные случайные величины.

Предполагается, что некоторая оперирующая сторона, называемая в дальнейшем оператором, в течение некоторого времени управляет своим капиталом, вложенным в бумаги (во всякий момент в бумагу ровно одного вида), продавая их в конце текущей сессии и тут же покупая на вырученные деньги другие бумаги. Управление, выбор приобретаемых бумаг, производится по алгоритму, зависящему от информированности оператора о процессе, формирующем доходности бумаг. Нами будут рассматриваться различные гипотезы об этой информированности и, соответственно, различные алгоритмы управления. Будем предполагать, что исследователь операции, разрабатывает и оптимизирует алгоритм управления, используя имеющийся ряд наблюдений за процессом, т.е., используя информацию о ценах закрытия на биржевых сессиях, а также, возможно, и о величинах, на некотором промежутке времени, соответствующем сессиям с номерами. Целью экспериментов является сравнение оценок ожидаемой эффективности различных алгоритмов управления с их теоретическим математическим ожиданием в условиях, когда алгоритмы настраиваются и оцениваются на одном и том же ряду наблюдений. Для оценки теоретического математического ожидания используется метод Монте-Карло «прогонкой» управления по достаточно объемному сгенерированному ряду, т.е. по матрице размерности, где столбцы соответствуют реализациям значений и по сессиям, а число определяется вычислительными возможностями, но при условии, чтобы элементов матрицы было не менее 10000. Необходимо, чтобы «полигон» был одним и тем же во всех проводимых экспериментах. Имеющийся ряд наблюдений имитирует сгенерированная матрица размерности, где значения в ячейках имеют тот же смысл, что и выше. Число и значения в этой матрице будут в дальнейшем варьироваться. Матрицы обоих видов формируются посредством процедуры генерации случайных чисел, имитирующей реализацию случайных величин, и расчета по этим реализациям и формулам (1) - (3) искомых элементов матриц.

Оценка эффективности управления на ряду наблюдений производится по формуле

где - индекс последней сессии в ряду наблюдений, а - номер облигаций, выбранных алгоритмом на шаге, т.е. того вида облигаций, в которых, согласно алгоритму, будет находиться капитал оператора в течение сессии. Кроме того, будем рассчитывать также месячную эффективность. Число 22 приблизительно соответствует числу торговых сессий за месяц.

Вычислительные эксперименты и анализ результатов

Гипотезы

Точное знание оператором будущих доходностей.

Индекс выбирается как. Этот вариант дает верхнюю оценку для всех возможных алгоритмов управления, даже в случае, если дополнительная информация (учет каких-то дополнительных факторов) позволит уточнить модель прогноза цен.

Случайное управление.

Оператор не знает закона ценообразования и проводит операции случайным выбором. Теоретически, в данной модели математическое ожидание результата операций совпадает с тем, как если бы оператор вкладывал капитал не в одну бумагу, а во все поровну. При нулевых математических ожиданиях величин математическое ожидание величины равно 1. Расчеты по данной гипотезе полезны только в том смысле, что позволяют в некоторой степени проконтролировать корректность написанных программ и сгенерированной матрицы значений.

Управление при точном знании модели доходностей, всех ее параметров и наблюдаемой величины .

В этом случае оператор в конце сессии, зная значения и для сессий, и, а в наших расчетах, используя строки, и, матрицы, вычисляет по формулам (1) - (3) математические ожидания величин и выбирает для покупки бумагу с наибольшей из этих значений величин.

где, согласно (2), . (6)

Управление при знании структуры модели доходностей и наблюдаемой величине , но неизвестных коэффициентах .

Будем предполагать, что исследователь операции не только не знает значения коэффициентов, но не знает и число влияющих на формирование величин, предшествующих значений этих параметров (глубину памяти марковских процессов). Не знает также, одинаковы или различны коэффициенты при разных значениях. Рассмотрим различные варианты действий исследователя - 4.1, 4.2, и 4.3, где второй индекс обозначает предположение исследователя о глубине памяти процессов (одинаковой для и). К примеру, в случае 4.3 исследователь предполагает, что формируется согласно уравнению

Здесь, для полноты описания, добавлен свободный член. Однако, этот член может быть исключен либо из содержательных соображений, либо статистическими методами. Поэтому для упрощения расчетов мы в дальнейшем свободные члены при настройке параметров из рассмотрения исключаем и формула (7) приобретает вид:

В зависимости от того, предполагает ли исследователь одинаковыми или различными коэффициенты при разных значениях, будем рассматривать подслучаи 4.m. 1 - 4.m. 2, m = 1 - 3. В случаях 4.m. 1 коэффициенты будут настраиваться по наблюденным значениям для всех бумаг вместе. В случаях 4.m. 2 коэффициенты настраиваются для каждой бумаги отдельно, при этом исследователь работает в рамках гипотезы, что коэффициенты, различны при разных и, к примеру, в случае 4.2.2. значения определяются модифицированной формулой (3)

Первый способ настройки - классический метод наименьших квадратов. Рассмотрим его на примере настройки коэффициентов при в вариантах 4.3.

Согласно формуле (8),

Требуется найти такие значения коэффициентов, чтобы минимизировать выборочную дисперсию для реализаций на известном ряду наблюдений, массиве при условии, что математическое ожидание значений определяется формулой (9).

Здесь и в дальнейшем знак «» указывает на реализацию случайной величины.

Минимум квадратичной формы (10) достигается в единственной точке, в которой все частные производные равны нулю. Отсюда получаем систему трех алгебраических линейных уравнений:

решение которой дает искомые значения коэффициентов.

После того как коэффициенты верифицированы, выбор управлений проводится так же, как и в случае 3.

Замечание. Для того, чтобы облегчить работу над программами, принято процедуру выбора управления, описанную для гипотезы 3, сразу писать, ориентируясь не на формулу (5), а на ее модифицированный вариант в виде

При этом в расчетах для случаев 4.1.m и 4.2.m, m = 1, 2, лишние коэффициенты обнуляются.

Второй способ настройки состоит в выборе значений параметров так, чтобы максимизировать оценку из формулы (4). Задача эта аналитически и вычислительно безнадежно сложна. Поэтому здесь можно говорить только о приемах некоторого улучшения значения критерия относительно исходной точки. За исходную точку можно взять значения, полученные методом наименьших квадратов, и затем произвести обсчет вокруг этих значений по сетке. При этом последовательность действий такова. Сначала обсчитывается сетка на параметрах (квадрат или куб) при фиксированных остальных параметрах. Затем для случаев 4.m. 1 обсчитывается сетка на параметрах, а для случаев 4.m. 2 на параметрах при фиксированных остальных параметрах. В случае 4.m. 2 далее так же оптимизируются параметры. Когда этим процессом исчерпываются все параметры, процесс повторяется. Повторения производятся до тех пор, пока новый цикл дает улучшение значений критерия по сравнению с предыдущим. Чтобы число итераций не оказалось слишком большим, применим следующий прием. Внутри каждого блока расчетов на 2-х или 3-х-мерном пространстве параметров сначала берется достаточно грубая сетка, затем, если лучшая точка оказывается на краю сетки, то исследуемый квадрат (куб) сдвигается и расчет повторяется, если же лучшая точка внутренняя, то строится новая сетка вокруг этой точки с меньшим шагом, но с тем же общим числом точек, и так некоторое, но разумное число раз.

Управление при ненаблюдаемом и без учета зависимости между доходностями разных бумаг.

Имеется в виду, что исследователь операции не замечает зависимости между разными бумаги, ничего не знает о существовании и пытается прогнозировать поведение каждой бумаги по отдельности. Рассмотрим, как обычно, три случая, когда исследователь моделирует процесс формирования доходностей в виде марковского процесса глубиной 1, 2, и 3:

Коэффициенты для прогноза ожидаемой доходности не важны, а коэффициенты настраиваются двумя способами, описанными в п. 4. Управления выбираются, аналогично тому, как это делалось выше.

Замечание: Так же, как и для выбора управления, для метода наименьших квадратов имеет смысл написать единую процедуру с максимальным числом переменных - 3. Если настраиваемые переменные, скажем, то для из решения линейной системы выписывается формула, в которую входят только константы, определяется через, а через и. В случаях, когда переменных меньше чем три, значения лишних переменных обнуляются.

Хотя расчеты в различных вариантах проводятся сходным образом, число вариантов довольно велико. Когда подготовка инструментов для расчетов во всех перечисленных вариантах оказывается затруднительным, рассматривается на экспертном уровне вопрос о сокращении их числа.

Управление при ненаблюдаемом с учетом зависимости между доходностями разных бумаг.

Это серия экспериментов имитирует те манипуляции, которые были произведены в задаче с ГКО . Мы предполагаем, что исследователь практически ничего не знает о механизме формирования доходностей. Он располагает только рядом наблюдений, матрицей. Из содержательных соображений он делает предположение о взаимозависимости текущих доходностей разных бумаг, группирующихся около некоторой базовой доходности, определяемой состоянием рынка в целом. Рассматривая графики доходностей бумаг от сессии к сессии, он делает предположение, что в каждый момент времени точки, координатами которых являются номера бумаг и доходности (в реальности это были сроки до погашения бумаг и их цены), группируются возле некоторой кривой (в случае с ГКО - параболы).

Здесь - точка пересечения теоретической прямой с осью ординат (базовая доходность), а - ее наклон (то, что должно быть равным 0.05).

Построив таким образом теоретические прямые, исследователь операции может рассчитать значения - отклонения величин от их теоретических значений.

(Заметим, что здесь имеют несколько иной смысл, чем в формуле (2). Отсутствует размерный коэффициент, и рассматриваются отклонения не от базового значения, а от теоретической прямой.)

Следующей задачей является прогноз значений по известным в момент значениям, . Поскольку

для прогноза значений исследователю требуется ввести гипотезу о формировании величин, и. По матрице исследователь может установить значительную корреляцию между величинами и. Можно принять гипотезу о линейной зависимости между величинами от: . Из содержательных соображений коэффициент сразу полагается равным нулю, и методом наименьших квадратов ищется в виде:

Далее, как и выше и моделируются посредством марковского процесса и описываются формулами, аналогичными (1) и (3) с разным числом переменных в зависимости от глубины памяти марковского процесса в рассматриваемом варианте. (здесь определяется не по формуле (2), а по формуле (16))

Наконец, как и выше реализуются два способа настройки параметров методом наименьших квадратов, и посредством непосредственной максимизации критерия и делаются оценки.

Эксперименты

Для всех описанных вариантов рассчитывались оценки критериев, при разных матрицах. (матрицы с числом строк 1003, 503, 103 и для каждого варианта размерности реализовывались порядка ста матриц). По результатам расчетов для каждой размерности оценивались математическое ожидание и дисперсия величин, и их отклонение от величин, для каждого из подготовленных вариантов.

Как показали первые серии вычислительных экспериментов при малом числе настраиваемых параметров (порядка 4), выбор метода настройки не оказывает существенного влияния на значение критерия в задаче.

2. Классификация средств моделирования

стохастический моделирование банк алгоритм

Классификация методов моделирования и моделей может проводиться по степени подробности моделей, по характеру признаков, по сфере приложения и т.д.

Рассмотрим одну из распространенных классификаций моделей по средствам моделирования, именно этот аспект является наиболее важным при анализе различных явлений и систем.

материальным в том случае, когда исследование ведется на моделях, связь которых с исследуемым объектом существует объективно, имеет материальный характер. Модели в этом случае строятся исследователем либо выбирается им из окружающего мира.

По средствам моделирования методы моделирования делятся на две группы: методы материального и методы идеального моделирования Моделирование называется материальным в том случае, когда исследование ведется на моделях, связь которых с исследуемым объектом существует объективно, имеет материальный характер. Модели в этом случае строятся исследователем либо выбирается им из окружающего мира. В свою очередь в материальном моделировании можно выделить: пространственное, физическое и аналоговое моделирование.

В пространственном моделировании используются модели, предназначенные для того, чтобы воспроизвести или отобразить пространственные свойства изучаемого объекта. Модели в этом случае геометрически подобны объектам исследования (любые макеты).

Модели, используемые в физическом моделировании предназначены для воспроизводства динамики процессов, происходящих в изучаемом объекте. Причем общность процессов в объекте исследования и модели основана на сходстве их физической природы. Этот метод моделирования широко распространен в технике при проектировании технических систем различного вида. Например, исследование летательных аппаратов на основе экспериментов в аэродинамической трубе.

Аналоговое моделирование связано с использованием материальных моделей, имеющих другую физическую природу, но описывающихся теми же математическими соотношениями, что и изучаемый объект. Оно основано на аналогии в математическом описании модели и объекта (изучение механических колебаний с помощью электрической системы, описываемой теми же дифференциальными уравнениями, но более удобной в проведении экспериментов).

Во всех случаях материального моделирования модель-это материальное отражение исходного объекта, а исследование состоит в материальном воздействии на модель, то есть в эксперименте с моделью. Материальное моделирование по своей природе является экспериментальным методом и в экономических исследованиях не используется.

От материального моделирования принципиально отличается идеальное моделирование , основанное на идеальной, мыслимой связи между объектом и моделью. Методы идеального моделирования широко используются в экономических исследованиях. Их условно можно разделить на две группы: формализованное и неформализованное.

В формализованном моделировании моделью служат системы знаков или образов, вместе с которыми задаются правила их преобразования и интерпретации. Если в качестве моделей используются системы знаков, то моделирование называется знаковым (чертежи, графики, схемы, формулы).

Важным видом знаковой моделирования является математическое моделирование , основанное на том факте, что различные изучаемые объекты и явления могут иметь одинаковое математическое описание в виде совокупности формул, уравнений, преобразование которых осуществляется на основе правил логики и математики.

Другой формой формализованного моделирования является образное, в котором модели строятся на наглядных элементах (упругие шары, потоки жидкости, траектории движения тел). Анализ образных моделей осуществляется мысленно, поэтому они могут быть отнесены к формализованному моделированию, когда правила взаимодействия объектов, используемых в модели четко фиксированы (например, в идеальном газе столкновение двух молекул рассматривается, как соударение шаров, причем результат соударения мыслится всеми одинаково). Модели такого типа широко используются в физике, их принято называть «мысленными экспериментами».

Неформализованное моделирование. К нему можно отнести такой анализ проблем разнообразного типа, когда модель не формируется, а вместо нее используется некоторое точно не зафиксированное мысленное отображение реальной действительности, служащее основой для рассуждения и принятия решения. Таким образом, всякое рассуждение не использующее формальную модель можно считать неформализованным моделированием, когда у мыслящего индивидуума имеется некоторый образ объекта исследования, который можно интерпретировать как неформализованную модель реальности.

Исследование экономических объектов в течение долгого времени проводилось только на основе таких неопределенных представлений. В настоящее время анализ неформализованных моделей остается наиболее распространенным средством экономического моделирования, а именно всякий человек, принимающий экономическое решение без использования математических моделей вынужден руководствоваться тем или иным описанием ситуации, основанной на опыте и интуиции.

Основным недостатком этого подхода является то, что решения может оказаться мало эффективным или ошибочным. Еще долгое время, по-видимому, эти методы останутся основным средством принятия решений не только в большинстве обыденных ситуаций, но и при принятий решений в экономике.

Размещено на Allbest.ru

...

Подобные документы

    Принципы и этапы построения модели авторегрессии, ее основные достоинства. Спектр процесса авторегрессии, формула для ее нахождения. Параметры, характеризующие спектральную оценку случайного процесса. Характеристическое уравнение модели авторегрессии.

    контрольная работа , добавлен 10.11.2010

    Понятие и типы моделей. Этапы построения математической модели. Основы математического моделирования взаимосвязи экономических переменных. Определение параметров линейного однофакторного уравнения регрессии. Оптимизационные методы математики в экономике.

    реферат , добавлен 11.02.2011

    Исследование особенностей разработки и построения модели социально-экономической системы. Характеристика основных этапов процесса имитации. Экспериментирование с использованием имитационной модели. Организационные аспекты имитационного моделирования.

    реферат , добавлен 15.06.2015

    Понятие имитационного моделирования, применение его в экономике. Этапы процесса построения математической модели сложной системы, критерии ее адекватности. Дискретно-событийное моделирование. Метод Монте-Карло - разновидность имитационного моделирования.

    контрольная работа , добавлен 23.12.2013

    Методологические основы эконометрики. Проблемы построения эконометрических моделей. Цели эконометрического исследования. Основные этапы эконометрического моделирования. Эконометрические модели парной линейной регрессии и методы оценки их параметров.

    контрольная работа , добавлен 17.10.2014

    Этапы построения деревьев решений: правило разбиения, остановки и отсечения. Постановка задачи многошагового стохастического выбора в предметной области. Оценка вероятности реализации успешной и неуспешной деятельности в задаче, ее оптимальный путь.

    реферат , добавлен 23.05.2015

    Определение, цели и задачи эконометрики. Этапы построения модели. Типы данных при моделировании экономических процессов. Примеры, формы и моделей. Эндогенные и экзогенные переменные. Построение спецификации неоклассической производственной функции.

    презентация , добавлен 18.03.2014

    Основной тезис формализации. Моделирование динамических процессов и имитационное моделирование сложных биологических, технических, социальных систем. Анализ моделирования объекта и выделение всех его известных свойств. Выбор формы представления модели.

    реферат , добавлен 09.09.2010

    Основные этапы математического моделирования, классификация моделей. Моделирование экономических процессов, основные этапы их исследования. Системные предпосылки формирования модели системы управления маркетинговой деятельностью предприятия сферы услуг.

    реферат , добавлен 21.06.2010

    Общая схема процесса проектирования. Формализация построения математической модели при проведении оптимизации. Примеры использования методов одномерного поиска. Методы многомерной оптимизации нулевого порядка. Генетические и естественные алгоритмы.

3.1. Математические модели случайных процессов

При проведении научных исследований в производстве и в быту часто встречаются события, которые многократно появляются при одних и тех же условиях, но отличающиеся каждый раз друг от друга. Например, измеряя значение напряжения в сети переменного тока с помощью одного и того же прибора с одинаковой тщательностью, никогда не получим одинаковых данных. Наблюдается случайное рассеивание. Для оценки величины рассеивания вводится вероятность, как мера измерения.

Закономерность рассеивания, выраженная функцией распределения вероятностей, носит общий характер.

Если входные параметры объекта, смена состояний объекта или его выходные параметры описываются случайными распределениями вероятностей, то эти объекты относятся к классу стохастических. При моделировании поведения данных объектов применяется аппарат теории вероятностей, а для идентификации параметров моделей применяется аппарат математической статистики. Рассмотрим виды моделей, которые могут быть применены для описания стохастических объектов.

3.1.1. Распределение случайных событий . Массовые явления или процессы характеризуются многократным повторением при постоянных условиях некоторых опытов (операций и прочее). Абстрагируясь от специальных свойств этих опытов, в теории вероятностей вводится понятие испытания (опыта). Испытанием называется осуществление определенного комплекса условий, который может быть воспроизведен сколь угодно большое число раз. Явления, происходящие при реализации этого комплекса условий (в результате испытания), называются событиями .

Положительное число в отрезке , представляющее собой количественную меру возможности реализации случайного события в испытании, называется его вероятностью. Вероятность появления события А обозначают символом Р(А) , причем 0£Р(А)£ 1. Вероятность понимается как идеальная мера возможности появления события.

Случайная величина рассматривается как функция, аргументом которой служит элементарное случайное событие. Дискретной случайной величиной называется такая, которая может принимать конечное или бесконечное счетное множество значений, например возможны значения x 1 , x 2 , …, x n , … Для каждого события x i определены вероятности P(x i) . Распределение вероятностей дискретной случайной величины, представленное на рис. 3.1, рассматривают как точечное распределение вероятностей.

При непрерывном распределении случайной величины вероятности распределены сплошной полосой по всей оси x или по некоторым ее участкам с определенной плотностью.

Распределение вероятностей носит название теоретического распределения случайной величины.

Интегральная функция распределения вероятностей определяет вероятность того, что случайная величина X меньше значения x

. (3.1)

Пример задания интегральной функции распределения вероятностей приведен на рис. 3.2.

Дифференциальная функция распределения вероятностей (плотность распределения вероятностей) определяет вероятность того, что случайная величина X меньше значения x

. (3.2)

Пример задания дифференциальной функции распределения вероятностей приведен на рис. 3.3.

Совокупность случайных величин X(Q) аргумента Q , образует случайный процесс. Течение случайного процесса описывают некоторой функцией X(Q) , где Q - аргумент функции со значениями из множества Q . Функцию X(Q) , наблюдаемую в некотором опыте, соблюдая определенный комплекс условий, называют выборочной функцией или реализацией случайного процесса.

Если множество Q произвольно, то вместо термина «случайный процесс» применяют термин «случайная функция». Название «случайный процесс» применимо в тех случаях, когда параметр Q интерпретируется как время. Если аргумент случайной функции является пространственной переменной, то функцию называют случайным полем.

Определение. Моделью случайного процесса называют случайную функцию X(Q) , заданную на множестве Q , принимающую действительные значения и описываемую семейством распределений :

, QiÎQ, i=1,2,...,n, n=1,2,...,

которое удовлетворяет условиям согласованности

,

= ,

где i 1 , i 2 ,…, i n , - любая перестановка индексов 1 , 2 ,..., n .

Набор функций называется конечномерными распределениями случайной функции или интегральной функции распределения вероятностей многомерной случайной величины. При n =1 получим одномерное распределение (3.1). Модель многомерного распределения необходима для моделирования многопараметрической случайной величины.

При решении многих задач моделирования приходится оперировать с несколькими случайными функциями. Для того чтобы над ними производить математические операции, недостаточно, чтобы каждая из этих случайных функций была задана в отдельности. Последовательность функций X 1 (Q), X 2 (Q),…, X n (Q) возможно заменить векторной функцией x(Q) , компонентами которой служат случайные функции X i (Q), (i=1,2,…,n) .

Явные выражения для конечномерных функций распределения случайного процесса бывают сложными и неудобными для применения. Поэтому в ряде случаев предпочитают задавать конечномерные распределения их плотностями (дифференциальной функцией распределения вероятностей многомерной случайной величины) или характеристическими функциями.

Если - плотность функций распределения , то

=

= .

Связь интегральной функции распределения вероятностей одномерной случайной величины и ее дифференциальной функцией распределения вероятностей показана формулой

.

Модель системы может быть задана также в виде характеристической функции конечномерного распределения последовательности

X 1 (Q),X 2 (Q), …, X n (Q), Qi³0 >, i=1,n, n=1,2,...,

которая определяется формулой

где M - символ математического ожидания, u 1 ,u 2 ,...,u k - вещественные числа.

Если существует плотность конечномерного распределения, то модель в виде характеристической функции является преобразованием Фурье плотности распределения. Для одномерной случайной величины характеристическая функция определится по формуле

.

3.1.2. Корреляционные функции. Исчерпывающую характеристику модели стохастического объекта в виде случайной функции в широком смысле дает семейство конечномерных распределений. Однако решение многих теоретико-вероятностных задач зависит только от небольшого числа параметров, характеризующих входящие в задачу распределения. Наиболее важными числовыми характеристиками распределений являются их моменты. В теории случайных функций роль моментов распределений играют моментные функции. Рассмотрим модели в виде моментных функций для одномерной случайной величины.

Момент k –го порядка дискретной случайной величины определяется по формуле

.

Для непрерывной случайной величины моментная функция k

.

Рассмотрим модели в виде моментных функций для многомерной случайной величины.

Определение . Модель случайной функции X(Q i), Q i ÎQ в виде моментной функции задается отношением

если математическое ожидание в правой части равенства имеет смысл при всех QiÎQ, i=1,n . Величина q=j 1 +j 2 +...+j n называется порядком моментной функции.

Если известны характеристические функции конечномерного распределения, то моментные функции с целочисленными индексами могут быть найдены с помощью дифференцирования

при u 1 =u 1 =…=u n =0 .

Кроме моментных функций в качестве моделей часто рассматривают центральные моменты функции. Центрированной случайной величиной называется случайная величина . Для непрерывной случайной величины центральная моментная функция k –го порядка определяется по формуле

.

Для многомерной случайной величины центральные моменты функции определятся по формуле

которые являются моментными функциями центрированной случайной функции многих параметров.

Среди моментных функций особое значение имеют функции первых двух порядков, которые могут иметь обозначения:

m(Q)=m 1 (Q 1)=MX(Q),

R 1 (Q 1 ,Q 2)=m 1 (Q 1 ,Q 2)=M{}.

Функции m(Q) называются средним значением или математическим ожиданием, а R 1 (Q 1 ,Q 2) - корреляционной функцией. При Q 1 =Q 2 =Q корреляционная функция дает дисперсию s(Q) величины e(Q), R 1 (Q 1 ,Q 2)=s 2 (Q) .

Величину

называют коэффициентом корреляции случайных величин X(Q 1) и X(Q 2) .

Стохастический вариант даже простой эпидемии достаточно сложен. Не удивительно, что в общем случае для анализа стохастической модели эпидемии требуется еще более сложный математический аппарат. По-настоящему удовлетворительное описание основных характеристик такого процесса еще не достигнуто, но ряд отдельных полезных результатов уже получен.

Рассмотрим вначале исходную модель и вывод основных уравнений движения. В данном случае имеются две существенно различные случайные величины. Пусть, как и ранее, обозначает число восприимчивых индивидуумов в момент времени t, a - число источников инфекции. Таким образом, мы имеем дело с двумерным процессом, аналогичным тому, который был рассмотрен в разд. 8.3. Здесь возможны переходы двух видов. Снова примем частоту контактов равной тогда вероятность появления в интервале нового источника инфекции будет равна . Если частота удаления из коллектива зараженных индивидуумов равна у, то вероятность того, что в интервале будет удален один индивидуум, составит . В данном случае возможны два значения функции отличные от нуля; в обозначениях, принятых в разд. 8.2 и 8.3, они имеют вид . Если изменить временной масштаб, перейдя к и обозначить через относительную частоту удаления, то, используя уравнение (8.48), получим следующее дифференциальное уравнение в частных производных для производящей функции вероятностей:

при начальном условии

(в предположении, что процесс начинается при наличии восприимчивых индивидуумов и а источников инфекции).

До сих пор непосредственно решить уравнение (9.24) в простом замкнутом виде еще не удалось. Попытки использовать обыкновенные дифференциальные уравнения для моментов или семиинвариантов, выведенные обычным способом, также не увенчались успехом по тем же причинам, что и в случае модели конкуренции между двумя видами, рассмотренной в разд. 8.4. (Такая же трудность возникает даже в случае простой стохастической эпидемии.) Однако не исключено, что уравнение (9.24) можно будет использовать как основу для дальнейших исследований.

Если вероятность того, что в момент имеется j восприимчивых индивидуумов и к источников инфекции, равна , то подстановка производящей функции вероятностей

в уравнение (9.24) дает систему дифференциальных уравнений

В принципе эти уравнения можно решить непосредственно с помощью преобразований Лапласа. Однако получающиеся алгебраические выражения столь громоздки, что практически этот метод совершенно непригоден.

Некоторого успеха можно добиться в предельном случае при когда . Здесь можно получить довольно простую треугольную систему линейных уравнений, решение которой дает вероятность того, что дополнительно к первоначальным случаям эпидемия охватит еще w индивидуумов. Для получения конкретных результатов необходимо провести численные расчеты; были рассчитаны распределения общего числа зараженных индивидуумов для и 40 при и различных значениях . Как и ожидалось, при все распределения имеют -образную форму с максимальным значением в точке Если же , то распределения имеют -образную форму, т. е. возможна очень малая или очень большая вспышка, тогда как промежуточные состояния наблюдаются редко.

Таким образом, хотя при столь малых значениях (не более 40) резкие переходы отсутствуют, имеются две различные схемы распространения эпидемии.

При больших справедлива теорема о стохастическом пороговом значении, принадлежащая Уиттлу. Не входя во все детали анализа, проведенного Уиттлом, с помощью следующих приближенных рассуждений легко показать, чего именно можно ожидать в этом случае. Если достаточно велико, то (во всяком случае, в начальный период) численность группы источников инфекции изменяется примерно по тому же закону, которому подчиняется процесс размножения и гибели со скоростями размножения и гибели, равными соответственно и у. Теперь используем формулу (8.35), выражающую вероятность вымирания популяции, заменив , на на у. Из нее следует, что вероятность прекращения эпидемического процесса равна 1 при и при . В первом случае исходная группа источников инфекции, безусловно, элиминирует и можно ожидать, что общее число заболеваний будет мало. Во втором случае с вероятностью можно ожидать малой вспышки и с вероятностью - большой вспышки эпидемии.

Стохастические модели с такими общими свойствами весьма полезны, хотя и до известного предела. Несмотря на присущие им ограничения, эти модели, соответствующим образом обобщенные и измененные, смогут, по-видимому, сыграть важную роль при исследовании широкого круга эпидемических явлений, наблюдаемых в больших популяциях. Однако очевидно, что для изучения более тонких деталей эти модели не подойдут. Так, в рассмотренной выше стохастической модели предполагалось, что не только латентный период равен нулю, но и длительность заразного периода имеет экспоненциальное распределение; для большинства болезней ни одно из этих допущений не справедливо. Для более реалистичного описания биологических и клинических деталей можно было бы построить модели для многофазовых процессов аналогично тому, что было сделано в конце разд. 8.3. Затем для различных интервалов можно выбрать распределения сохраняя при этом марковский характер всего процесса. В определенных случаях оказываются применимыми модели, рассмотренные в разд. 9.5 и 9.6.


Как уже говорилось выше, стохастические модели – это модели вероятностные. При этом в результате расчетов можно сказать с достаточной степенью вероятности, каково будет значение анализируемого показателя при изменении фактора. Самое частое применение стохастических моделей – прогнозирование.

Стохастическое моделирование является в определенной степени дополнением и углублением детерминированного факторного анализа. В факторном анализе эти модели используются по трем основным причинам:

  • необходимо изучить влияние факторов, по которым нельзя построить жестко детерминированную факторную модель (например, уровень финансового левериджа);
  • необходимо изучить влияние сложных факторов, которые не поддаются объединению в одной и той же жестко детерминированной модели;
  • необходимо изучить влияние сложных факторов, которые не могут быть выражены одним количественным показателем (например, уровень научно-технического прогресса).

В отличие от жестко детерминированного стохастический подход для реализации требует ряда предпосылок:

  1. наличие совокупности;
  2. достаточный объем наблюдений;
  3. случайность и независимость наблюдений;
  4. однородность;
  5. наличие распределения признаков, близкого к нормальному;
  6. наличие специального математического аппарата.

Построение стохастической модели проводится в несколько этапов:

  • качественный анализ (постановка цели анализа, определение совокупности, определение результативных и факторных признаков, выбор периода, за который проводится анализ, выбор метода анализа);
  • предварительный анализ моделируемой совокупности (проверка однородности совокупности, исключение аномальных наблюдений, уточнение необходимого объема выборки, установление законов распределения изучаемых показателей);
  • построение стохастической (регрессионной) модели (уточнение перечня факторов, расчет оценок параметров уравнения регрессии, перебор конкурирующих вариантов моделей);
  • оценка адекватности модели (проверка статистической существенности уравнения в целом и его отдельных параметров, проверка соответствия формальных свойств оценок задачам исследования);
  • экономическая интерпретация и практическое использование модели (определение пространственно-временной устойчивости построенной зависимости, оценка практических свойств модели).

Основные понятия корреляционного и регрессионного анализа

Корреляционный анализ - совокупность методов математической статистики, позволяющих оценивать коэффициенты, характеризующие корреляцию между случайными величинами, и проверять гипотезы об их значениях на основе расчета их выборочных аналогов.

Корреляционным анализом называется метод обработки статистических данных, заключающийся в изучении коэффициентов (корреляции) между переменными.

Корреляционная связь (которую также называют неполной, или статистической) проявляется в среднем, для массовых наблюдений, когда заданным значениям зависимой переменной соответствует некоторый ряд вероятных значений независимой переменной. Объяснение тому – сложность взаимосвязей между анализируемыми факторами, на взаимодействие которых влияют неучтенные случайные величины. Поэтому связь между признаками проявляется лишь в среднем, в массе случаев. При корреляционной связи каждому значению аргумента соответствуют случайно распределенные в некотором интервале значения функции .

В наиболее общем виде задача статистики (и, соответственно, экономического анализа) в области изучения взаимосвязей состоит в количественной оценке их наличия и направления, а также характеристике силы и формы влияния одних факторов на другие. Для ее решения применяются две группы методов, одна из которых включает в себя методы корреляционного анализа, а другая – регрессионный анализ. В то же время ряд исследователей объединяет эти методы в корреляционно-регрессионный анализ, что имеет под собой некоторые основания: наличие целого ряда общих вычислительных процедур, взаимодополнения при интерпретации результатов и др.

Поэтому в данном контексте можно говорить о корреляционном анализе в широком смысле – когда всесторонне характеризуется взаимосвязь. В то же время выделяют корреляционный анализ в узком смысле – когда исследуется сила связи – и регрессионный анализ, в ходе которого оцениваются ее форма и воздействие одних факторов на другие.

Задачи собственнокорреляционного анализа сводятся к измерению тесноты связи между варьирующими признаками, определению неизвестных причинных связей и оценке факторов оказывающих наибольшее влияние на результативный признак.

Задачирегрессионного анализа лежат в сфере установления формы зависимости, определения функции регрессии, использования уравнения для оценки неизвестных значении зависимой переменной.

Решение названных задач опирается на соответствующие приемы, алгоритмы, показатели, что дает основание говорить о статистическом изучении взаимосвязей.

Следует заметить, что традиционные методы корреляции и регрессии широко представлены в разного рода статистических пакетах программ для ЭВМ. Исследователю остается только правильно подготовить информацию, выбрать удовлетворяющий требованиям анализа пакет программ и быть готовым к интерпретации полученных результатов. Алгоритмов вычисления параметров связи существует множество, и в настоящее время вряд ли целесообразно проводить такой сложный вид анализа вручную. Вычислительные процедуры представляют самостоятельный интерес, но знание принципов изучения взаимосвязей, возможностей и ограничений тех или иных методов интерпретации результатов является обязательным условием исследования.

Методы оценки тесноты связи подразделяются на корреляционные (параметрические) и непараметрические. Параметрические методы основаны на использовании, как правило, оценок нормального распределения и применяются в случаях, когда изучаемая совокупность состоит из величин, которые подчиняются закону нормального распределения. На практике это положение чаще всего принимается априори. Собственно, эти методы – параметрические – и принято называть корреляционными.

Непараметрические методы не накладывают ограничений на закон распределения изучаемых величин. Их преимуществом является и простота вычислений.

Автокорреляция - статистическая взаимосвязь между случайными величинами из одного ряда, но взятых со сдвигом, например, для случайного процесса - со сдвигом по времени.

Парная корреляция

Простейшим приемом выявления связи между двумя признаками является построение корреляционной таблицы:

\ Y \ X \ Y 1 Y 2 ... Y z Итого Y i
X 1 f 11 ... f 1z
X 1 f 21 ... f 2z
... ... ... ... ... ... ...
X r f k1 k2 ... f kz
Итого ... n
... -

В основу группировки положены два изучаемых во взаимосвязи признака – Х и У. Частоты f ij показывают количество соответствующих сочетаний Х и У.

Если f ij расположены в таблице беспорядочно, можно говорить об отсутствии связи между переменными. В случае образования какого-либо характерного сочетания f ij допустимо утверждать о связи между Х и У. При этом, если f ij концентрируется около одной из двух диагоналей, имеет место прямая или обратная линейная связь.

Наглядным изображением корреляционной таблице служит корреляционное поле. Оно представляет собой график, где на оси абсцисс откладывают значения Х, по оси ординат – У, а точками показывается сочетание Х и У. По расположению точек, их концентрации в определенном направлении можно судить о наличии связи.

Корреляционным полем называется множество точек {X i , Y i } на плоскости XY (рисунки 6.1 - 6.2).

Если точки корреляционного поля образуют эллипс, главная диагональ которого имеет положительный угол наклона (/), то имеет место положительная корреляция (пример подобной ситуации можно видеть на рисунке 6.1).

Если точки корреляционного поля образуют эллипс, главная диагональ которого имеет отрицательный угол наклона (\), то имеет место отрицательная корреляция (пример изображен на рисунке 6.2).

Если же в расположении точек нет какой-либо закономерности, то говорят, что в этом случае наблюдается нулевая корреляция.

В итогах корреляционной таблицы по строкам и столбцам приводятся два распределения – одно по X, другое по У. Рассчитаем для каждого Х i среднее значение У, т.е. , как

Последовательность точек (X i , ) дает график, который иллюстрирует зависимость среднего значения результативного признака У от факторного X, – эмпирическую линию регрессии, наглядно показывающую, как изменяется У по мере изменения X.

По существу, и корреляционная таблица, и корреляционное поле, и эмпирическая линия регрессии предварительно уже характеризуют взаимосвязь, когда выбраны факторный и результативный признаки и требуется сформулировать предположения о форме и направленности связи. В то же время количественная оценка тесноты связи требует дополнительных расчетов.

    Классическое определение вероятности

    Вероятностная модель эксперимента с конечным числом исходов. Определение вероятностного пространства, алгебры, событий. Классические вероятностные задачи на подсчет случайных шансов. Число элементарных исходов, когда происходит выбор с возвращением/без возвращения, выборки упорядоченные/неупорядоченные. Связь с задачей подсчета числа размещений дробинок по ячейкам. Классические вероятностные задачи на подсчет случайных шансов (задача о совпадениях, выигрыш в лотерею). Биномиальное распределение. Мультиномиальное распределение. Многомерное гипергеометрическое распределение.

    Условные вероятности. Независимость. Условное математическое ожидание.

    Определение условной вероятности, свойства. Формула полной вероятности. Формула Байеса, теорема Байеса. Определение независимости событий. Пример, что из попарное независимости событий вообще говоря не следует их независимости. Схема Бернулли.

    Дискретные случайные величины и их характеристики

    Распределение случайной величины. Свойства функции распределения случайной величины. Определение математического ожидания, дисперсии, ковариации и корреляции, свойства. Наилучший в среднеквадратичном линейный прогноз значений одной случайной величины по значений другой случайной величины.

    Предельные теоремы

    Схема Бернулли. Неравенство Чебышева, следствия. Закон больших чисел Бернулли. Предельные теоремы (локальная, Муавра-Лапласа, Пуассона).

    Случайное блуждание

    Вероятности разорения и средняя продолжительность при игре с бросанием монеты. Принцип отражения. Закон арксинуса.

    Мартингалы

    Определение. Примеры мартингалов. Определение момента остановки. Тождества Вальда.

    Дискретные марковские цепи. Эргодическая теорема.

    Общее определение марковского процесса. Определение дискретной марковской цепи. Уравнение Колмогорова-Чепмена. Однородная марковская цепь. Классификация состояний марковской цепи (несущественные, возвратные, сообщающиеся, нулевые, периодические, эргодические состояния), теорема о "солидарности" их свойств. Неразложимая дискретная марковская цепь. Необходимое и достаточное условие возвратности состояния однородной дискретной марковской цепи. Определение эргодичной дискретной марковской цепи. Стационарное распределение. Эргодическая теорема в случае однородной дискретной марковской цепи.

    Вероятностная модель эксперимента с бесконечным числом событий. Аксиоматика Колмогорова. Разные виды сходимости случайных величин.

    Аксиоматика Колмогорова. Алгебры и сигма-алгебры. Измеримые пространства (R, B(R)), (Rd, B(Rd)), (R∞, B(R∞)) и (RT, B(RT)), где T - произвольное множество. Примеры дискретных мер, примеры абсолютно непрерывных мер. Многомерное нормальное распределение. Теорема Колмогорова о продолжении мер в (R∞, B(R∞)) (без доказательства). Определение случайной величины и ее свойства. Функция распределения и ее свойства. Построение интеграла Лебега. Математическое ожидание, свойства. Теорема о монотонной сходимости, лемма Фату, теорема Лебега о мажорируемой сходимости (без доказательства). Семейство равномерное интегрируемых случайных величин, достаточное условие равномерной интегрируемости. Неравенство Чебышева, Коши-Буняковского, Иенсена, Ляпунова, Гёльдера, Минковского. Теорема Радона-Никодима (без доказательства). Определение условного математического ожидания и условной вероятности, свойства. Разные виды сходимости последовательностей случайных величин, определения, соотношения разных видов сходимости друг с другом, контрпримеры. Лемма Бореля-Кантелли. Определение характеристической функции, свойства, примеры.