Социо-кибер-физические системы



Мы поможем в написании ваших работ!


Мы поможем в написании ваших работ!



Мы поможем в написании ваших работ!


ЗНАЕТЕ ЛИ ВЫ?

Социо-кибер-физические системы



ВВЕДЕНИЕ

 

Электронное учебное пособие по дисциплине «Теория информационных процессов и систем» направлено на формирование универсальных компетенций в соответствии с федеральным государственным образовательным стандартом (ФГОС ВО 3++) по уровню бакалауреата:

ПК-11 - Способность проектировать базовые и прикладные информационные технологии;

ПК-14 - Способность использовать знание основных закономерностей функционирования биосферы и принципов рационального природопользования для решения задач профессиональной деятельности;

        ПК-22 - Способность проводить сбор, анализ научно-технической информации, отечественного и зарубежного опыта по тематике исследования.

Электронное учебное пособие предназначено для обучающихся по направлению подготовки бакалауреата 09.03.02 «Информационные системы и технологии», и может быть использовано при изучении других дисциплин, направленных на формирование универсальных компетенций.

В электронном учебном пособии содержится систематическое изложение основ современных методов информационного анализа процессов и систем, в том числе на основе моделей теории сигналов и математической статистики.

Цель электронного учебного пособия – сформировать у обучающихся системные знания в области теории и практики анализа данных, развить коммуникативные компетенции, которые позволят и в будущем осуществлять профессиональную деятельность.

Содержание данного электронного учебного пособия соответствует рабочей программе дисциплины и основано на материалах отечественных и зарубежных исследований в области анализа данных, включая современные публикации.

Каждый раздел электронного учебного пособия включает контрольные вопросы и тестовые задания.


 

АННОТАЦИЯ ДИСЦИПЛИНЫ
«ТЕОРИЯ ИНФОРМАЦИОННЫХ ПРОЦЕССОВ И СИСТЕМ»

  1. Место дисциплины в структуре образовательной программы

       Дисциплина «Теория информационных процессов и систем» относится к базовой части программы и изучается в 4-5 семестрах 2-го и 3-го курсов.

Изучение дисциплины основано на принципах дальнейшего развития математических дисциплин базовой части программы, в том числе дисциплин «Математика», «Дополнительные главы математики», «Базовые информационные процессы и технологии», «Моделирование процессов и систем», а также дисциплины вариативной части «Проектирование информационных систем».

       В качестве «входных» знаний, умений и готовностей требуется владение основными понятиями теории вероятностей, конечномерного линейного анализа, прежде всего операциями с матрицами и квадратичными формами. 

       Освоение данной дисциплины как предшествующей необходимо для последующего овладения дисциплинами «Интеллектуальные информационные системы и технологии», «Инструментальные средства информационных систем», «Технологии обработки информации», «Технологии интеллектуального анализа данных» и для успешного выполнения ВКР.

2. Планируемые результаты обучения по дисциплине

В результате освоения дисциплины обучающийся должен:

Знать:

  • концепцию хранилища данных, организацию хранилища данных, способы обработки и извлечения данных;
  • принципы системного подхода и основные синергетические закономерности функционирования сложных систем;
  • концепцию базы данных, организацию базы данных, способы обработки и извлечения данных.

Уметь:

  • выбрать используемые технологии в зависимости от организационной структуры организации и от класса решаемых задач;
  • использовать принципы системного подхода при анализе природных процессов;
  • выбрать используемые технологии в зависимости от организационной структуры организации и от класса решаемых задач.

Владеть:

  • современной информациейо характеристиках конкретных систем, разработанных ведущими мировыми разработчиками и возможностях их интеграции;
  • методами компьютерной реализации вероятностного анализа процессов и явлений;
  • современными методами сбора, анализа и организации хранения данных.

3. Объем дисциплины по видам учебных занятий

Объем дисциплины составляет 5  зачетных единицы, всего  180  часов, из которых  48  часов составляет контактная работа обучающегося с преподавателем ( 36  часа занятий лекционного типа,  54  часов практических занятий),  90  часов составляет самостоятельная работа обучающегося). В конце 6-го семестра предусмотрен экзамен (36 часов)


ОГЛАВЛЕНИЕ

Введение………………….……………………………………………………………… Аннотация………………………………………………………………………………. 1. Системы и модели…..………….……………………………………..……………… 1.1. Аналитические модели………………............................................................... 1.2. Имитационные модели…………………………………………....................... 1.3.Большие системы………………………………………………......................... 1.4. Модели вместо законов ………………………………………......................... 1.5. Многозначность понятий…………………...…………………........................ 1.6. Человек и машина………………………………………………....................... 1.7. Теорема Гёделя…………………………………………………........................ 1.8. Генератор случая………………………………………………......................... 1.9. Живое и неживое……………………….………………………........................ 1.10. Социо-кибер-физические системы…………………………......................... Контрольные вопросы………………………………………………....................... 2. Построение динамических моделей по экспериментальным данным.......….   2.1. Разложение Юла……………………..………………………….......................   2.2. Тренд и сезонные сотавляющие……………………….………........................   2.3. Локально-полиномиальное сглаживание…………………...........................   2.4. Экспоненциальное сглаживание………………………………........................       Контрольные вопросы………………………………………………........................   Задания на лабораторную работу №2…………………………….......................  3. Рекуррентные алгоритмы.………… .........................................................................   3.1. Рекуррентное оценивание среднего и ковариационной матрицы……… 3.2. Одномерный линейный фильтр Калмана-Бьюси..………………………….   3.3. m-мерный линейный фильтр Калмана-Бьюси……………………………..   3.4. Варианты определения исходных параметров……………………………..   Контрольные вопросы……………………………………….…………………….. Задания на лабораторную работу №3……………………..……………………… 4. Корреляционный и спектральный анализ детерминированных процессов … 4.1. Пространство сигналов…………………………..…………………………….. 4.2. Преобразование Фурье…………………………………………….…………… 4.3. Процессы в линейных системах…………..………..…………………………  Контрольные вопросы………………………………………………...……………...    Задания на лабораторную работу № 4………………….………………………….. 5. Корреляционный анализ случайных процессов…………………………………. 5.1. Описание и классификация случайных процессов…………………………. 5.2. Математическое ожидание и корреляционная функция…………………… 5.3. Свойства корреляционной функции………………………………………….. 5.4. Вероятностный смысл корреляционной функции…………………………. 5.5. Основные типы случайных процессов……………………………………….. 5.6. Процесс броуновского движения……………………………………………… Контрольные вопросы………………………………………………........................    Задания на лабораторную работу № 5……………………………………………. 6. Спектральный анализ случайных процессов……………………………….. 6.1. Спектральное представление стационарного случайного процесса ……..   6.2. Свойства спектральной плотности……………………………………………… 6.3. Случайные процессы в линейных системах…………………………………. 6.4. Эргодическая теорема для процессов в линейных системах………………. Контрольные вопросы………………………………………………........................    Задания на лабораторную работу № 6…………………………………………….. 7. Непараметрический анализ стационарных временных рядов…………………. 7.1. Дискретизация. Частота Найквиста и теорема Котельникова …………..   7.2. Быстрое преобразование Фурье……………………………………………… Контрольные вопросы………………………………………………........................    Задания на лабораторную работу № 7……………………………………………. 8. Параметрический анализ  стационарных временных рядов…………………… 8.1. Дискретные модели стационарных временных рядов……........................ 8.2. Параметрическое оценивание СПМ………….……………………………. 8.3. Авторегрессия: процессы Маркова и Юла………………………………… Контрольные вопросы………………………………………………........................    Задания на лабораторную работу № 8…………………………………………….. 9. Оценивание параметров моделей………………………………………………… 9.1. Уравнения Юла-Уокера…………..…………………………………………… 9.2. Оценивание коэффициентов параметрических моделей…………………..  9.3. Оценивание порядка модели…………..……………………………………… Контрольные вопросы……………………………………………….........................    Задания на лабораторную работу № 9…………………………………………….. 10. Прогнозирование……………………………………………………………………..  10.1. Горизонт прогноза……………………………………………………………..  8.2. Адаптивные фильтры………………………………………………………….. Контрольные вопросы………………………………………………..........................    Задания на лабораторную работу №10…………………………………………….. 11. Системы массового  обслуживания (СМО)……………………………………   11.1. Конечные цепи Маркова …………………………………………………… 11.2. Потоки событий……………………………………………………………….. 11.3. Основные свойства простейшего потока...…………………………………. 11.4. СМО с отказами……………………………………………………………… 11.5. СМО с ожиданием……………………………………………………………… 11.6. Сводка основных формул для Марковских СМО…………………………. 11.7. Формулы Литтла……….…………………………………………………….. Контрольные вопросы………………………………………………..........................    Задания на лабораторную работу № 11……………………………………………. Библиографический список …………………………………………………………… 2 3 7 8 8 8 9 9 10 10 11 11 11 12 12 14 14 15 18 20 20 20 20 21 22 24 25 25 26 26 27 29 30 30 30 30 31 31 32 34 36 37 37 38 38 39 40 44 46 46 46 46 48 50 50 51 51 52 53 54 54 54 54 56 58 58 58 59 59 60 62 62 62 62 63 64 67 67 68 69 70 70 70  

 

Системы и модели

   Система – это целостное образование, обладающее свойствами, не сводящимися к свойствам входящих в это образование элементов.

  Модель – это система, исследование которой служит средством для получения информации о другой системе (прототипе). Она должна обладать следующими свойствами:

  • Находиться в объективном соответствии с изучаемой системой;
  • Замещать в определенном отношении изучаемую систему;
  • Давать информацию об изучаемой системе на основе правил перехода модель – прототип.

Модель, отражающая с необходимой полнотой систему в содержательном аспекте и записанная на естественном языке с использованием положений наивной логики, называется концептуальной моделью. Различают дескриптивное концептуальное моделирование, в котором рассматриваются модели описательного характера, и прескриптивное (нормативное) концептуальное моделирование. Прескриптивные модели предписывают определенное поведение, определенные действия (прогнозирование, оптимизация).

Аналитические модели

Аналитическая математическая модель

  • Строится на основе некоторой концептуальной модели (теории, гипотезы);
  • Описывает определенный аспект системы посредством математических конструкций (функций, функционалов, уравнений и т.п.)
  • Позволяет получить результаты исследования в виде формальных соотношений для количественного или качественного анализа.

Основной недостаток аналитического моделирования связан с тем, что для сложных систем необходима существенная идеализация как элементов, так и системы в целом.

Имитационные модели

Имитационная математическая модель

  • Строится на основе упрощенной концептуальной модели (теории, гипотезы);
  • Описывает последовательность операций, соответствующих логике функционирования системы;
  • Ориентирована на получение информации о системе путем проведения имитационных экспериментов.

Основным достоинством имитационных моделей является возможность отражения таких свойств системы, как нелинейность, дискретность, вероятность срабатывания, разнородность элементов и разнообразие связей между ними, временная логика и др.

      Основным недостатком имитационной модели является недостаточность теоретической проработки и необходимость многократных экспериментов, состоящих в имитации процессов в системе при различных воздействиях. Однако даже при многократном экспериментировании фундаментальность выводов здесь уступает фундаментальности выводов, получаемых на аналитической модели (если ее возможно построить).

Большие системы

Одно из самых примечательных явлений, наблюдающихся сейчас в науке, - это стремление перейти от изучения хорошо организованных систем к плохо орга­низованным или диффузным системам, к изуче­нию задач с плохой структурой. Сейчас такие системы называют сложными. Иногда их называют также большими системами, поскольку здесь надо учитывать действие очень многих разнородных факторов, задающих различные по своей природе, но тесно взаимодействующие друг с другом процессы. Еще большие трудности возникают при попытке изучать такие диффузные системы, для кото­рых неизвестны протекающие в них элементарные процес­сы. Примером служит, например, интел­лект человека.

Модели вместо законов

  Переход от изучения хорошо организованных систем к изучению плохо организованных, сложных систем оказал влияние на общие концепции науки. Поня­тие закона в науке заменяется более широким, хотя и очень расплывчатым понятием модели.Сейчас наряду с учеными нового направления, занимающимися изуче­нием плохо организованных систем, существуют ученые традиционного направления, занимающиеся изучением хорошо организованных систем. Много досадных недоразумений возникает, когда работы, выполненные с позиций статистических или кибер­нетических, обсуждаются учеными другого направления.

Модель — это весьма многозначное понятие. В математику понятие модели было введено Клейном (70-е годы XIX века), а затем Расселом. Одно из примене­ний этого понятия в математике состоит в доказательстве внутренней непротиворечивости теории путем нахождения реально существую­щей модели - то, что существует, не может быть внутренне противоречиво. П онятие математической модели, существующее сейчас в прикладной математике и кибернетике, можно противопоставить понятию за­кона в науке. Закон в науке имеет характер некоторой абсолютной категории на данном уровне знаний. Он может быть либо безусловно верен, либо безусловно неверен. Нельзя говорить о хороших и плохих законах или что одно и то же явление можно объяснить несколькими различными законами. Если в точных науках проявлялся дуа­лизм (волна – частица), то он всегда вызывал чрезвычайную озабоченность, и в конце концов выяснялось, что какая-то одна сторона явления описывается одними закономер­ностями, другая - другими.

   Понятие модели отличается от понятия гипотезы. Наличие нескольких гипотез всегда рассматривали как некое временное явле­ние. Если после выбора одной из конку­рирующих гипотез удается представить ее в математи­ческой форме, то она приобретает статус закона. Матема­тические же модели не всегда конкурируют друг с другом. Одни и те же аспекты изучаемой системы можно описывать различ­ными моделями, одновременно имеющими право на существование. Для разных аспектов строятся разные модели.

Многозначность понятий

  Раньше считалось, что язык математики строго одно­значен и этим отличается от многозначного - полиморф­ного - естественного языка людей. Снижение требо­ваний, предъявляемых к математическому описанию, замена закона моделью привели к тому, что математический язык, однозначный по своей природе, стал применяться как многозначный. Начала стираться четкая грань, которая ранее существовала между математическим и словесным описанием явлений.

Еще и сейчас очень часто можно слышать споры о воз­можности математического описания столь сложных систем, как, скажем, социальные системы. Те, кто утверждают, что нельзя, имеют в виду математическое описание в старом, традиционном смысле. Те же, кто гово­рит, что можно, исходят просто из совсем других концепций: под математическим опи­санием понимают не установление законов, а создание моделей.

Человек и машина

  Одно из самых серьезных различий между человеком и компьютером состоит в том, что человек, в отличие от ЭВМ, может решать плохо сформулированные задачи. Ина­че: машине нужен однозначный математический язык, человеку - естественный, полиморфный. Естест­венный язык, как раз в силу своей полиморфности, оказы­вается мощнее любого строго формализованного языка. Но пока еще никто не понял, как в сознании человека работает программа семантического анализа предложений, форму­лируемых на полиморфном языке.

Эвристическое программирование — это перебор вариантов, но перебор с наложением некоторого ограничения. Вся эвристичность заключается именно в этом ограничении, налагаемом на перебор всех вариантов. Ограничения налагают, исходя только из интуитивных соображений, подражая деятель­ности человеческого интеллекта - строгого математического обоснования им не дается.

Теорема Гёделя

Обсудим в заключение модель системы, в которой возникают новые идеи - модель информационно развивающейся системы. Это самоорганизующиеся системы, которые управляются своими инфор­мационными потоками и при этом создают новую информацию. Такими являются биологическая система, создающая новые виды, наука, рассматриваемая как самоорганизующаяся система, интеллект человека, мыслящий автомат (если он возможен).

Задачу можно поставить так: способна ли сколь угодно долго информационно развиваться система, состоящая из некоторой совокупности аксиом и правил обращения с ними? Аксиомы - это некоторые строки символов, а правила вывода - спо­собы получения новых строк. Если правила конечны и строго детерминированы, то на такую систему наклады­вает ограничения известная теорема Гёделя о неполноте (1931). Из нее следует существование истин, выразимых на языке этой системы, которые, тем не менее, нельзя вывести из системы, как бы ни задавались аксиомы и конечные и детерминированные правила вывода.

Генератор случая

Из теоремы Гёделя следует, что информационно развивающуюся систему нужно освободить от детерминизма и она должна иметь какие-то степени свободы. В модель необходимо ввести что-то вроде генератора случайных чисел, случайным образом изменяющего систему аксиом и пра­вила вывода. В биологической эволюции этот гене­ратор реализуется, скажем, в виде жесткого излучения, действующего на гены. В модель нужно включить еще и блок обу­чения, отсеивающий неблагоприятные идеи. Должна существовать какая-то неизвестная нам система ограничений, налагаемых на генератор случая или на правила отбора генерированной идеи, а также ее проверки. Интересно, что пришелец с другой планеты не смог бы отличить систему, построенную таким образом, от системы, наделенной «свободной волей».

Живое и неживое

  Генератор случая и блок обучения придают системе способность к адаптации. Система приобретает возмож­ность нетривиально приспосабливаться к изменяющимся условиям. В биологии уже давно делались попытки провести границу между живой и неживой природой. Сей­час ясно, что это различие надо искать в особен­ностях организации информационной системы. В живой природе она построена так, что одной из основных ее особенностей является способность к адаптации. Так же организованы жизнеспособные системы, созданные чело­веком: наука и общество. В неживой природе, при росте кристалла или развитии плазмы, не происходит нетри­виальных адаптационных процессов, т. е. система не обогащается информационно. В способности к адап­тации больше, чем в чем-нибудь другом, проявляется грань между живой и неживой природой.

Разложение Юла

В 1927 году английский статистик Эдвин Юл предложил рассматривать временной ряд как аддитивную смесь четырех компонент:

- тренда, или долгосрочного движения;

- сезонной компоненты - колебаний относительно тренда с известным периодом, который можно определить на основе априорной информации;

- периодической компоненты - колебаний, период которых определя­ется в ходе изучения данных;

- остатка или несистематического случайного эффекта.

Предположение аддитивности этих эффектов входит в исходную модель на правах гипотезы, которую, возможно, придется отвергнуть. Например, иногда имеющиеся данные могут потребовать модели с мультипликативным трендом – так устроены, в частности, сигналы с амплитудной модуляцией.

Пространство сигналов

Пусть на выходе некоторого измерительного устройства наблюдается сигнал x(t), представляющий собой зависимость напряжения от времени. Если к резистору с сопротивлением R приложено постоянное напряжение U, то выделяющаяся мощность равна

за время Т на резисторе выделится тепловая энергия

Если к этому резистору приложено переменное напряжение x(t), то за время [Т1,T2] на нем выделится энергия

средняя мощность за это время

Полагая R=1, получаем определения энергии и средней мощности, принятые в теории сигналов. Если x(t) измеряется в вольтах (В), а время – в секундах (с), то мощность имеет размерность В2, а энергия - В2с.

    Если полная энергия x(t) конечна,

то такой сигнал называют интегрируемым с квадратом, или сигналом с ограниченной энергией. Многие важные соотношения теории сигналов требуют предположения о конечности энергии. Если это условие не выполняется (например, для периодических функций), приходится использовать специальные подходы, например, использовать аппарат обобщенных функций.

     Наиболее распространенная обобщенная функция – дельта-функция или функция Дирака δ(t). Ее можно представить как бесконечно узкий импульс с бесконечной амплитудой, сосредоточенный в точке t =0, при этом

Важнейшее свойство дельта-функции состоит в том, что для любой интегрируемой функции f(t), определенной в точке t0, выполняется следующее соотношение:

4.2. Преобразование Фурье

  Прямым преобразованием Фурье сигнала x(t) называется функция

спектральная функция  x(t), f – частота в герцах. Обратное преобразование имеет вид

                                                (4.1)

   Процесс x(t) дает представление сигнала в виде функции времени. Физический смысл F( f ) состоит в том, что она дает представление того же сигнала в виде функции частоты. Для энергии сигнала выполняется равенство Релея

и его частный случай - равенство Парсеваля- Стеклова:

В этой связи величину

рассматривают как энергию сигнала в диапазоне частот [ f1, f2 ].

   Если x(t) – вещественная функция, то значения спектральной функции на частотах f и –f являются комплексно-сопряженными:

F( -f ) = F*( f ).

Если x(t) – четная функция, то F(f ) - вещественная четная. Если x(t) – нечетная функция, то F(f ) – чисто мнимая нечетная.

   Модуль спектральной функции A( f ) = | F( f ) | называют амплитудным спектром, а аргумент φ( f ) - фазовым спектром. Размерность амплитудного спектра та же, что у исходного сигнала (В), фазовый спектр – величина безразмерная. Для вещественного сигнала амплитудный спектр является четной, а фазовый – нечетной функцией частоты:

| A( -f )|= | A( f ) |; φ( -f )= - φ( f ).

   Произведение длительности сигнала на ширину его спектра (база сигнала) не может быть меньше единицы (принцип неопределенности). Из этого следует, что можно сформировать сигнал большой длительности с широким спектром, но короткий сигнал с узким спектром существовать не может.

   Квадрат модуля спектральной функции сигнала S( f )=| F( f ) |2 называют спектральной плотностью мощности или энергетическим спектром. Его размерность – В2.

  Корреляционная функция K(τ) сигнала x(t) с конечной энергией определяется как интеграл от произведения двух копий сигнала, сдвинутых на время τ:

Она показывает степень сходства между сигналом и его сдвинутой копией: чем она больше, тем сходство сильнее. Очевидно, что

и что при всех τ K(τ) ≤ K(0). Замечательный факт состоит в том, что корреляционная функция не зависит от фазового спектра сигнала и определяется только его энергетическим спектром по формулам:

Размерность K(τ) - В2с.

    К сожалению, этот подход годится только для сигналов с конечной энергией. Для периодических процессов с периодом T корреляционную функцию приходится вычислять, усредняя произведение сдвинутых копий в пределах одного периода

так что K(τ) является периодической функцией с периодом T, K(0) равно не энергии, а средней мощности, а ее размерность – не В2с, а В2.

Задания на лабораторную работу № 5

  1. Сформировать выборку из процесса Юла
  2. Проверить на примере условия стационарности
  3. Построить оценку корреляционной функции

ПАРАМЕТРИЧЕСКИЙ АНАЛИЗ

Уравнения Юла-Уокера

   Уравнения, связывающие значения корреляционной функции процесса с ко­эффициентами ai, bj, называют уравнениями Юла-Уокера.

  Пример 9.1. Пусть временной ряд {x(k)} удовлетворяет модели авторегрессии второго порядка AR(2) - процесс Юла, уравнение (8.9). При моделировании такого ряда нужно обеспечить выполнение условий Mx(1)=Mx(2)=0, тогда, очевидно, Mx(k)=0 для всех k. Требуется получить уравнения для ковариаций

K( j )=M[ x( k ) x( k – j ) ], .

Возьмем основное уравнение (11)

домножим обе его части на x(k -1) , x(k -2), x(k - j),  и перейдем в полученных соотношениях к математическим ожиданиям:

В формировании значений x(k-1), x(k-2),… участвуют случайные составляющие с номерами только до k-1, поэтому

,

В терминах ковариаций K(j) получаем систему уравнений

                                      (9.1)

откуда

Обратно, если известны ковариации, то

Если известны оценки нескольких ковариаций, то оценки коэффициентов a1, a2 можно получить из системы (9.1) по МНК.

  Пример 9.2. Пусть временной ряд {x(k)} удовлетворяет модели ARMA(1,1):

                       (9.2)

Если обеспечить условие Mx(1)=0, то, очевидно, Mx(k)=0 для всех k. Требуется получить уравнения для ковариаций

K( j )=M[ x( k ) x( k – j ) ], .

   a) Возьмем основное уравнение (13), домножим обе его части на x(k -2) и перейдем в полученных соотношениях к математическим ожиданиям:

т.е. Kx(2)=aKx(1),  Аналогично получаем, что для всех j

Kx(j+1)=aKx(j), так что Kx(j+1)=a j Kx(1).

   Рассмотрим новый процесс

                                                (9.3)

и вычислим его дисперсию и первую ковариацию двумя способами.

b) Из первого выражения для y(k) в (9.3)

но, как показано в пункте a), Kx(2)=aKx(1), поэтому

                                       

c) Из второго выражения для y(k) в (9.3)

Приравнивая выражения для моментов, полученные двумя разными способами, приходим к системе уравнений Юла-Уокера:

Таким образом, если имеются значения коэффициентов a,b, или их оценки, то

В то же время, если известны значения, например, Kx(0), Kx(1), Kx(2), то уравнения для нахождения a, b, оказываются нелинейными и параметры процесса определяются неоднозначно. Существует договоренность, согласно которой из нескольких решений та­кой системы уравнений выбирают то единственное решение, для которого выполняются условия устойчивости и обратимости. Такое решение назы­вают минимально-фазовым.

Оценивание порядка модели

  Определение для временного ряда {x(k)} адекватного порядка p , q модели ARMA(p,q) подчиняется тем же закономерностям, что и любой другой процесс моделирования. Для временных рядов обычно не удается разделить данные на обучающую и контрольную части, поэтому основной подход состоит в том, чтобы объяснить имеющуюся структуру данных с минимальным участием случайной составляющей. Таким образом, для различных выборов параметров порядка p , q предпочтение отдается тому варианту, который обеспечивает минимум оцененной дисперсии случайной составляющей:

Этот подход называют критерием ФОП – финальной ошибки прогнозирования.  Минимизация ФОП может приводить к моделям достаточно высокого порядка, так что в критерий желательно ввести штраф за используемое число параметров. На этом пути японский математик Акаике сформулировал общий критерий ИКА - информационный критерий Акаике. Он получен на основе достаточно глубокого анализа энтропийных свойств метода максимального правдоподобия, однако для моделей ARMA(p,q) имеет крайне простой вид:

ИКА =                                     (9.6)

Контрольные вопросы

1. Прямые и обратные уравнения Юла-Уокера для моделей AR, MA, ARMA

2. Оценивание коэффициентов по МНК

3. Оценивание коэффициентов по уравнениям Юла-Уокера

4. Оценивание в замкнутом контуре

5. Критерии ФОП и Акаике

Задания на лабораторную работу № 9

1. Сформировать выборку из стационарного процесса Юла

2. Интерпретировать ее как выходной сигнал системы, на вход которой подан гауссов белый шум.

3. Оценить параметры модели 3 различными способами

4. Оценить СПМ процессов на входе и выходе в параметрической и в непараметрической форме

ПРОГНОЗИРОВАНИЕ

     Прогнозирование временного ряда всегда основывается на некоторой модели и должен опираться на понимание физики процесса.

   Если у ряда {x(k)} имеется физически объяснимый тренд, то первичный прогноз делается по нему. Полиномиальный тренд использовать опасно: он может явно присутствовать на конечном отрезке ряда, но не иметь отношения к экстраполяции за его пределы. Например, так может проявиться синусоида с большим периодом. В таких случаях рекомендуют перейти от исходного ряда к ряду его конечных разностей. Если у ряда {x(k)} на отрезке выявлен тренд в виде полинома порядка r, то его конечные разности порядка (r -1) будут содержать только линейный тренд, который уже может служить основой для прогноза.    

Горизонт прогноза

    Для различных моделей временных рядов с удаленным трендом можно определить так называемый горизонт прогноза. Белый шум имеет горизонт прогноза, равный нулю.

   Ряд, который можно описать как сумму нескольких синусоид на фоне аддитивного шума, имеет бесконечный горизонт прогноза. На этом этапе прогноз осуществляется по обнаруженной системе синусоид, его точность определяется дисперсией шумовой составляющей. Часть обнаруженных периодических составляющих может оказаться ложной: в любом случайном шуме могут идентифицироваться эфемерные периодичности. Для их устранения интервал наблюдения разбивается на части и выделяются только те синусоиды, которые устойчиво фиксируются во всех частях. Это – стандартная составляющая любых процедур спектрального анализа. Однако если в ряде присутствует синусоида с частотой f0, то в его спектре, скорее всего, обнаружатся пики на кратных частотах 2 f0, 4 f0 и т.д. Классическим в экономике является пример 20-х годов XX века с исследованием динамики цен на пшеницу. В этом ряде было обнаружено 17 периодических составляющих, а на поверку оказалось, что его следует описывать как выход нелинейной системы, инициируемой одной-единственной периодической функцией.

   После того, как рассмотренные компоненты ряда идентифицированы и удалены, наступает этап анализа ряда остатков, который рассматривают как процесс с конечным горизонтом прогноза. К сожалению, структура остатков сильно зависит от методов, использованных на более ранних этапах. Например, для простейшей модели сигнала в виде синусоиды, наблюдаемой на фоне аддитивного белого шума, остаток будет представлять собой коррелированный ряд, причем его структура будет зависеть от того, каким методом оценивалась и удалялась эта синусоида.   

  Во всех этих случаях исследователя подстерегает типичная ошибка, которая встречается даже в самых серьёзных работах. Дело в том, что для набора коэффициентов, наилучшим образом описывающего имеющиеся данные, могут оказаться нарушенными условия устойчивости, т



Последнее изменение этой страницы: 2021-04-05; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 35.172.223.30 (0.057 с.)