Заглавная страница Избранные статьи Случайная статья Познавательные статьи Новые добавления Обратная связь КАТЕГОРИИ: АрхеологияБиология Генетика География Информатика История Логика Маркетинг Математика Менеджмент Механика Педагогика Религия Социология Технологии Физика Философия Финансы Химия Экология ТОП 10 на сайте Приготовление дезинфицирующих растворов различной концентрацииТехника нижней прямой подачи мяча. Франко-прусская война (причины и последствия) Организация работы процедурного кабинета Смысловое и механическое запоминание, их место и роль в усвоении знаний Коммуникативные барьеры и пути их преодоления Обработка изделий медицинского назначения многократного применения Образцы текста публицистического стиля Четыре типа изменения баланса Задачи с ответами для Всероссийской олимпиады по праву Мы поможем в написании ваших работ! ЗНАЕТЕ ЛИ ВЫ?
Влияние общества на человека
Приготовление дезинфицирующих растворов различной концентрации Практические работы по географии для 6 класса Организация работы процедурного кабинета Изменения в неживой природе осенью Уборка процедурного кабинета Сольфеджио. Все правила по сольфеджио Балочные системы. Определение реакций опор и моментов защемления |
Гистограмма и полигон частот.
Пусть - выборка объема из генеральной совокупности, имеющей непрерывное распределение с неизвестной (теоретической) плотностью вероятностей . Способом представления статистических данных, дающим наглядное представление о плотности вероятностей (статистическим аналогом ), является гистограмма. Для ее построения следует предварительно произвести группировку данных, которая состоит в следующем: 1. По данной выборке строят вариационный ряд . 2. Промежуток разбивают точками на непересекающихся интервалов , так что (на практике существенно меньше ). 3. Подсчитывают частоты и относительные частоты попадания выборочных значений в -ый интервал , . 4. Полученную информацию заносят в таблицу, называющуюся интервальным статистическим рядом:
Очевидно, что . Поэтому совокупность пар , где - середина интервала , , называют эмпирическим законом распределения, полученным по сгруппированным данным. Далее в прямоугольной системе координат на каждом интервале , как на основании длиной , строят прямоугольник с высотой . Получаемую при этом ступенчатую фигуру называют гистограммой. Площадь, ограниченная верхней границей гистограммы и осью абсцисс, равна 1, так как . Частоты , меняются от выборки к выборке, являясь в общем случае случайными величинами. В силу теоремы Бернулли при каждом , относительные частоты , где - истинная вероятность попадания наблюдаемой случайной величины в интервал . Если длины интервалов достаточно малы, а теоретическая плотность вероятностей непрерывна, то по теореме о среднем . Следовательно, при большом объеме выборки и достаточно малом справедливо приближенное равенство или, что эквивалентно, . Поэтому верхняя граница гистограммы является статистическим аналогом (оценкой) неизвестной плотности вероятностей наблюдаемой случайной величины . Построение гистограммы, как способ представления статистических данных, рекомендуется применять только в непрерывной статистической модели наблюдений. При этом, он обладает следующими очевидными недостатками: - потерей информации при группировке статистических данных (при построении используются не сами выборочные значения , а частоты попадания выборочных значений в интервалы группировки);
- неопределенностью в способе построения интервалов группировки и определении их числа и длин (на практике при группировке данных обычно для простоты берут интервалы одинаковой длины = = соnst, а число интервалов группировки определяют с помощью установленного эмпирическим путем правила Стургерса, согласно которому полагается , но эти рекомендации не являются оптимальными в каком-либо смысле в общем случае). Поэтому гистограмму следует применять только на предварительном этапе анализа статистических данных. Замечание. Иногда к группировке данных прибегают и в случае дискретной модели наблюдений. Это делают при большом , когда простой статистический ряд трудно обозрим. Но в этом случае число интервалов нужно брать тоже большим, чтобы избежать существенных неточностей при замене настоящего эмпирического закона распределения на эмпирический закон распределения, полученный по сгруппированным данным. Следует также понимать, что в дискретной модели наблюдений гистограмма – это просто частотно-графический способ представления статистических данных, а вероятностный смысл гистограммы, как оценки плотности вероятностей, отсутствует. Гистограмма является кусочно-постоянным приближением неизвестной (теоретической) плотности вероятностей . Если плотность вероятностей является гладкой функцией, то, как известно из математического анализа, ее значительно лучше можно аппроксимировать кусочно-линейной функцией. Ломаная с вершинами в точках , называется полигоном частот и является для гладких плотностей вероятностей более точной оценкой, чем гистограмма. Пример гистограммы и полигона частот приведен на рисунке 1. Рисунок 1 - Гистограмма и полигон частот
|
|||||||||||||||||||||||
Последнее изменение этой страницы: 2021-12-15; просмотров: 74; Нарушение авторского права страницы; Мы поможем в написании вашей работы! infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.138.116.20 (0.005 с.) |