Практическое занятие №2. Статистические параметры выборки и доверительные интервалы 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Практическое занятие №2. Статистические параметры выборки и доверительные интервалы



Параметры средней тенденции

Мода

Мода (Мо) – для номинальной и порядковых шкал – состояние переменного, встречающееся в выборке с максимальной частотой.

Мода (Мо) – для числовых шкал – середина модального класса или классов.

Модальный класс – класс, встречающийся с максимальной частотой.

Преимущества – простота определения, вычисляется во всех шкалах.

Недостатки – низкая статистическая мощность и информативность, наличие нескольких мод в выборке,

Медиана

Медиана (Ме) – это значение переменного, которое находится точно в середине (центре) ранжированного вариационного ряда. Медиана вычисляется только для данных, измеренных в порядковой и числовых шкалах.

Вычисление медианы зависит от четного или нечетного числа объектов в выборке:

1) четное число объектов – для точного нахождения нижней и верхней медиан в больших выборках с четным N необходимо сначала установить порядковые номера нижней и верхней медиан в ранжированном ряду:

порядковый номер нижней Me н =  (N – четное)

порядковый номер верхней Me в =  (N – четное)

Затем необходимо найти соответствующие этим порядковым номерам значения нижней и верхней медиан в ранжированном ряду и вычислить среднее между ними, которое и будет искомой медианой.

2) нечетное число объектов – необходимо сначала установить ее порядковый номер в ранжированном ряду по формуле:

порядковый номер Me =  (N – нечетное)

Затем необходимо найти соответствующее этому порядковому номеру значение медианы в ранжированном ряду.

Свойства медианы –) медиана в выборке всегда одна; 2) медиана относительно устойчива (робастна), и наименее зависит от значений отдельных вариант в выборке (высокая робастность).

Пример 1. Найти медианы в двух ранжированных выборках:

Выборка 1: xi = 1; 2; 2; 3; 3; 4; 5 (N =7).

Выборка 2: xi = 1; 2; 2; 3; 3; 4 (N =6).

Решение:

1) Определим порядковые номера ранжированных вариант в выборке 1:

xi 1 2 2 3 3 4 5
№ п.п. 1 2 3 4 5 6 7

В первой выборке N – нечетное число (N =7), тогда:

порядковый номер Me =

Порядковому номеру «4» соответствует варианта «3», то есть Ме 1 = 3.

2) Определим порядковые номера ранжированных вариант в выборке 2:

xi 1 2 2 3 3 4
№ п.п. 1 2 3 4 5 6

Во второй выборке N – четное число (N =6), тогда

порядковый номер нижней Me =

порядковый номер верхней Me =

Порядковому номеру «3» соответствует варианта «2», то есть нижняя Ме = 2. Порядковому номеру «4» соответствует варианта «3», то есть, верхняя Ме = 3 Тогда:

Пример 2. Изучали изменчивость опушения нижней стороны листовой пластинки (в баллах) у 9 образцов сливы домашней:

 

№ образца Опушение листовой пластинки, балл
1 2
2 2
3 1
4 3
5 3
6 0
7 5
8 5
9 4

Необходимо вычислить медиану в баллах и в рангах.

Решение:

1) Ранжируем баллы, определяем порядковые номера для каждого балла, преобразуем баллы в ранги (табл.3.9). Поскольку объем выборки (N =9) – нечетное число порядковый номер медианы равен:

 

Медины в баллах и рангах по признаку степень опушения листа у 9 образцов сливы домашней

Балл, ранжир. Порядковый номер Ri
0 1 1
1 2 2
2 3 3,5
2 4 3,5
3 5 5,5
3 6 5,5
4 7 7
5 8 8,5
5 9 8,5
Σ=25 Σ=45 Σ=45
Ме =3 Ме =5,5  

 

Примечание: темным фоном выделены медианный балл и медианный порядковый номер.

В табл. 3.9. порядковому номеру 5 соответствует балл 3 и ранг 5,5 – это и есть искомые медианы в баллах и рангах, то есть, Ме балл = 3, Ме ранг = 5,5.

Среднее арифметическое ()

Ограничения использования: 1) вычисляется только для переменных, измеренных в числовых шкалах; 2) является параметрической статистикой, основанной на биномиальном законе распределения случайной величины

Пример 3. Вычислить среднее арифметическое длины листовой пластинки (мм) у 9 образцов алычи:

№ образца Длина листовой пластинки, мм
1 67
2 58
3 54
4 63
5 72
6 59

Практическое задание 2. 1. Определите параметры средних тенденций (моду, медиану, среднее арифметическое):

Длина листовой пластинки у 32 сортов яблони домашней, см

8,0

5,5

6,0

5,5

9,0

7,5

5,0

4,6

6,5

6,5

8,0

5,5

7,5

8,0

7,8

6,0

6,5

5,0

5,1

5,5

7,4

7,7

7,8

7,5

7,8

7,0

7,2

6,4

7,0

7,8

9,0

8,5

Решение:

 

Параметры вариации

Размах варьирования (lim)

Размах варьирования (lim) - разность между максимальным и минимальным значениями переменного в выборке.

Недостатки данного показателя: 1) очень неустойчивый (зависит только от крайних значений xi выборки); 2) при равенстве размаха изменчивости двух выборок, распределение в них вариант может быть разным.

Дисперсия (σ2)

Дисперсия (σ2) – представляет собой средний квадрат отклонений вариант от средней арифметической совокупности, безразмерная величина. Является основным параметром, измеряющим вариацию переменного.

Дисперсию рекомендуется вычислять на два знака после запятой точнее, чем исходные данные.

Пример 4. Вычислить дисперсию длины листовой пластинки у 9 образцов вишни:

№ образца Длина листовой пластинки, мм
1 67
2 58
3 54
4 63
5 72
6 59

Среднее квадратическое отклонение (σ).

Среднее квадратическое отклонение представляет собой квадратный корень из дисперсии:

В отличие от дисперсии измеряется в тех же единицах, что и признак.

Среднее квадратическое отклонение может быть как положительным, так и отрицательным числом (±σ).

Среднее квадратическое отклонение используется в основном для определения доверительных интервалов статистических параметров, вычисления коэффициентов вариации, оценки достоверности статистических параметров.

Коэффициент вариации (cv).

Коэффициент вариации – частное от деления среднего квадратического отклонения (σ) на среднюю арифметическую ():

Выражается в процентах или в долях единицы. Отличается относительной устойчивостью. Нормирован от 0 до 100% или от 0 до 1.

В однородной выборке (повторности) коэффициент вариации, как правило, равен 5-10%.

Практическое задание 2.2. Диаметр соцветия и 88 сеянцев спиреи японской, см:

3,70

3,55

3,20

3,60

3,70

3,90

3,35

3,75

3,85

4,05

3,20

4,35

4,35

4,15

5,45

4,60

2,65

5,00

5,75

7,00

5,75

6,00

2,95

5,45

4,85

3,80

4,30

4,85

4,60

5,60

5,25

5,75

4,30

4,40

4,85

5,70

5,75

5,60

5,50

4,75

5,20

6,25

4,25

3,85

5,85

6,50

6,00

6,25

5,25

6,00

5,75

5,25

5,75

5,90

5,25

6,00

5,25

4,25

5,00

6,25

7,00

5,80

4,50

5,50

6,00

4,75

5,80

4,50

4,50

5,25

5,75

4,75

5,50

4,50

4,75

5,75

4,50

4,50

5,00

5,25

5,25

4,90

4,00

5,50

5,75

5,25

5,00

4,25

Определите следующие параметры вариации: размах изменчивости, дисперсию, среднее квадратическое отклонение, коэффициент вариации.

Решение:

 

Ошибка репрезентативности средней арифметической ( ).

Ошибка репрезентативности средней арифметической () – представляет собойраспределение средних арифметических различных выборок вокруг генерального среднего близкое к нормальному закону.

Ошибкой репрезентативности средней арифметической называют среднее квадратическое отклонение выборочных средних вокруг генерального среднего. Чем меньше эта ошибка, тем ближе выборочное среднее к генеральному среднему.

Если объём генеральной совокупности N ошибка средней арифметической () вычисляется по формуле:

Если объём генеральной совокупности представляет собой конечное число и объём выборки сопоставим с ним, ошибка средней арифметической () вычисляется по следующей формуле:

где  - объём генеральной совокупности, N – объём выборки

Показатель точности опыта

Показатель точности опыта показывает долю ошибки средней арифметической по сравнению с величиной самой средней арифметической. Обычно точность опыта выражается в процентах:

Точность опыта считается удовлетворительной, если она не превышает 5%. При значениях точности опыта свыше 5% рекомендуется заново заложить опыт, при этом необходимо увеличить объём выборки и повысить точность измерений.



Поделиться:


Последнее изменение этой страницы: 2021-05-12; просмотров: 155; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.217.109.151 (0.048 с.)