Если распределение близко к нормальному (см. Картинку) , они все будут близки. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Если распределение близко к нормальному (см. Картинку) , они все будут близки.



Среднее чувствительно к выбросам, в отличие от моды и медианы.

ПРИМЕР (сеть)

Их средний доход 1000$ i месяц...Если 9 человек имеют месячный доход от 5000 до 6000 рублей, со средним 5600 руб­лей, а доход десятого составляет 15000 руб­лей, то средний доход для этих 10 человек составит 6540 рублей. Эта цифра не позво­ляет судить о всей группе, и в качестве меры центральной тенденции следовало бы из­брать медиану или моду.

Меры центральной тенденции чаще всего используются для сравнения групп по уровню выраженности признака. Если исследователь при этом со­мневается, какую меру использовать, то можно дать простые советы.

Выборочные средние можно сравнивать, если выполняются следующие условия:

  • группы достаточно большие, чтобы судить о форме распределения;
  • распределения симметричны;
  • отсутствуют «выбросы».

Если хотя бы одно из перечисленных условий не выполняется, то следует ограничиться модой и медианой. Альтернативой является «сквозное» ранжи­рование представителей сравниваемых групп и сравнение средних, вычис­ленных для рангов этих групп.

Меры изменчивости (МИ) (источник слайды)

Если меры центральной тенденции отражают наиболее типичное, меры изменчивости – численные выражения индивидуальных различий (межиндивидуальной вариации признака)

Размах – самая простая МИ. Равна расстоянию между минимальным и максимальным значением переменной. Можно представить одним числом, но чаще указывают max/min.

Недостаток!: очень сильная зависимость от выбросов.

Стд. отклонение (часто обозначается SD) – мера отклонения значений от среднего. Чем больше SD, тем больше изменчивость (выше вероятность встретить «нетипичные» случаи).

Кварти́ль – 3 точки, которые делят все распределение на четыре равные части. Медиана – одна из них (2-ой квартиль). Есть верхний и нижний квартили (1-ой квартиль и 3-ий квартиль).

Межквартильный размах – более устойчив к выбросам, используется с порядковыми или не нормально распределенными переменными.

Итог предварительной оценки данных:

· Получение «чистых» данных

· Определение варианта графического представления (в зависимости от природы данных)

· Оценка характера данных (распределения) с помощью описательных статистики – модель описания

· оценка нормальности распределения количественных переменных

· Подготовка к следующему этапу проверки гипотез – модели стат. вывода

38. Первичная обработка данных научного исследования. Ошибки данных, выбросы.

Важно соблюдение принципа GIGO (сокр. от Garbage In Garbage Out) – "если мусор на входе, то мусор и на выходе"

Первый шаг в обработке данных – их проверка:

· ошибки данных

· пропуски данных

· выбросы

Проблема поиска ошибок – очевидные / неочевидные ошибки

Варианты:

  • опечатки на уровне заполнения анкеты/перенесения данных в таблицу
  • сознательное искажение данных испытуемым
  • логические ошибки (неправильное понимание инструкции) и пр.

Примеры:

l возраст = 112 лет;

l время поиска чисел табл. Шульте = 11 сек.

l одинаковые баллы на все вопросы 5-балльной шкалы

Решение: исправление или исключение

Выбросы – значения признака, которые очень сильно отличаются от большинства значений в выборке

Два источника:

ошибки измерения, наблюдения или записи (включая варианты, описанные выше)

наличие двух разных популяций в одной выборке



Поделиться:


Последнее изменение этой страницы: 2021-05-27; просмотров: 80; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.12.153.110 (0.008 с.)