Распределения качественных и количественных признаков 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Распределения качественных и количественных признаков



Множество, подлежащих статистическому анализу однородных объектов, называется статистической совокупностью. Отдельные объекты статистической совокупности называются ее элементами. Например, в качестве статистической совокупности можно взять множество однотипных станков, каждый из которых характеризуется своей производительностью. Элементами этой совокупности являются станки. Количество станков в совокупности ее объемом [24].

Отдельные элементы совокупности могут быть охарактеризованы одним или несколькими признаками. Значения признаков для отдельных элементов совокупности могут варьироваться. Признак называется атрибутивным, если является качественным, или количественным – если отдельные значения вариантов выражаются числами (например, объем, масса и т. д.).

Некоторые признаки можно упорядочить по номерам, которые называются рангами. Использование ранговой шкалы позволяет проводить статистический анализ данных при помощи непараметрических методов. Количественные признаки могут быть дискретными (отдельные числа) и непрерывными (изменяющиеся в некотором числовом диапазоне).

Изучение изменения значений (вариантов) признака проводится статистическое наблюдение (измерение, регистрация, описание и т. д.). В результате наблюдения определяются значения (варианты) признака, которые соответствуют каждому элементу совокупности. Статистические наблюдения могут быть сплошными, при которых изучается каждый элемент совокупности, или выборочными – изучается только некоторое ограниченное число элементов (выборка). Изучаться может один или несколько признаков.

Если элементы совокупности можно охарактеризовать одним качественным признаком, который имеет только два возможных значения: «признак есть » или «признака нет ». Например, измеряется признак тапа «брак» в некоторой партии изделий. В таблице 1.2 представлены результаты наблюдений.

 

 

 

 
 


Относительные частоты или доли признака:

 

Вариация признака может иметь не два, а более вариантов, то есть

. Если провести многоразрядную (множественную) группировку, получим распределение, представленное в таблице 1.4.

 

Таблица 1.4

 

Для оценки взаимозависимости между двумя признаками и можно

использовать таблицы сопряженности. При этом число возможных значений каждого признака должно быть зафиксировано. Пусть число значений признака равно а признака равно В таблице 1.5. приведены количества наблюдений в которых признак принял е значение, а признак е значение [1].

 

 

Чтобы установить, есть ли зависимость между признаками, необходимо воспользоваться критерием Пирсона. Для этого необходимо вычислить расчетный коэффициент

 

(1.91)

 

Расчетный коэффициент Пирсона сравнивается с табличным коэффициентом при выбранном уровне значимости q и числе степеней свободы f=(s 1)(t 1).

Пример. Пусть имеется три станка, разлчиающихся друг от друга степенью износа (признак А). На каждом из них обрабатываются одинаковые детали. Известен примерный процент бракованных деталей может находиться в диапазоне от 5 до 7 для каждого станка (признак В). Всего прошли обработку на всех станках 120 деталей. Данные наблюдений сведены в таблицу 1.6.

 

 

Необходимо проверить гипотезу о взаимосвязи процента бракованных деталей от степени износа станков по критерию Пирсона. Вычислим расчетный коэффициент :

 

.

 

Для q=5% и числе степеней свободы f=(3 1)(3 1)=4 табличный коэффициент Пирсона будет равен Поскольку можно сделать вывод о том, что существует взаимосвязь между степенью износа станков и процентом бракованных деталей.

 

1.25.2. Распределение количественных признаков [24]

 

Пусть получена выборка наблюдений () для изучения вариации некоторого признака . Среди сделанных наблюдений могут оказаться одинаковые.

Для удобства анализа данных, их группируют по отдельным признакам. Каждая группа данных соответствуют своему признаку . Количество элементов в ой группе называется частотой варианты . Варианты упорядочиваются по возрастанию, то есть Если сопоставить каждой варианте ее частоту, получим дискретный вариационный ряд, или распределение частот, таблица 1.7.

 

 

Таблица 1.7

 

Если разделить каждую частоту на , получим распределение относительных частот Для относительных частот выполняется условие

Накопленная (кумулятивная) частота – это частота, которая равна количеству элементов статистической совокупности с признаком , имеющим частоту Относительная накопленная частота определяется следующим образом:

 

 

 

(1.92)

 

 

Выражение в формуле (1.94) означает, что То есть, для любого нет элементов, меньше чем Для значений в интервале Таким образом, относительная частота равна сумме относительных частот Кумулятивный вариационный ряд строится в виде таблицы 1.8.

 

Таблица 1.8

 

График кумулятивного вариационного ряда представляет собой ступенчатую разрывную в точках кривую, рисунок 1.22.

 

 

Рисунок 1.22. Кумулята дискретного распределения

 

Когда количество различных вариант достаточно велико, необходимо использовать интервальную группировку данных. В этом случае весь диапазон от (минимальное значения) до (максимальное значения) разбивается на отдельные равные или неравные интервалы Каждый интервал имеет свой признак. Через обозначены численности групп данных. В результате такой группировки получается интервальный вариационной ряд или интервальное распределение, представленный в таблице 1.9. Здесь относительные частоты,

 

Таблица 1.9

 

При использовании интервалов различной длины , было введено понятие плотности частоты

 

(1.93)

 

которая равна числу элементов, приходящееся на единицу длины.

 

1.25.3. Ранговая корреляция [24]

Чтобы установить наличие или отсутствия взаимосвязи между двумя качественными признаками и (например, порода древесины, цветовая гамма некоторого покрытия, тип станка и т. п.) можно использовать коэффициент ранговой корреляции Спирмена. Для этого необходимо исследуемые объекты ранжируют, то есть присваивают порядковый номер в порядке возрастания или убывания. В результате получаются две последовательности рангов по признакам и :

 

· по признаку :

· по признаку :

 

Коэффициент ранговой корреляции Спирмена вычисляется по формуле:

 

(1.94)

 

где

 

Коэффициент также, как коэффициент корреляции, изменяется в пределах

 

(1.95)

 

Абсолютная величина увеличивается с увеличением степени зависимости между признаками и . Чем больше зависимость между признаками, тем больше .

Проверка значимости коэффициента производится так же, как и коэффициента корреляции. Коэффициент ранговой корреляции и в том случае, когда признаки и являются количественными.

Пример. Пусть необходимо узнать существует ли зависимость между сложностью схем раскроя плитных древесных материалов (признак ) и величиной полезного выхода (признак ) по каждой из них. Для этого мы присваиваем признакам и соответствующие ранги. На рисунок 1.23 приведены виды схем раскроя с различными уровнями сложности.

 

 

Рисунок 1.23. Виды схем раскроя

 

В таблице 1.10 приведены результаты ранжирования схем раскроя в зависимости от их сложности и диапазонов возможного полезного выхода по каждой схеме.

Таблица 1.10

Вычисляем коэффициент ранговой корреляции

 

.

 

Затем вычисляем расчетный коэффициент Стьюдента . По таблице значений коэффициента Стьюдента при уровне значимости q=5% и числе степеней свободы f=5-3 находим . Поскольку , можно считать, что связь между сложностью схем раскроя и полезным выходом заготовок установлена.

1.25.4. Коэффициент конкордации [24]

Коэффициент конкордации может быть использован, например, для согласования мнений экспертов при ранжировании произвольного числа признаков Например, при планировании производства изделий мебельной фабрики необходимо учитывать множество факторов, как производства, так и реализации готовой продукции. Возьмем для примера лишь некоторые из них. Нами выбраны следующие факторы:

· процент загрузки производственных мощностей предприятия;

· обеспеченность производства необходимыми ресурсами (сырье, материалы, комплектующие, энерго- и теплоснабжение, трудовые ресурсы и т. д.);

· уровень качества выпускаемой продукции в зависимости от состояния оборудования предприятия (соответствие мировому уровню, степенью износа и т. д.);

· удаленность предприятия от торговых центров, которые, как правило, находятся в больших городах (большие транспортные расходы);

· возможности потенциальных потребителей продукции предприятия;

· затраты на рекламу (объявления в газетах, центральных или местных, реклама на радио или по телевидению, по центральному или местному и т. п.).

Необходимо выявить наиболее важные из выбранных факторов, чтобы затем провести с ними дальнейшие исследования. Эксперты (технологи, экономисты, менеджеры и другие специалисты) должны дать свою оценку каждому из предложенных факторов, то есть ранжировать факторы по степени их влияния на исследуемую систему. Данные опроса экспертов можно представить в виде таблицы 1.11.

Таблица 1.11

Здесь ранг, присвоенный фактору м экспертом.

Чтобы решить вопрос о степени согласованности мнений экспертов необходимо использовать, так называемым, коэффициентом конкордации. Этот коэффициент можно вычислить по формуле:

 

(1.96)

 

Коэффициент конкордации может находиться в пределах Чем больше величина , тем больше согласованность мнений экспертов. Значимость коэффициента конкордации проверяется по критерию Пирсона (при ). Расчетный коэффициент вычисляется по формуле:

 

(1.97)

 

Полученное значение сравнивается с табличным при уровне значимости q и числе степеней свободы f = n – 1. Если выполняется неравенство , то можно принять гипотезу о согласованности мнений экспертов при данном уровне значимости. В том случае, когда эксперт считает, что некоторые факторы имеют одинаковое влияние на исследуемую систему, он присваивает этим факторам один и тот же, так называемый, связанный ранг. ранг. Связанный рангвычисляется как среднее мест, которые эксперты присвоили этим факторам. Например, пусть три фактора находятся на 2, 4 и 6 местах, тогда связанный ранг будет равен (2+4+6)/3=4. Этот ранг и будет присвоен каждому из этих факторов. Если в оценках экспертов имеются связанные ранги, то формула для вычисления коэффициента конкордации будет иметь вид

 

(1.98)

где количество типов связанных рангов у го эксперта; количество экспертов, использовавшее связанные ранги.

Пример. Пусть исследуется зависимость полезного выхода заготовок от следующих организационно-технологических факторов раскроя плитных древесных материалов:

1. количество продольных резов;

2. количество поперечных резов;

3. количество типоразмеров заготовок в схеме раскроя;

4. сложность схемы раскроя;

5. толщина пилы;

6. величины базовых кромок;

7. наличие автоматических разгрузочных устройств;

8. ручная выгрузка и штабелирование заготовок после

раскроя;

9. тип станка (с программным управлением, полуавтомат).

В таблице 1.12 приведены данные опроса экспертов.

 

Таблица 1.12

 

Используя систему Mathcad вычислим значение коэффициента конкордации W.

Далее мы проверим значимость коэффициента конкордации W который будет равен При уровне значимости q=5% и числе свободы f = 9 1=8 найдем =15.5. Поскольку можно считать, что мнения экспертов согласованы.

Глава 2

Метод наименьших квадратов

 



Поделиться:


Последнее изменение этой страницы: 2017-02-08; просмотров: 692; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.139.79.59 (0.057 с.)