Сбор и обработка исходных данных 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Сбор и обработка исходных данных



Анализ исходных данных

В качестве исходных данных в этой курсовой используются результаты сопоставления различных цен на ручки с количеством покупателей, желающих приобрести ручку по каждой из этих цен.

Результаты этого сопоставления приведены в таблице. За Х принята количество покупателей за месяц, а за Y принято цена на ручку в рублях.

 

 

Таблица 2. Выборки Х и Y

Исходные данные

X Y X Y X Y X Y
71 217 24 584 74 198 60 421
50 358 67 345 43 497 61 336
69 259 50 403 27 552 38 471
38 517 56 378 36 490 45 389
40 459 25 592 16 677 39 456
33 568 55 369 19 647 39 493
48 381 48 426 22 615 37 507
41 470 21 603 27 584 17 630
33 524 69 312 36 495 43 499
34 508 25 624 41 468 46 448
30 529 24 577 26 574 26 579
26 653 51 367 17 663 27 587
28 602 26 609 43 450 56 331
17 736 22 606 73 246 44 428
40 505 50 405 25 588 21 645
25 622 28 531 27 584 50 409
7 990 78 821 57 369 32 336
12 1001 30 761 30 426 35 471
113 50 77 529 23 603 19 389
25 699 30 653 60 312 92 456
49 860 21 602 56 624 75 493
53 790 43 736 82 577 71 507
71 921 44 505 11 367 82 630
100 333 56 678 17 609 36 499
32 513 56 481 49 606 29 552
44 423 29 635 36 534 41 467
31 598 68 245 26 598 45 438
34 508 54 403 38 515 44 469
31 573 29 551 24 579 28 567
43 453 25 567 41 478 21 602
70 269 39 492 52 423 46 443
52 425 33 458 41 470 58 354
71 217 24 584 74 198 60 421
65 272 34 508 62 342 28 603

 

 

X Y X Y X Y X Y
50 358 67 345 43 497 61 336
69 259 50 403 27 552 38 471
38 517 56 378 36 490 45 389
40 459 25 592 16 677 39 456
33 568 55 369 19 647 39 493
48 381 48 426 22 615 37 507
41 470 21 603 27 584 17 630
33 524 69 312 36 495 43 499
34 508 25 624 41 468 46 448
30 529 24 577 26 574 26 579
26 653 51 367 17 663 27 587
28 602 26 609 43 450 56 331
17 736 22 606 73 246 44 428
40 505 50 405 25 588 21 645
25 622 28 531 27 584 50 409
23 513 53 812 79 112 65 312

Проведем теперь анализ этих данных различными способами.

Вычисления основных характеристик выборки

Основные числовые характеристики данных, которые будут в дальнейшем использоваться в данной работе, можно представить в виде таблицы:

 

Таблица 3. Числовые характеристики данных

Основные числовые характеристики
Стоимость ручки, руб. (X) Количество покупателей в месяц, чел. (Y)
Среднее выборочное 39,43, руб. Среднее выборочное 488,00, чел.
Медиана 38,00, руб. Медиана 496,00, чел.
Мода 25,00, руб. Мода 584,00, чел.
Среднее квадратичное отклонение 14,715, руб. Среднее квадратичное отклонение 112,735, чел.
Дисперсия выборки 216,53, руб2. Дисперсия выборки 12709,272, чел2.
Минимум 16,00, руб. Минимум 198,00, чел.
Максимум 74,00, руб. Максимум 736,00, чел.

 

Графический анализ данных

Диаграмма рассеивания

Диаграмма рассеивания — это нанесенные на плоскость точки, координаты которых представляют собой соответствующие пары чисел X и Y. Данная диаграмма для наших конкретных данных, изображенная на Рис.1 выглядит следующим образом:

Рис. 1. Зависимость количества покупателей от стоимости ручки

Как видно из диаграммы, зависимость количества покупателей от стоимости ручки является обратной, т.е. чем больше стоимость ручки, тем меньшее количество покупателей желает ее приобрести.

Гистограммы

Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны .

Рис. 2. Гистограммы частот X и Y

Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению .

Рис. 3. Гистограммы относительных частот X и Y

Гистограммой нормированных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны . Гистограмму нормированных частот можно рассматривать как эмпирическую функцию плотности вероятности.

Рис. 4. Гистограммы нормированных частот X и Y

Полигоны

Полигоном частот называют ломаную, отрезки которой соединяют точки ..., , где — варианты выборки и — соответствующие им частоты.

Рис. 5. Полигоны частот X и Y

Полигоном относительных частот называют ломаную, отрезки которой соединяют точки ..., , где — варианты выборки и — соответствующие им относительные частоты.

Рис. 6. Полигоны относительных частот X и Y

Полигоном нормированных частот называют ломаную, отрезки которой соединяют точки ..., , где — варианты выборки и — соответствующие им относительные частоты.

Рис. 7. Полигоны нормированных частот X и Y

 

Корреляционный анализ

Корреляционная таблица

Двумерную выборку (обычно большого объема) можно представить в виде корреляционной таблицы. Если на диаграмме рассеивания ввести k интервалов по x -ам и m интервалов по y -ам, а количество точек, попадающих в пересечения интервалов (частоты nij), затабулировать, то получим корреляционную таблицу.

Для приведенных выше данных корреляционная таблица выглядит следующим образом:

Таблица 4. Корреляционная таблица

x|y 185 259 333 407 481 555 629 703 Nx Pi(x)
18,75                   0,1
26,25                   0,24
33,75                   0,14
41,25                   0,2
48,75                   0,14
56,25                   0,06
63,75                   0,05
71,25                   0,07
Ny                    
Pi(y) 0,02 0,05 0,09 0,16 0,28 0,2 0,18 0,02    

 

Эмпирические функции распределения

Эмпирической функцией распределения (функцией распределения выборки) называют функцию , определяющую для каждого значения х относительную частоту события :

,

где — число вариант, меньших х, n — объем выборки.

Для данных курсовой работы эмпирические функции распределения имеют вид:

Рис. 8. Эмпирическая функция распределения стоимости ручки

Рис. 9. Эмпирическая функция распределения количества покупателей

Числовые характеристики выборки

С помощью корреляционной таблицы можно посчитать все числовые характеристики выборки, но они будут иметь некоторые отклонения от тех значений, которые мы получили выше. Формулы для вычисления числовых характеристик теперь имеют вид:

ü выборочные средние: , ;

ü выборочные дисперсии: ,

.

В этих формулах

, .

ü исправленная выборочная дисперсия:

ü , где — исправленное средне-квадратичное отклонение Х, — исправленное средне-квадратичное отклонение Y.

ü выборочный корреляционный момент (ковариация):

,

а выборочный коэффициент корреляции вычисляется по формуле:

.

Для данных, приведенных в таблице 2, получаем:

(руб.), (чел.);

(руб.2); (чел.2);

(руб.2), (чел.2);

(руб.), (чел.);

, .



Поделиться:


Последнее изменение этой страницы: 2017-02-22; просмотров: 187; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.217.182.45 (0.048 с.)