Графическое представление данных и их характеристики 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Графическое представление данных и их характеристики



В качестве численных характеристик гистограмм чаще всего рассматривают два параметра – среднюю величину и дисперсию, и реже используют такие величины как наиболее вероятная и медиана. Определим два последних понятия. Наиболее вероятная величина распределения определяется как значение переменной, на которую приходится максимум распределения. Медианой называют такое значение переменной, относительно которой полная площадь под распределением делится на две равные части. В идеальном эксперименте, когда проводится большое число высокоточных измерений, средняя величина совпадает с т.н. математическим ожиданием. Средняя величина характеризует положение центра тяжести гистограммы на оси абсцисс, а дисперсия - ширину распределения вдоль нее. Вычислим эти характеристики по данным табл. 1. По определению, средняя величина проницаемости есть

, (2.1)

где

(2.2)

Формула (2.1) применяется для вычисления средней величины в случае, когда исходные данные предварительно распределены по отдельным ячейкам, т.е. в виде табл. 1. В этом случае мы не располагаем данными по отдельно взятым породам. В случае, когда известны проницаемости каждой из тысячи рассмотренных пород, средняя проницаемость вычисляется как средняя арифметическая

.

Таким образом, мы вычислили среднюю проницаемость горных пород, хотя и для достаточно большой, но ограниченной выборки пород . Поэтому, полученная величина является приближенной. Поясним сказанное. Предположим, что у нас имеется возможность выбора образцов горных пород из неограниченно большого набора пород. Результат (2.2) получен для одной выборки, состоящей из 1000 образцов. Если проделать аналогичную процедуру для другой выборки из 1000 образцов, то получаемый результат может оказаться близким, но не совпадающим с (2.2). Увеличивая, таким образом, число исследуемых образцов в одной выборке можно повысить точность определения величины средней проницаемости. При бесконечно большом числе исследуемых образцов эта величина неограниченно приближается к истинной средней величине , т.е. к математическому ожиданию. Поскольку величина часто используется в уравнениях гидродинамики в качестве основного параметра фильтрации жидкости, то здесь следует оговорить одну возможную особенность ее использования. В общем случае, средняя проницаемость пород, определяемая для большой совокупности образцов пород, может оказаться малоинформативной характеристикой грунта. Например, в случае, если в выбранную совокупность пород ввести тонкую перегородку со сравнительно низкой проницаемостью, то величина , рассчитанная по формуле (2.2), может измениться несущественно, тогда, как скорость фильтрации будет определяться, в основном, проницаемостью этой тонкой перегородки. В аналогичных случаях бывает полезным использование метода сопряженных уравнений, содержащих наряду со средними величинами и моменты более высоких порядков, каковой является, например, дисперсия распределения. Эта величина характеризует степень «рассеяния» совокупности результатов опытов относительно средней величины. Конкретное рассмотрение дисперсии проделаем на основе результатов табл. 1. Вычислим дисперсию распределения проницаемостей. По определению

, (2.3)

где - математическое ожидание.

В формуле (2.3) математическое ожидание не известно, и поэтому вычислим приближенное значение дисперсии с использованием средней проницаемости (2.2), определенной из опыта.

. (2.4)

Применим эту формулу к данным табл. 1.

.

. (2.5)

Здесь отметим, что формулы (2.3) и (2.4), вообще говоря, являются приближенными. Они справедливы только в случае больших значений . Для сравнительно малых значений нужно пользоваться более точной формулой:

. (2.6)

Отличие знаменателей правых частей формул (2.6) и (2.4) обусловлено тем, что сумма в числителе должна быть отнесена не к числу образцов , а к числу подлинно независимых значений . Здесь можно предположить, что все 1000 измерений в табл. 1 являются независимыми. Но в формуле (2.6) выражается через среднюю проницаемость , которая вычислена по формуле (1) с использованием тех же данных. Этим мы накладываем одно условие связи на имеющуюся совокупность данных, после чего независимых становится . В этом смысле величину в (2.6) называют числом степеней свободы. Поскольку величина , в рассматриваемом нами случае, достаточно велика, то дисперсия, вычисленная по формуле (2.6) совпадает с (2.5).

Как уже отмечалось, дисперсия является одной из важнейших характеристик статистического распределения, и характеризует ее ширину. Она обладает следующими важными свойствами (без доказательства).

1. Дисперсия постоянной величины равна нулю: .

2. Постоянный множитель можно выносить за знак дисперсии, возводя его в квадрат: .

3. Дисперсия суммы нескольких взаимно независимых случайных величин равна сумме дисперсий этих величин: .

 



Поделиться:


Последнее изменение этой страницы: 2016-04-21; просмотров: 482; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.117.142.128 (0.006 с.)