Из табл.4.1 известны значения х 1 и х 2. Подставив их в полученное уравнение, найдем расчетные теоретические значения у рас. Сравнивая их с фактическими значениями у, получим отклонения d и дисперсию (табл.4.2). Далее найдем дисперсию значений y по формуле (2.14): =24,16. Это позволит рассчитать коэффициент множественной корреляции:
Полезно проанализировать рассчитанное уравнение регрессии. Коэффициент перед содержанием меди – положительный, а перед содержанием цинка – отрицательный. Первый коэффициент на порядок больше второго, следовательно, содержание меди оказывает более сильное влияние на содержание золота, чем на содержание цинка. Можно также рассчитать погрешность уравнения регрессии: 2sd = 3,4 г/т.7
4.1.3. Отбор информативных свойств в уравнении множественной линейной регрессии
Главное назначение уравнения множественной регрессии – прогнозирование значений одной случайной величины по множеству значений других случайных величин. Однако, как показано в примере 4.1, роль последних бывает различной, поэтому возникает необходимость выявить в уравнении информативные свойства, а неинформативные свойства исключить из расчета.
Отбор информативных факторов основан на анализе дисперсии отклонений с учетом степеней свободы m = k + 1, где k – количество свойств в уравнении множественной регрессии. Для этого вычисляется дисперсия с учетом степеней свободы:
(4.10)
При увеличении числа учитываемых случайных величин дисперсия вначале убывает, потом достигает минимума и далее начинает расти. Когда дисперсия достигнет минимума, информативные свойства определены. Дальнейшее увеличение числа случайных величин приведет к росту дисперсии и внесет искусственный «шум» в результаты прогнозирования по уравнению регрессии.
Информативные свойства определяют путем перебора сочетаний случайных величин. Вначале выбирают одну величину, которая имеет самый высокий парный коэффициент с прогнозируемой величиной у. Далее находят сочетание этой величины попарно со всеми остальными величинами, и каждый раз вычисляют дисперсию с учетом степеней свободы. Лучшим будет такое сочетание случайных величин, при котором дисперсия минимальна. Потом к двум найденным величинам добавляют третью, четвертую и т.д. до тех пор, пока дисперсия продолжает убывать. Когда дисперсия начнет возрастать, процесс отыскания информативных свойств прекращается.
8 Пример 4.2. Имеется 20 проб полиметаллической руды, проанализированных на пять компонентов (табл.4.3). Требуется изучить влияние первых четырех компонентов на содержание серебра, выступающего в роли функции у, и выбрать среди них наиболее информативные.
По исходным данным табл.4.3 вычислим статистические характеристики (табл.4.3 и 4.4). Дисперсия содержаний серебра = 2,7822 = 7,740. Содержания серебра имеют самый высокий коэффициент корреляции с содержанием свинца (r = 0,811), которое, очевидно, является наиболее информативным признаком. Дисперсия отклонений для содержаний серебра = 7,740(1 – 0,8112) = 2,649, с учетом степеней свободы дисперсия = 2,649·20/18 = 2,943.
Далее к ведущему фактору – содержанию свинца – поочередно присоединим содержания других компонентов и рассчитаем уравнения регрессии, а потом дисперсии отклонений:
содержания Pb и Cu = 1,170; = 1,376;
содержания Pb и Zn = 2,554; = 3,005;
содержания Pb и S = 2,269; = 2,669.
Наименьшая дисперсия имеет место для содержаний Pb и Cu, следовательно, медь является вторым по силе влияния фактором.
Таким же образом изучим тройные сочетания компонентов:
содержания Pb, Cu и Zn = 1,167; = 1,459;
содержания Pb, Cu и S = 1,127; = 1,409;
Третьим по силе влияния является содержание серы.
Таблица 4,3
Химические анализы проб руды
Номер пробы | Cu, % | Zn, % | S, % | Pb, % | Ag, г/т | |
0,25 | 3,94 | 19,1 | 4,04 | 6,9 | ||
0,62 | 5,10 | 15,0 | 2,61 | 5,3 | ||
0,38 | 5,11 | 21,0 | 3,58 | 4,7 | ||
1,86 | 3,06 | 41,0 | 3,02 | 5,3 | ||
1,23 | 3,58 | 24,2 | 1,71 | 0,1 | ||
2,11 | 2,04 | 28,8 | 2,53 | 3,7 | ||
2,75 | 1,89 | 11,5 | 2,76 | 5,4 | ||
2,73 | 3,81 | 41,5 | 2,29 | 4,6 | ||
1,40 | 2,70 | 44,2 | 2,86 | 3,9 | ||
1,04 | 0,88 | 18,7 | 1,72 | 0,7 | ||
2,66 | 2,47 | 39,8 | 3,34 | 8,0 | ||
3,99 | 4,37 | 40,2 | 5,12 | 10,9 | ||
4,29 | 4,28 | 30,9 | 4,85 | 8,9 | ||
1,80 | 4,35 | 40,2 | 2,20 | 3,0 | ||
1,43 | 6,80 | 30,0 | 3,92 | 5,8 | ||
2,42 | 4,65 | 44,5 | 2,68 | 5,5 | ||
3,20 | 3,89 | 44,3 | 3,30 | 8,5 | ||
2,02 | 0,81 | 28,7 | 1,35 | 1,8 | ||
3,82 | 1,17 | 17,6 | 0,80 | 4,3 | ||
1,20 | 1,70 | 12,8 | 2,12 | 0,7 | ||
Среднее | 2,06 | 3,33 | 29,7 | 2,89 | 4,9 | |
s | 1,142 | 1,561 | 11,3 | 1,089 | 2,782 | |
Таблица 4.4
| Поделиться: |
Познавательные статьи:
Последнее изменение этой страницы: 2016-04-26; просмотров: 438; Нарушение авторского права страницы; Мы поможем в написании вашей работы!
infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.118.24.228 (0.006 с.)