ЗНАЕТЕ ЛИ ВЫ?

Сравнение фактических и расчетных содержаний золота



Номер пробы ni Содержание золота, г/т Отклонение d Квадрат отклонения d2  
фактическое у теоретическое урас  
 
22,2 0,8 0,64  
15,9 2,1 4,41  
11,9 –2,9 8,41  
16,2 –1,2 1,44  
16,3 0,7 0,49  
23,7 –2,7 7,29  
27,4 0,6 0,36  
13,0 2,0 4,00  
16,9 –0,9 0,81  
8,6 1,4 1,96  
           
           
Сумма 172,1 –0,1 29,81  
Среднее 17,2 17,21 0,0 2,98  
             
 

Из табл.4.1 известны значения х1 и х2. Подставив их в полученное уравнение, найдем расчетные теоретические значения урас. Сравнивая их с фактическими значениями у, получим отклонения d и дисперсию (табл.4.2). Далее найдем дисперсию значений y по формуле (2.14): =24,16. Это позволит рассчитать коэффициент множественной корреляции:

Полезно проанализировать рассчитанное урав­нение регрессии. Коэффициент перед содержанием меди – положительный, а перед содержанием цинка – отрицательный. Первый коэффициент на порядок больше второго, следовательно, содержание меди оказывает более сильное влияние на содержание золота, чем на содержание цинка. Можно также рассчитать погрешность уравнения регрессии: 2sd = 3,4 г/т.7

 

 

4.1.3. Отбор информативных свойств в уравнении множественной линейной регрессии

 

Главное назначение уравнения множественной регрессии – прогнозирование значений одной случайной величины по множеству значений других случайных величин. Однако, как показано в примере 4.1, роль последних бывает различной, поэтому возникает необходимость выявить в уравнении информативные свойства, а неинформативные свойства исключить из расчета.

Отбор информативных факторов основан на анализе дисперсии отклонений с учетом степеней свободы m = k + 1, где k – количество свойств в уравнении множественной регрессии. Для этого вычисляется дисперсия с учетом степеней свободы:

(4.10)

При увеличении числа учитываемых случайных величин дисперсия вначале убывает, потом достигает минимума и далее начинает расти. Когда дисперсия достигнет минимума, информативные свойства определены. Дальнейшее увеличение числа случайных величин приведет к росту дисперсии и внесет искусственный «шум» в результаты прогнозирования по уравнению регрессии.

Информативные свойства определяют путем перебора сочетаний случайных величин. Вначале выбирают одну величину, которая имеет самый высокий парный коэффициент с прогнозируемой величиной у. Далее находят сочетание этой величины попарно со всеми остальными величинами, и каждый раз вычисляют дисперсию с учетом степеней свободы. Лучшим будет такое сочетание случайных величин, при котором дисперсия минимальна. Потом к двум найденным величинам добавляют третью, четвертую и т.д. до тех пор, пока дисперсия продолжает убывать. Когда дисперсия начнет возрастать, процесс отыскания информативных свойств прекращается.

 

8Пример 4.2. Имеется 20 проб полиметаллической руды, проанализированных на пять компонентов (табл.4.3). Требуется изучить влияние первых четырех компонентов на содержание серебра, выступающего в роли функции у, и выбрать среди них наиболее информативные.

По исходным данным табл.4.3 вычислим статистические характеристики (табл.4.3 и 4.4). Дисперсия содержаний серебра = 2,7822 = 7,740. Содержания серебра имеют самый высокий коэффициент корреляции с содержанием свинца (r = 0,811), которое, очевидно, является наиболее информативным признаком. Дисперсия отклонений для содержаний серебра = 7,740(1 – 0,8112) = 2,649, с учетом степеней свободы дисперсия = 2,649·20/18 = 2,943.

Далее к ведущему фактору – содержанию свинца – поочередно присоединим содержания других компонентов и рассчитаем уравнения регрессии, а потом дисперсии отклонений:

содержания Pb и Cu = 1,170; = 1,376;

содержания Pb и Zn = 2,554; = 3,005;

содержания Pb и S = 2,269; = 2,669.

Наименьшая дисперсия имеет место для содержаний Pb и Cu, следовательно, медь является вторым по силе влияния фактором.

Таким же образом изучим тройные сочетания компонентов:

содержания Pb, Cu и Zn = 1,167; = 1,459;

содержания Pb, Cu и S = 1,127; = 1,409;

Третьим по силе влияния является содержание серы.

Таблица 4,3

Химические анализы проб руды

Номер пробы Cu, % Zn, % S, % Pb, % Ag, г/т
0,25 3,94 19,1 4,04 6,9
0,62 5,10 15,0 2,61 5,3
0,38 5,11 21,0 3,58 4,7
1,86 3,06 41,0 3,02 5,3
1,23 3,58 24,2 1,71 0,1
2,11 2,04 28,8 2,53 3,7
2,75 1,89 11,5 2,76 5,4
2,73 3,81 41,5 2,29 4,6
1,40 2,70 44,2 2,86 3,9
1,04 0,88 18,7 1,72 0,7
2,66 2,47 39,8 3,34 8,0
3,99 4,37 40,2 5,12 10,9
4,29 4,28 30,9 4,85 8,9
1,80 4,35 40,2 2,20 3,0
1,43 6,80 30,0 3,92 5,8
2,42 4,65 44,5 2,68 5,5
3,20 3,89 44,3 3,30 8,5
2,02 0,81 28,7 1,35 1,8
3,82 1,17 17,6 0,80 4,3
1,20 1,70 12,8 2,12 0,7
           
           
Среднее 2,06 3,33 29,7 2,89 4,9
s 1,142 1,561 11,3 1,089 2,782
             

 

Таблица 4.4



Читайте также:




Последнее изменение этой страницы: 2016-04-26; Нарушение авторского права страницы

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.239.242.55 (0.008 с.)