ФЭА / АИТ / Метод множественной корреляции для определения коэффициентов корреляций между входными и выходной переменными процесса. Определение коэффициентов множественной корреляции
(автор - student, добавлено - 8-04-2014, 11:59)
СКАЧАТЬ:
Метод множественной корреляции для определения коэффициентов корреляций между входными и выходной переменными процесса. Определение коэффициентов множественной корреляции Коэффициенты корреляции характеризуют линейные вероятностные зависимости между двумя случайными величинами. На практике необходимо оценивать эти зависимости между выходными переменными процессов и многими входными, а также зависимости между различными входными переменными. Для количественной характеристики таких связей используют коэффициенты множественной корреляции. Для установления корреляционных связей между многими переменными используется метод множественной корреляции, основанный на использовании линейного уравнения вида (1): , (1) где - входные переменные, влияющих на состояние процесса; - расчетное значение выходной переменной, которое характеризует состояние протекающего процесса ; – определяемые из экспериментов коэффициенты регрессии. Доя определения коэффициентов (1) может использоваться таблица результатов пассивного эксперимента в натуральном масштабе (табл. 1). Таблица 1. Результаты пассивного эксперимента на действующей установке в натуральном масштабе переменных
Для большего удобства обработки результатов экспериментов и определения корреляционных зависимостей между переменными в соответствии с методом множественной корреляции производится нормировка всех переменных процесса по формулам: (i=1,…,n) (2) (i=1,…; j=1,…,m). (3) В этом случае: и = (4) и (j=1,…,m) (5) В результате получается уравнение регрессии (1) между нормированными переменными в безразмерном масштабе, которое не имеет свободного члена и может быть представлено в виде: , (6) где - нормированные коэффициенты, а данные пассивного эксперимента для нормированных переменных представлены в табл. 2. Таблица 2. Результаты пассивного эксперимента для нормированных переменных в безразмерном масштабе
Для переменных процесса в натуральном масштабе выборочные коэффициенты корреляции определяются по формулам (4): (j=1,…,m); (7) (l, u=1,…,m; l >u). (8) При этом и (j=1,…,m) рассчитываются по соотношениям (4) и (5). В случае нормированных переменных в безразмерном масштабе (i =1,…,n) (2) и (i = l,...,n;y = l,...,m) (3), следует определять следующие величины для вычисления выборочных коэффициентов корреляции: ===0 (9) = = =0 (j=1,…,m) (10) и с учетом (4), (5) и (9), (10):
= = = 1; (11) ==== ==1, (j=1,…,m) (12)
В результате для нормированных переменных в безразмерном масштабе формулы для выборочных коэффициентов корреляции записываются следующим образом [ (4). (7) и (8)]: (j=1,…,m) (13)
= (l, u=1,…,m; l >u). (14) и принимая во внимание полученные равенства (9), (10), (11) и (12), выборочные коэффициенты корреляции между всеми входными переменными и выходной переменной определяются как = (j=1,…,m) (15) = (l, u=1,…,m; l >u). (16)
Для определения коэффициента множественной корреляции между выходной переменной у и всеми входными переменными хj (j=1,…,m) также используют нормированные переменные (2) и (3) и одновременно с выборочными коэффициентами (5) рассчитывают нормированные коэффициенты регрессии уравнения (6). Для этой цели используется таблица экспериментов (см. табл. 2) и критерий наименьших квадратов вида : Cr = = , (17) который минимизируется с учетом необходимого условия экстремума функций многих переменных: = (u=1,…,m) (18) В результате получается система нормальных неоднородных линейных уравнений с симметричной матрицей коэффициентов :
(19)Для преобразования элементов матрицы коэффициентов этой системы и элементов вектора свободных членов в выборочные коэффициенты корреляции (15) и (16) необходимо ее левую и правую части разделить на (n-1) и принять во внимание, что в соответствии с равенствами (3) и (5) диагональные элементы матрицы коэффициентов системы (19) равны: = (j=1,…,m). (20) В результате получается линейная система уравнений с выборочными коэффициентами корреляции, при решении которой определяются нормированные коэффициенты регрессии , уравнения (6): (21) В этой системе уравнений перекрестные выборочные корреляции равны между собой, т.е. (u, l=1,…,m), (22) и значения m нормированных коэффициентов уравнения (6) определяются путем решения линейной системы уравнений (21) методом обратной матрицы. По найденным значениям нормированных коэффициентов регрессии коэффициент множественной корреляции вычисляется по формуле: R=, (23) он служит показателем силы связи для множественной регрессии и значения которого располагаются в замкнутом интервале 0≤R≤1. Нормированные коэффициенты регрессии , также могут использоваться для прогнозирования поведения процесса с использованием линейного уравнения регрессии (1): . (24) Для определения коэффициентов регрессии а0, a1,..., am уравнение (6) с нормированными коэффициентами регрессии , записывается с учетом системы нормировки переменных (2) и (3) в виде: = (25) в результате чего коэффициенты регрессии уравнения (24) определяются по формулам: (26) (j=1,…,m) (27)
Метод множественной корреляции позволяет определять не только коэффициенты множественной корреляции (23), характеризующие линейную зависимость между выходной переменной и множеством входных переменных. Он также позволяет оценить линейную связьмежду двумя любыми переменными: входные-входные (16) и выходная- входная (15), что имеет важное практическое значение.
Метод множественной регрессии Брандона для построения нелинейных эмпирических моделей Применение этого метода позволяет определять как вид уравнения регрессии (структурная идентификация), так и его коэффициенты (параметрическая идентификация). При этом вид, в общем случае, нелинейного уравнения регрессии представляется произведением многочленов различных степеней от каждой входной переменной. Большой объём экспериментального материала и правильный выбор приоритетности построения многочленов для различных входных переменных могут обеспечить удовлетворительный результат при построении эмпирических моделей. Ставится задача определить зависимость одного основного параметра системы у (выходная переменная) от r других параметров х1, х2, х3,..., хr (входные переменные), т.е. необходимо найти функцию: y = F(x1,x2,x3,...,xr). (28) Необходимо решить задачи структурной и параметрической идентификации. Эти задачи решаются, исходя из опытных данных, получаемых в результате проведения пассивного эксперимента, в том числе и промышленного. При этом экспериментальные данные представляются в виде табл. 3 (п — общее число опытов). В рассматриваемом методе множественной регрессии предполагается, что функция F является произведением некоторых функций отдельных параметров: y = K∙f1(xl)∙f2(x2)∙f3(x3)∙...∙fr(xr), (29) где К— некоторый коэффициент. Предполагается, что каждая функция fi(xi) описывается многочленом произвольной степени т; fi(xi)= + (30) причем конкретная степень многочлена т и его коэффициенты определяются из экспериментальных данных. Таким образом, по экспериментальным данным табл.4 определяются:
В результате одновременно определяется вид функций fi(xi) — путем нахождения оптимальных степеней многочленов тi, а также значения соответствующих коэффициентов регрессии aji , и только после этого определяется параметр К. Таблица 4. Результаты экспериментальных исследований
Обязательным условием реализации рассматриваемой стратегии множественной регрессии является последовательное определение коэффициентов регрессии оптимальных степеней многочленов fi(xi), соответствующих параметрам хi по мере убывания их влияния на выходную переменную у. Поэтому в таблице экспериментных данных целесообразно входные переменные х1, ..., хn располагать в порядке убывания степени их влияния на выходную переменную у. На первом этапе определяются коэффициенты линейной регрессии методом наименьших квадратов по экспериментальным данным т.е. данные для входных переменных берутся из первого столбца табл. 4. Ставится задача как определения степени многочлена (30) путём увеличения т в (31) последовательно до тех пор, пока критерий Сr (31) уменьшается, так и определения коэффициентов регрессии . При этом вектор считается равным . Критерий аппроксимации в соответствии с методом наименьших квадратов имеет вид: Cr= (31) Коэффициенты регрессии определяются путем минимизации этого критерия с использованием необходимого условия экстремума функции (в данном случае критерия Сr многих переменных): Cr=Cr (а0, а1, ...аm). (32) В результате получается:
= (s=0,1,…,m) (33) Перемножив соответствующие члены уравнений (s=0,1,…,m) (34) и выполнив перегруппировку слагаемых их левой части, получим систему линейных алгебраических уравнений относительно коэффициентов регрессии аа, a1, ..,am: (s=0,1,…,m) (35) В развернутом виде система линейных уравнений для определения коэффициентов регрессии записывается в виде (36):
или в матричной форме: ×= (37)
В этом случае матрица коэффициентов этой системы уравнений получается симметричной и для ее решения используется метод обратной матрицы. Если обозначить матрицу коэффициентов через с размером (т + 1)×(т + 1), вектор определяемых коэффициентов регрессии через с размером (т + 1), а вектор свободных членов через , то матричная формула для определения коэффициентов регрессии методом обратной матрицы имеет вид : (38) Задача выбора оптимальной степени многочлена решается на отдельно м (в данном случае первом этапе, так как х =x1) решается путем постепенного увеличения m: 1, 2, 3 и т.д. и определением для каждого его значения коэффициентов регрессии по матричной формуле (38). Выбор оптимального значения m на отдельном этапе осуществляется путем оценки значения двух факторов:
Остаточная дисперсия S2R характеризует точность уравнения регрессии (в данном случае уравнения многочлена) и определяется по формуле : S2R= (39) где находится с помощью рассчитанных значений коэффициентов регрессии по формуле: = i=1,…,n, (40) а p- количество коэффициентов регрессии при выбранной степени многочлена. Число относительной обусловленности матрицы коэффициентов характеризует максимально возможный эффект от возмущений при расчете ее элементов и элементов вектора свободных членов на результат решения линейной системы (37), т.е. на значение коэффициентов регрессии. Чем меньше это число, тем надежнее получаемые значения коэффициентов регрессии. Оно определяется с использованием норм прямой и обратной матриц коэффициентов линейной системы уравнений (36) по следующей формуле : cond=∙. (41) В результате оптимальная степень многочлена и его коэффициенты на первом этапе построения эмпирической модели (m1) определяются при наименьших значениях S2R и cond(). Таким образом, на первом этапе построения эмпирической модели получается конкретное выражение для функции f1(x1) в уравнении регрессии, которое имеет вид: f1(x1)== (42) На втором этане построения эмпирической модели аналогичным путем определяются конкретный вид f2(x2) и оптимальная степень многочлена т2: f2(x2)== (43) При этом обрабатываются экспериментальные данные второго столбца (х2) табл.4,и элементы вектора выходной переменной у вычисляются по формуле: =, i=1,…,n (44) На третьем этапе по аналогичной схеме определяются конкретный вид и оптимальная степень многочлена m3: == (45) Для этой цели используются экспериментальные данные третьего столбца табл.4 и элементы вектора выходной переменной у вычисляются по формуле: =, i=1,…,n (46) На r-этапе расчетов для получения конкретного вида функции fr(xr) и оптимальной степени многочлена
== (47) повторяется та же процедура расчетов, что и на предыдущих этапах. Из табл. 4 берутся элементы вектора последнего столбца xr, а элементы вектора выходной переменной у вычисляются по формуле:
=, i=1,…,n. (48)
Последним определяется значение К в уравнении эмпирической модели (28) по следующей формуле: K=/n. (49)
В результате получается конкретный вид функции (49) с известным значением коэффициента К, а также коэффициентов функций f1(x1),…, fr(xr) с оптимальными порядками многочленов для них- m1,…,mr (30).
Полученная функция представляет собой в общем случае нелинейную эмпирическую математическую модель технологического процесса, для которого были проведены экспериментальные исследования, представленные в табл.4.
ПРАКТИЧЕСКАЯ ЧАСТЬ Метод множественной корреляции. Найдем выборочные коэффициенты корреляции Для Х1 (линейная зависимость):
Для Х2 (гиперболическая зависимость):
Для Х3(гиперболическая зависимость):
Для Х4 (гиперболическая зависимость):
Из найденных значений следует, что параметры , и влияют на величину выходного параметра и математическая модель определяется уравнением множественной регрессии для случая трех факторов.
Выборочные коэффициенты корреляции:
Найдем коэффициенты а1,а2,а3:
Определим коэффициент множественной корреляции R :
Коэффициент множественной корреляции служит показателем силы связи в случае множественной регрессии: 0≤R≤1. Перейдем к натуральному масштабу:
Получим уравнение множественной корреляции: Y(X1,X3,X4)=211.773+0.911*X1-0.349*X3+1.022*X4
Метод множественной регрессии Брандона. Найдем коэффициенты множественной регрессии, остаточную дисперсию и число относительной обусловленности матрицы коэффициентов при различных значениях m для Х4:
Наименьшее значение и cond достигается при m=2. Из этого следует, что
Найдем коэффициенты множественной регрессии, остаточную дисперсию и число относительной обусловленности матрицы коэффициентов при различных значениях m для Х1:
Наименьшее значение и cond достигается при m=2. Из этого следует, что
Найдем коэффициенты множественной регрессии, остаточную дисперсию и число относительной обусловленности матрицы коэффициентов при различных значениях m для Х3:
Наименьшее значение и cond достигается при m=2. Из этого следует, что
Рассчитываем коэффициент К:
Таким образом, уравнение множественной регрессии Брандона имеет вид:
Похожие статьи:
|
|