ФЭА / АИТ / Лабораторная работа № 3 по дисциплине «Моделирование систем» Корреляционный и регрессионный анализ экспериментальных данных
(автор - student, добавлено - 7-04-2014, 19:58)
СКАЧАТЬ:
Лабораторная работа № 3 по дисциплине «Моделирование систем»
Корреляционный и регрессионный анализ экспериментальных данных
Цель работы: освоение методов регрессионного и корреляционного анализа.
Краткие сведения из теории
Построение математической модели технологического процесса в зависимости от поставленной задачи может преследовать следующие цели: минимизировать расход материала на единицу выпускаемой продукции при сохранении качества, произвести замену дорогостоящих материалов на более дешевые; сократить время обработки в целом или на отдельных операциях, снизить трудовые затраты на единицу продукции и т.п.; улучшить частные показатели и общее количество готовой продукции, повысить однородность продукции, улучшить показатели надежности и т.п.; увеличить надежность и быстродействие управления, увеличить эффективность контроля качества, создать условия для автоматизации процесса управления и т.п. Прежде всего, необходимо выбрать зависимую переменную Y, которую будем называть целевой функцией или параметром оптимизации, за который принимают один из показателей качества продукции либо по каждой технологической операции отдельно, либо по всему технологическому процессу сразу. Параметр оптимизации должен соответствовать следующим требованиям:
За фактор принимают контролируемую величину объекта (изделия, процесса, операции), то есть величину, характеризующую то или иное свойство объекта или режим технологического оборудования. Эта величина, числовое значение которой измеряется в пределах (границах) изменения, должна влиять на параметр оптимизации. При определении величин количественных оценок во внимание должны приниматься только те факторы, которые имеют четкий метрологический смысл (возможность измерения фактора с определенной точностью). Одна из наиболее распространенных задач статистического исследования состоит в изучении связи между некоторыми наблюдаемыми переменными и построения с помощью полученных экспериментальных данных математического описания исследуемого объекта (задача идентификации). Исследуемый объект или процесс в планировании эксперимента представляют "черным ящиком", на входе которого действуют управляющие xi и возмущающие факторы. Выходы объекта называют откликами yi. Устанавливая факторы на тех или иных уровнях, получают разные реализации yj=fj(xj), поэтому функцию fj называют функцией отклика. Задача регрессионного анализа - выбор вида функции отклика и анализ свойств результата. Ее выбирают в виде отрезка полинома, характер которого зависит от необходимой точности определения функции:
где все β - коэффициенты регрессии, причем
По результатам опытов можно найти только выборочные значения функции и точечные оценки , b0, b1,... В итоге получают регрессионную модель
Решение этой задачи можно разбить на следующие этапы. 1. Выдвинуть гипотезу о виде зависимости y = f(X,β). 2. По экспериментальным данным {xiu} и {yu} найти оценки b0, b1... 3. Определить значимость оценок коэффициентов регрессии 4. Проверить адекватность построенной модели объекту. 5. Проверить работоспособность модели. Вид функции отклика должен быть по возможности простым, но в то же время хорошо выражать реальную зависимость. Ее первоначальный выбор базируется на материалах решения аналогичных задач и интуиции. Если проверка адекватности модели покажет, что она не соответствует объекту, то нужно перейти к более сложной модели. При проведении экспериментов на реальных объектах независимое варьирование факторов в большинстве случаев оказывается невозможным, поэтому для получения их математических моделей обычно проводятся пассивные эксперименты. Объекты при этом находятся в нормальных условиях функционирования, а изменение их фазовых координат и выходных параметров обусловлено влиянием внешних возмущающих воздействий, носящих случайный характер. В этой связи фазовые координаты и выходные параметры представляют собой случайные процессы. Для получения информации о физических свойствах объекта, необходимой при построении математической модели, выбирают некоторый интервал дискретизации независимой переменной (времени t) и фиксируют в дискретные моменты времени значения факторов и функций отклика. Эти значения представляют собой случайные последовательности чисел, составляющие непрерывные множества. Проверка значимости коэффициентов регрессии. В результате проверки устанавливается статистическая значимость или незначимость отличия оценок коэффициентов регрессии от нуля, т.е. проверяется, обусловлено ли отличие bj от нуля влиянием помех или это отличие не случайно и влияние j-го фактора существенно (bj ≠ 0). Для проверки используется статистика:
где σ{bj} - среднеквадратическое отклонение оценки bj. Найденное значение tj сравнивается с табличным значением t-распределения с числом степеней свободы vbj =n(k-1). Если tj >tтабл, то считается, что bj отличается от нуля не случайно, коэффициент bj статистически значим и должен быть сохранен в уравнении регрессии. Если же tj < tтабл, то коэффициент bj статистически незначим и может быть исключен из уравнения регрессии. Проверка адекватности модели. Идея проверки адекватности заключается в сравнении дисперсии предсказания на основе исследуемой регрессионной модели с дисперсией шума. Дисперсия предсказания (остаточная дисперсия) определяется по формуле
где d - число значимых коэффициентов в регрессионной модели. Дисперсия шума:
Рассчитывается статистика:
Расчетное значение F сравниваем с табличным значением F-критерия Фишера со степенями свободы νY=n−1 и νR=n−k−1. При F>Fтабл делается вывод с уровнем значимости α о неадекватности модели. Это значит, что необходимо усовершенствовать модель (усложнить, ввести нелинейность и т.п.). Анализ работоспособности модели Адекватность регрессионной модели еще не гарантирует ее пригодность к практическому использованию в задачах прогнозирования и поиска оптимальных решений. Модель может оказаться неработоспобной из-за низкой ее точности. Модель считается работоспособной и годится для предсказания поведения объекта (процесса), если она в 2 раза уменьшает ошибку предсказания по сравнению с предсказанием по среднему. Для оценки качества полученной модели используют совокупный коэффициент (индекс) множественной корреляции. Известно, что величина R характеризует тесноту связи результативного (рассчитанного по формуле) значения параметра и факторов x1, x2, x3. Чем плотнее фактические значения yi располагаются относительно линии регрессии, тем меньше остаточная дисперсия и, следовательно, величина R. Квадрат коэффициента множественной корреляции R2 называют коэффициентом множественной детерминации, представляющий собой числовую интегральную характеристику точности уравнения регрессии. При этом коэффициент детерминации, который показывает, какая доля вариации отклика объекта обусловлена коэффициентами регрессии, будет составлять R2 ≥ 0,75. Причем при значениях 0,75‹R2‹0,9 степень влияния факторов на выходной параметр характеризуется как высокая, а при 0,9‹R2‹0,99 – как весьма высокая (шкала Чеддока). Коэффициент детерминации вычисляется по формуле
Задание. Провести регрессионный и корреляционный анализ экспериментальных данных. Все расчеты произведем с помощью программы MathCad. Экспериментальный данные:
Далее построим зависимость Твых от Твх, Р и F.
Выборочный коэффициент корреляции равен:
Находим коэффициенты парной корреляции
Вывод: на данной лабораторной работе мы изучили методы корреляционного и регрессионного анализа, а также научились применять для этого систему MathCad. Похожие статьи:
|
|