ФЭА / АИТ / Отчет по лабораторной работе № 1 По дисциплине: «Планирование и обработка результатов измерений»
(автор - student, добавлено - 19-06-2013, 11:56)
СКАЧАТЬ:
Министерство образования Республики Татарстан Альметьевский Государственный Нефтяной институт
Кафедра автоматизации и информационных технологий
Отчет по лабораторной работе № 1 По дисциплине: «Планирование и обработка результатов измерений»
Альметьевск 2013 ЭМПИРИЧЕСКИЕ РАСПРЕДЕЛЕНИЯ Теоретическая часть
Цель работы Научиться выполнять группировку данных и оформлять результаты обработки эмпирической выборки графически (в виде полигона, гистограммы, эмпирической функции распределения). Научиться вычислять числовые характеристики выборки. Теоретические сведения В этом разделе рассматривается представление необработанных данных в табличном виде. Сюда относятся принятие решений о ширине интервалов, некоторые необходимые определения, а также ряд эмпирических логических правил. Допустим, что получены данные. Такие числовые характеристики, как среднее значение или среднее абсолютное отклонение от некоторого заданного значения, могут быть вычислены непосредственно. Однако нередко необходимо иметь более полную информацию без сохранения точных деталей первоначальных наблюдений. Удобным способом, обеспечивающим выполнение этих требований, является группировка данных. В процессе группировки данных первоначально наблюдаемые значения теряются, но если группы выбраны правильно, то сохраняется удовлетворительное общее представление о полученных фактических данных. Дадим теперь несколько определений, связанных с нашей таблицей. Нам нужно иметь данные, распределенные по группам (или интервалам), каждая из которых охватывает некоторый интервал значений (обычно) постоянной ширины, т. е. интервал группировки. Интервал группировки представляет собой группу значений, попадающих в данный интервал. Вначале выбираем ширину интервала группировки и находим границы интервалов. В каждом из этих интервалов группировки определяем частоту попадания в интервал, или просто частоту. Теперь каждый интервал группировки имеет определенные границы, и целесообразно задать в нем некоторое представительное значение. Определим вначале пределы интервала группировки. Эго наибольшее и наименьшее возможные значения, которые могут находиться в данном интервале. С другой стороны, границы интервала лежат где-то между наибольшим значением одного интервала и наименьшим значением следующего интервала, содержащего большие значения. Это относится ко всем границам интервалов, кроме первой и последней, которые можно вычислить исходя из условия постоянства расстояния между границами каждого интервала. Наконец, в качестве представительного значения каждого интервала группировки будем использовать срединное значение X. Оно находится посередине; между пределами интервала или между границами интервала. В некоторых случаях ширина интервала группировки может быть переменной, например на краях диапазона, где наблюдаемые значения встречаются реже. Существует несколько характеристик положения совокупности эмпирических данных. Наиболее распространенными из них являются среднее, медиана и мода. Среднее представляет собой первый момент распределения, т.е. значение относительно которого может быть сбалансировано все эмпирическое распределение. Медиана 1/х представляет собой такое значение х, что одна половина значений х меньше ее, а другая больше. Мода—это наиболее часто появляющееся значение х. Если данные сгруппированы, то в качестве моды обычно выбирается срединное значение интервала с наибольшей частотой. Обычно мода не используется, так как ее трудно определить или интерпретировать.Начнем рассмотрение вычислений выборочного среднего арифметического со случая необработанных (несгруппироваиных) данных х1, х2, ..., хn Среднее равно i=1,2,…,n При вычислении выборочного среднего может оказаться целесообразным представление данных в следующем виде: i=1,2,…,k, где n обозначает общий объем выборки, а k – число интервалов. При вычислении выборочного среднего может оказаться целесообразным представление данных в следующем виде:
где x0 – некоторое произвольное начало отсчета, а с – ширина интервала группировки. Тогда
Характеристики рассеяния Одной из наиболее часто используемых характеристик рассеяния (или разброса) данных является среднее квадратическое (стандартное) отклонение. Вначале определим квадрат этой величины, называемый дисперсией. Для выборки несгруппированных данных дисперсия находится как
Если данные сгруппированы, то
Внимательное изучение этого выражения показывает, что оно (если исключить —1 в знаменателе) представляет собой момент инерции, или второй момент относительно среднего. Среднее квадратическое отклонение определяется как положительный квадратный корень из дисперсии. Для несгруппированных данных
для сгруппированных данных
В случае несгруппированных данных при использовании формулы для выполнения вычислений ее можно записать в следующем виде:
Соотношение между средними квадратическими отклонениями:
При линейном преобразовании х например вида z=a+bx, среднее значение и среднее квадратическое отклонение соответственно равны
Задание: Ниже приводятся данные (табл. 1.) о пределе текучести для 100 образцов из титанового сплава при 1000 фунт/кв. дюйм. построить
найти
Таблица 1
Наиболее наглядной формой графического представления выборки является гистограмма. Гистограммой частот называется ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы длины , а высоты равны отношению (плотность частоты). Построим гистограмму, полигон, накопительная частота с помощью функций histogram(n,m):
Рис. 1. Гистограмма распределения по объемам (в фунт/кв. дюйм).
Полигон частот и полигон накопленных частот.
Числовое представление данных. Арифметическое среднее - сумма всех значений, отнесенная к общему числу наблюдений. Иначе говоря, среднее - это такое значение величины , для которого алгебраическая сумма расстояний выборочных значений , , …, от равна нулю. Для случая с несгруппированными данными формула нахождения среднего представляет собой вид:
В программе MathCAD среднее находится с помощью функции .
Медиана и мода Медиана представляет собой такое значение , что одна половина значений меньше её, а другая – больше (медиана делить площадь гистограммы пополам). Мода – наиболее часто появляющееся значение Медиана:
Выполним проверку в MathCAD:
Найдем моду функцию
Среднее квадратичное отклонение и дисперсия.
Вывод :
В данной лабораторной работе мы научились выполнять группировку данных и оформлять результаты обработки эмпирической выборки графически (в виде полигона, гистограммы, эмпирической функции распределения). Так же мы научились вычислять числовые характеристики выборки.
Список использованной литературы
Похожие статьи:
|
|