Решение задач по статистике

​​​​​Содержание:

  1. Элементы математической статистики
  2. Генеральная и выборочная совокупности
  3. Статистическое распределение выборки
  4. Графическое изображение статистических распределений
  5. Эмпирическая функция распределения
  6. Числовые характеристики статистического распределения выборки
  7. Статистические оценки параметров генеральной совокупности
  8. Статистические оценки неизвестных параметров распределения и их свойства
  9. Статистическая оценка математического ожидания
  10. Статистическая оценка дисперсии. Исправленная дисперсия
  11. Метод моментов статистического оценивания параметров распределения 
  12. Метод максимума правдоподобности статистического оценивания параметров распределения
  13. Интервальные оценки параметров распределения
  14. Распределение x2 - "хи-квадрат"
  15. Распределение Стьюдента
  16. Интервальные оценки для математического ожидания
  17. Оценка истинного значения измеряемой величины
  18. Доверительные интервалы для среднего квадратического отклонения нормально распределенной случайной величины
  19. Оценка точности измерений
  20. Элементы теории корреляции
  21. Выборочный коэффициент корреляции
  22. Основные понятия и методы регрессионного анализа
  23. Метод наименьших квадратов
  24. Статистическая проверка статистических гипотез
  25. Статистический критерий проверки нулевой гипотезы
  26. Проверка гипотезы про закон распределения. Критерия согласия Пирсона
  27. Проверка гипотезы про сравнение среднего значения признака генеральной совокупности со стандартом
  28. Проверка гипотезы про равенство дисперсий двух независимых случайных величин
  29. Проверка гипотезы про значимость коэффициента корреляции
  30. Определение размаха вариации
  31. Определение среднего линейного отклонения по индивидуальным данным и в рядах распределения
  32. Расчет дисперсии и среднего квадратического отклонения по индивидуальным данным и в рядах распределения
  33. Расчет дисперсии по формуле По индивидуальным данным и в рядах распределения
  34. Расчет дисперсии по способу моментов
  35. Определение коэффициента вариации
  36. Математическая статистика для университета
  37. Статистический и вариационный ряды
  38. Полигон и гистограмма
  39. Числовые оценки параметров распределения
  40. Статистическое описание и вычисление параметров распределения двумерного случайного вектора
  41. Уравнение регрессии
  42. Нелинейные регрессии
  43. Метод максимального правдоподобия
  44. Распределения, которые используются в статистике
  45. Интервальные оценки
  46. Построение группировки типологической, структурной и аналитической
  47. Приемы вторичной группировки
  48. Методические указания и решение типовых задач
  49. Статистические таблицы
Если у вас нет времени на выполнение заданий по статистике, вы всегда можете попросить меня, пришлите задания мне в Решение задач по статистикеwhatsapp, и я вам помогу онлайн или в срок от 1 до 3 дней.

Решение задач по статистике

Решение задач по статистикеОтветы на вопросы по заказу заданий по статистике:

Решение задач по статистике

Решение задач по статистикеСколько стоит помощь?

  • Цена зависит от объёма, сложности и срочности. Присылайте любые задания по любым предметам - я изучу и оценю.

Решение задач по статистикеКакой срок выполнения?

  • Мне и моей команде под силу выполнить как срочный заказ, так и сложный заказ. Стандартный срок выполнения – от 1 до 3 дней. Мы всегда стараемся выполнять любые работы и задания раньше срока.

Решение задач по статистикеЕсли требуется доработка, это бесплатно?

  • Доработка бесплатна. Срок выполнения от 1 до 2 дней.

Решение задач по статистикеМогу ли я не платить, если меня не устроит стоимость?

  • Оценка стоимости бесплатна.

Решение задач по статистикеКаким способом можно оплатить?

  • Можно оплатить любым способом: картой Visa / MasterCard, с баланса мобильного, google pay, apple pay, qiwi и т.д.

Решение задач по статистикеКакие у вас гарантии?

  • Если работу не зачли, и мы не смогли её исправить – верну полную стоимость заказа.

Решение задач по статистикеВ какое время я вам могу написать и прислать задание на выполнение?

  • Присылайте в любое время! Я стараюсь быть всегда онлайн.

Решение задач по статистике

Решение задач по статистикеНиже размещён теоретический и практический материал, который вам поможет разобраться в предмете "Статистика", если у вас есть желание и много свободного времени!

Решение задач по статистике

Элементы математической статистики

Предмет и основные задачи математической статистики:

Математическая статистика - это раздел математики, в котором изучаются методы, сбора, систематизации и анализа результатов наблюдений массовых случайных явлений с целью выявления существующих закономерностей с помощью методов теории вероятностей.

Основными задачами математической статистики являются такие:

Решение задач по статистикеуказать способы сбора и группировки статистических данных, полученных в результате наблюдений;

Решение задач по статистикеразработать методы анализа статистических  данных в зависимости от цели исследования.

Генеральная и выборочная совокупности

Генеральной совокупностью называется множество всех реально существующих или только условно возможных однородных объектов, которые изучаются с точки зрения их распределения по некоторому признаку.

Например: 

  • а) множества частных банков России по прибыли;
  • б) множества производств определенного товара по качеству;
  • в) множества людей по возрасту.

С теоретико-вероятностной точки зрения генеральная совокупность - это случайная величина Решение задач по статистике которая задана в пространстве элементарных событий Решение задач по статистике

Генеральная совокупность может быть конечной или бесконечной. Полное описание закона распределения случайной величины Решение задач по статистике можно получить, только выяснив значение признака для всех представителей данной совокупности.

В случае, если исследовать данный признак у всех предметов этой совокупности не невозможно (или их очень много, ил по другим причинам), пользуются выборочным методом, в соответствии с которым из данной генеральной совокупности случайно выбираются Решение задач по статистикеэлементов Решение задач по статистике

Часть объектов, которая отобрана случайным образом для непосредственного изучения из генеральной совокупности, называется выборочной совокупностью или выборкой.

С теоретико-вероятностного взгляда выборка из данной генеральной совокупности - это результаты ограниченного ряда наблюдений Решение задач по статистике случайной величины Решение задач по статистике

Число Решение задач по статистике которое отвечает количеству наблюдений, образующих выборку, называют объемом выборки, а числа Решение задач по статистике - элементами или вариантами выборки.

Размахом вариации Решение задач по статистикеназывается разница между максимальным вариантом выборки Решение задач по статистикеи минимальным вариантом Решение задач по статистике

В статистике интерпретация выборки и ее отдельных элементов допускает в зависимости от контекста два разных подхода - практический и теоретический.

В практическом подходе под Решение задач по статистике понимают фактически наблюдаемые в данном конкретном Решение задач по статистике-кратном эксперименте значение исследуемой случайной величины Решение задач по статистикето есть конкретные числа.

Согласно теоретическому подходу, под выборкой Решение задач по статистикепонимают последовательность случайных величин, Решение задач по статистике член которой Решение задач по статистике  только означает результат наблюдения, который мы могли бы получить Решение задач по статистике шаге Решение задач по статистике-кратного эксперимента, связанного с наблюдением исследуемой случайной величины Решение задач по статистике

Выборка называется случайной, если (в пределах теоретического подхода) серия наблюдений Решение задач по статистикеобразует последовательность независимых и одинаково распределенных случайных величин. Далее всегда буде считать, что выборка случайная.

Различают повторную и бесповторную выборки.

Во время повторной выборки объект, который берется из генеральной совокупности, после его исследования возвращается в генеральную совокупность. При этом один и тот же объект может исследоваться несколько раз.

Во время бесповторной выборки объекты, которые брались из генеральной совокупности на исследование, не возвращаются. На практике чаще всего пользуются бесповторным случайном отбором. 

Разница между повторной и бесповторной выборками практически отсутствует в случае, если объем генеральном совокупности достаточно большой, а выборка составляет лишь незначительную ее часть. Когда рассматривается бесконечная генеральная совокупность, а выборка имеет конечный объем, эта разница полностью исчезает.

Необходимо, чтобы выборка правильно представляла пропорции генеральной совокупности, то есть была репрезентативной. В соответствии с законом больших чисел можно утверждать, что выборка - репрезентативная, если она - случайная

Статистическое распределение выборки

Статистическим рядом называют выборку объема Решение задач по статистикеполученную из генеральной совокупности. Он подлежит дальнейшей обработке и анализу. 

Первый этап обработки статистического ряда - ранжирование - запись элементов в порядке их возрастания, в результате которого получают так называемый простой вариационный ряд, элементами которого являются Решение задач по статистике где Решение задач по статистике

Следующий этап обработки - построение статистического (эмпирического) закона распределения.

Если Решение задач по статистике- дискретная случайная величина, наиболее природная форма статистического закона распределения выборки описывается с помощью сгруппированного вариационного ряда.

Сгруппированный вариационный ряд получен на основе простого вариационного ряда путем отбора всех разных элементов, и размещения их в порядке возрастания Решение задач по статистикегде Решение задач по статистике

Для выделенных вариантов одновременно вычисляют частоты Решение задач по статистике которые им соответствуют, или относительные частоты Решение задач по статистике

Решение задач по статистике

Очевидно, что

Решение задач по статистике

Дискретным статистическим распределением выборки называется соответствие между вариантами и их частотами ил относительными частотами. 

Дискретное статистическое распределение подают в форме таблиц 3.1-3.2.

Решение задач по статистикедискретное статистическое распределение частот:

Таблица 3.1.

Решение задач по статистике

Решение задач по статистикедискретное статистическое распределение относительных частот:

Таблица 3.2.

Решение задач по статистике

Если Решение задач по статистике- непрерывная случайная величина (а также в случае, когда случайная величина дискретная и объем выборки относительно большой: Решение задач по статистике) статистический закон распределения выборки записывают, как интервальный вариационный ряд частот или относительных частот.

Интервальным статистическим распределением выборки  называется соответствие между интервалами вариационного ряда и их частотами или относительными частотами (или плотностью относительных частот).

Схема построения интервального статистического распределения выборки:

Решение задач по статистике статистические данные ранжируют;

Решение задач по статистикеопределяют оптимальный интервал длиной Решение задач по статистике- такой, при котором интервальный ряд не был бы большим м в то же время позволял выявить характерные черты исследуемого явления.

Длину интервала Решение задач по статистике находим как отношение размаха вариации Решение задач по статистике к числу интервалов Решение задач по статистике

Решение задач по статистике

где число интервалов приближенно вычисляем с помощью формулы Стерджесса:

Решение задач по статистике

Если Решение задач по статистикедробное, то за величину Решение задач по статистике можно принять или ближайшее целое число или ближайшее несложное дробное значение. За начало первого интервала рационально взять Решение задач по статистике

Решение задач по статистике

начало второго интервала совпадает с концом первого и равно

Решение задач по статистике

и т.д. Этот процесс продолжают, пока начало следующего интервала не meltn большим (если равно, в интервальном вариационном ряду последний промежуток - отрезок), чем Решение задач по статистике

Решение задач по статистике определяют частоту Решение задач по статистике для каждого интервала, то есть число значений случайной величины, которое принадлежит этому интервалу, включая и значения, совпадающие с нижней границей, но меньше верхней границы;

Решение задач по статистикеопределяют относительные частоты:

Решение задач по статистике

Интервальное статистическое распределение выборки, как и дискретное, записывают в виде таблиц 3.3-3.4.

Решение задач по статистикеинтервальное статистическое распределение частот:

Таблица 3.3

Решение задач по статистике

Решение задач по статистике

Решение задач по статистикеинтервальное статистическое распределение относительных частот:

Таблица 3.4.

Решение задач по статистике

Интервальное статистическое распределение выборки по необходимости можно заменить дискретным, для этого в каждом интервале Решение задач по статистике выбирают его "представителя", то есть находят среднее арифметическое:

Решение задач по статистике

а соответствующие значения частот (относительных частот) оставляют без изменений.

Пример 3.1. Рассмотрим построение ряда распределения  по начальным данным о размере прибыли 20-ти коммерческих банков региона за месяц (в млн. ден. ед.): Решение задач по статистикеРешение задач по статистике

Решение. Поскольку варианты значений признака не повторяются, строим интервальное статистическое распределение частот.

Определяем число интервалов:

Решение задач по статистике

тогда величина интервала составит 0,9 млн. ден. ед. :

Решение задач по статистике

В результате подсчетов количества банков в каждой группе, получим ряд распределения банков по величине прибыли за месяц - интервальное статистическое распределение частот и относительных частот (табл. 3.5-3.6).

Таблица 3.5.

Решение задач по статистике

Таблица 3.6.

Решение задач по статистике

где Решение задач по статистикеи .т.д.

Графическое изображение статистических распределений

Для наглядности используют графическое изображение статистических распределений - полигон и гистограмму.

Полигон распределения выборки используется для изображения как дискретных, так и интервальных вариационных рядов, а гистограмма - только для интервальных рядов.

Полигоном частот называют ломанную, отрезки которой последовательно соединяют точки Решение задач по статистике координатной плоскости.

Полигоном относительных частот называют ломанную, отрезки которой последовательно соединяют точки Решение задач по статистике координатной плоскости.

Схема построения полигона частот (относительных частот):

Решение задач по статистике на оси абсцисс откладывают варианты Решение задач по статистике

Решение задач по статистике на ост ординат - соответствующие частоты Решение задач по статистике (относительные частоты Решение задач по статистике);

Решение задач по статистике точки Решение задач по статистике соединяют отрезками прямых.

Гистограммой частот называется ступенчатая фигура, которая состоит из прямоугольников, основами которых являются частные интервалы Решение задач по статистике а их высоты:

Решение задач по статистике

Гистограммой частот называется ступенчатая фигура, которая состоит из прямоугольников, основами которых являются частные интервалы Решение задач по статистике, а их высоты:

Решение задач по статистике

Схема построения гистограмм частот (относительных частот):

Решение задач по статистике на оси абсцисс откладывают частные интервалы Решение задач по статистике

Решение задач по статистике на этих интервалах, как на основе, строят прямоугольники с высотами Решение задач по статистике Площадь каждого такого прямоугольника равна Решение задач по статистикеа площадь гистограммы частот равна объему выборки Решение задач по статистике(единице).

Пример 3.2. Построить гистограмму частот по данным примера 3.1, потом заменить интервальное статистическое распределение частот дискретным, начертить полигон частот.

Решение. Рассчитаем высоты Решение задач по статистике по формуле (3.11) и данным таблицы 3.5:

Решение задач по статистике

Заменим интервальное статистическое распределение частот дискретным. Для этого в каждом интервале Решение задач по статистикевыберем его "представителя", то есть найдем среднее арифметическое Решение задач по статистике а соответствующие значения частот оставим без изменения:

Решение задач по статистике

Построим гистограмму частот:

Решение задач по статистике

Рис. 3.1. Гистограмма частот по данным примера 3.1

Начертим полигон частот:

Решение задач по статистике

Рис. 3.2. Полигон частот по данным таблицы 3.6

Эмпирическая функция распределения

Теоретической функцией распределения генеральной совокупности или просто функцией распределения Решение задач по статистике случайной величины Решение задач по статистикеназывают функция, которая определяется равенством

Решение задач по статистике

Эмпирической функцией распределения случайной величины Решение задач по статистике (функцией распределения выборки) называют функцию. Решение задач по статистике которая определяет для любого действительного числа Решение задач по статистике относительную частоту события Решение задач по статистике то есть

Решение задач по статистике

где Решение задач по статистике - зафиксированное произвольное число;

Решение задач по статистике - количество элементов выборки, которое меньше, чем Решение задач по статистике

Решение задач по статистике- объем выборки;

Решение задач по статистике - относительная частота события Решение задач по статистике

Свойства эмпирической функции распределения Решение задач по статистике

1) значения эмпирической функции распределения принадлежат отрезку Решение задач по статистике

2) Решение задач по статистике - неубывающая функция;

3) если Решение задач по статистике - наименьший вариант, то Решение задач по статистике если Решение задач по статистике - наибольший вариант, то Решение задач по статистике

4) Решение задач по статистике - функция, непрерывная слева.

Связь между функциями Решение задач по статистике и Решение задач по статистике устанавливает теорема Гливенка Для любого действительного числа Решение задач по статистикепри условии неограниченного возрастания объема выборки Решение задач по статистикефункция распределения Решение задач по статистике совпадает по вероятности с теоретической функцией распределения Решение задач по статистике то есть для Решение задач по статистике и для Решение задач по статистике

Решение задач по статистике

Кумулятивная кривая (кумулята) используется для изображения вариационных рядов, если количество наблюдений большое.

Накопленными называются частоты, которые показывают сколько единиц совокупности имеют значения признака не больше, чем значение, которое рассматривается, и определяются последовательным сложением частот   интервалов.

Для построения кумулятивной кривой необходимо рассчитать накопленные частоты так, что:

Решение задач по статистике границе первого интервала соответствует частота, равная нулю, а верхней границе - вся частота данного интервала;

Решение задач по статистикеверхней границе второго интервала соответствует накопленная частота, равная сумме частот первых двух интервалов и т.д.

Кумуляту считают приближенным графиком  эмпирической функции распределения.

Изображение вариационного ряда в виде кумуляты особенно удобно при  сравнении вариационных рядов.

Числовые характеристики статистического распределения выборки

На практике часто вместо полного изучения данных выборки бывает достаточно ограничиться нахождением их числовых характеристик. Допустим, что статистические данные сгруппированы в дискретный вариационный ряд.

Выборочным средним Решение задач по статистикестатистического распределения выборки называется среднее арифметическое значение ее вариантов Решение задач по статистике с учетом их частот:

Решение задач по статистике

Если все элементы выборки разные, то  выборочное среднее Решение задач по статистике является средним арифметическим значением признака выборочной совокупности:

Решение задач по статистике

Выборочное среднее Решение задач по статистике является основной характеристикой статистического распределения выборки. Его обобщением является понятие начального эмпирического момента.

Начальным эмпирическим моментом Решение задач по статистике порядка Решение задач по статистике статистического распределения выборки называется среднее арифметическое значение степеней порядка Решение задач по статистике вариантов Решение задач по статистике

Решение задач по статистике

В частности, Решение задач по статистике

Перейдем к определению основных характеристик рассеивания значений случайной величины вокруг ее среднего значения. Самым простым показателем рассеивания вариационного ряда является размах Решение задач по статистике

Размахом выборки Решение задач по статистикеназывают разницу между наибольшим значением ее вариантов:

Решение задач по статистике

Выборочной дисперсией Решение задач по статистике статистического распределения выборки называется среднее арифметическое значений квадратов отклонений вариантов Решение задач по статистикеот выборочного среднего Решение задач по статистике

Решение задач по статистике

Для вычисления выборочной дисперсии удобнее использовать другую формулу:

Решение задач по статистике

Размерность дисперсии равна квадрату размерности значений случайной величины, которая  немного неудобна, для устранения которой за характеристику рассеивания значений случайной величины принимают выборочное среднее квадратическое отклонение Решение задач по статистике которое определяется равенством:

Решение задач по статистике

Коэффициентом ковариации  Решение задач по статистике статистического распределения выборки называется выраженное в процентах отношение выборочного среднего квадратического отклонения к выборочному среднему 

Решение задач по статистике

Центральным эмпирическим моментом Решение задач по статистике порядка Решение задач по статистике статистического распределения выборки называется среднее арифметическое значение степеней порядка Решение задач по статистикеотклонений вариантов Решение задач по статистикеот среднего выборочного значения:

Решение задач по статистике

В частностиРешение задач по статистике

Для оценки отклонения статистического распределения выборки от нормального распределения используют числовые характеристики - асимметрию и эксцесс. 

Асимметрией (коэффициентом асимметрии) Решение задач по статистике статистического распределения выборки называется отношение центрального эмпирического момента 3-го порядка Решение задач по статистике к среднему квадратическому отклонению в кубе Решение задач по статистике

Решение задач по статистике

Эксцессом Решение задач по статистикестатистического распределения выборки называется разница между отношением  центрального эмпирического момента 4-го порядка Решение задач по статистике к среднему квадратическому отклонению в четвертой степениРешение задач по статистике и тройкой:

Решение задач по статистике

Если случайная величина  Решение задач по статистике распределена по нормальному закону, то ее асимметрия и эксцесс равны нулю.

В случаях, когда эмпирические данные сгруппированы с помощью интервального вариационного ряда, для вычисления соответствующих числовых характеристик выборки используют формулы (3.15)-(3.25) остаются без изменений, если считать, что у них Решение задач по статистике - середины частных промежутков Решение задач по статистике

Существуют другие числовые характеристики, такие как: мода и медиана.

Модой Решение задач по статистике статистического распределения выборки называет вариант, который имеет наибольшую частоту.

В случае дискретного вариационного ряда мода может определяться неоднозначно, поэтому говорят, про одно- и многомодальное распределение.

В случае интервального вариационного ряда, моду определяют таким образом:

Решение задач по статистике правую вершину так называемого модального прямоугольника (прямоугольник, который имеет наибольшую высоту) соединяют с правым верхним углом предыдущего прямоугольника;

Решение задач по статистике левую вершину модального прямоугольника - с левым верхним углом следующего прямоугольника;

Решение задач по статистике абсцисса точки пересечения этих прямых является модой распределения.

Медианой Решение задач по статистикестатистического распределения выборки называют вариант, который делит вариационный ряд на две части, одинаковые по количеству вариантов.

Если число вариантов дискретного статистического распределения выборки нечетное, то есть Решение задач по статистике при четном Решение задач по статистике медиана Решение задач по статистике

Определение медианы интервального вариационного ряда по кумуляте:

Решение задач по статистике высоту наибольшей ординаты, которая соответствует общей численности совокупности, делят пополам;

Решение задач по статистикечерез полученную точку проводят прямую, параллельную оси абсцисс, до ее пересечения с кумулятой;

Решение задач по статистике абсцисса точки пересечения является медианой.

Пример 3.3. Исследуемый признак Решение задач по статистике - количество работников на предприятии имеет распределение, заданное таблицей 3.8. Вычислить числовые характеристики случайной величины Решение задач по статистике

Таблица 3.8.

Решение задач по статистике

Решение. Для расчета числовых характеристик данного распределения удобно воспользоваться таблицей 3.9.

Таблица 3.9.

Решение задач по статистике

Вычислим выборочное среднее:

Решение задач по статистике (чел.) - среднее количество работников на предприятии.

Дисперсию рассчитаем двумя способами - по формулам (3.19) и (3.20):

Решение задач по статистике

Вычислим выборочное среднее квадратическое отклонение:

Решение задач по статистике

Таким образом, количество работников на каждом предприятии отклоняется от среднего количества в среднем на 124 лица.

Размах вариации равен:

Решение задач по статистике (чел.).

Рассчитаем коэффициент вариации Решение задач по статистикестатистического распределения выборки:

Решение задач по статистике

Как видно из распределения, приведенного в таблице 3.8, модой статистического распределения выборки является Решение задач по статистике а медиана в данном случае совпадает с модой.

Статистические оценки параметров генеральной совокупности

Изучая определенный признак Решение задач по статистике генеральной совокупности, мы можем знать характер распределения случайной величины Решение задач по статистике но параметры этого законы остаются неизвестными. Тогда стает дальнейшее задание: на основании полученной выборки определить приближенные числовые значения неизвестных параметров распределения - точечные статистические оценки или просто статистические оценки.

Статистические оценки неизвестных параметров распределения и их свойства

Статистической оценкой неизвестного параметра Решение задач по статистике теоретического распределения называется любая однозначная функция от случайных величин, которые наблюдаются: Решение задач по статистике

Для того, чтобы оценка Решение задач по статистике имела практическую ценность, она должна удовлетворять определенные условия. Статистическая оценка является сама случайной величиной.

Статистическая оценка Решение задач по статистикенеизвестного параметра распределения Решение задач по статистикеслучайной величины Решение задач по статистике называется несмещенной, если ее математическое ожидание равно точному значению этого параметра:

Решение задач по статистике

Если оценка не удовлетворяет этому условию, то она называется смещенной.

Статистическая оценка Решение задач по статистикенеизвестного параметра распределения Решение задач по статистикеслучайной величины Решение задач по статистике называется эффективной, если она имеет наименьшую дисперсию среди  всех несмещенных оценок параметра Решение задач по статистике вычисленных по выборкам одного и того же объема.

Во время рассмотрения выборок большого объема к статистическим оценкам добавляется требование состоятельности (или содержательности или конзистентности).

Статистическая оценка Решение задач по статистике неизвестного параметра распределения Решение задач по статистикеслучайной величины Решение задач по статистике называется состоятельной (или содержательной или конзистентной), если Решение задач по статистике совпадает по вероятности с оценочным параметром при неограниченном возрастании объема выборки, то есть выполняет такое равенство: Решение задач по статистике

Решение задач по статистике

где Решение задач по статистике- сколь угодно малое число.

Статистическая оценка математического ожидания

Допустим, чтоРешение задач по статистике - выборка, полученная в результате Решение задач по статистике независимых испытаний над случайной величиной Решение задач по статистике - некоторым признаком генеральной совокупности, который имеет математическое ожидание Решение задач по статистике

За статистическую оценку математического ожидания Решение задач по статистикепринимают выборочное среднее:

Решение задач по статистике

Оценка Решение задач по статистике является несмещенной, то есть Решение задач по статистике

Допустим дополнительно, что случайная величина Решение задач по статистикеимеет конечную дисперсию Решение задач по статистикеТогда оценка Решение задач по статистикеявляется состоятельной для параметра Решение задач по статистике

Утверждение. Если случайная величина Решение задач по статистике нормально распределена с параметрами Решение задач по статистике и Решение задач по статистике то оценка Решение задач по статистике имеет в классе всех несмещенных оценок математического ожидания Решение задач по статистике минимальную дисперсию, которая равна Решение задач по статистике поэтому Решение задач по статистикеявляется эффективной оценкой параметра Решение задач по статистике

Статистическая оценка дисперсии. Исправленная дисперсия

Если случайная выборка Решение задач по статистике состоит из Решение задач по статистикенезависимых испытаний над случайной  величиной Решение задач по статистике с математическим ожиданием Решение задач по статистике и дисперсией Решение задач по статистике то за статистическую оценку дисперсии берут выборочную дисперсию

Решение задач по статистике

которая является смещенной оценкой параметра Решение задач по статистике

или исправленную выборочную дисперсию

Решение задач по статистике

которая является несмещенной оценкой параметра Решение задач по статистике

Тот факт, что Решение задач по статистике является смещенной оценкой для Решение задач по статистике следует из равенства:

Решение задач по статистике

Учитывая соотношение Решение задач по статистике получим:

Решение задач по статистике

то есть, исправленная дисперсия Решение задач по статистике является несмещенной оценкой для дисперсии Решение задач по статистике

Соответственно несмещенной точечной оценкой среднего квадратического отклонения является число - исправленное среднее квадратическое отклонение:

Решение задач по статистике

Дробь Решение задач по статистике называют поправкой Бесселя. Для малых  Решение задач по статистике поправка Бесселя значительно отличается от единицы. Для Решение задач по статистике и Решение задач по статистике отличаются мало. На практике пользуются исправленной дисперсией, если объем Решение задач по статистике

Оценки Решение задач по статистике и Решение задач по статистике являются состоятельными и не являются эффективными.

В случае, если математическое ожидание Решение задач по статистикеизвестна и случайная величина Решение задач по статистикераспределена нормально, состоятельной и эффективной оценкой дисперсии Решение задач по статистикеявляется:

Решение задач по статистике

Пример 3.4. В результате исследования получен статистический ряд: Решение задач по статистикеРешение задач по статистикеВычислить статистическую оценку математического ожидания, несмещенную оценку дисперсии и исправленное среднее квадратическое отклонение.

Решение. Для вычисления статистических оценок построим дискретный вариационный ряд:

Решение задач по статистике

Вычислим статистическую оценку математического ожидания:

Решение задач по статистике

Поскольку объем выборки Решение задач по статистикевычислим несмещенную оценку дисперсии и исправленное среднее квадратическое отклонение:

Решение задач по статистике

Метод моментов статистического оценивания параметров распределения 

На основании данных выборки Решение задач по статистике полученной вследствие наблюдений над случайной величиной Решение задач по статистике необходимо оценить неизвестный параметр Решение задач по статистикеДопустим, что закон распределения случайной величины Решение задач по статистике известен с точность до параметра Решение задач по статистике и определяется с помощью функции Решение задач по статистике которая в случае дискретной случайной величины Решение задач по статистике задает вероятность события Решение задач по статистике а в случае непрерывной случайной величины Решение задач по статистике - плотность ее распределения. Тогда все моменты случайной величины Решение задач по статистике являются функциями от Решение задач по статистике

Решение задач по статистике

где  Решение задач по статистике если Решение задач по статистике - дискретная случайная величина, а Решение задач по статистике - возможные значения Решение задач по статистикеи Решение задач по статистикеРешение задач по статистике если Решение задач по статистике - непрерывная случайная величина.

Схема статистической оценки  параметров Решение задач по статистике по методу моментов:

1) вычисляем Решение задач по статистикетеоретических начальных моментов;

Решение задач по статистике

2) на основании выборки Решение задач по статистикевычисляем Решение задач по статистикесоответствующих выборочных начальных моментов.

В случае, если выборка задана выходным статистическим рядом, это будут эмпирические моменты:

Решение задач по статистике

В случае, если выборка задана сгруппированным вариационным рядом, это будут эмпирические моменты:

Решение задач по статистике

3) приравниваем теоретические и соответствующие эмпирические моменты и получаем систему уравнений относительно компонент Решение задач по статистике оцениваемого параметра:

Решение задач по статистике

4) решая полученную систему уравнений (точно или приблизительно), находим искомые оценки Решение задач по статистике Эти оценки, очевидно, являются функциями от выборочных значений Решение задач по статистике

Необходимо заметить, что:

Решение задач по статистике схема в случае выбора центральных или начальных и центральных моментов в совокупности остается без изменений;

Решение задач по статистике теоретическим обоснованием метода моментов является закон больших чисел;

Решение задач по статистике методом моментов получают состоятельные статистические оценки параметров распределения, которые, однако, условия несмещенности вообще не удовлетворяют;

Решение задач по статистике приравнивая функции от теоретических и эмпирических моментов, можно получить статистические оценки для характеристик случайной величины, которые являются функциями от теоретических моментов.

Пример 3.5. Найти методом моментов по выборке Решение задач по статистикестатистические оценки  неизвестных параметров Решение задач по статистикеи Решение задач по статистике нормального распределения:

Решение задач по статистике

Решение. Приравняем начальные теоретические и эмпирические моменты первого порядка, а также центральные и эмпирические моменты второго порядка: Решение задач по статистикеУчитывая, что

Решение задач по статистике

получим:  Решение задач по статистике

Принимая во внимание, что математическое ожидание нормального распределения равно параметру Решение задач по статистике дисперсия равна Решение задач по статистике получим:

Решение задач по статистике

Таким образом, искомые статистические оценки параметров нормального распределения:

Решение задач по статистике

Метод максимума правдоподобности статистического оценивания параметров распределения

На основании данных выборки Решение задач по статистике полученной вследствие наблюдений над случайной величиной Решение задач по статистике необходимо оценить неизвестный параметр Решение задач по статистикеДопустим, что закон распределения случайной величины Решение задач по статистике известен с точностью до параметра Решение задач по статистике и определяется с помощью функции Решение задач по статистике которая в случае дискретной случайной величины Решение задач по статистике задает вероятность события Решение задач по статистике а в случае непрерывной случайной величины Решение задач по статистике- плотность ее распределения.

Функцией правдоподобности называют функцию .Решение задач по статистике

которая изображает совместное распределение случайного вектора с независимыми компонентами, каждая из которых имеет такое же распределение, что и случайная величина Решение задач по статистике

Идея метода максимума правдоподобности: за статистическую оценку неизвестного параметра Решение задач по статистике принимают такое его значение Решение задач по статистике для которого функция правдоподобности Решение задач по статистике рассматриваемая как функция от Решение задач по статистике при фиксированных значениях Решение задач по статистике достигает максимума.

Схема статистического оценивания параметра Решение задач по статистике методом максимума правдоподобности:

1) исследуем функцию правдоподобности Решение задач по статистикена максимум с помощью методов дифференциального исчисления: находим критические точки Решение задач по статистикеиз системы уравнений:

Решение задач по статистике

Для упрощения вычислений удобно вместо функции  Решение задач по статистике рассматривать логарифмическую функцию правдоподобности Решение задач по статистикепоскольку точки экстремума для функций Решение задач по статистикеи Решение задач по статистике совпадают, так как Решение задач по статистике Находим критические точки функции Решение задач по статистике из системы уравнений:

Решение задач по статистике

решение которой Решение задач по статистике

2) используя достаточные условия экстремума функции, находим точку максимума.

Метод максимума правдоподобности статистического оценивания параметров распределения имеет серию важных преимуществ:

Решение задач по статистике они состоятельные, асимптотически нормально распределены (при большом объеме выборки Решение задач по статистике их распределение приближается к нормальному) и имеют наименьшую дисперсию по сравнению с другими асимптотически нормальными оценками;

Решение задач по статистикенаиболее полно используются данные выборки для оценки параметров, поэтому этот метод особенно полезный при малых объемах выборки.

Недостаток метода в том, что он часто требует сложных вычислений.

Чаще всего этот метод используется при биномиальном, показательном распределениях и распределении Пуассона.

В случае биномиального распределения функция правдоподобности имеет вид: Решение задач по статистике

где  Решение задач по статистике

После логарифмирования и приравнивания к нулю производной от Решение задач по статистикеполучаем выражение для оценки параметра Решение задач по статистике

Решение задач по статистике

В случае, если вариант Решение задач по статистике имеет частоту Решение задач по статистике то оценка параметра Решение задач по статистике такая:

Решение задач по статистике

где Решение задач по статистике- количество исследования по Решение задач по статистике испытаний в каждом.

Интервальные оценки параметров распределения

Статистическая точечная оценка Решение задач по статистике параметра Решение задач по статистике тем точнее, чем меньше величина разницы Решение задач по статистике Если бы удалось установить, что Решение задач по статистике то число Решение задач по статистике характеризовало бы точность статистической точечной оценки Решение задач по статистике параметра Решение задач по статистикеНо статистические методы не позволяют категорически утверждать, что Решение задач по статистикетак как Решение задач по статистикеявляется случайной величиной. Можно только говорить про вероятность Решение задач по статистике с которой это неравенство выполняется.

Надежностью статистической точечной оценки Решение задач по статистикепараметра Решение задач по статистике называется вероятность Решение задач по статистике с которой выполняется неравенство Решение задач по статистике то есть

Решение задач по статистике

На практике надежность оценки задается наперед, по крайней мере число Решение задач по статистике выбирают близким к единице: Решение задач по статистике

Например, надежность оценки Решение задач по статистикеозначает, что при достаточно большом количестве выборок 95% из них определяют такие доверительные интервалы, в которых действительно находится неизвестный параметр.

Соотношение (3.32) перепишем в таком виде:

Решение задач по статистике

Интервал Решение задач по статистикедля которого выполняется равенство (3.32), называется доверительным интервалом (надежным интервалом), а его пределы Решение задач по статистике и Решение задач по статистике - надежными пределами для параметра распределения Решение задач по статистике

Способ нахождения доверительного интервала - решить уравнение (3.32), из которого и определяют число Решение задач по статистике

Для этого необходимо вычислить вероятность Решение задач по статистикеЭто можно сделать, если известен закон распределения статистической оценки Решение задач по статистике или связанной с ней другой случайной величины, так как тогда можно использовать известные формулы из теории вероятностей:

Решение задач по статистике

где Решение задач по статистике- функция распределения;

Решение задач по статистике - плотность распределения случайной величины Решение задач по статистике

Распределение x2 - "хи-квадрат"

Распределение Решение задач по статистике - "хи-квадрат"

Для решения уравнения Решение задач по статистикевместе с рассмотренными распределениями случайных величин в статистике применяют еще распределения "хи-квадрат", Стьюдента и Фишера-Снедекора. Рассмотрим эти распределения.

Допустим, что Решение задач по статистике - независимые и нормально распределенные случайные величины, по крайней мере их математические ожидания Решение задач по статистике и средние квадратические отклонения Решение задач по статистикедля любого Решение задач по статистике Случайная величина

Решение задач по статистике

имеет распределение Решение задач по статистике с Решение задач по статистике степенями свободы.

Распределение Решение задач по статистике "хи-квадрат" зависит от одного параметра Решение задач по статистикеи при Решение задач по статистике оно приближается к нормальному закону. 

Распределение Стьюдента

Допустим, что Решение задач по статистике- нормально распределенная случайная величина, по крайней мере ее математическое ожидание Решение задач по статистикеи средние квадратические отклонения Решение задач по статистике- независимая от Решение задач по статистикеслучайная величина, которая распределена по закону Решение задач по статистикес Решение задач по статистике степенями свободы. Тогда случайная величина:

Решение задач по статистике

имеет распределение Стьюдента с Решение задач по статистике степенями свободы. 

Распределение Стьюдента также зависит от одного параметра Решение задач по статистике и при Решение задач по статистике оно приближается к нормальному закону.

3.8.4. Распределение Фишера-Снедекора

Допустим, что Решение задач по статистикеи Решение задач по статистике - независимые случайные величины, которые имеют Решение задач по статистике распределение с Решение задач по статистикеи Решение задач по статистике степенями свободы соответственно. Случайная величина

Решение задач по статистике

зависит от двух параметров - степеней свободы Решение задач по статистикеи Решение задач по статистике

Это распределение получило название Решение задач по статистике-распределения, или распределения Фишера-Стедекора.

В частности, Решение задач по статистике-распределению подчиняется отношение дисперсий двух независимых выборок объемов Решение задач по статистикеи Решение задач по статистике из двух, нормально распределенных генеральных совокупностей с равными дисперсиями. В этом случае Решение задач по статистикеи Решение задач по статистике

Интервальные оценки для математического ожидания

Теорема. Допустим, что Решение задач по статистике- нормально распределенный признак генеральной совокупности, Решение задач по статистике- выборочное среднее, найденное по выборке объема Решение задач по статистикеиз этой генеральной совокупности. Тогда Решение задач по статистике- нормально распределенная случайная величина.

Теорема. Допустим, что Решение задач по статистике нормально распределенный признак генеральной совокупности, для которой Решение задач по статистике- выборочное среднее, вычисленное по выборке объема Решение задач по статистикеиз этой генеральной совокупности. Тогда для Решение задач по статистике

Решение задач по статистике

где Решение задач по статистике

Теорема. Допустим, что Решение задач по статистике нормально распределенный признак генеральной совокупности, для которой Решение задач по статистике- выборочное среднее, вычисленное по выборке объема Решение задач по статистикеиз этой генеральной совокупности. Тогда для Решение задач по статистике

Решение задач по статистике

Допустим, что Решение задач по статистике- результаты Решение задач по статистикенезависимых наблюдений за случайной величиной Решение задач по статистике на основании которых необходимо найти доверительный интервал для неизвестного параметра Решение задач по статистике

Поскольку для математического ожидания статистической точечной оценкой является выборочное среднее Решение задач по статистике то для нахождения доверительного интервала Решение задач по статистикенужно решить уравнение:

Решение задач по статистике

Если среднее квадратическое отклонение Решение задач по статистикеслучайной величины Решение задач по статистикеизвестно, то решение уравнения (3.35) можно найти, используя равенство (3.33) ил (3.34).

Так, если Решение задач по статистике- нормально распределенная случайна величина с известным средним квадратическим отклонением Решение задач по статистикето можно записать, что:

Решение задач по статистике

Тогда, если Решение задач по статистике - решение уравнения Решение задач по статистикес надежностью Решение задач по статистике то интервал

Решение задач по статистике

является доверительным интервалом математического ожидания Решение задач по статистике

Если среднее квадратическое отклонение Решение задач по статистике- неизвестно, но объем выборки значительный Решение задач по статистике то доверительный интервал можно записать в виде:

Решение задач по статистике

где Решение задач по статистике- исправленное среднее квадратическое отклонение, найденное по выборке объемом Решение задач по статистике

Если среднее квадратическое отклонение Решение задач по статистике- неизвестно, но объем выборки незначительный Решение задач по статистике - нормально распределенная случайная величина, то доверительный интервал также записывают с помощью формулы (3.36), где значение Решение задач по статистикенаходят по таблицам как решение уравнения

Решение задач по статистике

где Решение задач по статистике - случайная величина, распределенная по закону Стьюдента с Решение задач по статистике степенями свободы.

Распределение Стьюдента зависит  только от одного параметра Решение задач по статистикеи при Решение задач по статистике приближается к нормальному распределению. Поэтому даже если среднее квадратическое отклонение Решение задач по статистикеслучайной величины Решение задач по статистике неизвестно, но объем выборки значительный Решение задач по статистике то можно пользоваться формулами (3.33) или (3.34).

Если необходимо оценить математическое ожидание с заранее заданной точностью Решение задач по статистике и надежностью Решение задач по статистике то минимальный объем выборки, который обеспечит эту точность, находят по формуле

Решение задач по статистике

(как следствие равенства Решение задач по статистике).

Пример 3.6 Случайная величина Решение задач по статистике распределена нормально с известным средним квадратическим отклонением Решение задач по статистике Найти доверительный интервал с надежностью Решение задач по статистике для оценки неизвестного математического ожидания Решение задач по статистике если выборочное среднее Решение задач по статистикенайдено по данным выборки объема Решение задач по статистике

Решение. Из уравнения Решение задач по статистикес помощью таблицы значений функции Лапласа (приложение Б) находим Решение задач по статистикеПределы доверительного интервала ищем по формулам:

Решение задач по статистике

Следовательно, Решение задач по статистикес надежностью Решение задач по статистике

Пример 3.7. Признак Решение задач по статистике генеральной совокупности распределен нормально. По выборке объемом Решение задач по статистике найдено выборочное среднее Решение задач по статистикеи исправленное среднее квадратическое отклонение Решение задач по статистике Оценить неизвестное математическое ожидание Решение задач по статистике с помощью доверительного интервала с надежностью Решение задач по статистике

Решение. Поскольку объем выборки незначительный Решение задач по статистике и среднее квадратическое отклонение неизвестно, то для нахождения пределов доверительного интервала воспользуемся формулой (3.36), где значение Решение задач по статистике находим с помощью таблицы (приложение Г): Решение задач по статистике Тогда

Решение задач по статистике

Следовательно, Решение задач по статистике с надежностью Решение задач по статистике

Пример 3.8. Найти минимальный объем выборки, на основании которой можно было бы оценить математическое ожидание случайной величины с погрешностью, которая не превышает 0,2 и надежность. 0,98, если случайная величина распределена нормально с Решение задач по статистике

Решение. Из уравнения Решение задач по статистике с помощью таблицы функции Лапласа (см. прил. Б) находим Решение задач по статистике По формуле (3.37) находим Решение задач по статистике

Решение задач по статистике

Оценка истинного значения измеряемой величины

Допустим, что одним прибором проводят Решение задач по статистикенезависимых измерений некоторой физической величины с одинаковой точностью прибора, к тому же истинное значение этой величины неизвестно. Результаты измерений Решение задач по статистике - это независимые одинаково распределенные случайные величины, поскольку они имеют то же самое математическое ожидание - истинное значение измеряемой величины и одинаковые дисперсии, так как измерение осуществляется с одинаковой точностью. На основании центральной предельной теоремы можно также утверждать, что эти случайные величины распределены нормально. Следовательно, истинное значение величины, которая измеряется, можно оценить по средним арифметическим отдельных измерений с помощью доверительных интервалов. 

Пример 3.9. По данным 9-ти независимых измерений физической величины, проведенных с помощью одного прибора, найдено среднее арифметическое результатов отдельных измерений Решение задач по статистикеи исправленное среднее квадратическое отклонение Решение задач по статистикеОценить истинное значение измеряемой величины с надежностью Решение задач по статистике

Решение. Поскольку Решение задач по статистике и среднее квадратическое отклонение неизвестно, то пределы доверительного интервала находим по формуле (3.36), а значение Решение задач по статистике - с помощью таблицы (см. прил. Г): Решение задач по статистикеТогда

Решение задач по статистике

Следовательно, с надежностью Решение задач по статистикеистинное значение измеряемой величины покрывается интервалом Решение задач по статистике

Доверительные интервалы для среднего квадратического отклонения нормально распределенной случайной величины

Допустим, что признак Решение задач по статистикегенеральной совокупности распределен нормально. Найдем доверительный интервал для среднего квадратического отклонения Решение задач по статистике с заданной надежностью Решение задач по статистике Поскольку статистической точечной оценкой для параметра Решение задач по статистикеявляется исправленное среднее квадратическое отклонение Решение задач по статистике то для этого необходимо решить уравнение:

Решение задач по статистике

преобразуем двойное неравенство Решение задач по статистике

Решение задач по статистике

где Решение задач по статистике

Остается найти Для этого рассмотрим случайную величину

Решение задач по статистике

где Решение задач по статистике - объем выборки.

Известно, что случайная величина Решение задач по статистикераспределена по закону Решение задач по статистикес Решение задач по статистике степенями свободы, поэтому корень квадратный из нее обозначают через Решение задач по статистике

Допустим, что Решение задач по статистике тогда неравенство (3.38) преобразуется так:

Решение задач по статистике

или

Решение задач по статистике

Следовательно,

Решение задач по статистике

где Решение задач по статистике Из полученного уравнения можно с помощью таблицы Решение задач по статистике (приложение Е) найти Решение задач по статистике

 Вычислив по выборке Решение задач по статистикеи найдя по таблице Решение задач по статистике получаем искомый доверительный интервал (3.38), который покрывает параметр Решение задач по статистикес заданной вероятностью Решение задач по статистике

Если Решение задач по статистике то неравенство (3.38) принимает вид:

Решение задач по статистике

В этом случае Решение задач по статистике также ищут по таблице значений Решение задач по статистике (см. прил. Е).

Оценка точности измерений

В теории ошибок принято точность измерений характеризовать с помощью среднего квадратического отклонения Решение задач по статистикеслучайных ошибок измерений. Для оценки Решение задач по статистикеиспользуют исправленное среднее квадратическое отклонение Решение задач по статистике

Пример 3.10. По данным 20-ти равноточных измерений найдено исправленное среднее квадратическое отклонение Решение задач по статистикеНайти точность измерения с надежностью Решение задач по статистике

Решение. Найти точность измерения - означает найти доверительный интервал Решение задач по статистикекоторый покрывает Решение задач по статистике с заданной надежностью Решение задач по статистике По таблице значений Решение задач по статистике (см. приложение Е) находим Решение задач по статистикеИскомый доверительный интервал:

Решение задач по статистике

Элементы теории корреляции

Функциональная, статистическая и корреляционная зависимости^

Две случайные величины Решение задач по статистикеи Решение задач по статистике могут быть связаны или функциональной зависимостью, ..или зависимостью другого рода, которая называется статистической или быть н.езависимыми. Четкая функциональная зависимость реализуется редко.

Статистической называют зависимость, во время которой изменение одной из величин вызывает изменения распределения другой. 

В частности, в случае, если во время изменения одной из величин изменяется среднее значение второй, статистическую зависимость называют корреляционной.

Выборочный коэффициент корреляции

Корреляционный анализ исследует наличие и характер связей между случайными величинами Решение задач по статистикеи Решение задач по статистике - признаками генеральной совокупности.

Основанием для анализа зависимости между случайными величинами  Решение задач по статистикеи Решение задач по статистике являются данные выборки, образованной вследствие независимых наблюдений над двумерной величиной Решение задач по статистике

Элементами выборки являются упорядоченные пары чисел Решение задач по статистике где Решение задач по статистике- выборочные значения признаков Решение задач по статистике и Решение задач по статистике соответственно, которые получают в результате Решение задач по статистике наблюдения, Решение задач по статистике - объем выборки. Выходные статистические данные, как правило, подаются в виде таблицы, строки (или столбцы) которой закреплены за выборочными значениями признаков  Решение задач по статистике и Решение задач по статистике.

Если объем выборки Решение задач по статистикедостаточно большой, то статистические данные группируют.

Допустим, что среди выборочных значений признака Решение задач по статистике можно выделить Решение задач по статистикеразных значений или частных интервалов, а среди выборочных значений признака Решение задач по статистике есть Решение задач по статистике разных значений или частных интервалов. Потом переходят к построению таблицы. В случае дискретной случайной величины Решение задач по статистике в первой строке записывают проранжированные варианты случайной величины Решение задач по статистике а в первом столбце записывают проранжированные варианты случайной величины Решение задач по статистике Через Решение задач по статистике обозначим частоту появления события Решение задач по статистике Частоты Решение задач по статистике которые расположены во внутренних клетках таблицы, составляют эмпирическую (статистическую) структуру закона совместного распределения случайных величин Решение задач по статистике и Решение задач по статистике В последней строке (столбце) записывают частоты вариантов Решение задач по статистике которые обозначают через Решение задач по статистике Частоты вариантов связаны между собой соотношениями:

Решение задач по статистике

Выполняется также очевидное равенство:

Решение задач по статистике

Частоты Решение задач по статистикеи Решение задач по статистике вместе с соответствующими вариантами Решение задач по статистике и Решение задач по статистике характеризуют эмпирические (статистические) законы распределения одномерных случайных величин Решение задач по статистикеи Решение задач по статистике

Построенную таким образом таблицу называют корреляционной.

Если для построения корреляционной таблицы вместо вариантов возьмем частные интервалы, то в каждом из них необходимо выбрать своего "представителя", то есть середину соответствующего интервала, тогда числа Решение задач по статистике означают середины соответствующих интервалов. 

Из теории вероятностей известно, что степень связи между случайными величинами Решение задач по статистикеи Решение задач по статистикеопределяется такими числовыми характеристиками их совместного распределения, как ковариация Решение задач по статистике и коэффициент корреляции Решение задач по статистике которые вычисляются по формулам:

Решение задач по статистике

Основная задача корреляционного анализа состоит в выявлении зависимостей между случайными величинами  Решение задач по статистикеи Решение задач по статистике и может быть решена путем построения статистических оценок коэффициента корреляции.

Статистическую точечную оценку для коэффициента корреляции вычисляют по формуле:

Решение задач по статистике

Выборочным коэффициентом корреляции называется статистическая точечная оценка Решение задач по статистикекоэффициента корреляции между случайными величинами Решение задач по статистикеи Решение задач по статистике, которая вычисляется по формуле (3.39).

Выборочный коэффициент корреляции характеризует связь между случайными величинами Решение задач по статистикеи Решение задач по статистике- признаками генеральной совокупности:

а) если Решение задач по статистике то связь между  Решение задач по статистикеи Решение задач по статистике является положительной, и они уменьшаются или увеличиваются одновременно;

б) если Решение задач по статистикето связь между  Решение задач по статистикеи Решение задач по статистике является отрицательной - с увеличением одной из них вторая уменьшается и наоборот; если Решение задач по статистике то случайные величины   Решение задач по статистикеи Решение задач по статистике- некоррелированные, и это не означает только отсутствие линейной связи между ними.

Выборочный коэффициент корреляции удовлетворяет неравенство:

Решение задач по статистике

На практике пользуются также коэффициентом детерминации.

Коэффициентом детерминации называется квадрат выборочного коэффициента корреляции Решение задач по статистике

Пример 3.11 По данным 20-ти туристических фирм были установлены затраты на рекламу Решение задач по статистике (ус. ед.) и количество туристов Решение задач по статистике (чел.), которые воспользовались услугами каждой фирмы. Исследовать зависимость между этими признаками (в таблице 3.10 представлены данные, которые проранжированы по величине затрат на рекламу).

Таблица 3.10

Решение задач по статистике

Решение. По таблице можно видеть, что вообще увеличение затрат на рекламу приводит к увеличению количества туристов, которые пользуются услугами фирмы, хотя в отдельных случаях наличие такой зависимости может и не прослеживаться. В каждом отдельном случае количество туристов, которые воспользовались услугами фирмы, зависит не только от размера затрат на рекламу, а и от того как сработают другие факторы, определяющие эту величину.

Проверим наличие прямой зависимости между исследуемыми признаками.

Для этого вычислим выборочный коэффициент корреляции. Для его расчета составим таблицу 3.10 и воспользуемся формулой (3.39).

Таблица 3.10.

Решение задач по статистике

В результате получим: Решение задач по статистикеПолученная величина является свидетельством наличия достаточно тесной прямой зависимости между исследуемыми признаками. Коэффициент детерминации вычисляем как квадрат выборочного коэффициента корреляции Решение задач по статистике а это означает, что 65,69% вариации количества клиентов, которые воспользовались услугами фирмы, объясняется вариацией затрат фирм на рекламу своих услуг.

Основные понятия и методы регрессионного анализа

В отличие от корреляционного анализа, который исследует наличие и характер связей между случайными величинами Решение задач по статистике и Решение задач по статистике - признаками генеральной совокупности, регрессионный анализ устанавливает аналитическую форму этой зависимости.

Если Решение задач по статистикеи Решение задач по статистике - коррелированные случайные величины. С приближением величин Решение задач по статистикек единице зависимость между этими случайными величинами приближается к линейной зависимости вида Решение задач по статистике

Как известно, уравнение линейной регрессии Решение задач по статистикена Решение задач по статистике имеет вид:

Решение задач по статистике

где Решение задач по статистике

Выборочным уравнением линейной регрессии Решение задач по статистикена Решение задач по статистике называется уравнение (3.40), если коэффициент в нем выбран в виде точечных оценок Решение задач по статистике и Решение задач по статистикеопределенных соотношением (3.41).

Допустим, что Решение задач по статистике- независима переменная (факторный признак), а Решение задач по статистике- зависимая переменная (результативный признак). Для получения полного описания зависимости между случайными величинами Решение задач по статистике и Решение задач по статистике необходимо найти аналитическое выражение совместного распределения этих величин, то есть функцию: Решение задач по статистике что, как правило, практически невозможно. Поэтому во время исследования аналитической зависимости между случайными величинами  Решение задач по статистике и Решение задач по статистике ограничиваются изучением зависимости между одной из них и условным математическим ожиданием другой, в частности зависимостью вида:

Решение задач по статистике - выборочное уравнение регрессии Решение задач по статистике Решение задач по статистике

Решение задач по статистике - выборочное уравнение регрессии Решение задач по статистике Решение задач по статистике

В приведенных выборочных уравнениях регрессии Решение задач по статистикеи Решение задач по статистике - выборочные условные математические ожидания, соответственно, Решение задач по статистике и Решение задач по статистикеа Решение задач по статистикеи Решение задач по статистике- выборочные функции регрессии соответственно. Аналитические выражения для функций Решение задач по статистике и Решение задач по статистике строим на основании проведенной выборки Решение задач по статистикеХарактер соответствующей регрессионной модели помогает выбрать диаграмма рассеивания точек Решение задач по статистике на плоскости.

Допуская, что признак Решение задач по статистикев генеральной совокупности распределен нормально; дисперсия результативного признака Решение задач по статистикене зависит от факторного признака Решение задач по статистике характер связи между результативным и факторным признаками - линейный, тогда имеем простейшую регрессионную модель - линейной регрессии, когда выборочное уравнение регрессии Решение задач по статистикеимеет такой вид:

Решение задач по статистике

В этом случае для точечных оценок Решение задач по статистикеи Решение задач по статистике можно построить доверительные интервалы и оценить их значимость.

Основным методом получения точечных оценок для параметров Решение задач по статистикеи Решение задач по статистике уравнения регрессии является метод наименьших квадратов.

Метод наименьших квадратов

Допустим, что выборка Решение задач по статистикеобъемом Решение задач по статистике - не сгруппирована. Поскольку мы допустили существование линейной связи между результативным и факторным признаками, то диаграмма рассеивания точек Решение задач по статистикеимеет вид:

Решение задач по статистике

Рис. 3.3. Диаграмма рассеивания точек

Основная идея метода наименьших квадратов состоит в том, что точечными оценками Решение задач по статистикеи Решение задач по статистикепараметров Решение задач по статистикеи Решение задач по статистике выбирают такие числа, для которых прямая Решение задач по статистикеявляется "ближайшей" к точкам Решение задач по статистике

Мерой отклонения искомой прямой от точек Решение задач по статистике выбирают величину:

Решение задач по статистике

то есть сумму квадратов разностей между ординатами прямой и ординатами точек Решение задач по статистикедля одних и тех же значений Решение задач по статистике

Если числа Решение задач по статистикеи Решение задач по статистике - такие, что функция Решение задач по статистикеимеет наименьшее значение, то прямая Решение задач по статистике меньше всего отклоняется от точек Решение задач по статистике

Методом наименьших квадратов называется метод нахождения статистических оценок  Решение задач по статистикепараметров Решение задач по статистикеи Решение задач по статистике с помощью функции Решение задач по статистике исходя из равенства:

Решение задач по статистике

Для нахождения минимума функций Решение задач по статистике мы должны решить систему уравнений:

Решение задач по статистике

которую элементарными преобразованиями приводим к такому виду:

Решение задач по статистике

В случае ср-группированной выборки для определения неизвестных параметров Решение задач по статистикеи Решение задач по статистике получаем систему уравнений:

Решение задач по статистике

где Решение задач по статистике - частота соответствующих вариантов Решение задач по статистике и Решение задач по статистике

Решение задач по статистике- частота появления события Решение задач по статистике

Допуская, что признак Решение задач по статистикене является постоянным, то есть среди вариантов Решение задач по статистикеобязательно есть разные числа, делаем вывод про определитель системы:

Решение задач по статистике

Отсюда следует, что исследуемая система уравнений имеет единое решение:

Решение задач по статистике

где Решение задач по статистике

Таким образом, искомое уравнение регрессии принимает такой вид:

Решение задач по статистике

Коэффициент Решение задач по статистикеназывают коэффициентом регрессии, который характеризует отношение величины прироста результативного признака Решение задач по статистике к величине прироста факторного признака Решение задач по статистике

Линейное уравнение регрессии можно представить в другом виде через статистическую оценку коэффициента корреляции:

Решение задач по статистике

Необходимо заметить, что в случае нарушения предположения про линейность связи между результативным и факторным признаками, а про это можно сделать вывод из диаграммы рассеивания выборки, используют нелинейные регрессионные модели. В нелинейных регрессионных моделях связь может выражаться, например, такими уравнениями:Решение задач по статистикеили Решение задач по статистикеСтатистические оценки параметров в этих нелинейных моделях также можно найти с помощью метода наименьших квадратов.

Пример 3.12. Найти уравнение регрессии Решение задач по статистике на основании выборки:

Решение задач по статистике

Решение. Для нахождения уравнения регрессии проведем необходимые вычисления:

Решение задач по статистике

Для вычисления выборочного коэффициента корреляции вычислим предварительно: Решение задач по статистике

Тогда Решение задач по статистике

Следовательно, уравнение регрессии Решение задач по статистикеполученное на основании выборки:

Решение задач по статистике

Статистическая проверка статистических гипотез

Данные выборочных наблюдений часто являются основанием для принятия одного из нескольких альтернативных решений (продукция может быть качественной или бракованной, точность обработки изделия в пределах нормы или ниже нормы и т.п.). То есть, говорится о выдвижении гипотезы, которую после проведения эксперимента или принимают, или отклоняют. Если эксперимент имеет статистический (стохастический) характер, то говорят, что гипотеза является статистической.

Статистической называют гипотезу о свойствах генеральной совокупности, которая проверяется на основании выборки.

Статистическими гипотезами могут быть такие утверждения про закон распределения, про значения параметров распределения, про равенство параметров двух или нескольких распределений, про независимость выборок и др.

Например, статистическими являются гипотезы:

а) генеральная совокупность распределена по закону Пуассона;

б) дисперсии двух нормальных совокупностей равны между собой.

В математической статистике выделяют два основных типа статистических гипотез:

1) непараметрические - гипотезы про закон распределения вероятностей случайной величины (признаки генеральной совокупности);

2) параметрические - гипотезы про значения параметров распределения случайной величины (признаки генеральной совокупности).

Вместе с выдвинутой гипотезой рассматривают и гипотезу, которая ей противоречит. Если выдвинутая гипотеза будет отклонена, то имеет место гипотеза, которая ей противоречит. Поэтому эти гипотезы нужно различать.

Основной (нулевой) называют выдвинутую гипотезу, ее обозначают Решение задач по статистике

Альтернативной (конкурирующей) называют гипотезу, которая полностью или частично логически отрицает нулевую гипотезу, ее обозначают Решение задач по статистике

Например, если основной гипотезой Решение задач по статистике является гипотеза про значение одного из параметров нормально распределенной случайной величины Решение задач по статистике тогда альтернативной является гипотеза Решение задач по статистике

Простой параметрической гипотезой называют гипотезу, которая утверждает, что все неизвестные параметры имеют некоторые числовые значения.

Сложной параметрической гипотезой называют гипотезу, которая состоит из конечного или бесконечного числа простых параметрических гипотез.

Например, если Решение задач по статистике- параметр экспоненциального распределения, то гипотеза Решение задач по статистикеявляется простой, тогда альтернативная гипотеза Решение задач по статистике является сложной.

Задача про статистическую проверку статистических гипотез формулируется так: рассмотреть некоторую статистическую гипотезу и на основании изучения статистических данных (выборки) подтвердить справедливость выдвинутой гипотезы или опровергнуть ее. При этом указывается также вероятность того, что принятое решение является правильным или ошибочным. Проблема уменьшения вероятности того, что принятое решение  ошибочно, является также одной из задач математической статистики.

В результате статистической проверки гипотез может быть принято одно из двух правильных решений:

1) гипотеза принимается, и она истинная;

2) гипотеза отклоняется, и она неистинная.

Вместе с этим в результате статистической проверки статистической гипотезы могут быть допущены ошибки, то есть приняты неправильные решения двух видов:

1) ошибочно отклонена истинная гипотеза;

2) ошибочно принята неистинная гипотеза.

Ошибкой первого рода называют неправильное решение, в результате которого отклоняется правильная гипотеза.

Ошибкой второго рода называют неправильное решение, в результате которого принимается неправильная гипотеза.

Оказывается, что ошибка первого рода имеет более весомые последствия, чем ошибка второго рода. Чтобы застраховать себя от ошибки первого рода или по крайней мере привести к минимуму риск ее допущения, вводится число Решение задач по статистикекоторое выражает вероятность отклонения правильной гипотезы.

Уровнем значимости называют вероятность допущения ошибки первого рода, его обозначают Решение задач по статистике

Уровень значимости Решение задач по статистикезадают заранее и чаще всего его выбирают равным Решение задач по статистике Если Решение задач по статистике то это означает, что вероятность допустить ошибку первого рода является мала: мы рискуем допустить ее в пяти случаях и ста.

Гипотетической называют информацию про случайную величину, которая содержится в гипотезе.

Эмпирической называют информацию про случайную величину, которую получают на основании выборки.

Статистический критерий проверки нулевой гипотезы

Для проверки нулевой гипотезы используют специально подобранную случайную величину, точное или приблизительное распределение которой известно. Эту величину обозначают через Решение задач по статистикеили Решение задач по статистике если она распределена нормально, или Решение задач по статистике - по закону Фишера-Снедекора, Решение задач по статистике- по закону Стьюдента, Решение задач по статистике- по закону "хи-квадрат" и т.д. С целью обобщения обозначим эту величину Решение задач по статистике

Статистическим критерием (или просто критерием) называют случайную величину Решение задач по статистикекоторая служит для проверки нулевой гипотезы Решение задач по статистике

Эмпирическим значением критерия гипотезы называют значение случайной величины Решение задач по статистикевычисленное на основании данных определенной выборки. Обозначают эмпирическое значение Решение задач по статистике

Оказывается, что при одних значениях Решение задач по статистикегипотеза Решение задач по статистикепринимается, а при других - отклоняется.

Критической областью называется совокупность значений критерия Решение задач по статистике при которых нулевая гипотеза Решение задач по статистикеотклоняется.

Областью принятия гипотезы Решение задач по статистикеназывается совокупность значений критерия Решение задач по статистике при которых нулевую гипотезу Решение задач по статистике принимают.

Таким образом, сформулируем основной принцип проверки статистических гипотез:

Решение задач по статистикеесли эмпирическое значение критерия Решение задач по статистике принадлежит критической области, то нулевую гипотезу Решение задач по статистике отклоняют;

Решение задач по статистикеесли эмпирическое значение критерия Решение задач по статистике принадлежит области принятия гипотезы Решение задач по статистикето нулевую гипотезу Решение задач по статистикепринимают.

В случае одномерности случайной величины Решение задач по статистике критическая область, как правило, является множеством точек определенных интервалов на прямой, которые отделены от области принятия гипотезы так называемыми критическими точками Решение задач по статистике

Критическими точками (пределами) Решение задач по статистике называют точки, которые отделяют критическую область от области принятия гипотезы.

То есть, для нахождения критической области достаточно определить критические точки.

Рассматривают три вида критических областей в зависимости от конкурирующей гипотезы:

Решение задач по статистике правосторонняя критическая область - это та область на числовой прямой, которая определяется неравенством Решение задач по статистике

Решение задач по статистике левосторонняя критическая область - это та область на числовой прямой, которая определяется неравенством Решение задач по статистике

Решение задач по статистикедвусторонняя критическая область - это та область на числовой прямой, которая определяется неравенством Решение задач по статистике ( предполагая, что Решение задач по статистике).

Для нахождения критической области задается уровень значимости Решение задач по статистике и ищут критические точки Решение задач по статистике по таким соотношениям:

Решение задач по статистике для правосторонней критической области:

Решение задач по статистике

Решение задач по статистике для левосторонней критической области:

Решение задач по статистике

Решение задач по статистике для двусторонней симметричной критической области:

Решение задач по статистике

Вполне понятно, что для определенной гипотезы можно построить много разных критериев ее проверки, по каждому из них можем получить разные результаты по поводу принятия нулевой гипотезы Решение задач по статистике на основании той же самой выборки.

Мы строили критическую область, исходя из требования, чтобы вероятность попадания в нее критерия была равной Решение задач по статистикепри условии, что именно нулевая гипотеза справедлива. Случается, что целесообразно ввести в рассмотрение вероятность попадания критерия в критическую область при другом условии, а именно - при условии, что нулевая гипотеза неправильная, а значит истинная - конкурирующая. Для определения этого критерия вводится характеристика, которая имеет называние мощности критерия.

Мощностью критерия называют вероятность попадания критерия в критическую область при условии, что конкурирующая гипотеза Решение задач по статистике является истинной.

Другими словами, мощность критерия определяется как вероятность не допустить ошибку второго рода при выбранном критерии.

Проверка гипотезы про закон распределения. Критерия согласия Пирсона

Критерием согласия называют статистический критерий проверки гипотезы про закон распределения вероятностей случайной величины (признаки генеральной совокупности).

Есть несколько критериев согласия: критерий Пирсона, критерий Колмогорова и другие.

Рассмотрим критерий согласия Пирсона (критерий Решение задач по статистике), который основывается на сравнении эмпирических и теоретических частот.

Допустим, что выдвинута гипотеза Решение задач по статистике случайная величина Решение задач по статистике распределена по закону А.

Осуществив выборку объема Решение задач по статистике находят и записывают в виде таблицы 3.12 интервальное статистическое распределение частот:

Таблица 3.12

Решение задач по статистике

Поскольку проверяется гипотеза про то, что распределение признака Решение задач по статистике генеральной совокупности описывается определенной функцией распределения Решение задач по статистике или (что эквивалентно) плотностью распределения Решение задач по статистике Тогда для каждого интервала Решение задач по статистикеможно определить теоретические вероятности Решение задач по статистике попадания значений случайной величины Решение задач по статистикев этот интервал, а следовательно, и теоретические частоты Решение задач по статистике

Для вычисления вероятностей Решение задач по статистике используют формулы:

Решение задач по статистике

Отметим, что для вычисления вероятностей Решение задач по статистикеи Решение задач по статистике в формулах (3.42) подставляют, соответственно, Решение задач по статистикеи Решение задач по статистике Тогда Решение задач по статистике

Полученные результаты вычислений удобно записать в виде таблицы 3.13:

Таблица 3.13

Решение задач по статистике

В соответствии с критерием Пирсона для проверки гипотезы Решение задач по статистике вводится случайная величина (статистика) Решение задач по статистике

Решение задач по статистике

где Решение задач по статистике- количество групп в статистическом распределении выборки;

Решение задач по статистике- эмпирическая частота признака Решение задач по статистике в Решение задач по статистике группе;

Решение задач по статистике- теоретическая частота;

Решение задач по статистике - вероятность того, что значение Решение задач по статистике принадлежит Решение задач по статистике группе.

Известно, что при Решение задач по статистике закон распределения статистики Решение задач по статистике стремится к закону распределения Решение задач по статистике с Решение задач по статистике степенями свободы, где Решение задач по статистике - количество групп в статистическом распределении выборки; Решение задач по статистике- количество параметров гипотетического распределения А. Например, Решение задач по статистике- для нормального распределения, Решение задач по статистике- для распределения Пуассона, Решение задач по статистике- для равномерного распределения.

Для критерия Решение задач по статистике строят правостороннюю критическую область по правилу:

Решение задач по статистике

По данному уровню значимости Решение задач по статистике и количеству степеней свободы Решение задач по статистикеиз таблицы критических точек распределения Решение задач по статистике(в которой даны решения уравнения (3.43)), находят критическую точку Решение задач по статистике (приложение Б).

На основании данных выборки, записанных в таблице, вычисляют эмпирическое значение критерия Пирсона:

Решение задач по статистике

Сравниваем значение Решение задач по статистике и Решение задач по статистике Если Решение задач по статистике то гипотезу Решение задач по статистике отклоняют. Если же Решение задач по статистике то гипотезу Решение задач по статистике принимают.

Применение критерия Решение задач по статистике требует соблюдения таких условий:

Решение задач по статистике экспериментальные данные должны быть независимыми, то есть выборка должна быть случайной;

Решение задач по статистике объем выборки должен быть достаточно большим (практически не менее 50 единиц), а частота каждой группы - не менее, чем 5.

Если последнее условие не выполняется, то проводится предварительное объединение немногочисленных групп.

Критерий согласия Пирсона дает ответ на вопрос, является ли расхождение между эмпирическими и теоретическими частотами обусловлено случайностью, или оно является значимым.

Как и любой другой критерий, критерий согласия Пирсона не доказывает справедливость гипотезы Решение задач по статистике а только позволяет установить на принятом уровне значимости согласованность или несогласованность гипотезы Решение задач по статистике с данными наблюдений

Пример 3.13 При уровне значимости Решение задач по статистикепроверить гипотезу про нормальное распределение генеральной совокупности, если известны эмпирические и теоретические частоты:

Таблица 3.14

Решение задач по статистике

Решение. Согласно критерию Пирсона для проверки гипотезы Решение задач по статистикеслучайная величина Решение задач по статистикераспределена по нормальному закону, необходимо вычислить эмпирическое значение критерия Пирсона:

Решение задач по статистике

А для контроля вычислений эту формулу преобразуют так:

Решение задач по статистике

Прежде всего убедимся, что экспериментальные данные отвечают всем необходимым требованиям, а именно: выборка является случайной, объем выборки - достаточно большой, частота каждой группы - не менее, чем 5. Действительно, все требования выполнены  Переходим к вычислениям. Для этого составим таблицу 3.15.

Таблица 3.15

Решение задач по статистике

Для контроля вычислений: Решение задач по статистике

По данному уровню значимости Решение задач по статистикеи количеству степеней свободы Решение задач по статистике по таблице критических точек распределения Решение задач по статистике(см. приложение В) находим критическую точку Решение задач по статистике

Сравниваем значения Решение задач по статистике и Решение задач по статистике Поскольку Решение задач по статистике то гипотезу Решение задач по статистике принимают. Другими словами, расхождение между эмпирическими и теоретическими частотами незначительное. То сеть данные наблюдения согласуются с гипотезой про нормальное распределение генеральной совокупности.

Проверка гипотезы про сравнение среднего значения признака генеральной совокупности со стандартом

В критериях для проверки гипотезы Решение задач по статистике про то, что значение математического ожидания Решение задач по статистике исследуемого признака генеральной совокупности совпадает со стандартом Решение задач по статистикеиспользуют статистику Решение задач по статистике- выборочное среднее. Различают такие модели в зависимости от информации о генеральной совокупности, которой мы владеем.

Модель А. Гипотеза про значение математического ожидания нормального закона распределения при условии известной дисперсии.

Допустим, что случайная величина распределена нормально с неизвестным математическим ожиданием Решение задач по статистике но известной дисперсией Решение задач по статистике Необходимо на основании выборки проверить нулевую гипотезу Решение задач по статистике про равенство математического ожидания Решение задач по статистике определенному числу Решение задач по статистике При этом допускаем, что известны такие величины: данные выборки  объема Решение задач по статистикесреднее квадратическое отклонение Решение задач по статистикегипотетическое значение математического ожидания Решение задач по статистикеуровень значимости Решение задач по статистике

Тогда следует, что выборочное среднее Решение задач по статистикедля выборки из нормального распределения с параметрами Решение задач по статистике имеет нормальное распределение с параметрами Решение задач по статистикепоэтому при условии истинности гипотезы Решение задач по статистике (когда Решение задач по статистике) случайная величина

Решение задач по статистике

которую берут за критерий проверки гипотезы Решение задач по статистикетакже распределена нормально с параметрами Решение задач по статистике

Действительно,

Решение задач по статистике

Следовательно, плотность распределения случайной величины Решение задач по статистике имеет вид:

Решение задач по статистике

Поэтому

Решение задач по статистике

Если конкурирующая гипотеза имеет вид: Решение задач по статистикето рассматривают двустороннюю симметричную область, для которой критическую точку ищут из соотношения:

Решение задач по статистике

Поскольку Решение задач по статистике

то Решение задач по статистике

то есть

Решение задач по статистике

Правило 1. Если нулевая гипотеза Решение задач по статистикеа конкурирующая гипотеза Решение задач по статистикето проверку гипотезы Решение задач по статистикепроводим по такой схеме:

1) вычисляем эмпирическое значение критерия по формуле:

Решение задач по статистике

2) находим по таблице значений функции Лапласа критическое значение Решение задач по статистике используя уравнение:

Решение задач по статистике

3) делаем вывод про выдвинутую гипотезу: если Решение задач по статистике то гипотезу Решение задач по статистике принимаем; если Решение задач по статистике то отклоняем гипотезу Решение задач по статистике в польщу альтернативной Решение задач по статистике

Если конкурирующая гипотеза имеет вид: Решение задач по статистике то рассматривают правостороннюю критическую область, для которой критическую точку ищут из соотношения:

Решение задач по статистике

Тогда Решение задач по статистикеили Решение задач по статистике

Если конкурирующая гипотеза имеет вид Решение задач по статистикето рассматривают левостороннюю критическую область, для которой

Решение задач по статистике

Правило 2. Если нулевая гипотеза Решение задач по статистике а конкурирующая гипотеза Решение задач по статистикеили Решение задач по статистике то проверку гипотезы Решение задач по статистике проводим по схеме правила 1 с такими изменениями:

1) вместо уравнения (3.45) для нахождения критического значения Решение задач по статистике используем уравнение:

Решение задач по статистике

2) делаем вывод касаемо выдвинутой гипотезы Решение задач по статистике

а) если Решение задач по статистике то нет оснований отклонять гипотезу Решение задач по статистике если Решение задач по статистикето отклоняем гипотезу Решение задач по статистике в пользу альтернативной Решение задач по статистике

б) если Решение задач по статистике то нет оснований отклонять гипотезу Решение задач по статистике если Решение задач по статистике то гипотезу Решение задач по статистикеотклоняем и принимаем гипотезу Решение задач по статистике

Пример 3.14. Из нормально распределенной генеральной совокупности с известным средним квадратическим отклонением Решение задач по статистике получили выборку объема Решение задач по статистике По этой выборке найдено выборочное среднее Решение задач по статистике Необходимо для уровня значимости Решение задач по статистикепроверить нулевую гипотезу Решение задач по статистике при наличии конкурирующей: а) Решение задач по статистике

Решение. Вычислим эмпирическое значение критерия по формуле (3.44): Решение задач по статистике

Рассмотрим случай:

а) для альтернативной гипотезы Решение задач по статистикевычислим значение Решение задач по статистикепо формуле Решение задач по статистике (см. приложение Б). Поскольку Решение задач по статистике то отклоняем гипотезу Решение задач по статистикев пользу Решение задач по статистике

б) для альтернативной гипотезы Решение задач по статистике находим значения Решение задач по статистике по формуле (3.46): Решение задач по статистике(см. приложение Б). Поскольку Решение задач по статистикеотклоняем гипотезу Решение задач по статистикев пользу гипотезы Решение задач по статистике

Модель Б. Гипотеза про значение математического ожидания нормального закона распределения при условии неизвестной дисперсии.

Допустим, что случайная величина Решение задач по статистикенормально распределена с неизвестным математическим ожиданием Решение задач по статистикеи дисперсией Решение задач по статистике Требуется на основании выборки проверить нулевую гипотезу Решение задач по статистикепро равенство математического ожидания Решение задач по статистикеопределенному числу Решение задач по статистике При этом допускаем, что известны такие величины: данные выборки объема Решение задач по статистикегипотетическое значение математического ожидания Решение задач по статистикеуровень значимости Решение задач по статистике

Поскольку среднее квадратическое отклонение Решение задач по статистикенеизвестно, то для проверки гипотезы Решение задач по статистике не сможем воспользоваться статистикой из-за того, что для нее невозможно будет вычислить эмпирическое значение Решение задач по статистике В данном случае используем статистику

Решение задач по статистике

где Решение задач по статистике- выборочное среднее;

Решение задач по статистике- исправленное среднее квадратическое отклонение.

Можно показать, что при условии истинности гипотезы Решение задач по статистикеслучайная величина Решение задач по статистике имеет распределение Стьюдента с  Решение задач по статистикестепенями свободы.

Дальнейшее построение критической области для дву- и односторонних проверок гипотезы осуществляется аналогично случаю модели А с отличием в том, что критические точки (тут вместо Решение задач по статистике они будут обозначаться через Решение задач по статистике) определяются по таблице критических точек распределения Стьюдента (см. приложение Г), а не значений функции Лапласа. При том же самом уровне значимости Решение задач по статистикезначение Решение задач по статистике будет больше, чем Решение задач по статистике

Правило 1. Если нулевая гипотеза Решение задач по статистике а конкурирующая гипотеза Решение задач по статистике то проверку гипотезы Решение задач по статистике проводим по такой схеме:

1) вычисляем эмпирическое значение критерия по формуле:

Решение задач по статистике

2) находим по таблице критических точек распределения Стьюдента при данном уровне значимости Решение задач по статистике (для двусторонней критической области) и количестве степеней свободы Решение задач по статистике критическую точку Решение задач по статистике

3) делаем вывод про выдвинутую гипотезу: если Решение задач по статистике то гипотезу принимаем; если Решение задач по статистике то отклоняем гипотезу Решение задач по статистике в пользу альтернативной Решение задач по статистике

Правило 2. Если нулевая гипотеза Решение задач по статистике а конкурирующая гипотеза Решение задач по статистике или Решение задач по статистике то проверку гипотезы Решение задач по статистике проводим по схеме правила 1 с такими изменениями:

1) по таблице критических точек распределения Стьюдента с данным уровнем значимости Решение задач по статистике(для односторонней критической области) и количестве степеней свободы Решение задач по статистике находим критическую точку Решение задач по статистике(см. приложение Г);

2) делаем вывод относительно выдвинутой гипотезы:

а) если Решение задач по статистике то нет оснований отклонять гипотезу Решение задач по статистике если Решение задач по статистике то отклоняем гипотезу Решение задач по статистике в пользу альтернативной Решение задач по статистике

б) если Решение задач по статистикето нет оснований отклонять гипотезу Решение задач по статистике если Решение задач по статистике то гипотезу Решение задач по статистике отклоняем и принимаем гипотезу Решение задач по статистике

Пример 3.15. Из нормально распределенной генеральной совокупности получена выборка объема Решение задач по статистикеПо этой выборке найдено выборочное среднее Решение задач по статистикеи исправленное среднее Решение задач по статистике Необходимо для уровня значимости Решение задач по статистикепроверить нулевую гипотезу Решение задач по статистикепри наличии конкурирующей: Решение задач по статистике

Решение. Вычислим эмпирическое значение критерия по формуле (3.45): Решение задач по статистике

Рассмотрим отдельно случаи:

а) для альтернативной гипотезы Решение задач по статистикевычислим значение Решение задач по статистике по таблице для числа степеней свободы Решение задач по статистикеи уровня значимости Решение задач по статистике пользуясь приложением Г, находим Решение задач по статистике (для двусторонней критической области). Поскольку Решение задач по статистике то отклоняем гипотезу Решение задач по статистике в пользу Решение задач по статистике

б) для альтернативной гипотезы Решение задач по статистике находим значение Решение задач по статистике по таблице для числа степеней свободы Решение задач по статистикеи уровня значимости Решение задач по статистике пользуясь приложением Г,  находим Решение задач по статистике(для правосторонней критической области). Поскольку Решение задач по статистике гипотезу Решение задач по статистикеотклоняем и принимаем гипотезу Решение задач по статистике

Проверка гипотезы про равенство дисперсий двух независимых случайных величин

Проверять гипотезу про равенство двух дисперсий приходится достаточно часто, например, во время анализа стабильности производственного процесса до и после введения новой технологии (колебание в выпуске продукции измеряется с помощью квадратического отклонения), изучения качества измерительных приборов (сравнение дисперсий показателей отдельных приборов), изучения степени однородности двух совокупностей по определенному признаку (квалификации работников, стажа персонала и т.п.). Необходимость проверить равенство дисперсий возникает и во время сравнения средних величин совокупностей.

Следовательно, допустим, что случайные величины Решение задач по статистикеи Решение задач по статистике которые характеризуют две статистические совокупности, независимые, нормально распределенные с неизвестными дисперсиями Решение задач по статистикеи Решение задач по статистике соответственно.

проверим гипотезу Решение задач по статистике про равенство дисперсий случайных величин Решение задач по статистикеи Решение задач по статистике

Считают известными:

1) данные двух независимых выборок объемов Решение задач по статистике и Решение задач по статистике для случайных величин Решение задач по статистике и Решение задач по статистикесоответственно;

2) уровень значимости Решение задач по статистике

критерий проверки гипотезы Решение задач по статистике основывается на сопоставлении исправленных выборочных дисперсий Решение задач по статистикеи Решение задач по статистике вычисленных по данным выборок.

Так, в предположениях данной модели случайная величина

Решение задач по статистике

при условии выполнения гипотезы Решение задач по статистикераспределена по закону Фишера-Снедекора с Решение задач по статистикеи Решение задач по статистике степенями свободы.

Правило. Если нулевая гипотеза Решение задач по статистике а конкурирующая Решение задач по статистике то проверку гипотезы выполняем по схеме:

1) находим эмпирическое значения критерия по формуле (3.38);

2) по таблице критических точек распределения Фишера-Снедекора для заданного уровня значимости Решение задач по статистикеи степеней свободы Решение задач по статистикеи Решение задач по статистикенаходим критическую точку правосторонней области Решение задач по статистике (приложение Д);

3) делаем вывод о принятии гипотезы Решение задач по статистике

а) если Решение задач по статистике то гипотезу Решение задач по статистике принимаем;

б) если Решение задач по статистикето гипотезу Решение задач по статистике отклоняем в пользу альтернативной гипотезы Решение задач по статистике

В случае, когда Решение задач по статистике критерий согласия Решение задач по статистикеи Решение задач по статистике

Замечание. Если нулевая гипотеза Решение задач по статистикеа конкурирующая Решение задач по статистикето проверку гипотезы выполняем по сформулированному правилу, в котором изменяется только методика нахождения критического значения Решение задач по статистике а именно: в таблице критических точек распределения Фишера-Снедекора критическую точку Решение задач по статистикеопределяем по уроню значимости Решение задач по статистике в два раза меньшим, чем заданный, и степеней свободы Решение задач по статистикеи Решение задач по статистике (см. приложение Д).

Пример 3.16. Даны две независимые выборки объемом Решение задач по статистике и Решение задач по статистике которые получены из генеральных совокупностей Решение задач по статистикеи Решение задач по статистике распределенных по нормальному закону. Найдены исправленные выборочные дисперсии Решение задач по статистикеи Решение задач по статистике Проверим при уровне значимости Решение задач по статистикенулевую гипотезу про равенство генеральных дисперсий при конкурирующей гипотезе Решение задач по статистике

Решение. Найдем значение Решение задач по статистике (см. приложение Д). Критическая область - правосторонняя. Вычислим значение наблюдаемого критерия: Решение задач по статистикеСледовательно, нет оснований отклонять нулевую гипотезу.

Проверка гипотезы про значимость коэффициента корреляции

Допустим, что двумерная генеральная совокупность Решение задач по статистике распределена нормально. Из этой совокупности получили выборку объема Решение задач по статистике по этой выборке найден коэффициент корреляции Решение задач по статистике который отличный от нуля. Поскольку выборка случайная, то еще нельзя сделать вывод, что коэффициент генеральной совокупности Решение задач по статистикетакже отличен от нуля. В конце-концов нас интересует именно этот коэффициент, поэтому возникает необходимость при заданном уровне значимости Решение задач по статистикепроверить нулевую гипотезу Решение задач по статистикепро равенство нулю генерального коэффициента корреляции при конкурирующей Решение задач по статистике

Если нулевая гипотеза отклоняется, то это означает, что выборочный коэффициент корреляции значительно отличается от нуля (является значимым), а Решение задач по статистике и Решение задач по статистике - коррелированные.

Если нулевая гипотеза принимается, то то выборочный коэффициент корреляции незначимый, а Решение задач по статистике и Решение задач по статистике - коррелированные.

За критерий проверки нулевой гипотезы примем случайную величину:

Решение задач по статистике

Величина Решение задач по статистике при справедливой нулевой гипотезе имеет распределение Стьюдента с Решение задач по статистикестепенями свободы.

Поскольку конкурирующая гипотеза Решение задач по статистикето критическая область - двусторонняя, которая строится исходя из требования, чтобы вероятность попадания критерия Решение задач по статистике в эту область в предположении справедливой нулевой гипотезы была равна принятому уровню значимости Решение задач по статистике

Правило. Для того, чтобы при заданном уровне значимости Решение задач по статистикепроверить нулевую гипотезу Решение задач по статистике про равенство нулю генерального коэффициента корреляции нормальной двумерной случайной величины при конкурирующей гипотезе Решение задач по статистике необходимо:

1) вычислить значение наблюдаемого критерия:

Решение задач по статистике

2) по таблице критических точек распределения Стьюдента при данном уровне значимости Решение задач по статистикеи степенями свободы Решение задач по статистике найти критическую точку Решение задач по статистике для двусторонней критической области (см. приложение Г);

3) делаем вывод касательно выдвинутой гипотезы:

а) если Решение задач по статистике то нет оснований отклонят гипотезу Решение задач по статистике

б) если Решение задач по статистике то отклоняем гипотезу Решение задач по статистике в пользу альтернативной.

Пример 3.17. По выборке объема Решение задач по статистикеполученной из нормально распределенной генеральной совокупности, вычислен выборочный коэффициент корреляции Решение задач по статистикеПроверим при уровне значимости Решение задач по статистике нулевую гипотезу Решение задач по статистикепро равенство нулю генерального коэффициента корреляции при  конкурирующей гипотезе Решение задач по статистике

Решение. Критическая точка Решение задач по статистике(см. приложение Г). Вычислим значение наблюдаемого критерия: Решение задач по статистикеРешение задач по статистике Поскольку Решение задач по статистике то нулевая гипотеза отклоняется, то есть Решение задач по статистикеи Решение задач по статистике коррелированные.

Определение размаха вариации

Методические указания и решение типовой задачи

Для характеристики совокупностей и исчисленных средних величин важно знать, какая вариация изучаемого признака скрывается за средними. Рассмотрим пример расчета размаха вариации.

Задача с решением 1.

Имеются следующие данные о производительности труда рабочих в двух бригадах:

Решение задач по статистике

Средняя производительность труда в обеих бригадах одинакова:

Решение задач по статистике

Однако в первой бригаде вариация производительности труда значительно больше, чем во второй, и можно сказать, что первая бригада по своему составу в отношении изучаемого приказа менее однородна, чем вторая. Для изменения степени варьирования признака служат показатели вариации. Наиболее простым показателем вариации является размах вариации Решение задач по статистике, который определяется как разновидность между наибольшим и наименьшим значением признака:

Решение задач по статистике

Для нашего примера размах вариации производительности труда для первой бригады составляет: 18-2=16; для второй бригады: 12-8=4. Этот показатель прост в вычислении и указывает на общие размеры вариации, но он не дает представления о степени колеблемости внутри совокупности, так как вычисляется на основе только двух крайних значений приказа совокупности.

Определение среднего линейного отклонения по индивидуальным данным и в рядах распределения

Чтобы определить вариацию признака единиц совокупности, надо исчислить отклонения каждого значения признака х от средней арифметической Решение задач по статистике :

Решение задач по статистике и т.д.

При этом отклонения могут быть положительными или отрицательными в зависимости от значений признака. Из полученных значений отклонений необходимо исчислить среднюю арифметическую:

Решение задач по статистике

Известно, что сумма отклонений всех значений признака от средней арифметической будет равна нулю. Для определения среднего линейного отклонения, которое часто называют средним абсолютным отклонением, необходимо взять значения отклонений по абсолютной величине без учета знака. Итак, среднее линейное (абсолютное)отклонение есть средняя арифметическая из абсолютных отклонений отдельных значений признака от общей средней: Решение задач по статистике

Задача с решением 2.

Исчислим среднее линейное отклонение по данным типовой задачи 1 гл. 6.

Решение задач по статистике

Порядок расчета среднего линейного отклонения следующий:

  • 1. по значениям признака исчисляется средняя арифметическая Решение задач по статистике
  • 2. определяются отклонения каждой варианты Решение задач по статистикеот среднейРешение задач по статистике
  • 3. рассчитывается сумма абсолютных величин отклоне-: Решение задач по статистике
  • 4. сумма абсолютных величин отклонений делится на число значений: Решение задач по статистике

Если данные наблюдения представлены в виде дискретного ряда распределения с частотами, среднее линейное отклонение исчисляется по формуле средней арифметической взвешенной:

Решение задач по статистике

Рассмотрим пример расчета среднего линейного отклонения взвешенного.

Задача с решением 3.

Имеются данные о производительности труда 50 рабочих:

Решение задач по статистике

Определить среднюю производительность труда одного рабочего:

Решение задач по статистике

Отклонения каждого значения признака от средней и взвешенные отклонения представлены в таблице. Определим среднее линейное отклонение:

Решение задач по статистике

Среднее линейное отклонение- величина именованная и выражается в единицах измерения признака.

Если статистические данные представлены в виде интервального ряда распределения, то предварительно определяется дискретная величина признака в каждой группе, а затем производится расчет по средней арифметической взвешенной, как указано выше.

Порядок расчета среднего линейного отклонения взвешенного следующий:

  • 1. вычисляется средняя арифметическая взвешенная: Решение задач по статистике;
  • 2. определяются абсолютные отклонения вариант от средней Решение задач по статистике
  • 3. полученные отклонения умножаются на частоты Решение задач по статистике
  • 4. находится сумма взвешенных отклонений без учета знака Решение задач по статистике
  • 5. сумма взвешенных отклонений делится на сумму частот Решение задач по статистике

Этот показатель делает более полное представление о степени колеблемости признака по сравнению с размахом вариации.

Расчет дисперсии и среднего квадратического отклонения по индивидуальным данным и в рядах распределения

Методические указания и решение типовых задач

Основными показателями вариации в статистике являются дисперсия и среднее квадратическое отклонение.

Дисперсия - это средняя арифметическая квадратов отклонений каждого значения признака от общей средней. Дисперсия обычно называется средним квадратом отклонений и обозначается Решение задач по статистике. В зависимости от исходных данных дисперсия может вычисляться по средней арифметической простой или взвешенной:

  • Решение задач по статистике - дисперсия невзвешенная (простая);
  • Решение задач по статистике - дисперсия взвешенная.
  • Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии и обозначается Решение задач по статистике:
  • Решение задач по статистике - среднее квадратическое отклонение невзвешенное;
  • Решение задач по статистике - среднее квадратическое отклонение взвешенное.

Среднее квадратическое отклонение - это обобщающая характеристика абсолютных размеров вариации признака в совокупности. Выражается оно в тех же единицах измерения, что и признак (в метрах, тоннах, процентах, гектарах и т.д.). Вычислению среднего квадратического отклонения предшествует расчет дисперсии. Покажем расчет на примерах.

Задача с решением 4.

Исчислим дисперсию по данным типовой задачи 3 гл. 6.

Решение задач по статистике

Исчислим среднюю арифметическую взвешенную:

Решение задач по статистике

Значения отклонений от средней и их квадратов представлены в таблице. Определим дисперсию:

Решение задач по статистике Среднее квадратное отклонение будет равно:

Решение задач по статистике

Если исходные данные представлены в виде интервального ряда распределения, то сначала надо определить дискретное значение признака, а далее применить тот же метод, что изложен выше.

Задача с решением 5.

Покажем расчет дисперсии для интервального ряда на данных о распределении посевной площади колхоза по урожайности пшеницы: Решение задач по статистике

Средняя арифметическая равна:

Решение задач по статистике

Исчислим дисперсию:

Решение задач по статистике

Порядок расчета дисперсии в этом случае следующий:

  • 1. определяют среднюю арифметическую взвешенную Решение задач по статистике
  • 2. находят отклонение от среднейРешение задач по статистике
  • 3. возводят в квадрат отклонение каждой варианты от средней Решение задач по статистике
  • 4. умножают варианты отклонений на веса (частоты) Решение задач по статистике
  • 5. суммируют полученные произведения Решение задач по статистике
  • 6. полученную сумму делят на сумму весов (частот): Решение задач по статистике

Расчет дисперсии по формуле По индивидуальным данным и в рядах распределения

Техника вычисления дисперсии сложна, а при больших значениях вариант и частот может быть громоздкой. Расчеты можно упростить, используя свойства дисперсии. Напомним некоторые из них.

1. Уменьшение или увеличение весов (частот) варьирующего признака в определенное число раз дисперсии не изменят. 2. Уменьшение или увеличение каждого значения признака на одну и ту же постоянную величину А дисперсии не изменят. 3. Уменьшение или увеличение каждого значения признака в какое-то число раз к соответственно уменьшает или увеличивает дисперсию в Решение задач по статистике раз, а среднее квадратическое отклонение - в Решение задач по статистикераз. 4. Дисперсия признака относительно произвольной величины всегда больше дисперсии относительно средней арифметической на квадрат разности между средней и произвольной величиной: Решение задач по статистике. Если А равно нулю, то приходим к следующему равенству: Решение задач по статистике , т. е дисперсия признака равна разности между средним квадратом значений признака и квадратом средней.

Каждое свойство при расчете дисперсии может быть применено самостоятельно или в сочетании с другими. Воспользуемся указанными свойствами для вычисления дисперсии.

Задача с решением 6.

Рассмотрим расчет дисперсии по формуле Решение задач по статистике по индивидуальным данным. Имеются следующие данные о производительности труда рабочих:

Решение задач по статистике

Произведем следующие расчеты:

Решение задач по статистике

Порядок расчета дисперсии следующий: 1. определяют среднюю арифметическую Решение задач по статистике 2. возводят в квадрат среднюю арифметическую Решение задач по статистике 3. возводят в квадрат каждую варианту ряда Решение задач по статистике 4. находят сумму квадратов вариант Решение задач по статистике 5. делят сумму квадратов вариант на их число, т.е. определяют среднии квадрат Решение задач по статистике 6. определяют разность между средним квадратом признака и квадратом средней Решение задач по статистике

Покажем расчет дисперсии по этому методу в рядах распределения.

Задача с решением 7.

Исчислим дисперсию в дискретном ряду распределения, используя табл. 6.6.

Решение задач по статистике

Получили тот же результат, что в табл. 6.6 этой главы. Покажем расчет дисперсии в интервальном ряду распределения.

Задача с решением 8.

Имеются следующие данные о распределении посевной площади колхоза по урожайности пшеницы:

Решение задач по статистике

В подобных примерах прежде всего определяется дискретное значение признака в каждом интервале, а затем применяется метод расчета, указанный выше:

Решение задач по статистике

Этот способ расчета дисперсии удобен при машинной обработке данных. Порядок расчета дисперсии по этой формуле в нашем примере следующий:

1) определяют среднюю арифметическую Решение задач по статистике 2) возводят в квадрат полученную среднюю Решение задач по статистике 3) возводят в квадрат каждую варианту Решение задач по статистике 4) умножают квадраты вариант на частоты Решение задач по статистике 5) суммируют полученные произведения Решение задач по статистике 6) делят полученную сумму на сумму весов и получают средний квадрат признака Решение задач по статистике 7) находят разность между средним значением квадратов и квадратом средней арифметической, т.е. дисперсию Решение задач по статистике .

Расчет дисперсии по способу моментов

Методические указания и решение типовой задачи

Расчет дисперсии можно значительно упростить, если применить способ моментов (способ отсчета от условного нуля). Этим способом удобно пользоваться, когда значения признака заданы в виде рядов распределения с равными интервалами.

Задача с решением 9.

Покажем расчет дисперсии по способу моментов, используя данные задачи 7 гл. 5. Представим условие и необходимые расчеты в следующей таблице:

Решение задач по статистике Поясним расчеты. Воспользуемся тем, что уменьшение или увеличение каждого значения признака на одну и ту же постоянную величину не изменяет дисперсии. Применяя это свойство, можно исчислить дисперсию не по заданным вариантам, а по отклонениям их от какого-то постоянного числа. В рядах распределения с равными интервалами за постоянное число принято брать варианту ряда с наибольшей частотой. В нашем примере это А = 1300.

Отнимая это число от каждой варианты, получим значения признака, представленные в гр. 3 табл. 6.19. Отклонение от постоянной условной варианты в третьей группе равно нулю.

Используя третье свойство дисперсии, уменьшим все варианты в несколько раз. Для всех вариант кратным числом является величина интервала Решение задач по статистике. Разделив Решение задач по статистике на 200, получим упрощенные значения признака, приведенные в гр. 4. Используя оба свойства дисперсии и воспользовавшись формулой Решение задач по статистике, получим следующую формулу для расчета дисперсии:

Решение задач по статистике

или в развернутом виде:

Решение задач по статистике Исчислим дисперсию для нашего примера: Решение задач по статистике Среднее квадратическое отклонение составит:

Решение задач по статистике

Среднее квадратическое отклонение может быть исчислено сразу по формуле

Решение задач по статистике В статистике величину Решение задач по статистике

называют моментом второго порядка и условно обозначают символом Решение задач по статистикеа величину Решение задач по статистике моментом первого порядка и обозначают Решение задач по статистике Учитывая это, формулы дисперсии и среднего квадратического отклонения можно записать так:

Решение задач по статистике

Определение коэффициента вариации

Методические указания и решение типовой задачи

Коэффициент вариации — это отношение среднего квадратического отклонения к средней арифметической:

Решение задач по статистике

В отличие от среднего квадратического отклонения коэффициент вариации является величиной относительной, что очень удобно для сравнения вариаций в любых совокупностях.

Задача с решением 10.

Исчислим коэффициент вариации по данным типовых задач 5 и 6 гл. 6:

Решение задач по статистике

По величине коэффициента вариации можно судить о степени вариации признаков совокупностей. Чем больше его величина, тем больше разброс значений признака вокруг средней, тем менее однородна совокупность по своему составу и тем менее представительна средняя.

Возможно, вас также заинтересует:

Математическая статистика для университета

Основные понятия математической статистики:

Математическая статистика - это раздел математики, который занимается методами сбора, анализа и обработки статистических данных.
Статистические данные - это совокупность числовых результатов, полученных исследованием большого количества объектов или явлений.
Современная математическая статистика делится на две области: описательную и аналитическую статистику.
Первая из них охватывает методы описания статистических данных, представление их в форме таблиц, диаграмм и т.д.
Аналитическая статистика еще называется теорией статистических выводов. Ее предметом являются обработка данных и формулирование выводов.
Группа предметов, объединенных по определенному признаку или свойству, называется статистической совокупностью.
Все множество исследуемых числовых результатов называется генеральной совокупностью, ее подмножества - выборкой из генеральной совокупности или просто выборкой. Количество элементов генеральной совокупности называется объемом генеральной совокупности, количество элементов ее подмножества - объемом выборки.
Далее под выборкой объема n будем понимать n-мерный случайный вектор Решение задач по статистике элементы которого является независимыми и одинаково распределенными. Множество значений, которые может приобретать каждая из компонент, будет генеральной совокупностью, а n-мерный числовой вектор Решение задач по статистике каждая из компонент которого является элементом генеральной совокупности, будем называть реализацией выборки.

Статистический и вариационный ряды

Рассматриваем реализацию выборки Решение задач по статистике Разные значения реализации Решение задач по статистике будем называть вариантами. Пусть варианта Решение задач по статистике встречаются Решение задач по статистике раз, варианта Решение задач по статистике — Решение задач по статистике раз, ..., Решение задач по статистике — Решение задач по статистике раз. Значения Решение задач по статистике называются частотами.
Определение. Статистическим рядом или статистическим распределением выборки называется последовательность пар Решение задач по статистике Решение задач по статистике
Естественно статистический ряд представляется в виде таблицы, первая строка которой содержит элементы Решение задач по статистике вторая — Решение задач по статистике
Решение задач по статистике
Очевидно, что Решение задач по статистике
Относительной частотой появления варианты Решение задач по статистике называется отношение Решение задач по статистике и обозначается Решение задач по статистике Несложно убедиться, что
Решение задач по статистике
Статистическим рядом относительных частот называется набор пар Решение задач по статистике Решение задач по статистике
Элементы реализации выборки, записанные в порядке неубывания, называются вариационным рядом и обозначаются Решение задач по статистике Если встречаются равные между собой элементы, то их нумеруют в произвольном порядке. Эта операция называется ранжированием данных.
Величина Решение задач по статистике называется размахом выборки.
Если количество вариант является довольно большим, то элементы выборки объединяют в группы и представляют в виде сгруппированного статистического ряда. Для этого интервал, который содержит все элементы реализации, разбивается на Решение задач по статистике интервалов, которые не пересекаются. Вычисления значительно упрощаются, если все частичные интервалы имеют одинаковую длину Решение задач по статистике (Далее мы будем рассматривать только интервалы одинаковой длины). Частоты Решение задач по статистике - количество элементов реализации выборки, которые попали Решение задач по статистике интервал. При этом полученный статистический ряд можно записывать двумя способами:
а) в верхней строке средина Решение задач по статистике интервала Решение задач по статистике в нижней - Решение задач по статистике
б) в верхней - границы Решение задач по статистике интервала, в нижнем - Решение задач по статистике
В литературе элементы, которые находятся на краях интервала, можно записывать либо в левый интервал, либо в правый интервал, или по 0.5 добавлять к частотам, которые находятся слева и справа.
Аналогично образуется сгруппированный статистический ряд относительных частот.
В зависимости от объема выборки Решение задач по статистике количество интервалов Решение задач по статистике берется от 6 до 20 или подсчитывается согласно одной из формул Решение задач по статистике Решение задач по статистике Решение задач по статистике
Очевидно, что
Решение задач по статистике
где Решение задач по статистике
Наряду с частотами одновременно подсчитываются и накопленные частоты Решение задач по статистике и накопленные относительные частоты Решение задач по статистике
Следует заметить, что группирование выборки вносит погрешность в дальнейшие вычисления, которая растет с уменьшением количества интервалов.

Полигон и гистограмма

Определение. Полигоном частот выборки (сгруппированной выборки) называется ломаная в декартовой системе координат с вершинами Решение задач по статистике

Определение. Полигоном относительных частот выборки (сгруппированной выборки) называется ломаная в декартовой системе координат с вершинами Решение задач по статистике

Определение. Гистограммой частот (относительных частот) называется ступенчатая фигура, сложенная из прямоугольников, построенных на интервалах группирования. Высота Решение задач по статистике прямоугольника Решение задач по статистике равна Решение задач по статистике где Решение задач по статистике - ширина Решение задач по статистике промежутка Решение задач по статистике
Площадь прямоугольников для гистограммы частот равна
Решение задач по статистике
Решение задач по статистике
Аналогично сумма площадей прямоугольников для гистограммы относительных частот равна
Решение задач по статистике
Определение. Полигоном накопленных частот сгруппированной выборки называется ломаная с вершинами в точках Решение задач по статистике
Аналогично дается определение полигона накопленных относительных частот, только Решение задач по статистике меняется на Решение задач по статистике

Эмпирическая функция распределения

Эмпирическая функция распределения определяется аналогично, как и функция распределения для дискретной случайной величины, только значения Решение задач по статистике заменяются Решение задач по статистике

Определение. Эмпирической функцией распределения для реализации выборки Решение задач по статистике называется функция Решение задач по статистике

Определение. Пусть Решение задач по статистике Выборочным квантилем порядка р называется абсцисса Решение задач по статистике точки, которая лежит на графике эмпирической функции распределения и имеет ординату Решение задач по статистике
Порядок квантиля Решение задач по статистике определяет долю общего количества наблюдений в выборке, результаты которых не превышают Решение задач по статистике Значение порядка часто представляют в процентах.
Примеры.
Пример 1. Дано реализацию выборки
Решение задач по статистике
Записать статистический и вариационный ряды. Найти эмпирическую функцию распределения, полигон частот.
Решение. Объем выборки равен 50.
Вариантами для этой реализации будут значения -5, 4, 1, 3, 5. Подсчитаем соответствующие частоты.
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Проверка: Решение задач по статистике
Статистический ряд частот
Решение задач по статистике
Вычисляем относительные частоты
Решение задач по статистике Решение задач по статистике Решение задач по статистике
Решение задач по статистике Решение задач по статистике
Статистический ряд относительных частот:
Решение задач по статистике
Вариационный ряд
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Эмпирическая функция распределения:
Решение задач по статистике
График эмпирической функции распределения
Решение задач по статистике
Полигон частот
Решение задач по статистике
Пример 2. Годовая прибыль 50 предприятий составляет
Решение задач по статистике
Найти размах выборки, количество и длину интервалов, построить гистограмму, записать сгруппированный статистический ряд.
Решение. Прежде всего найдем размах выборки.
Решение задач по статистике
Количество интервалов равно
Решение задач по статистике
Далее находим длины интервалов. Нам удобно, чтобы они были равными.
Поэтому все длины интервалов равняются Решение задач по статистике
Соответственно границы интервалов будут такими:
Решение задач по статистике
Выпишем элементы выборки, которые попадают в каждый из интервалов.
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Сгруппированный статистический ряд:
Решение задач по статистике
Гистограмма:
Решение задач по статистике

Числовые оценки параметров распределения

Рассмотрим статистические данные по-другому. Пусть ξ - случайная величина, распределение которой нам неизвестно. Исследуя эту величину, мы осуществляем Решение задач по статистике раз один и тот же эксперимент, в результате чего получаем Решение задач по статистике значений этой величины Решение задач по статистике Мы хотим на основании полученных данных найти характеристики (а точнее примерные значения) случайной величины ξ.
Теорема. Пусть Решение задач по статистике – эмпирическая функция распределения, которое соответствует выборке Решение задач по статистике а Решение задач по статистике  соответствующая теоретическая функция распределения. Тогда
Решение задач по статистике
Распределение случайной величины ξ  характеризуется рядом параметров Решение задач по статистике Решение задач по статистике и т.д. Приближенные значения каждого из параметров, найденные из наблюдаемых данных, называются числовыми оценками параметров или просто оценками. Оценки параметров распределения являются значениями некоторых функций элементов выборки - статистик.
Пусть дано выборку Решение задач по статистике распределение которой нам неизвестно, и ее реализацию Решение задач по статистике По реализации построен статистический ряд.
Решение задач по статистике

Определение. Выборочным средним называют величину Решение задач по статистике
для реализации выборки
Решение задач по статистике
для сгруппированной выборки
Решение задач по статистике

Определение. Начальным выборочным моментом порядка Решение задач по статистике называют величину
Решение задач по статистике
для реализации выборки
Решение задач по статистике
для сгруппированной выборки
Решение задач по статистике

Определение. Центральным выборочным моментом порядка Решение задач по статистике называют величину
Решение задач по статистике
для реализации выборки
Решение задач по статистике
для сгруппированной выборки
Решение задач по статистике
Замечание. Центральные моменты удобно рассчитывать по начальным моментам, используя такие соотношение между ними:
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Определение. Модой реализации выборки Решение задач по статистике называют варианту, которой отвечает наибольшая частота.
Если двум или более вариантам отвечает наибольшая частота, то модой будут две и более варианты.
Для сгруппированной выборки
Решение задач по статистике
где Решение задач по статистике – нижняя граница интервала, которая содержит наибольшее количество элементов выборки, Решение задач по статистике – количество элементов выборки в этом интервале, Решение задач по статистике – количество элементов выборки в соседних интервалах.
Определение. Медианой Решение задач по статистике называется число, которое делит выборку на две равные части.
Если объем выборки являются нечетным числом (т.е. Решение задач по статистике), то Решение задач по статистике, если объем выборки являются четным числом (т.е. Решение задач по статистике), то Решение задач по статистике
Оценкой медианы по сгруппированной выборке является квантиль Решение задач по статистике
Оценка медианы по сгруппированной выборке (при одинаковой длине интервалов Решение задач по статистике) также может быть определена по формуле
Решение задач по статистике
де Решение задач по статистике - нижняя граница интервала, к которому принадлежит медиана, Решение задач по статистике - количество элементов выборки в этом интервале, Решение задач по статистике - количество элементов выборки в интервалах, которые лежат слева от интервала, который содержит медиану.

Определение. Второй центральный выборочный момент называется выборочной дисперсией. Его будем обозначать Решение задач по статистике или Решение задач по статистике т.е.
Решение задач по статистике
или для реализации выборки
Решение задач по статистике
или для сгруппированной выборки
Решение задач по статистике

Определение. Несмещенной дисперсией называют величину Решение задач по статистике

Определение. Средним квадратическим отклонением называют величину Решение задач по статистике или Решение задач по статистике

Определение. Выборочной асимметрией называют величину
Решение задач по статистике
для реализации выборки
Решение задач по статистике

Определение. Выборочным эксцессом называют величину
Решение задач по статистике
для реализации выборки
Решение задач по статистике

Определение. Коэффициентом вариации называют величину
Решение задач по статистике
для реализации выборки
Решение задач по статистике
Пример. Дано статистический ряд
Решение задач по статистике
Найти среднее, выборочную и несмещенную дисперсию, асимметрию и эксцесс.
Решение. Объем выборки:
Решение задач по статистике
Среднее:
Решение задач по статистике
Выборочная дисперсия:
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Несмещенная дисперсия:
Решение задач по статистике
Мода - это варианта, которой отвечает наибольшая частота. В нашем случае вариантой, которой отвечает наибольшая частота, является 1, т.е. Решение задач по статистике
По определению медиана Решение задач по статистике равна
Решение задач по статистике
В нашем случае объем выборки равен 50. Поскольку 50 является четным числом, то для нахождения медианы будем пользоваться нижней строкой формулы, Решение задач по статистике Вариационный ряд является таким: сначала записывают 8 раз -4, далее - 12 раз записываем -3, далее 21 раз записываем 1 и, наконец, 9 раз записываем 7. Следовательно, Решение задач по статистике
равняются-4, Решение задач по статистике равняются-3, Решение задач по статистике равняются 1, а Решение задач по статистике равняются 7. В этом вариационном ряду Решение задач по статистике
Следовательно, медиана Решение задач по статистике
Асимметрия Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Эксцесс
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике

Пример 2. Определить среднее, выборочную и несмещенную дисперсию, моду и медиану для сгруппированной выборки
Решение задач по статистике
Решение. Прежде всего найдем средины интервалов.
Решение задач по статистике Решение задач по статистике Решение задач по статистике Решение задач по статистике Решение задач по статистике Решение задач по статистике Решение задач по статистике
Далее находим их длины. Длины всех интервалов одинаковые и равняются 2, т.е. Решение задач по статистике
Далее находим объем выборки
Решение задач по статистике
Находим среднее значение
Решение задач по статистике
Выборочная дисперсия:
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Несмещенная дисперсия:
Решение задач по статистике
Асимметрия:
Решение задач по статистике
Эксцесс:
Решение задач по статистике
Мода:
Решение задач по статистике
Медиана:
Решение задач по статистике
Интервал, которому принадлежит медиана, т.е. квантиль Решение задач по статистике Это пятый интервал. (Первые четыре интервала содержат 26 элементов, первые пять - 42, объем выборки - 55). Поэтому
Решение задач по статистике
Заметим, что для упрощения вычислений в случае сгруппированной выборки данные преобразовываются так:
Решение задач по статистике
Тогда Решение задач по статистике
Пример. Дано сгруппированный статистический ряд.
Решение задач по статистике
Найти Решение задач по статистике
Решение. Ширина интервала Решение задач по статистике
Решение задач по статистике
Результаты вычислений представим в виде таблицы
Решение задач по статистике
Проверка:
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Проверка:
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике

Статистическое описание и вычисление параметров распределения двумерного случайного вектора

Иногда результат эксперимента описывается двумя или более случайными величинами. Например, в технологическом процессе давление и температура, влажность и давление, в медицине - возраст и вес пациента и т.п. Возникает естественный вопрос: связаны ли между собой эти величины и какая форма связи?
Результатом некоторого эксперимента (исследования) является Решение задач по статистике пар данных Решение задач по статистике (для реализации выборки Решение задач по статистикеРешение задач по статистике
В теории вероятностей случайные величины ξ, η называются независимыми, если
Решение задач по статистике
Известно, что для независимых случайных величин ковариация (корреляция) и коэффициент корреляции равняются нулю.
Оценкой ковариации (корреляции) и коэффициента корреляции является выборочная ковариация
Решение задач по статистике
и выборочный коэффициент корреляции
Решение задач по статистике
Для реализации выборки выборочная ковариация (корреляция) и выборочный коэффициент корреляции вычисляются по формулам
Решение задач по статистике
Тут Решение задач по статистике
Корреляция и коэффициент корреляции определяют степень линейной зависимости между случайными величинами ξ и η.
Пример. Дана реализация выборки
Решение задач по статистике
Используя линейные преобразования, вычислить выборочную (ковариацию) корреляцию и выборочный коэффициент корреляции.
Решение. Найдем Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике Решение задач по статистике
Решение задач по статистике
Решение задач по статистике

Уравнение регрессии

Определение. Для двух случайных величин ξ и η регрессией η на ξ называют условное математическое ожидание Решение задач по статистике
График этой функции называют кривой регрессии. Функция регрессии может быть использована для вычисления значений случайной величины η, если известны значения ξ.
Если Решение задач по статистике то говорят о линейной регрессии η на ξ. Прямая Решение задач по статистике называется прямой регрессии.
Оценки коэффициентов Решение задач по статистике Решение задач по статистике можно получить методом наименьших квадратов из условия минимума суммы Решение задач по статистике А именно, пусть
Решение задач по статистике
Необходимым условием существования экстремума функции многих переменных является равенство частичных производных нулю, т.е.
Решение задач по статистике
Решение задач по статистике
Отсюда получим систему линейных алгебраических уравнений относительно неизвестных Решение задач по статистике и Решение задач по статистике:
Решение задач по статистике
Решением этой системы уравнений являются Решение задач по статистике Решение задач по статистике
Аналогично рассматривается регрессия ξ на η. Если кривая регрессии имеет вид Решение задач по статистике то Решение задач по статистике Решение задач по статистике
Пример. Дано реализацию двумерного случайного вектора
Решение задач по статистике
Записать уравнение прямой регрессии ξ на η.
Решение. Уравнение регрессии имеет вид Решение задач по статистике где
Решение задач по статистике Решение задач по статистике
Проводя вычисления, находим
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Следовательно, уравнение регрессии имеет вид
Решение задач по статистике
В реализациях выборки большого объема значения Решение задач по статистике могут повторяться. Тогда полученные данные удобно представлять в виде корреляционной таблицы. Пусть первая компонента двумерного выборочного вектора приобретает значения Решение задач по статистике а вторая компонента – Решение задач по статистике Обозначим через Решение задач по статистике частоту, с которой встречается пара Решение задач по статистике Тогда таблица данных будет иметь вид
Решение задач по статистике
Решение задач по статистике Решение задач по статистике Решение задач по статистике Решение задач по статистике Решение задач по статистике Решение задач по статистике
Для произвольной выборки большого объема с большим количеством вариант данные также представляют в виде корреляционной таблицы. С этой целью реализации случайных компонент ξη группируют по интервалам длиной Решение задач по статистике Решение задач по статистике соответственно, а в клетки таблицы записывают количество пар начальной выборки.
Обозначим середины интервалов через Решение задач по статистике и Решение задач по статистике a соответствующие частоты Решение задач по статистике Очевидно, что Решение задач по статистике
Обозначим
Решение задач по статистике
Для упрощения вычислений вместо середин интервалов Решение задач по статистике введем числа
Решение задач по статистике Решение задач по статистике Решение задач по статистике Решение задач по статистике
тут Решение задач по статистике – выборочные медианы.
Тогда, если Решение задач по статистике - уравнение регрессии, то Решение задач по статистике Решение задач по статистике Тут
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Аналогично определяется кривая регрессии ξ на η.
Пример. Дана корреляционная таблица двумерного выборочного вектора Решение задач по статистике
Решение задач по статистике
Решение. Уравнение регрессии имеет вид
Решение задач по статистике где Решение задач по статистике
Находим
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Следовательно,
Решение задач по статистике
И, соответственно, уравнение регрессии является таким:
Решение задач по статистике

Нелинейные регрессии

Самой распространенной моделью является линейная регрессия. Но не все процессы можно моделировать ею. Поэтому на практике используют более сложные модели с нелинейной зависимостью между переменными Решение задач по статистике Нелинейные модели бывают двух видов: 1) нелинейные по переменным, но линейные по неизвестным параметрам, которые подлежат оценке; 2) нелинейные по переменным и параметрам. Линии регрессии, которые являются нелинейными по переменным, но линейными по неизвестным параметрам, которые подлежат оценке, называются квазилинейными регрессиями. Приведем примеры таких моделей. Модель Решение задач по статистике нелинейная по переменной, модель Решение задач по статистике - нелинейная по параметру.
Самой распространенной нелинейной по переменным моделью является квадратическая модель Решение задач по статистике Оценку параметров зависимости между ξ и η находят из системы уравнений, которую получают методом наименьших квадратов:
Решение задач по статистике
Пример. Дано реализацию двумерной выборки
Решение задач по статистике
Записать уравнение квадратической регрессии ξ на η.
Решение. Сначала проведем расчеты
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
В этом случае система уравнений для нахождения неизвестных Решение задач по статистике будет такой:
Решение задач по статистике
Решением этой системы уравнений является
Решение задач по статистике
Следовательно, искомое уравнение линии регрессии имеет вид
Решение задач по статистике

Точечные оценки
Пусть дано выборку Решение задач по статистике объема Решение задач по статистике и ее реализацию Решение задач по статистике Известно, что Решение задач по статистике являются независимыми и одинаково распределенными. Считаем, что распределение компонент случайного вектора является известным, но он зависит от неизвестных параметров Решение задач по статистике Например, величины Решение задач по статистике имеют нормальное распределение с неизвестными параметрами Решение задач по статистике Необходимо по выборке (реализации выборки) найти неизвестные параметры Решение задач по статистике
Для нахождения неизвестных параметров строим функции от случайных величин Решение задач по статистике с помощью которых будем находить неизвестные параметры Решение задач по статистике
Определение. Оценка Решение задач по статистике параметра Решение задач по статистике называется несмещенной (несдвинутой), если Решение задач по статистике

Пример. Для параметра Решение задач по статистике нормального распределения Решение задач по статистике оценка Решение задач по статистике является несмещенной.
Доказательство.
Решение задач по статистике

Определение. Оценка Решение задач по статистике параметра Решение задач по статистике называется асимптотически несмещенной (асимптотически несдвинутой), если
Решение задач по статистике
Пример. Пусть Решение задач по статистике выборка из равномерного распределения на отрезке Решение задач по статистике Оценка Решение задач по статистике является асимптотически несмещенной.
Доказательство. Прежде всего найдем плотность распределения случайной величины Решение задач по статистике
Если случайные величины Решение задач по статистике является независимыми, то функция распределения случайной величины Решение задач по статистике равна Решение задач по статистике Соответственно плотность распределения
Решение задач по статистике
Поэтому
Решение задач по статистике
Решение задач по статистике
Очевидно, что оценка Решение задач по статистике не является несмещенной. Но
Решение задач по статистике
Следовательно, оценка Решение задач по статистике является асимптотически несмещенной.

Определение. Оценка Решение задач по статистике параметра Решение задач по статистике называется конзистенционной (способной, обоснованной) если
Решение задач по статистике

ТеоремаЕсли Решение задач по статистике то оценка Решение задач по статистике параметра Решение задач по статистике является конзистенционной.

Пример. Оценка Решение задач по статистике параметра Решение задач по статистике нормального распределения Решение задач по статистике является конзистенционной.
Доказательство.
Решение задач по статистике
Решение задач по статистике
имеем Решение задач по статистике следовательно, оценка Решение задач по статистике является конзистенционной.
Определение. Несмещенная оценка параметра Решение задач по статистике называется эффективной, если она имеет наименьшую дисперсию среди всех возможных несмещенных оценок.

Метод моментов
С теории вероятностей известно, что начальным моментом Решение задач по статистике-го порядка называют число Решение задач по статистике центральным моментом Решение задач по статистике-го порядка - число Решение задач по статистике
Суть методу моментов заключается в том, что выборочные моменты (начальные или центральные) Решение задач по статистике-го порядка приравниваются к соответствующим теоретических моментам.

Пример. Методом моментов оценить неизвестные параметры Решение задач по статистике равномерного распределения Решение задач по статистике
Решение. Если случайная величина ξ имеет равномерное распределение на отрезке Решение задач по статистике то ее математическое ожидание равно Решение задач по статистике а дисперсия – Решение задач по статистике
Приравниваем первый начальный теоретический момент с первым начальным выборочным моментом и второй теоретический центральный момент с соответствующим выборочным моментом
Решение задач по статистике
Решение задач по статистике
Тут неизвестными являются параметры Решение задач по статистике и Решение задач по статистике известными - выборочные моменты.
Решаем систему уравнений
Решение задач по статистике
и получаем, что
Решение задач по статистике

Метод максимального правдоподобия

Суть метода максимального правдоподобия заключается в том, что мы строим функцию правдоподобия Решение задач по статистике которая зависит от выборки и неизвестных параметров.
Если распределение компонент является абсолютно непрерывным и плотность каждой компоненты равна Решение задач по статистике то функция правдоподобия записывается так:
Решение задач по статистике
если же распределение компонент является дискретным и Решение задач по статистике  то
Решение задач по статистике
Значения неизвестных параметров принимаются в тех точках, где функция правдоподобия приобретает своего наибольшего значения.
Известно, что функция приобретает своего наибольшего или наименьшего значения либо в стационарных точках, либо на границе области. Для нахождения стационарных точек находим частичные производные по Решение задач по статистике и приравниваем их к нулю. Учитывая вид функции правдоподобия, целесообразным является нахождение частичных производных от логарифма функции правдоподобия, потому что, известно, частичные производные от некоторой функции равняются нулю в тех же точках, что и производная от логарифма этой функции.

Пример. Методом максимального правдоподобия оценить неизвестный параметр Решение задач по статистике геометрического распределения.
Решение. Геометрическое распределение является дискретным и Решение задач по статистике Функция правдоподобия:
Решение задач по статистике
Далее
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Решение задач по статистике
Следовательно,
Решение задач по статистике

Пример. Методом максимального правдоподобия оценить неизвестные параметры Решение задач по статистике Решение задач по статистике равномерного распределения на Решение задач по статистике
Решение. Функция правдоподобия для равномерного распределения имеет вид
Решение задач по статистике
если все Решение задач по статистике и 0 в противоположному случае.
Следовательно, пусть Решение задач по статистике
Функция правдоподобия явным образом не зависит от Решение задач по статистике Поэтому и ее частичные производные по Решение задач по статистике Решение задач по статистике также не зависят явно от Решение задач по статистике
Посмотрим на задачу с другой стороны.
Значения неизвестных параметров должны быть такими, чтобы значения функции правдоподобия в этих точках было максимальным.
Рассматриваем дробь Решение задач по статистике Очевидно, значение дроби является наибольшим, если ее знаменатель является минимальным. Это значит, что замкнутый отрезок Решение задач по статистике должен иметь минимальную длину. Все значения реализации выборки содержатся в замкнутом интервале Решение задач по статистике Поэтому
Решение задач по статистике
Как видим, оценка, полученная методом максимального правдоподобия, не всегда совпадает с оценкой, полученной методом моментов.

Распределения, которые используются в статистике

На практике очень часто встречаются нормальное распределение и распределения, которые является его функциями. Далее мы будем использовать такие распределения:
1. Распределение Решение задач по статистике с Решение задач по статистике степенями свободы.
Случайная величина имеет распределение Решение задач по статистике с Решение задач по статистике степенями свободы, если
Решение задач по статистике
где случайные Решение задач по статистике независимы между собой и имеют нормальное распределение Решение задач по статистике
Плотность этой случайной величины равна
Решение задач по статистике
Тут Решение задач по статистике – интеграл Эйлера второго рода, т.е.
Решение задач по статистике
2. Распределение Стьюдента с Решение задач по статистике степенями свободы.
Пусть Решение задач по статистике независимые случайные величины, которые имеют нормальное распределение Решение задач по статистике
Случайная величина Решение задач по статистике имеет распределение Стьюдента с Решение задач по статистике степенями свободы, если она равна
Решение задач по статистике
Плотность этой случайной величины равна
Решение задач по статистике
где Решение задач по статистике
3. Распределение Фишера-Снедекора с Решение задач по статистике степенями свободы.
Пусть Решение задач по статистике независимые случайные величины, которые имеют распределение Решение задач по статистике с Решение задач по статистике степенями свободы.
Случайная величина
Решение задач по статистике
имеет распределение Фишера-Снекедора с Решение задач по статистике степенями свободы.
Ее плотность равна
Решение задач по статистике

Понятие о квантиле распределения и верхней Решение задач по статистике-границе

Пусть дано некоторую абсолютно непрерывную случайную величину ξРешение задач по статистике - ее плотность, a Решение задач по статистике - ее функция распределения. Выберем число Решение задач по статистике

Определение. Число Решение задач по статистике называется квантилем распределения ξ, если
Решение задач по статистике

Определение. Число Решение задач по статистике называется верхней Решение задач по статистике-границей распределения случайной величины ξ, если
Решение задач по статистике
где Решение задач по статистике - функция распределения случайной величины ξ.
Очевидно, что
Решение задач по статистике

Интервальные оценки

Рассматриваем выборку с Решение задач по статистикеи ее реализацию Решение задач по статистике Распределение компонент Решение задач по статистике является известным, но зависит от неизвестных параметров Решение задач по статистике
Для каждой реализации выборки методом моментов и методом максимального правдоподобия получают некоторое конкретное число.
Суть интервальных оценок заключается в том, что для неизвестного параметра Решение задач по статистике мы ищем определенный интервал Решение задач по статистике такой, что для заранее заданного числа Решение задач по статистике Число Решение задач по статистике называют надежностью или доверительной вероятностью.
Иногда вместо надежности задают число Решение задач по статистике которое называют уровнем значимости. Заметим, что доверительная вероятность всегда близка к единице, а уровень значимости - близок к нулю. При этом отрезок Решение задач по статистике называют интервалом надежности или доверительным интервалом.
Для неизвестных параметров Решение задач по статистике выборки из нормального распределения Решение задач по статистике интервалы надежности является такими:
1. Интервал надежности для неизвестного математического ожидания при известной дисперсии Решение задач по статистике
Решение задач по статистике
где Решение задач по статистике – объем выборки,
Решение задач по статистике – квантиль распределения Решение задач по статистике
2. Интервал надежности для неизвестного математического ожидания при неизвестной дисперсии.
Решение задач по статистике
где Решение задач по статистике – несмещенная дисперсия,
Решение задач по статистике – квантиль распределения Стьюдента с Решение задач по статистике степенями свободы.
3. Интервал надежности для неизвестной дисперсии при известном математическом ожидании.
Решение задач по статистике
где Решение задач по статистике – выборочная дисперсия, Решение задач по статистике – квантили распределения Решение задач по статистике с Решение задач по статистике степенями свободы.
4. Интервал надежности для неизвестной дисперсии при неизвестном математическом ожидании.
Решение задач по статистике
где Решение задач по статистике - несмещенная дисперсия, Решение задач по статистике - квантили распределения Решение задач по статистике с Решение задач по статистике степенями свободы.

Пример. Найти 90% интервалы надежности для математического ожидания и дисперсии содержания углерода в единице продукции, если
Решение задач по статистике
Решение.
Решение задач по статистике
Решение задач по статистике
Находим
Решение задач по статистике
По таблицам имеем
Решение задач по статистике
Поэтому интервал надежности для неизвестного математического ожидания при неизвестной дисперсии являются таким:
Решение задач по статистике
т.е.
Решение задач по статистике
По таблицам ищем
Решение задач по статистике
Решение задач по статистике
Имеем
Решение задач по статистике
откуда находим
Решение задач по статистике

Построение группировки типологической, структурной и аналитической

Статистические ряды распределения позволяют систематизировать и обобщать статистические материалы. Однако они не дают всесторонней характеристики выделенных групп. Чтобы решить ряд конкретных задач выявить особенности в развитии явлений, обнаружить тенденции, установить зависимости, необходимо произвести группировку статистических данных. Для этой цели выбирается группировочный признак и разрабатывается система показателей сводки, которыми будут характеризоваться выделенные группы. Определение и обоснование показателей целиком зависят от цели исследования и поставленной задачи. В зависимости от цели и задач исследования различают следующие виды группировок: типологические, структурные, аналитические.

К типологическим группировкам относятся все группировки, которые характеризуются качественными особенностями и различия между типами явлений. Здесь особая роль принадлежит выбору группировочных признаков. За основание группировки должны быть взяты наиболее существенные признаки, которые непосредственно характеризуют сущность явлений. Группировки должны быть обоснованны экономически.

Структурные группировки имеют большое практическое значение для изучения структуры однотипных явлений. Примерами могут служить группировки предприятий по проценту выполнения плана, по числу рабочих и т.д. Значение такого рода группировок заключается в том, что с их помощью могут быть выделены и изучены группы предприятий передовых, средних, отстающих; выявлены неиспользованные резервы производства, например в области улучшения использования основных фондов, повышения производительности труда, улучшения качества продукции и т.д. Группировка населения по возрасту, например, необходима для проведения различных расчетов, связанных с медицинским, культурным, бытовым обслуживанием населения, для вычисления специальных демографических показателей и т.д. Пример структурной группировки также может служить составленная нами группировка предприятий по размеру основных фондов, представленная в табл. 2.15.

Группировки, которые применяются для исследования взаимосвязи между явлениями, называются аналитическими. Используя аналитические группировки, определяют факторные и результативные признаки изучаемых явлений. Факторные - это признаки, оказывающие влияние на другие, связанные с ними признаки. Результативные - признаки, которые изменяются под влиянием факторных.

Чтобы исследовать взаимосвязь между отобранными признаками с помощью метода аналитических группировок, необходимо произвести группировку единиц совокупности по факторному признаку и по каждой группе исчислить средние значения результативного признака, вариация которого от группы к группе под влиянием группировочного признака будет указывать на наличие или отсутствие взаимосвязи.

Задача 1

Рассмотрим практическое применение метода группировок по данным табл. 2.1.

Решение:

Поставим задачу выявить в данной отрасли промышленности распределение предприятий по мощности, а также влияние этого признака на объем производства. Прежде всего выберем группировочный признак, по которому будет производится группировка. Из экономической теории известно, что мощность предприятия в значительной степени определяется размером основных фондов (здания, сооружения, машины, оборудование и т.д.). Чтобы выявить распределение предприятий по мощности, разобьем совокупность заводов отрасли на группы по размеру стоимости основных фондов. Метод образования групп был изложен при построении рядов распределения. Были выделены пять групп заводов по размеру основных производственных фондов и определено их число в каждой группе заводов. Полученные группы заводов охарактеризуем показателями: стоимостью основных фондов, числом рабочих и валовой продукцией предприятий. Оставим макет таблицы с системой показателей, куда занесем результаты группировки заводов по среднегодовой стоимости основных производственных фондов:

Решение задач по статистике

Для заполнения макета таблицы предварительно составим рабочую таблицу (см. табл. 2.14): Решение задач по статистике

Групповые показатели рабочей таблицы занесем в соответствующие строки и графы макета таблицы и получим окончательную сводную групповую таблицу с результатами группировки заводов по среднегодовой стоимости основных производственных фондов (табл. 2.14).

Таким образом, в отличие от ряда распределения (табл. 2.2), группировка позволяет сделать конкретные и содержательные выводы. Данная группировка показывает, что наиболее крупные предприятия имеют лучшие производственные показатели. Около 29% предприятий (группы IV - V) имеют 45% всех основных фондов и дают 52% всего объема промышленной продукции, имея лишь 31% общего числа рабочих.

Решение задач по статистике

Выделенные группы можно охарактеризовать и другими показателями: выпуском продукции на 1 руб. основных фондов, на 1 рабочего, на 1 завод и т.д.; можно сравнить показатели каждой группы с первой.

Задача 2

По данным табл. 2.1 исследуем характер зависимости между экономической эффективностью и мощностью предприятий.

Решение:

Для этого необходимо, прежде всего определить, какой из названных двух признаков является факторным и какой результативным. Из экономической теории известно, что размер предприятия, его мощность определяется стоимостью основных производственных фондов, от величины которых зависит и объем производства. Следовательно, этот признак должен быть взят в основание группировки как факторный признак. Исходя из имеющихся данных в качестве показателей экономической эффективности возьмем стоимость выработанной продукции в среднем на одного рабочего и на рубль основных фондов. Первый показатель характеризует эффективность труда, а второй - эффективность основных фондов. Произведем группировку по размеру основных фондов, взяв те же пять групп предприятий, которые были выделены в табл. 2.14. Применив изложенный выше метод группировки, получим сводную таблицу, характеризующую зависимость между размером основных производственных фондов и объемов валовой продукции (табл. 2.15).

В таблице ясно видна прямая зависимость показателей эффективности от величины стоимости основных фондов. Решение задач по статистике

Эффективность работы промышленных предприятий зависит не только от размера основных фондов, но и от числа рабочих, использования оборудования и т.д. Отбирая разные факторные признаки и уточняя систему показателей, можно дать разностороннюю характеристику взаимосвязи отдельных факторов.

Приемы вторичной группировки

Методические указания и решение типовых задач

Перегруппировка ранее сгруппированных статистических данных называется вторичной группировкой. К этому методу прибегают в тех случаях, когда в результате первоначальной группировки нечетко проявился характер распределения изучаемой совокупности. В этом случае производят укрепление или уменьшение интервалов. Вторичная группировка также используется для приведения к сопоставимому виду группировок с различными интервалами с целью их сравнения.

Задача 3

Рассмотрим метод укрепления интервалов на основе данных табл. 2.20.

Решение задач по статистике

Решение:

Приведенная группировка недостаточно наглядна. Она позволяет видеть структуру совокупности, но не показывает четкой и строгой закономерности в изменении товарооборота по группам. Уплотним ряд распределения, образовав 6 групп: Решение задач по статистике

В табл. 2.21 новые группы образованы путем суммирования первоначальных групп. Так, во вторую группу магазинов с товарооборотом от 10 до 20 тыс. руб. вошли магазины II, III групп (8+13); соответственно суммировались и размеры товарооборота по группам. Группировка получилась компактной и наглядной. Совершенно четко проявилась тенденция: чем крупнее магазины, тем выше уровень товарооборота. Рассмотрим метод вторичной группировки.

Задача 4

Имеются следующие данные о распределении колхозов по числу дворов (домохозяев): Решение задач по статистике

Решение:

Приведенные данные не позволяют произвести сравнение распределения колхозов в двух районах по числу дворов, так как в этих районах имеется различное число групп колхозов.

Необходимо ряды распределения привести к сопоставимому виду. За основу сравнения возьмем распределение колхозов I района. Следовательно, по II району надо произвести вторичную группировку колхозов, образовав такое же число групп и с теми же интервалами, как и в I районе. В результате перегруппировки получим следующие сопоставимые данные, характеризующие распределение колхозов по числу дворов.

Решение задач по статистике

Поясним расчеты. В первую, вновь образованную группу колхозов II района с числом дворов до 100, войдут первые три группы колхозов, сумма частот которых равна (1+1+2). Теперь надо образовать вторую группу колхозов с числом дворов 100-200. В нее входит четвертая группа колхозов с числом дворов 100-150, составляющая 10% общего числа колхозов, а также часть пятой группы. Для определения числа колхозов, которое надо взять из пятой группы во вновь образованную, условно примем, что это число колхозов должно быть пропорционально удельному весу отобранных дворов в группе. Удельный вес 50 дворов в 5-й группе равен:

Решение задач по статистике

т.е. составляет 50%. Следовательно, в новую группу надо взять половину колхозов из пятой группы:

Решение задач по статистике

Тогда удельный вес колхозов вновь образованной группы составит: 10 + 9 = 19.

Аналогично производятся расчеты при образовании других групп. Если наряду с частностями имеются численные значения показателей по группам, то все расчеты показателей по вновь образованным группам производятся в тех ж соотношениях, что численность единиц распределения.

Статистические таблицы

Табличная форма является рациональной, наглядной и компактной формой представления статистических данных, изложения результатов сводки и группировки материалов статистического наблюдения.

Анализ данных статистических таблиц как метод научного исследования позволяет выявить соотношения и пропорции между группами явлений по одному или нескольким признакам, провести сравнительный анализ, охарактеризовать типы социально-экономических явлений, выявить характер и направление взаимосвязей и взаимозависимостей между различными, определенными логикой экономического анализа признаками, сформулировать выводы и определить резервы развития изучаемого явления, объекта или процесса.

Тема «Статистические таблицы» неразрывно связана с другими разделами курса.

Статистической таблицей называется таблица, которая содержит сводную числовую характеристику исследуемой совокупности по одному или нескольким существенным признакам, взаимосвязанным логикой экономического анализа. Прежде чем переходить к рассмотрению видов и правил построения статистических таблиц, необходимо иметь представление об основных элементах, ее формирующих.

Основные элементы статистической таблицы, составляющие ее остов (основу), показаны на схеме 3.1. Решение задач по статистике

Важно практически закрепить понятия статистического подлежащего и иметь знания и навыки построения таблиц по характеру подлежащего.

Виды таблиц по характеру подлежащего

Подлежащим статистической таблицы называется объект, который в ней характеризуется цифрами. Это могут быть совокупность, отдельные единицы совокупности в порядке их перечня или сгруппированные по одному или нескольким признакам территориальные единицы, временные периоды и т.д. в соответствии с этим в зависимости от структуры подлежащего различают статистические таблицы простые, в подлежащем которых дается простой перечень единиц совокупности (перечневые), или только одна какая - либо из них единица, выделенная по определенному признаку (монографические), и сложные, подлежащее которых содержит группы единиц совокупности по одному (групповые) или нескольким (комбинационные) количественным или атрибутивным признакам. При этом подлежащее простой таблицы может быть сформировано по видовому, территориальному и временному принципам.

Приведем примеры разработки подлежащего таблицы.

1. Простая монографическая таблица (табл. 3.1.)

Решение задач по статистике

2. Простые перечневые таблицы по видовому принципу (табл. 3.2-3.4).

Решение задач по статистике

В данной таблице подлежащее - облигации государственного внутреннего займа.

Решение задач по статистике

Подлежащее - наименование товара.

Решение задач по статистике

Подлежащее - группы несовершеннолетних, совершивших правонарушения и преступления по возрасту.

Решение задач по статистике

Подлежащее - группы эмитентов фондового рынка по величине котировки банковских долгов.

6. Сложная комбинационная таблица (табл. 3.6).

Решение задач по статистике

Подлежащее - группы эмитентов фондового рынка, распределенные по величине котировки банковских долгов и средневзвешенной ставке.

Наряду с подлежащим важным составным элементом статистической таблицы является сказуемое, изучению которого необходимо уделить большое внимание.

Виды таблиц по характеру сказуемого. Система показателей, которыми характеризуется объект изучения, т.е. подлежащее таблицы, образует сказуемое статистической таблицы. Сказуемое формирует заголовки граф и составляет их содержание. По структурному строению сказуемого различают статистические таблицы с простой и сложной его разработкой.

При простой разработке сказуемого показатель, его определяющий, получается путем простого суммирования значений по каждому признаку отдельно независимо друг от друга. Табл. 3.2, 3.4, 3.6, 3.7, 3.8 являются примером таблицы с простой разработкой сказуемого.

Сложная разработка сказуемого предполагает деление признака, его формирующего, на группы. Рассмотрим пример статистической таблицы со сложной комбинированной разработкой сказуемого. Сказуемое табл. 3.7 содержит два связанных между собой признака: атрибутивный - качественный -категории застрахованных и количественный - страховая сумма.

Решение задач по статистике

Статистические таблицы, как средство наглядного и компактного представления цифровой информации, должны быть статистически правильно оформлены. Основными правилами, определяющими технику формирования статистических таблиц, являются следующие:

1. Таблица должна быть компактной и содержать только те исходные данные, которые непосредственно отражают исследуемое социально-экономическое явление в статике и динамике и необходимы для познания его сущности.

2. Заголовок таблицы и названия граф и строк должны быть четкими, краткими, лаконичными, представлять собой законченное целое, органично вписывающееся в содержание текста.

Необходимо избегать большого количества точек и запятых в названии таблицы и граф, которые затрудняют чтение. Если название таблицы состоит из двух и более предложений, точка ставится с целью отделения предложений друг от друга, но не после последнего.

В заголовках граф допускаются точки только при необходимых сокращениях. В заголовке таблицы должны найти отражение объект, признак, время и место совершения события. Например: «Курс доллара США на торгах ММВБ в 2003 г.» Названия таблицы, граф и строк пишутся полностью, без сокращений.

Информация, располагаемая в столбцах (графах) таблицы, завершается итоговой строкой. В групповых и комбинационных таблицах всегда необходимо давать итоговые графы и строки.

В достаточно больших таблицах (по количеству приведенных строк) целесообразно оставлять двойной промежуток после каждых пяти (и далее кратных пяти) строк для того, чтобы было удобнее читать и анализировать таблицу.

Если названия отдельных граф повторяются между собой, содержат повторяющиеся термины или несут единую смысловую нагрузку, то необходимо присвоить общий объединяющий заголовок. Данный прием используется и для подлежащего, и для сказуемого таблиц.

Графы и строки полезно нумеровать. Графы подлежащего принято обозначать заглавными буквами алфавита А, В т.д., а графы сказуемого - цифрами в порядке возрастания.

Взаимосвязанные данные, характеризующие одну из сторон анализируемого явлении (например, число предприятий и удельный вес заводов (% к итогу) и т.д.) целесообразно располагать в соседних друг с другом графах.

Графы и строки должны содержать единицы измерения, соответствующие поставленным в подлежащем и сказуемом показателям. При этом используются общепринятые сокращения единиц измерения.

Располагать в таблицах сопоставляемую в ходе анализа цифровую информацию лучше в одной и той же графе, одну под другой, что значительно облегчает процесс их сравнения. В групповых таблицах группы по изучаемому признаку более грамотно располагать в порядке убывания или возрастания его значений при сохранении логической связи между подлежащими сказуемым.

Для более удобной работы с цифровым материалом числа в таблицах следует представлять в середине граф, одно под другим: единицы под единицами, запятая под запятой, четко соблюдая при этом их разрядность.

Числа целесообразнее по возможности округлять. Округление чисел в пределах одной и той же графы или строки следует проводить с одинаковой степенью точности.

Отсутствие данных об анализируемом социально-экономическом явлении может быть обусловлено различными причинами и по-разному отмечается в таблице:

а) если данная позиция (на пересечении соответствующих графы и строки) вообще не подлежит заполнению, то ставится знак «х»;

б) если по какой-либо причине отсутствуют сведения, то ставится многоточие «...» или «нет свед.», или «н. св.»;

в) если отсутствует явление, то клетка заполняется тире «-».

Для отображения очень малых чисел используются обозначения (0,0) или (0,00), что предполагает возможность наличия числа.

В случае необходимости дополнительной информации -разъяснений к таблице - могут даваться примечания.

Соблюдение приведенных правил построения и оформления статистических таблиц делает их основным средством представления, обработки и обобщения статистической информации о состоянии и развитии анализируемых социально - экономических явлений.

В анализе данных наряду со статистическими таблицами применяются и другие виды таблиц, одним из которых является матрица.

Матрицей называется прямоугольная таблица числовой информации, состоящая из Решение задач по статистике-строк и Решение задач по статистике-столбцов. Например, матрица экспертных оценок влияния некоторых факторов на уровень рентабельности строительных организаций:

Решение задач по статистике

где Решение задач по статистике - уровень фондоотдачи; Решение задач по статистике - выработка продукции на одного работающего, руб./чел.; Решение задач по статистике - коэффициент оборачиваемости оборотных средств; Решение задач по статистике - эксперты.

Таблица сопряженности - это таблица. Которая содержит сводную числовую характеристику изучаемой совокупности по двум и более атрибутивным признакам или комбинации количественных и атрибутивных признаков. Наибольшее распространение таблицы сопряженности получили при изучении социальных явлений. Табл. 3.8 и 3.9 являются примерами таблиц сопряженности.Решение задач по статистике

Возможно, вас также заинтересует:

  1. Заказать статистику помощь в учёбе
  2. Контрольная работа по статистике заказать
  3. Помощь по статистике онлайн
  4. Курсовая работа по статистике заказать готовую онлайн
  5. РГР по статистике расчетно графическая работа