2.2.2. Вариационный ряд и его числовые характеристики

Вариационные ряды

2.2.2. Вариационный ряд и его числовые характеристики
      

> Учебные материалы > Математика:  Вариационные ряды
1.Вариационный ряд. 2.Числовые характеристики вариационного ряда.
24 25 26 27 28 29 30 31 32
   Многие явления, в том числе и экономические, имеют большой объем числовой информации. Для того, чтобы обработатать и изучить такой большой объем данных, необходимо сначала каким-то образом его сгруппировать. От того как сгруппировать ряд, зависит какую информацию можно получить в конечном итоге и какими свойствами обладают те или иные признаки (варианты). Вариационный ряд представляет собой сгруппированный ряд числовых данных, ранжированный в порядке возрастания или убывания, каждая группа которого имеет определенный вес (или частоту). Например объем продаж магазином товара за определенный промежуток времени (например за день) можно сгруппировать по наименованию товара.
Таб.1 По данным таблицы построим полигон распределения частот (рис.1) Рис.1
   В приведенной выше таблице проданные товары сгруппированы по наименованию бренда товара (например телевизоры разных марок). Т.е. в данном случае признаком является наименование марки (бренда) товара. Во второй колонке дано количество проданного товара, т.е. частота данного признака. Данный ряд является дискретным. Из графика видно, что наибольшей частотой обладают товары С, D и E. Соответственно 21, 22 и 20 шт.
Таб. 2 По данным таблицы построим гистограмму распределения частот (рис.2) Рис.2
   Таблица 2 сгруппирована по ценовым категориям. Каждая группа имеет свой интервал цен. Данный ряд называется интервальный. Из таблицы можно увидеть, что наибольшее значение частоты имеет группа 3 в интервале цен 40-60 соответственно 43шт. Вариационные ряды на порядок меньше всего объема данных и это существенно облегчает их обработку и анализ. Полигон распределения или гистограмма вариационного ряда является аналогом распределения случайной величины. Несмотря на то, что вариационный ряд имеет существенное преимущество перед полными данными, т.к. он меньше по объему и дает полную информацию об изменении признака и свойствах ряда, на практике бывает достаточно знать лишь некоторые его характеристики.
   Одной из основных числовых характеристик вариационных рядов является средняя арифметическая. Данная величина показывает центральное значение признака, вокруг которого сосредоточенны все наблюдения. Средней арифметической вариационного ряда называется сумма произведений признаков (вариантов) ряда на соответствующие им частости.
   Средним линейным отклонением вариационного ряда называется средняя арифметическая модуля отклонения признаков от их средней арифметической.
   Дисперсией s2 вариационного ряда называется средняя арифметическая квадратов отклонений признаков от их средней арифметической.
   Среднее квадратическое отклонение вариационного ряда равно квадратному корню из дисперсии.
   Важным показателем вариационного ряда является также коэффициент вариации, который показывает однородность исследуемого признака.
   В компании по продаже бытовой техники, случайная величина Х (цена за единицу товара (техники) в ден.ед.) сгруппирована по интервалам цен и общий объем продаж составил 400 шт. Необходимо построить полигон распределения случайной величины Х, кумуляту и эмпирическую функцию ряда. Необходимо также найти: среднюю арифметическую, моду, медиану, дисперсию, среднее квадратическое отклонение, коэффициент вариации, начальный (центральный) моменты k-го порядка, коэффициент асиметрии и эксцесс данной случайной величины.
    Решение. Построим таблицу для рассчета средней арифметической и рассчитаем частость для каждого интервала цен.
   Как видно из таблицы сумма произведений xini = 14610, разделим эту сумму на n и получим среднюю арифметическую вариационного ряда.
    По данным таблицы построим гистограмму распределения частот.
    Построим и эмпирическую функцию распределения случайной величины (кумуляту).
   Далее найдем моду и медиану случайной величины Х. Наиболее вероятное значение случайной величины Х (мода) равно Mo = 34,117. Т.е. Pmax (34,1) = 0,1975. Медиана – Ме = 34,3 (как видно из графика). Теперь рассчитаем начальный и центральный моменты k – го порядка и сведем эти данные в таблицу.
   Из данных таблицы найдем дисперсию, среднее квадратическое отклонение, коэффициент вариации, коэффициент асимметрии и эксцесс по следующим формулам:
24 25 26 27 28 29 30 31 32

Источник: http://www.mathtask.ru/0036-variation-series.php

Числовые характеристики вариационного ряда

2.2.2. Вариационный ряд и его числовые характеристики

Одной из основных числовых характеристик ряда распределения (вариационного ряда) является средняя арифметическая.

Существует две формулы расчета средней арифметической: простая и взвешенная.

Простую среднюю арифметическую обычно используют, когда данные наблюдения не сведены в вариационный ряд либо все частоты равны единице или одинаковы.

; (6.8)

где xi – i-е значение признака;

n – объем ряда (число наблюдений; число значений признака).

В том случае, если частоты отличны друг от друга, расчет производится по формуле средней арифметической взвешенной:

; (6.9)

где xi – i-е значение признака;

mi – частота i-го значения признака;

k – число значений признака (вариантов).

При расчете средней арифметической в качестве весов могут выступать и частости. Тогда формула расчета средней арифметической взвешенной примет следующий вид:

(6.10)

где xi – i-е значение признака;

wi – частость i-го значения признака;

k – число значений признака (вариантов).

Колеблемость изучаемого признака можно охарактеризовать с помощью различных показателей вариации. К числу основных показателей вариации относятся: дисперсия, среднее квадратическое отклонение, коэффициент вариации.

Дисперсию можно рассчитать по простой и взвешенной формуле.

Простая имеет вид:

. (6.11)

А взвешенная:

. (6.12)

Среднее квадратическое отклонение рассчитывается по формуле:

(6.13)

Коэффициент вариации рассчитывается по формуле:

. (6.14)

Пример 6.1 При обследовании 50 членов семей рабочих и служащих установлено следующее количество членов семьи: 5; 3; 2; 1; 4; 6; 3; 7; 9; 1; 3; 2; 5; 6; 8; 2; 5; 2; 3; 6; 8; 3; 4; 4; 5; 6; 5; 4; 7; 5; 6; 4; 8; 7; 4; 5; 7; 8; 6; 5; 7; 5; 6; 6; 7; 3; 4; 6; 5; 4.

а) Составьте вариационный ряд распределения частот;

б) Постройте полигон распределения частот, кумуляту;

в) Определите средний размер (среднее число членов) семьи;

г) Охарактеризуйте колеблемость размера семьи с помощью показателей вариации (дисперсии, среднего квадратического отклонения, коэффициента вариации).

Объясните полученные результаты, сделайте выводы.

Решение.а) В данной задаче изучаемый признак является дискретно варьирующим, т.к. размер семей не может отличаться друг от друга менее чем на одного человека. Следовательно, необходимо построить дискретный вариационный ряд.

Чтобы построить вариационный ряд, необходимо подсчитать: сколько раз встречаются те или иные значения признака, и упорядочить их в порядке возрастания или убывания.

Значения изучаемого признака – размер семьи – обозначим xi, частоты – mi.

Произведем упомянутые расчеты и запишем полученные результаты в таблице:

б) Дискретный вариационный ряд графически можно представить с помощью полигона распределения частот или частостей.

Построим полигон распределения частот:

Для того чтобы построить кумуляту, необходимо рассчитать накопленные частоты или частости.

Накопленная частота первого варианта х1 = 1 равна самой частоте этого варианта, т.е. двум: v1 = 2.

Накопленная частота второго варианта х2 = 2 равна сумме частот первого и второго вариантов, т.е. v2 = 2 + 4 = 6.

Далее, аналогично:

v3 = 12; v4 = 20; v5 = 30; v6 = 39; v7 = 45; v7 = 49; v8 =50.

Построим кумуляту:

в) Рассчитаем средний размер (среднее число членов) семьи. Так как частоты отличны друг от друга, расчет средней арифметической произведем по формуле (6.9).

Средний размер семьи – 5,06 человека.

г) Так как частоты – неодинаковы, для расчета дисперсии размера семьи используем формулу (6.12).

Дисперсия размера семьи – 3,6964 чел2.

Найдем среднее квадратическое отклонение размера семьи по формуле (6.13).

Среднее квадратическое отклонение размера семьи – 1,9226 чел.

Найдем коэффициент вариации размера семьи по формуле (6.14).

Коэффициент вариации составляет 38%. Так как коэффициент вариации больше 35%, можно сделать вывод о том, что изучаемая совокупность семей является неоднородной, чем и объясняется высокая колеблемость размера семьи в данной совокупности.

Ввиду неоднородности семей, попавших в выборку, использование средней арифметической для характеристики наиболее типичного уровня размера семьи не вполне оправданно – средняя арифметическая нетипична для изучаемой совокупности. В качестве характеристик наиболее типичного уровня размера семьи в данной совокупности лучше использовать моду или медиану.

Пример 6.2 Имеются данные о годовой мощности предприятий цементной промышленности :

Предприятия с годовой мощностью, тыс. тонн Количество предприятий
до 500
500 – 1000
1000 – 2000
2000 – 3000
свыше 3000

а) Постройте гистограмму, кумуляту;

б) Рассчитайте среднюю мощность предприятий;

в) Найдите дисперсию, среднее квадратическое отклонение, коэффициент вариации.

Объясните полученные результаты, сделать выводы.

Решение.а) Данные о годовой мощности предприятий цементной промышленности представлены в виде интервального вариационного ряда – значения признака заданы в виде интервалов.

При этом первый и последний интервалы – открытые: оба интервала не имеют одной из границ.

Наконец, данный интервальный вариационный ряд – с неравными интервалами: интервальные разности (разность между верхней и нижней границами интервала) интервалов неодинаковы.

Условно закроем границы открытых интервалов.

Интервальная разность второго интервала равна: 1000 – 500 = 500. Следовательно, нижняя граница первого интервала составит: 500 – 500 = 0.

Интервальная разность предпоследнего интервала равна: 3000 – 2000 = 1000. Следовательно, верхняя граница последнего интервала составит: 3000 + 1000 = 4000.

В результате, получим следующий вариационный ряд:

xi mi
0 – 500
500 – 1000
1000 – 2000
2000 – 3000
3000 – 4000

Учитывая неодинаковую величину интервалов, для построения гистограммы рассчитаем абсолютные плотности распределения по формуле (6.6).

Построим гистограмму:

f(a) Гистограмма
0,05
0,04
0,03
0,02
0,01
x
1 1500

Для того чтобы построить кумуляту, необходимо рассчитать накопленные частоты или частости.

Накопленная частота нижней границы первого варианта х=0 равна нулю. Накопленная частота верхней границы первого интервала равна частоте этого интервала, т.е. 27.

Накопленная частота верхней границы второго интервала равна сумме частот первого и второго интервалов, т.е. 27 + 11 = 38.

Далее, аналогично:

38 + 8 = 46;46 + 8 = 54; 54 + 2 = 56.

Построим кумуляту:

б) Рассчитаем среднюю мощность предприятий цементной промышленности.

Так как частоты интервалов – разные, используем для расчета средней арифметической формулу (6.9). При расчете числовых характеристик интервального вариационного ряда в качестве значений признака принимаются середины интервалов.

Рассчитаем середины интервалов:

Теперь расчет средней арифметической примет вид:

Средняя мощность предприятий цементной промышленности составила 964,2857 тыс. тонн.

Следует отметить, что использование с той или иной целью средней арифметической, рассчитанной по данным интервального ряда с открытыми интервалами, может привести к серьезным ошибкам. Это связано с тем, что открытые интервалы закрываются условно, в действительности значения признака у объектов, попадающих в открытые интервалы, могут выходить далеко за их условные границы.

В связи с этим, для оценки наиболее типичного уровня изучаемого признака по данным интервального ряда с открытыми интервалами лучше использовать моду или медиану.

в) Оценим колеблемость мощности предприятий цементной промышленности.

Так как частоты – неодинаковы, для расчета дисперсии используем формулу (6.12)

Дисперсия мощности предприятий – 862563,7755 (тыс. тонн)2.

Найдем среднее квадратическое отклонение мощности предприятий по формуле (6.13)

Среднее квадратическое отклонение мощности предприятий – 928,7431 тыс. тонн.

Найдем коэффициент вариации по формуле (6.14)

Коэффициент вариации годовой мощности предприятий цементной промышленности составляет 96,31%. Так как коэффициент вариации больше 35%, можно сделать вывод о том, что изучаемая совокупность предприятий является неоднородной, в ее состав вошли и крупные и мелкие предприятия, что и обусловило высокую колеблемость годовой мощности.

Следовательно, использование средней арифметической для характеристики наиболее типичного уровня годовой мощности предприятий цементной промышленности неверно – средняя арифметическая нетипична для изучаемой совокупности. Это еще раз подтверждает необходимость использования моды или медианы для характеристики наиболее типичного уровня годовой мощности данной совокупности предприятий цементной промышленности.

Задачи к теме 6

1. В течение месяца страховой компанией было выплачено 6 страховых возмещений по договорам имущественного страхования. Размер выплат составил (тыс. руб.): 128, 256, 347, 141, 95, 107. Определите средний размер выплат. Охарактеризуйте колеблемость размеров страховых возмещений с помощью различных показателей вариации. Сделайте выводы.

2. Служба почтовой экспересс-доставки анализирует объем корреспонденции из Ростова – на – Дону в Москву. Согласно полученной информации в течение недели количество отправлений варьировалось следующим образом: 6 ,9, 14, 16, 18, 10, 5, 6. Определите среднедневной объем отправлений, среднее квадратическое отклонение, коэффициент вариации. Объяснить полученные результаты.

3. На основании данных о выпуске иностранных автомобилей различных марок в России в 2005 году определить средний объем производства иномарок, среднее квадратическое отклонение, коэффициент вариации. Объяснить полученные результаты.

Марки автомобилей Kia Renault Hyundai Ford Chevrolet Chery Hummer
Произведено в 2005 году, тыс.штук   16,3   10,2   44,4   32,0   51,8   8,3   3,5

4. На основании данных о динамике импорта рыбных товаров Россией в 2001-2007 годах (в млн. долл.) определить среднегодовой объем импорта рыбных товаров, дисперсию, среднее квадратическое отклонение и коэффициент вариации. Объяснить полученные результаты.

Годы 2007*
Рыба свежая и охлажденная 6,2 13,9 32,4 72,2 131,9 150,2 170,5

* Данные за 2007 год являются прогнозными.

5. Имеются данные о размерах чистой прибыли крупнейших российских нефтяных компаний в первом полугодии 2006 года:

Компания   «Лукойл» «Роснефть» «ТНК-ВР» «Сургутнефть» «Газпромнефть» «Татнефть»
Чистая прибыль (млрд.руб.)   43,2   60,0   38,7   47,9   30,0   23,4

Определите средний размер чистой прибыли нефтяной компании, дисперсию, среднее квадратическое отклонение и коэффициент вариации. Объясните полученные результаты.

6. Менеджер проводит анализ эффективности работы аптеки за неделю. Одним из показателей эффективности является объем выручки, дневная величина которой была соответственно равна 19, 25 ,31, 30 ,16, 22, 11, 14 тыс. руб. Рассчитайте среднедневной объем выручки, дисперсию и коэффициент вариации. Сделайте выводы.

7. На основании данных о численности студентов учебных заведений среднего профессионального образования за период 2001-2005гг. определить среднегодовую численность студентов, дисперсию, среднее квадратическое отклонение, коэффициент вариации. Объяснить полученные результаты.

Годы
Число студентов, (млн.чел.) 2,470 2,585 2,612 2,503 2,461

8. Имеются данные о распределении городского населения по затратам на ежемесячную оплату электроэнергии:

Размер оплаты (руб.) Менее 100 100-200 200-300 300- 400 400-500 500-600 Более 600
Удельный вес в общей численности населения (%)

Определить среднемесячные затраты городского населения на оплату электроэнергии. Найти и проанализировать дисперсию, среднее квадратическое отклонение, коэффициент вариации. Построить гистограмму распределения городского населения по затратам на ежемесячную оплату электроэнергии. Сделать выводы.

9.По данным поискового сайта Рамблер доля Интернет-пользователей в различных возрастных группах распределена следующим образом:

Возраст, лет 18-25 25-35 35-45 45 и более
Доля Интернет-пользователей (% от числаопрошенных)

На основании этих данных определить средний возраст Интернет-пользователей. Найти и проанализировать дисперсию, среднее квадратическое отклонение, коэффициент вариации. Построить гистограмму распределения доли Интернет-пользователей по различным возрастным группам. Сделать выводы.

10. Имеются данные о распределении объемов продаж мобильных телефонов в сетевых салонах связи по ценовым группам:

Цена, тыс. руб. 1-2 2-3 3-4 4-5 5-6 6-7
Доля в объеме продаж (%)

Определить среднюю цену мобильного телефона, продаваемого в сетевых салонах связи, дисперсию, среднее квадратическое отклонение, коэффициент вариации. Построить гистограмму распределения объемов продаж мобильных телефонов по ценовым группам. Сделать выводы.

11.Для выяснения возрастных особенностей кадрового состава сотрудников фирмы было произведено обследование, в результате которого получены следующие данные:

Возраст сотрудников, лет   20-25   25-30   30-35   35-40   40-45   45-50 Старше 50
Число сотрудников

Определить средний возраст сотрудника фирмы, дисперсию, среднее квадратическое отклонение, коэффициент вариации. Построить гистограмму распределения числа сотрудников по интервалам возраста. Сделать анализ полученных результатов.

12. Ниже приводятся данные о возрастном составе безработных города, зарегистрированных в службе занятости, в %:

Возраст (лет) до 20 20-24 25-29 30-49 50-54 55-59 60 и старше
Мужчины 7,7 17,0 11,9 50,9 4,2 5,7 2,6
Женщины 11,2 18,5 11,7 49,5 4,0 3,8 1,3

Найдите средний возраст безработных мужчин и женщин, дисперсию, среднее квадратическое отклонение и коэффициент вариации. Оцените различия показателей возрастного состава безработных мужчин и женщин. Сделайте выводы.

13. Для оценки состояния деловой активности промышленных предприятий различных форм собственности были проведены выборочные бизнес-обследования и получены следующие результаты:

Интервалы значений показателя деловой активности (в баллах) 0 – 8 8 – 16 16 – 24 24 – 32
Число предприятий (акционерные общества открытого типа)

Постройте гистограмму распределения частот. Найдите среднее значение показателя деловой активности, дисперсию, среднее квадратическое отклонение, коэффициент вариации. Объясните полученные результаты.

14. Имеются данные о числе дней, пропущенных работниками предприятия в текущем месяце по болезни.

Число пропущенных дней
Число работников

Постройте полигон распределения частот. Найдите среднее число пропущенных дней, стандартное отклонение, коэффициент вариации. Является ли распределение симметричным?

15. Постройте гистограмму частот, найдите среднюю арифметическую, среднее квадратическое отклонение и коэффициент вариации для данных о дневной выручке в магазине электроники:

Выручка, у.е. 0-200 200-300 300-400 400-500 500-600 600-700
Число дней

16. Администрацию универсама интересует оптимальный уровень запасов продуктов в торговом зале, а также среднемесячный объем покупок товаров, которые не являющихся предметом ежедневного потребления в семье (например, таких как сода).

Для выяснения этого вопроса менеджер универсама в течение января регистрировал частоту покупок стограммовых пакетиков с содой и собрал следующие данные (xi): 8, 4, 4, 9, 3, 3, 1, 2, 0, 4, 2, 3, 5, 7, 10, 6, 5, 7, 3, 2, 9, 8, 1, 4, 6, 5, 4, 2, 1, 8.

Постройте вариационный ряд, определите его числовые характеристики. Какие рекомендации Вы дали бы администрации универсама?

17. Число пассажиров компании «Аэрофлот – Дон» рейса Ростов – Стамбул в мае текущего года составило: 125, 130, 121, 124, 128, 136, 125, 130, 124, 128, 125, 125, 130, 128, 125, 128.

Составьте вариационный ряд. Чему равно среднее число пассажиров в рейсе? Рассчитайте показатели вариации. Сделайте анализ полученных результатов.

18. Имеются данные об объемах экспорта российской нефти в Польшу по нефтепроводу «Дружба» за первый квартал 2007 года:

Компания – экспортер «Лукойл» «Роснефть» «ТНК-ВР» «Сургутнефть» «Газпромнефть» «Татнефть»
Объем экспорта (млн.т) 0,496 1,380 1,055 1,000 0,600 0,300

Определите средний объем экспорта нефти в Польшу в первом квартале 2007 года. Рассчитайте дисперсию, среднее квадратическое отклонение, коэффициент вариации. Проанализируйте полученные результаты.

19. Имеются данные о вредных выбросах в атмосферу в 2006 году по ряду крупных российских городов:

Город Москва Санкт -Петербург Самара Краснодар Ростов-на-Дону Новосибирск Челябинск
Объем выбросов в атмосферу (тыс. тонн)   89,0   52,5   33,5   99,0   10,6   109,2   140,9

Определить средний объем выбросов в атмосферу, дисперсию, среднее квадратическое отклонение, коэффициент вариации. Проанализировать полученные результаты.

20. Имеются данные об объемах загрязненных сточных вод по ряду крупных российских городов в 2006 году:

Город Москва Санкт-Петербург Самара Краснодар Ростов-на-Дону Новосибирск Челябинск
Объем загрязненных сточных вод (тыс. тонн)   1922,0   753,0   238,0   74,0   104,0   4,1   234,0

Определить средний объем выбросов в атмосферу, дисперсию, среднее квадратическое отклонение, коэффициент вариации. Проанализировать полученные результаты.

Источник: https://megaobuchalka.ru/5/15285.html

6.2. Числовые характеристики вариационного ряда

2.2.2. Вариационный ряд и его числовые характеристики

Однойиз основных числовых характеристикряда распределения (вариационного ряда)является средняяарифметическая.

Существует двеформулы расчета средней арифметической:простая и взвешенная.

Простуюсреднюю арифметическуюобычно используют, когда данные наблюденияне сведены в вариационный ряд либо всечастоты равны единице или одинаковы.

; (6.8)

гдеxi-i-езначение признака;

n- объем ряда (число наблюдений; числозначений признака).

Втом случае, если частоты отличны другот друга, расчет производится по формулесреднейарифметической взвешенной:

; (6.9)

гдеxi-i-езначение признака;

mi-частота i-гозначения признака;

k- число значений признака (вариантов).

Прирасчете средней арифметической вкачестве весов могут выступать ичастости. Тогда формула расчета среднейарифметической взвешенной приметследующий вид:

(6.10)

гдеxi-i-езначение признака;

wi-частость i-гозначения признака;

k- число значений признака (вариантов).

Колеблемостьизучаемого признака можно охарактеризоватьс помощью различных показателейвариации.К числу основных показателей вариацииотносятся: дисперсия, среднее квадратическоеотклонение, коэффициент вариации.

Дисперсиюможнорассчитать по простой и взвешеннойформуле.

Простаяимеетвид:

. (6.11)

Авзвешенная:

. (6.12)

Среднееквадратическое отклонениерассчитываетсяпо формуле:

(6.13)

Коэффициентвариациирассчитывается по формуле:

. (6.14)

Пример6.1При обследовании 50 членов семей рабочихи служащих установлено следующееколичество членов семьи: 5; 3; 2; 1; 4; 6; 3; 7;9; 1; 3; 2; 5; 6; 8; 2; 5; 2; 3; 6; 8; 3; 4; 4; 5; 6; 5; 4; 7; 5; 6;4; 8; 7; 4; 5; 7; 8; 6; 5; 7; 5; 6; 6; 7; 3; 4; 6; 5; 4.

а) Составьтевариационный ряд распределения частот;

б) Постройте полигонраспределения частот, кумуляту;

в)Определите средний размер (среднеечисло членов) семьи;

г) Охарактеризуйтеколеблемость размера семьи с помощьюпоказателей вариации (дисперсии, среднегоквадратического отклонения, коэффициентавариации).

Объясните полученныерезультаты, сделайте выводы.

Решение.а)В данной задаче изучаемый признакявляется дискретно варьирующим, т.к.размер семей не может отличаться другот друга менее чем на одного человека.Следовательно, необходимо построитьдискретный вариационный ряд.

Чтобы построитьвариационный ряд, необходимо подсчитать:сколько раз встречаются те или иныезначения признака, и упорядочить их впорядке возрастания или убывания.

Значенияизучаемого признака – размер семьи – обозначим xi,частоты – mi.

Произведемупомянутые расчеты и запишем полученныерезультаты в таблице:

xi

1

2

3

4

5

6

7

8

9

mi

2

4

6

8

10

9

6

4

1

б)Дискретный вариационный ряд графическиможно представить с помощью полигонараспределения частот или частостей.

Построимполигон распределения частот:

Для того чтобыпостроить кумуляту, необходимо рассчитатьнакопленные частоты или частости.

Накопленнаячастота первого варианта х1= 1 равна самой частоте этого варианта,т.е. двум: v1= 2.

Накопленнаячастота второго варианта х2= 2 равна сумме частот первого и второговариантов, т.е. v2= 2 + 4 = 6.

Далее, аналогично:

v3= 12;v4= 20; v5= 30;v6= 39;v7= 45;v7= 49;v8=50.

Построимкумуляту:

в)Рассчитаем средний размер (среднее число членов)семьи. Так как частоты отличны друг отдруга, расчет средней арифметическойпроизведем по формуле (6.9).

Средний размерсемьи – 5,06 человека.

г)Так как частоты – неодинаковы, для расчетадисперсии размера семьи используемформулу (6.12).

Дисперсияразмера семьи – 3,6964 чел2.

Найдем среднееквадратическое отклонение размерасемьи по формуле (6.13).

Среднее квадратическоеотклонение размера семьи – 1,9226 чел.

Найдем коэффициентвариации размера семьи по формуле(6.14).

Коэффициентвариации составляет 38%. Так как коэффициентвариации больше 35%, можно сделать выводо том, что изучаемая совокупность семейявляется неоднородной, чем и объясняетсявысокая колеблемость размера семьи вданной совокупности.

Ввидунеоднородности семей, попавших в выборку,использование средней арифметическойдля характеристики наиболее типичногоуровня размера семьи не вполне оправданно- средняя арифметическая нетипична дляизучаемой совокупности. В качествехарактеристик наиболее типичного уровняразмера семьи в данной совокупностилучше использовать моду или медиану.

Пример6.2Имеются данные о годовой мощностипредприятий цементной промышленности:

Предприятия с годовой мощностью, тыс. тонн

Количество предприятий

до 500

27

500 – 1000

11

1000 – 2000

8

2000 – 3000

8

свыше 3000

2

а) Постройтегистограмму, кумуляту;

б) Рассчитайтесреднюю мощность предприятий;

в) Найдите дисперсию,среднее квадратическое отклонение,коэффициент вариации.

Объясните полученныерезультаты, сделать выводы.

Решение.а)Данные о годовой мощности предприятийцементной промышленности представленыв виде интервального вариационногоряда – значения признака заданы в видеинтервалов.

При этом первый и последнийинтервалы – открытые: оба интервала неимеют одной из границ.

Наконец, данныйинтервальный вариационный ряд – снеравными интервалами: интервальныеразности (разность между верхней инижней границами интервала) интерваловнеодинаковы.

Условно закроемграницы открытых интервалов.

Интервальнаяразность второго интервала равна: 1000 -500 = 500. Следовательно, нижняя границапервого интервала составит: 500 – 500 = 0.

Интервальнаяразность предпоследнего интерваларавна: 3000 – 2000 = 1000. Следовательно, верхняяграница последнего интервала составит:3000 + 1000 = 4000.

В результате,получим следующий вариационный ряд:

xi

mi

0 – 500

27

500 – 1000

11

1000 – 2000

8

2000 – 3000

8

3000 – 4000

2

Учитываянеодинаковую величину интервалов, дляпостроения гистограммы рассчитаемабсолютные плотности распределения поформуле (6.6).

Построимгистограмму:

f(a)

Гистограмма

0,05

0,04

0,03

0,02

0,01

x

0

500

500

1 1500

1000

1500

1500

2000

2000

3000

4000

Для того чтобыпостроить кумуляту, необходимо рассчитатьнакопленные частоты или частости.

Накопленная частотанижней границы первого варианта х=0равна нулю. Накопленная частота верхнейграницы первого интервала равна частотеэтого интервала, т.е. 27.

Накопленнаячастота верхней границы второго интерваларавна сумме частот первого и второгоинтервалов, т.е. 27 + 11 = 38.

Далее, аналогично:

38+ 8 = 46;46+ 8 = 54; 54 + 2 = 56.

Построим кумуляту:

б)Рассчитаем среднюю мощность предприятийцементной промышленности.

Таккак частоты интервалов – разные, используемдля расчета средней арифметическойформулу (6.9). При расчете числовыххарактеристик интервального вариационногоряда в качестве значений признакапринимаются середины интервалов.

Рассчитаем серединыинтервалов:

Теперь расчетсредней арифметической примет вид:

Средняя мощностьпредприятий цементной промышленностисоставила 964,2857 тыс. тонн.

Следуетотметить, что использование с той илииной целью средней арифметической,рассчитанной по данным интервальногоряда с открытыми интервалами, можетпривести к серьезным ошибкам. Это связанос тем, что открытые интервалы закрываютсяусловно, в действительности значения признака у объектов, попадающих воткрытые интервалы, могут выходитьдалеко за их условные границы.

Всвязи с этим, для оценки наиболеетипичного уровня изучаемого признакапо данным интервального ряда с открытымиинтервалами лучше использовать модуили медиану.

в)Оценим колеблемость мощности предприятийцементной промышленности.

Так как частоты -неодинаковы, для расчета дисперсиииспользуем формулу (6.12)

Дисперсиямощности предприятий – 862563,7755 (тыс.тонн)2.

Найдем среднееквадратическое отклонение мощностипредприятий по формуле (6.13)

Среднее квадратическоеотклонение мощности предприятий -928,7431 тыс. тонн.

Найдем коэффициентвариации по формуле (6.14)

Коэффициентвариации годовой мощности предприятийцементной промышленности составляет96,31%. Так как коэффициент вариации больше35%, можно сделать вывод о том, что изучаемаясовокупность предприятий являетсянеоднородной, в ее состав вошли и крупныеи мелкие предприятия, что и обусловиловысокую колеблемость годовой мощности.

Следовательно,использование средней арифметическойдля характеристики наиболее типичногоуровня годовой мощности предприятийцементной промышленности неверно -средняя арифметическая нетипична дляизучаемой совокупности. Это еще разподтверждает необходимость использованиямоды или медианы для характеристикинаиболее типичного уровня годовоймощности данной совокупности предприятийцементной промышленности.

Источник: https://studfile.net/preview/2915188/page:20/

Medic-studio
Добавить комментарий