Домой	Поиск	Войти	Контакты		Добавить в избранное
					Сделать стартовой

ГЛАВНАЯ

ИНФОБЛОК

НОВОСТИ

ВОЙТИ

КОНТАКТЫ

БОЛЬШАЯ ЛЕНИНГРАДСКАЯ БИБЛИОТЕКА

МЕНЮ

Главная

Технология

Уголовное и уголовно-исполнительное право

Строительство и архитектура

Спорт и туризм

Социология и обществознание

Сельское лесное хозяйство и землепользование

Религия и мифология

Разное

Психология

Производство и технологии

Программирование компьютеры и кибернетика

Начертательная геометрия

Не сортированные

Оккультизм и уфология

Программирование и комп-ры

Экологическое право

Экология

Экономика

Экономико-математическое моделирование

Экономическая география

Финансовый менеджмент финансовая математика

Финансы деньги кредит

Статистическая обработка данных, полученных экспериментальным путем в лесохозяйстве

БОЛЬШАЯ ЛЕНИНГРАДСКАЯ БИБЛИОТЕКА - РЕФЕРАТЫ - Статистическая обработка данных, полученных экспериментальным путем в лесохозяйстве

Статистическая обработка данных, полученных экспериментальным путем в лесохозяйстве

МОДЕЛИРОВАНИЕ ЭКОСИСТЕМ

ВВЕДЕНИЕ

Эффективность ведения современного лесного хозяйства определяется полнотой научных сведений, как о естественном формировании лесных фитоценозов, так и под воздействием хозяйственных мероприятий. Достоверность этих сведений оценивается путем статистической обработки цифрового материала, полученного в результате целенаправленно спланированного эксперимента и последующей производственной проверки.

Каждый из существующих статистических методов имеет свои возможности и ограниченную область применения, продиктованную спецификой эксперимента. При этом все они служат экспериментатору средством выявления закономерностей, позволяющих сделать выводы и заключения в условиях неопределенности. Достоверно полученные результаты наблюдений, представление выявленных закономерностей в виде статистических моделей следует рассматривать в практическом приложении в качестве основы применения количественных методов моделирования и оптимизации экономических, технологических и других процессов, и явлений.

Постановка задачи

Результаты наблюдения над лесохозяйственными объектами обычно фиксируются в журналах, бланках, анкетах и других документах учета или заносятся непосредственно в соответствующие файлы портативных компьютеров. Зафиксированные сведения об изучаемом объекте представляют первичный фактический материал, который нуждается в соответствующей обработке с целью исследования генеральной совокупности. На практике инженер лесного хозяйства имеет дело только с выборочной совокупностью (выборкой), т.е. частью генеральной совокупности, поэтому возникает потребность по результатам сравнительно небольшой выборки сделать предположение о поведении всей генеральной совокупности. В других случаях необходимо какой-либо совокупности величин поставить в соответствие другую совокупность и выяснить, имеется ли между ними различие, какая-нибудь взаимосвязь или нет.

Для того чтобы сделать статистическое заключение о рассматриваемом объекте, следует выполнить ряд взаимосвязанных операций:

1. Грамотно обеспечить отбор единиц выборочной совокупности;

2. Систематизировать и сгруппировать результаты наблюдений;

3. Графически представить эмпирические совокупности;

4. Получить статистические показатели для эмпирических совокупностей;

5. Получить статистические параметры для генеральной совокупности.

Единицы выборочной совокупности (варианты) должны быть отобраны так, чтобы по ним с достаточной точностью можно было судить о свойствах генеральной совокупности. Зачастую в исследованиях проводится отбор так называемых «типичных» представителей генеральной совокупности. Такой подход субъективен и не может служить основой получения качественной информации. Заданная точность в характеристике генеральной совокупности обеспечивается случайным отбором необходимого количества вариант.

Классификация и группировка вариант

Статистическая обработка первичных данных начинается с расположения вариант в определенной последовательности, зависящей от характера варьирования изучаемого признака:

1. Количественное:

· непрерывное;

· дискретное.

2. Качественное:

· атрибутивное.

При непрерывном варьировании отдельные значения признака могут иметь любое значение меры (протяженности, объема, веса и т. д.) в определенных пределах. Например, толщина деревьев в древостое принимает различные значения меры протяженности до самого толстого.

При дискретном варьировании отдельные значения признака выражаются отвлеченными числами (чаще всего целыми). Например, число деревьев на пробной площади, диаметр деревьев в ступенях (классах) толщины и т. д.

При атрибутивном варьировании значения признака классифицируют по градациям этого признака. Например, цвет, повреждаемость, класс бонитета и т. д.

При качественном варьировании первоначальное упорядочивание совокупности проводят в порядке возрастания или убывания. При малом числе вариант (до 30) строится непосредственный ряд значений.

При большом объеме выборки (n > 30) ранжированный ряд не обладает свойством наглядности. Поэтому значение признака размещают с указанием числа их повторяемости в виде двойного ряда. В первой строке (столбце) заносят значение признака, а во второй строке (столбце) указывают число повторяющихся значений.

Размещение значений признака в порядке их возрастания (убывания) с указанием числа их повторяемости называют вариационным рядом. В вариационном ряду значения признака, разнесенные по классам, называют распределением частот. Очевидно, что сумма частот равна объему выборки n. Величина классового промежутка, на которую разбивается ряд варьирующих значений признака, определяется по формуле:

C = X max - X min / i ,

где X max и X min - максимальное и минимальное значение признака; i - число классовых промежутков.

Число классовых промежутков зависит от объема выборки и ориентировочно равно корню квадратному из числа наблюдений, т. е. i = v n .

Задание 1. Расчет статистических показателей для малой выборочной совокупности

Изучаемый признак - объем деревьев (м3).

Данные замеров объема приведены в таблице 1

Таблица 1

Данные для статистической обработки малой выборочной совокупности

0,64	1,20	1,28	0,88	1,08
1,06	0,79	1,82	0,65	0,34
0,86	1,26	1,05	2,06	0,70
0,89	0,83	0,99	0,64	0,26 (Xmin)
1,02	0,41	0,96	0,89	0,74
0,59	1,23	1,41	0,56	0,39

1. Находим среднюю величину распределения по формуле:

Xср = ? Чi / n,

где n - объем выборочной совокупности равный 30. Подставляя данные из таблицы в формулу, получим:

Xср = 27,48 / 30 = 0,916 м 3.

2. Определим сумму квадратов отклонений (СКО) каждой варианты от средней величины по формуле:

СКО = ?(Xi - Xср)2.

Предварительно определив все квадраты отклонения, находим их сумму:

СКО = 0,430336 + 0,331776 + 0,276676 + 0,256036 + 0,126736 + 0,106276 + 0,076176 + 0,076176 + 0,070756 + 0,046656 + 0,030976 + 0,015876 + 0,007396 + 0,003136 + 0,001296 + 0,000676 + 0,000676 + 0,001936 + 0,005476 + 0,010816 + 0,017956 + 0,020736 + 0,026896 + 0,080656 + 0,098596 + 0,118336 + 0,132496 + 0,244036 + 0,817216 + 1,308736 = 4,74152 м 6.

3. Находим дисперсию, характеризующую степень разнообразия объекта, используя формулу: д 2 = СКО / n.

Отсюда д 2 = 4,74152 / 30 = 0,1581 м 6 .

4. Рассчитываем стандартное отклонение - основной показатель вариации, характеризующий варьирование значений признака вокруг центра распределения: д = v д 2 .

Тогда д = v 0,1581 = 0,3976 = 0,4 м 3.

5. Вычислим коэффициент вариации - показатель изменчивости признака. Он определяется как Cv = д • 100%/ Xср.

Имеем Cv = 0,4 / 0,916 • 100 = 43,67 %.

По шкале Мамаева для установления уровня изменчивости признака определяем, что уровень изменчивости в данном случае высокий (таблица 2).

6. Находим коэффициент дифференциации, характеризующий изменчивость признака. Он определяется как Vд = д • 100 % / (Xср - Xmin),

где Xmin = 0,26 м3.

Тогда Vд = 0,4 • 100 / (0,916 - 0,26) = 40 / 0,656 = 60,98 %.

Степень дифференциации признака определим с помощью таблицы 3, из которой следует, что эта степень большая.

Таблица 2

Шкала Мамаева для установления уровня изменчивости признака

Величина коэффициента вариации, %	Уровень изменчивости
до 7	очень низкий
7 - 15	Низкий
16 - 25	Средний
26 - 35	Повышенный
36 - 50	Высокий
более 50	очень высокий

Таблица 3

Классификация степени дифференциации признака

Величина коэффициента дифференциации, %	Степень дифференциации
до 13	Слабая
13 - 27	Умеренная
28 - 38	Средняя
39 - 53	Значительная
54 - 70	Большая
более 70	очень большая

7. Расчет ошибок репрезентативности.

Ошибка средней величины вычисляется по формуле:

m x = + д / vn .

В нашем случае: mx = + 0,4 / v30 =+ 0,073 м 3.

Ошибка стандартного отклонения: m д = + д / v2n .

Значит m д = + 0,4 / v2 • 30 = + 0,052 м 3.

Ошибка коэффициента вариации:

m c = + Cv / vn • v0,5 + (Cv/100)2.

Тогда mc=+43,67/5,48 • v0,5 + (43,67/100) 2=+ 7,97 • 0,831 =+ 6,623 %.

Ошибка точности: m p = + m c / vn .

Отсюда m p = + 6,623 / 5,48 = + 1,21 %.

8. Находим точность определения средней величины

p = + (m x / Xср) • 100 %.

Отсюда p = + (0,073 / 0,916) • 100 = + 7,97 %.

Данный показатель позволяет сделать заключение о достоверности эмпирических данных для получения достоверных результатов.

9. Достоверность статистических показателей (надежность)

Достоверность - отношение величины статистического показателя к его ошибке репрезентативности. Это отношение должно быть ? 3, определяется по t - критерию.

Достоверность средней величины: tx = Xср / mx .

Значит tx = 0,916 / 0,073 = 12,55.

Достоверность стандартного отклонения: tд = д / mд .

Тогда tд = 0,4 / 0, 052 = 7,69.

Достоверность коэффициента вариации: tc = Cv / mc .

Имеем tc = 43,67 / 6,623 = 6,59.

Достоверность точности: tp = p / mp .

Получаем tp = 7,97 / 1,21 = 6,587.

Все статистические показатели достоверны, т. к. их отношение к ошибкам репрезентативности больше 3 во всех случаях

10. Доверительный интервал для генеральной средней

ДИГС - интервал нахождения средней величины для всей генеральной совокупности.

ДИГС = Xср + mx • t0,5 ,

где t0,5 - критерий Стьюдента на 5% уровне значимости, определяется по числу степеней свободы (см. приложение).

Число степеней свободы - число свободно варьирующих вариант (v)

v = n - 1 = 30 - 1 =29 t0,5 = 2,045

Находим ДИГС = 0,916 + 0,073 • 2,045; ДИГС 0,767 ? 1,065 м 3.

Чем меньше расстояние между точками интервала, тем точнее выборочная совокупность характеризует генеральные параметры.

11. Необходимое число наблюдений для будущих исследований

n = ((Cv • K)/p)2,

где Cv - расчетный коэффициент вариации;

p - заданная точность (3 %);

К - коэффициент порогового уровня доверительной вероятности (К1 =1; К2 = 1,98; К3 =2,63) .

n1 = (43,67 • 1 / 3)2 = 212 шт.

n2 = (43,67 • 1,98 / 3)2 = 831 шт.

n3 = (43,67 • 2,63 / 3)2 = 1466 шт.

Статистическое заключение

В результате анализа малой выборочной совокупности в виде измерения объема деревьев получили следующие статистические показатели с их ошибками репрезентативности:

- средняя величина 0,916 + 0,073 м 3;

- стандартное отклонение 0,4 + 0,052 м 3;

- коэффициент вариации 43,67 + 6,623 %, которому по шкале Мамаева соответствует высокий уровень изменчивости;

- коэффициент дифференциации 60,98 %, которому по классификации соответствует большая степень дифференциации.

Точность определения средней величины 7,97 + 1,21 %.

Все статистические показатели достоверны, т. к. их отношение к ошибкам репрезентативности больше 3 во всех случаях.

Доверительный интервал генеральной средней 0,767 - 1,065 м 3.

Необходимое число наблюдений для будущих исследований, которое бы обеспечивало заданную точность 3 % при известном коэффициенте вариации 43,67 % и трех пороговых уровнях доверительной вероятности следующее:

- для первого порогового уровня 212 штук;

- для второго порогового уровня 831 штука;

- для третьего порогового уровня 1466 штук.

Задание 2. Расчет статистических показателей для большой выборочной совокупности

Изучаемый признак - диаметр деревьев, см.

Данные для статистической обработки большой выборочной совокупности приведены в таблице 4.

Таблица 4.

Данные для статистической обработки большой выборочной совокупности

Ступени толщины, см
4	8	12	16	20	24	28	32	36	40

Для построения вариационного ряда выполняем следующие расчеты:

1. Выбираем Xmin и Xmax Xmin = 4 см; Xmax = 40 см.

Устанавливаем размах варьирования:

Xmax - Xmin = 40 - 4 = 36 см.

2. Определяем классовый интервал:

С = (Xmax - Xmin) / i,

где Xmin - минимальное значение варианты; Xmax - максимальное значение варианты; i

- количество классов, i = v n , где n - объем выборочной совокупности.

Применяя формулу Стерджеса,

C = Xmax - Xmin / 1 + 3,32 ln n =( Xmax - Xmin)/ i,

где i = v n , при n = 100 i = v100 = 10.

Тогда C = 40 - 4 / 10 = 3,6 см. Принимаем С = 4.

3. Устанавливаем границы классов

Нижняя граница

Xmin - С/2 = 4 - 4 / 2 = 2 см.

Верхняя граница

Xmin + C/2 = 4 + 4/2 = 6 см.

Вычисленные границы классов представлены в таблице 5.

Таблица 5.

Границы классов

Классы	Границы классов
I	2,0 - 6,0
II	6,1 - 10,0
III	10,1 - 14,0
IV	14,1 - 18,0
V	18,1 - 22,0
VI	22,1 - 26,0
VII	26,1 - 30,0
VIII	30,1 - 34,0
IX	34,1 - 38,0
X	38,1 - 42,0

После установления границ классов можно приступить к схематическому изображению вариационного ряда.

Схематическое изображение вариационного ряда

Классы I II III IV V VI VII VIII IX X

Границы 2 - 6 - 10 - 14 - 18 - 22 - 26 - 30 - 34 - 38 - 42 Классов

Частота, шт. 8 19 32 47 50 61 46 19 15 7

Накопленная 8 27 59 106 156 217 263 282 297 304

частота, шт.

Группировка данных, расчет средней величины и суммы квадратов отклонений

Границы классов,	Частота F,	Группов. варианта	По исходным данным	По преобразованным Данным
см.	шт.	X I, см	F • X i	X2i	F • X2i	X1=(Xi- A)/C	F • X1	X12	F • X21
						A =24
2,0 - 6,0	8	4	32	16	128	-5	-40	25	200
6,1 -10,0	19	8	152	64	1216	-4	-76	16	304
10,1 14,0	32	12	384	144	4608	-3	-96	9	288
14,1 - 18,0	47	16	752	256	12032	-2	-94	4	188
18,1 - 22,0	50	20	1000	400	20000	-1	-50	1	50
22,1 - 26,0	61	24	1464	576	35136	0	0	0	0
26,1 - 30,0	46	28	1288	784	36064	1	46	1	46
30,1 - 34,0	19	32	608	1024	19456	2	38	4	76
34,1 - 38,0	15	36	540	1296	19440	3	45	9	135
38,1 - 42,0	7	40	280	1600	11200	4	28	16	112
	?F = n	?X i	?(F •Xi)		?(F * X2й )		?(F •X1)		?(F •X12)
	304	220	6500		159280		-199		1399

I 1) Средняя величина

Xср = ? F • X I / n,

где Xi - групповая варианта.

Значит Xср = 6500 / 304 = 21,38 см.

2) Сумма квадратов отклонений

СКО = ?(F • Xi2) - (?(F • X i))2 / n.

Тогда СКО = 159280 - 42250000 / 304 = 159280 - 138980 = 20300 см 2.

II 1) Средняя величина

Xср = A + (?(F * Xй) / n) • C.

Отсюда Xср = 24 + (- 199 / 304) • 4 = 24 + (- 0,6546) • 4 = 24 - 2,6184 = 21,38 см.

Xср1 = Xср2 = 21,38 см. X1 = Xi - A / C.

2) Сумма квадратов отклонений

СКО = ( ?(F • X12) - (?(F • Xй ) 2 / n ) • C2 .

Отсюда получаем СКО = (1399 - (39601 / 304 )) • 16 = (1399 - 130,2664) • 16 = 20299,74 = 20300 см 2.

3) Дисперсия

д 2 = СКО / n - 1.

Находим д 2 = 20300 / 303 = 66,78 см 2.

4) Рассчитываем стандартное отклонение - основной показатель вариации, характеризующий варьирование значений признака вокруг центра распределения:

д = v д 2 .

Тогда д = v 66,78 = 8,172 см.

5) Вычислим коэффициент вариации - показатель изменчивости признака. Он определяется как

Cv = д • 100%/ Xср.

Имеем Cv = 8,172 / 21,38 • 100 = 38,22 %.

По шкале Мамаева (см. таблица 2) для установления уровня изменчивости признака определяем, что уровень изменчивости в данном случае высокий.

6) Находим коэффициент дифференциации, характеризующий изменчивость признака. Он определяется как

Vд = д • 100 % / (Xср - X0) + C/2,

где X0 - значение первого класса ряда распределения. В нашем случае X0 = 2 см.

Тогда Vд = 8,172 • 100 / (21,38 - 2) + 2 = 44, 17 %.

Степень дифференциации признака определим с помощью таблицы 3, из которой следует, что эта степень значительная, т.к. ее коэффициент находится в интервале 39 - 53 %.

7) Расчет ошибок репрезентативности.

Ошибка средней величины вычисляется по формуле:

m x = + д / vn .

В нашем случае: mx = + 8,172 / v304 =+ 8,172 / 17,44 =+ 0,47 см.

Ошибка стандартного отклонения:

m д = + д / v2n .

Значит m д = + 8,172 / v2 • 304 = + 8,172 / 24,66 =+ 0,331 см.

Ошибка коэффициента вариации:

m c = + Cv / vn • v0,5 + (Cv/100)2.

Тогда m c = + 38,22 / 17,44 • v0,5 + (38,22/100) 2 = + 2,192 • 0,804 =+ 1,762 %.

Ошибка точности:

m p = + m c / vn .

Отсюда m p = + 1,762 / 17,44 = + 0,101 %.

8) Находим точность определения средней величины

p = + (m x / Xср) • 100 %.

Отсюда p = + (0,47 / 21,38) • 100 = + 2,2 %.

9) Достоверность статистических показателей (надежность)

Достоверность средней величины: tx = Xср / mx .

Значит tx = 21,38 / 0,47 = 45,49.

Достоверность стандартного отклонения: tд = д / mд .

Тогда tд = 8,172 / 0,331 = 24,69.

Достоверность коэффициента вариации: tc = Cv / mc .

Имеем tc = 38,22 / 1,762 = 21,69.

Достоверность точности: tp = p / mp .

Получаем tp = 2,2 / 0,101 = 21,78.

10) Доверительный интервал для генеральной средней

ДИГС - интервал нахождения средней величины для всей генеральной совокупности.

ДИГС = Xср + mx • t0,5 ,

где t0,5 - критерий Стьюдента на 5% уровне значимости, определяется по числу степеней свободы (см. приложение).

Число степеней свободы - число свободно варьирующих вариант (v)

v = n - 1 = 304 - 1 =303 t0,5 = 1,96

Находим ДИГС = 21,38 + 0,47 • 1,96 = 21,38 + 0,92; ДИГС 20,46 ? 22,3 см.

Чем меньше расстояние между точками интервала, тем точнее выборочная совокупность характеризует генеральные параметры. В нашем случае интервал несколько завышен.

11) Необходимое число наблюдений для будущих исследований

n = ((Cv • K)/p)2,

где Cv - расчетный коэффициент вариации;

p - заданная точность (3 %);

К - коэффициент порогового уровня доверительной вероятности (К1 =1; К2 = 1,98; К3 =2,63) .

n1 = (38,22 • 1 / 3)2 = 162 штуки.

n2 = (38,22 • 1,98 / 3)2 = 636 штук.

n3 = (38,22 • 2,63 / 3)2 = 1123 штуки.

Статистическое заключение

В результате анализа большой выборочной совокупности в виде измерения объема деревьев получили следующие статистические показатели с их ошибками репрезентативности:

- средняя величина 21,38 + 0,47 см;

- стандартное отклонение 8,172 + 0,331 см;

- коэффициент вариации 38,22 + 1,762 %, которому по шкале Мамаева соответствует повышенный уровень изменчивости;

- коэффициент дифференциации 44,17 %, которому по классификации соответствует значительная степень дифференциации.

Точность определения средней величины 2,2 + 0,101 %.

Доверительный интервал генеральной средней 20,46 - 22,3 см.

Необходимое число наблюдений для будущих исследований, которое бы обеспечивало заданную точность 3 % при известном коэффициенте вариации 38,22 % и трех пороговых уровнях доверительной вероятности следующее:

- для первого порогового уровня 162 штуки;

- для второго порогового уровня 636 штук;

- для третьего порогового уровня 1123 штук.

Графическое представление вариационного ряда

После того как произведена группировка совокупности по классам, характер распределения более или менее проясняется. Однако более наглядное представление этого распределения дает графическое изображение.

Графическое представление вариационного ряда с использованием Microsoft Excel

Задание 3. Расчет среднеквадратических ошибок

При проведении полевого и других опытов проявляются три вида ошибок. Ошибка - это расхождение между различными значениями выборочной совокупности или отдельных наблюдений от истинных значений измеряемых величин.

Основные свойства ошибок и причины их возникновения

Случайные (среднеквадратические ошибки) - это ошибки, возникающие под воздействием факторов, действие которых не значительно и их нельзя выделить и учесть отдельно. Случайные ошибки в полевом опыте неизбежны. Математическая статистика дает методы их определения.

Систематические - искажают измеряемую величину в сторону преувеличения или преуменьшения в результате действия вполне определенной постоянной причины. Исключить действие этой причины можно путем применения правильной методики.

Случайные ошибки имеют знак +. Они взаимопогашаются, а систематические нет.

Грубые (промахи) - возникают в результате нарушения основных требований полевого опыта. Грубые ошибки не погашаются, а результат бракуется.

Для математической обработки подходят лишь результаты наблюдений без систематических и грубых ошибок.

Таблица 6.

Расчет среднеквадратических ошибок.

Запас, м3 / га	Откло- нение	Откло- нение с поправкой	Квадрат отклонений с поправкой	Расчет ошибок
Факти- ческий	Глазомерный такс. № 1
230	180	- 19,41	- 19,36	374,81	Систематическая ошибка: Д = + Уоткл / n = = - 9,16 / 13 = 0,71 % Поправка: Д' = + Д / n = = 0,71 / 13 = 0,05 % Случайная ошибка: у = + (vСКО / n - 1) / vn = = + 13,68 / 3,61 = + 3,79 % Ошибка для всех случаев: m у = + у / v n = = + 3,79 / 3,61 = + 1,05 %
210	240	14,27	14,22	202,21
220	200	- 9,52	- 9,47	89,68
240	270	13,21	13,16	173,19
260	220	- 10,33	- 10,28	105,68
310	340	12,64	12,59	158,51
300	270	- 11,08	- 11,03	121,66
320	350	13,19	13,14	172,66
350	320	- 13,78	- 13,73	188,51
360	400	15,26	15,21	231,34
370	350	- 8,01	- 7,96	63,36
380	410	10,43	10,38	107,74
440	400	- 16,03	- 15,98	255,36
N = 13		?откл -9,16		СКО 2244,71

Таблица 7

Запас, м3 / га	Откло- нение	Откло- нение с поправкой	Квадрат отклонений с поправкой	Расчет ошибок
Факти- ческий	Глазомерный такс. № 2
230	220	- 4,76	- 4,713	22,212	Систематическая ошибка: Д = + Уоткл / n = = 8,02 / 13 = 0,617 % Поправка: Д' = + Д / n = = 0,617 / 13 = 0,047 % Случайная ошибка: у = + (vСКО / n - 1) / vn = = + 7,73 / 3,61 = + 2,141 % Ошибка для всех случаев: m у = + у / v n = = + 2,141 / 3,61 = + 0,593 %
210	220	4,68	4,633	21,465
220	210	- 3,96	- 3,913	15,312
240	250	4,13	4,083	16,671
260	240	- 8,87	- 8,823	77,845
310	360	15,19	15,143	229,310
300	290	- 4,62	- 4,573	20,912
320	360	10,53	10,483	109,893
350	330	- 8,08	- 8,033	64,529
360	390	9,39	9,343	87,292
380	370	- 5,00	- 4,953	24,532
370	380	3,45	3,403	11,580
400	390	- 4,06	- 4,013	16,104
N = 13		?откл 8,02		СКО 717,657

Статистическое заключение

Второй таксатор определил запас древесины глазомерным способом точнее, так как его ошибка для всех случаев меньше чем у первого таксатора.

Задание 4. Расчет теоретических частот для кривой нормального распределения

Расчет теоретических частот эмпирического ряда производим следующим образом:

1. Находим значение функции плотности вероятности нормального распределения через величину нормированного отклонения по приложению учебника.

2. Вычисляем теоретические частоты ряда распределения n` по соответствующим данным объема выборки при величине классового промежутка по формуле:

n` = (nC / д) • f(x),

где n - объем выборки; C - классовый интервал; д - стандартное отклонение; f(x) - плотность вероятности.

Таблица 8

Вычисление выравнивающих частот по уравнению Лапласа - Гаусса

Классы X, см	Эмпирические частоты, шт.	Отклонение ¦X i - X ср¦= = Д X Xср = 21,38	Нормирован. отклонение t = ДX / д д = 8,172 см	Плотность вероятнос. нормальн. распредел.	Теоретическая частота n`, шт.
					фактич.	округл.
4	8	17,38	2,126774	0,0413	6,145	6
8	19	13,38	1,637298	0,1040	15,475	15
12	32	9,38	1,147822	0,2059	30,638	31
16	47	5,38	0,658346	0,3209	47,750	48
20	50	1,38	0,168869	0,3932	58,508	59
24	61	2,62	0,320607	0,3790	56,395	56
28	46	6,62	0,810083	0,2874	42,765	43
32	19	10,62	1,299559	0,1714	25,504	26
36	15	14,62	1,789036	0,0804	11,964	12
40	7	18,62	2,278512	0,0297	4,419	4
220	n = 304					n`= 300

- в первый столбец вписаны групповые варианты - Xi , см;

- во втором столбце - эмпирическая частота n, шт.;

- в четвертом столбце - нормированное отклонение, показывающее, насколько «д» отдельные члены данной совокупности отклоняются от среднего уровня учитываемого признака. Нормированное отклонение рассчитываем по формуле: t = ¦(Xi - X ср) / д¦.

Например, для первого значения варианты Xi = 4 получим:

t = ¦(4 - 21,38) / 8,172 ¦= 2,126774.

В пятом столбце находятся значения функции для нормированного отклонения - f(x), взятые из таблицы в соответствии с полученными значениями t .

В шестой столбец сведены значения теоретически рассчитанной частоты - n`, штук.

Например: n` = (304 • 4 / 8,172) • 0,0413 = 6,145.

По результатам вычислений построим графики распределения эмпирических и теоретических частот.

Задание 5. Статистическое сравнение эмпирического распределения с теоретическим по критерию ч - квадрат Пирсона

Критерий ч- квадрат (ч 2) впервые был предложен К. Пирсоном в 1901 году. Пользуясь этим критерием можно произвести оценку различий между эмпирическим и теоретическим распределением частот. Он рассчитывается по формуле: ч 2 = ? (ni - n`)2 / n`,

где ni - эмпирическая частота; n` - теоретическая частота.

Оценка значимости критерия ч 2 производится по специальной таблице (приложение 3 учебника Герасимов, Хлюстов), в которой приведены стандартные значения этого критерия (ч 2st) для трех пороговых уровней доверительной вероятности и для разных чисел степеней свободы.

Число степеней свободы равно числу классов без трех k = n - 3.

Если ч 2ф < ч 2st , то расхождение между эмпирическим и теоретическим распределением подчиняется тому закону, по которому рассчитаны теоретические частоты.

Таблица 9

Оценка различий между эмпирическим и теоретическим распределением деревьев сосны по диаметру на уровне груди.

Классы, xi (диаметр), см.	Частоты	n I - n`	(n i - n`)2	(n i - n`)2 / n`
	Эмпирические (n i), штук	Теоретические (n`), штук
4	8	6,145	1,855	3,441	0,560
8	19	15,475	3,525	12,426	0,803
12	32	30,638	1,362	1,855	0,061
16	47	47,750	- 0,75	0,563	0,012
20	50	58,508	- 8,508	72,386	1,237
24	61	56,395	4,605	21,206	0,376
28	46	42,765	3,235	10,465	0,245
32	19	25,504	- 6,504	42,302	1,659
36	15	11,964	3,036	9,217	0,770
40	7	4,419	2,581	6,662	1,508
220	n = 304				7,231

Теоретические частоты берутся неокругленными.

ч 2ф = 7,231. ч 205/01 = 14,10 / 18,50, при k = 10 - 3 = 7. ч 2ф < ч 205/01 .

Следовательно, нулевая гипотеза H0 не отвергается, т.к. различия между эмпирическим и теоретическим распределением частот не существенны.

Статистическое заключение

Так как ч 2ф < ч 205/01, то можно сделать вывод о том, что опытное распределение деревьев по диаметру на уровне груди подчиняется закону предполагаемого теоретического распределения.

Задание 6. Статистическое сравнение частот взвешенных рядов эмпирических распределений по критерию Колмогорова

Если два эмпирических распределения имеют различное количество классов и объем совокупности, то согласие между ними устанавливается по критерию л , рассчитанному по формуле:

л = ¦(?n 1 /N1) - (?n 2/N2)¦max • v N1N2 / N1 + N2 , где

¦(?n 1 /N1) - (?n 2/N2)¦max = d max , тогда

л = d max • v N1N2 / N1 + N2 ,

где n 1 и n 2 - частоты первого и второго сравниваемых рядов; N1 и N2 - объемы первого и второго рядов.

	НОВОСТИ

Изменения

Прошла модернизация движка, изменение дизайна и переезд на новый более качественный сервер

	СЧЕТЧИК

БОЛЬШАЯ ЛЕНИНГРАДСКАЯ БИБЛИОТЕКА
	© 2010