|
||||||||||||
|
||||||||||||
|
|||||||||
МЕНЮ
|
БОЛЬШАЯ ЛЕНИНГРАДСКАЯ БИБЛИОТЕКА - РЕФЕРАТЫ - Статистическая обработка данных, полученных экспериментальным путем в лесохозяйствеСтатистическая обработка данных, полученных экспериментальным путем в лесохозяйстве46 МОДЕЛИРОВАНИЕ ЭКОСИСТЕМ ВВЕДЕНИЕ Эффективность ведения современного лесного хозяйства определяется полнотой научных сведений, как о естественном формировании лесных фитоценозов, так и под воздействием хозяйственных мероприятий. Достоверность этих сведений оценивается путем статистической обработки цифрового материала, полученного в результате целенаправленно спланированного эксперимента и последующей производственной проверки. Каждый из существующих статистических методов имеет свои возможности и ограниченную область применения, продиктованную спецификой эксперимента. При этом все они служат экспериментатору средством выявления закономерностей, позволяющих сделать выводы и заключения в условиях неопределенности. Достоверно полученные результаты наблюдений, представление выявленных закономерностей в виде статистических моделей следует рассматривать в практическом приложении в качестве основы применения количественных методов моделирования и оптимизации экономических, технологических и других процессов, и явлений. Постановка задачи Результаты наблюдения над лесохозяйственными объектами обычно фиксируются в журналах, бланках, анкетах и других документах учета или заносятся непосредственно в соответствующие файлы портативных компьютеров. Зафиксированные сведения об изучаемом объекте представляют первичный фактический материал, который нуждается в соответствующей обработке с целью исследования генеральной совокупности. На практике инженер лесного хозяйства имеет дело только с выборочной совокупностью (выборкой), т.е. частью генеральной совокупности, поэтому возникает потребность по результатам сравнительно небольшой выборки сделать предположение о поведении всей генеральной совокупности. В других случаях необходимо какой-либо совокупности величин поставить в соответствие другую совокупность и выяснить, имеется ли между ними различие, какая-нибудь взаимосвязь или нет. Для того чтобы сделать статистическое заключение о рассматриваемом объекте, следует выполнить ряд взаимосвязанных операций: 1. Грамотно обеспечить отбор единиц выборочной совокупности; 2. Систематизировать и сгруппировать результаты наблюдений; 3. Графически представить эмпирические совокупности; 4. Получить статистические показатели для эмпирических совокупностей; 5. Получить статистические параметры для генеральной совокупности. Единицы выборочной совокупности (варианты) должны быть отобраны так, чтобы по ним с достаточной точностью можно было судить о свойствах генеральной совокупности. Зачастую в исследованиях проводится отбор так называемых «типичных» представителей генеральной совокупности. Такой подход субъективен и не может служить основой получения качественной информации. Заданная точность в характеристике генеральной совокупности обеспечивается случайным отбором необходимого количества вариант. Классификация и группировка вариант Статистическая обработка первичных данных начинается с расположения вариант в определенной последовательности, зависящей от характера варьирования изучаемого признака: 1. Количественное: · непрерывное; · дискретное. 2. Качественное: · атрибутивное. При непрерывном варьировании отдельные значения признака могут иметь любое значение меры (протяженности, объема, веса и т. д.) в определенных пределах. Например, толщина деревьев в древостое принимает различные значения меры протяженности до самого толстого. При дискретном варьировании отдельные значения признака выражаются отвлеченными числами (чаще всего целыми). Например, число деревьев на пробной площади, диаметр деревьев в ступенях (классах) толщины и т. д. При атрибутивном варьировании значения признака классифицируют по градациям этого признака. Например, цвет, повреждаемость, класс бонитета и т. д. При качественном варьировании первоначальное упорядочивание совокупности проводят в порядке возрастания или убывания. При малом числе вариант (до 30) строится непосредственный ряд значений. При большом объеме выборки (n > 30) ранжированный ряд не обладает свойством наглядности. Поэтому значение признака размещают с указанием числа их повторяемости в виде двойного ряда. В первой строке (столбце) заносят значение признака, а во второй строке (столбце) указывают число повторяющихся значений. Размещение значений признака в порядке их возрастания (убывания) с указанием числа их повторяемости называют вариационным рядом. В вариационном ряду значения признака, разнесенные по классам, называют распределением частот. Очевидно, что сумма частот равна объему выборки n. Величина классового промежутка, на которую разбивается ряд варьирующих значений признака, определяется по формуле: C = X max - X min / i , где X max и X min - максимальное и минимальное значение признака; i - число классовых промежутков. Число классовых промежутков зависит от объема выборки и ориентировочно равно корню квадратному из числа наблюдений, т. е. i = v n . Задание 1. Расчет статистических показателей для малой выборочной совокупности
Изучаемый признак - объем деревьев (м3). Данные замеров объема приведены в таблице 1 Таблица 1 Данные для статистической обработки малой выборочной совокупности
1. Находим среднюю величину распределения по формуле: Xср = ? Чi / n, где n - объем выборочной совокупности равный 30. Подставляя данные из таблицы в формулу, получим: Xср = 27,48 / 30 = 0,916 м 3. 2. Определим сумму квадратов отклонений (СКО) каждой варианты от средней величины по формуле: СКО = ?(Xi - Xср)2. Предварительно определив все квадраты отклонения, находим их сумму: СКО = 0,430336 + 0,331776 + 0,276676 + 0,256036 + 0,126736 + 0,106276 + 0,076176 + 0,076176 + 0,070756 + 0,046656 + 0,030976 + 0,015876 + 0,007396 + 0,003136 + 0,001296 + 0,000676 + 0,000676 + 0,001936 + 0,005476 + 0,010816 + 0,017956 + 0,020736 + 0,026896 + 0,080656 + 0,098596 + 0,118336 + 0,132496 + 0,244036 + 0,817216 + 1,308736 = 4,74152 м 6. 3. Находим дисперсию, характеризующую степень разнообразия объекта, используя формулу: д 2 = СКО / n. Отсюда д 2 = 4,74152 / 30 = 0,1581 м 6 . 4. Рассчитываем стандартное отклонение - основной показатель вариации, характеризующий варьирование значений признака вокруг центра распределения: д = v д 2 . Тогда д = v 0,1581 = 0,3976 = 0,4 м 3. 5. Вычислим коэффициент вариации - показатель изменчивости признака. Он определяется как Cv = д • 100%/ Xср. Имеем Cv = 0,4 / 0,916 • 100 = 43,67 %. По шкале Мамаева для установления уровня изменчивости признака определяем, что уровень изменчивости в данном случае высокий (таблица 2). 6. Находим коэффициент дифференциации, характеризующий изменчивость признака. Он определяется как Vд = д • 100 % / (Xср - Xmin), где Xmin = 0,26 м3. Тогда Vд = 0,4 • 100 / (0,916 - 0,26) = 40 / 0,656 = 60,98 %. Степень дифференциации признака определим с помощью таблицы 3, из которой следует, что эта степень большая. Таблица 2 Шкала Мамаева для установления уровня изменчивости признака
Таблица 3 Классификация степени дифференциации признака
7. Расчет ошибок репрезентативности. Ошибка средней величины вычисляется по формуле: m x = + д / vn . В нашем случае: mx = + 0,4 / v30 =+ 0,073 м 3. Ошибка стандартного отклонения: m д = + д / v2n . Значит m д = + 0,4 / v2 • 30 = + 0,052 м 3. Ошибка коэффициента вариации: m c = + Cv / vn • v0,5 + (Cv/100)2. Тогда mc=+43,67/5,48 • v0,5 + (43,67/100) 2=+ 7,97 • 0,831 =+ 6,623 %. Ошибка точности: m p = + m c / vn . Отсюда m p = + 6,623 / 5,48 = + 1,21 %. 8. Находим точность определения средней величины p = + (m x / Xср) • 100 %. Отсюда p = + (0,073 / 0,916) • 100 = + 7,97 %. Данный показатель позволяет сделать заключение о достоверности эмпирических данных для получения достоверных результатов. 9. Достоверность статистических показателей (надежность) Достоверность - отношение величины статистического показателя к его ошибке репрезентативности. Это отношение должно быть ? 3, определяется по t - критерию. Достоверность средней величины: tx = Xср / mx . Значит tx = 0,916 / 0,073 = 12,55. Достоверность стандартного отклонения: tд = д / mд . Тогда tд = 0,4 / 0, 052 = 7,69. Достоверность коэффициента вариации: tc = Cv / mc . Имеем tc = 43,67 / 6,623 = 6,59. Достоверность точности: tp = p / mp . Получаем tp = 7,97 / 1,21 = 6,587. Все статистические показатели достоверны, т. к. их отношение к ошибкам репрезентативности больше 3 во всех случаях 10. Доверительный интервал для генеральной средней ДИГС - интервал нахождения средней величины для всей генеральной совокупности. ДИГС = Xср + mx • t0,5 , где t0,5 - критерий Стьюдента на 5% уровне значимости, определяется по числу степеней свободы (см. приложение). Число степеней свободы - число свободно варьирующих вариант (v) v = n - 1 = 30 - 1 =29 t0,5 = 2,045 Находим ДИГС = 0,916 + 0,073 • 2,045; ДИГС 0,767 ? 1,065 м 3. Чем меньше расстояние между точками интервала, тем точнее выборочная совокупность характеризует генеральные параметры. 11. Необходимое число наблюдений для будущих исследований n = ((Cv • K)/p)2, где Cv - расчетный коэффициент вариации; p - заданная точность (3 %); К - коэффициент порогового уровня доверительной вероятности (К1 =1; К2 = 1,98; К3 =2,63) . n1 = (43,67 • 1 / 3)2 = 212 шт. n2 = (43,67 • 1,98 / 3)2 = 831 шт. n3 = (43,67 • 2,63 / 3)2 = 1466 шт. Статистическое заключение В результате анализа малой выборочной совокупности в виде измерения объема деревьев получили следующие статистические показатели с их ошибками репрезентативности: - средняя величина 0,916 + 0,073 м 3; - стандартное отклонение 0,4 + 0,052 м 3; - коэффициент вариации 43,67 + 6,623 %, которому по шкале Мамаева соответствует высокий уровень изменчивости; - коэффициент дифференциации 60,98 %, которому по классификации соответствует большая степень дифференциации. Точность определения средней величины 7,97 + 1,21 %. Все статистические показатели достоверны, т. к. их отношение к ошибкам репрезентативности больше 3 во всех случаях. Доверительный интервал генеральной средней 0,767 - 1,065 м 3. Необходимое число наблюдений для будущих исследований, которое бы обеспечивало заданную точность 3 % при известном коэффициенте вариации 43,67 % и трех пороговых уровнях доверительной вероятности следующее: - для первого порогового уровня 212 штук; - для второго порогового уровня 831 штука; - для третьего порогового уровня 1466 штук. Задание 2. Расчет статистических показателей для большой выборочной совокупности Изучаемый признак - диаметр деревьев, см. Данные для статистической обработки большой выборочной совокупности приведены в таблице 4. Таблица 4. Данные для статистической обработки большой выборочной совокупности
Для построения вариационного ряда выполняем следующие расчеты: 1. Выбираем Xmin и Xmax Xmin = 4 см; Xmax = 40 см. Устанавливаем размах варьирования: Xmax - Xmin = 40 - 4 = 36 см. 2. Определяем классовый интервал: С = (Xmax - Xmin) / i, где Xmin - минимальное значение варианты; Xmax - максимальное значение варианты; i - количество классов, i = v n , где n - объем выборочной совокупности. Применяя формулу Стерджеса, C = Xmax - Xmin / 1 + 3,32 ln n =( Xmax - Xmin)/ i, где i = v n , при n = 100 i = v100 = 10. Тогда C = 40 - 4 / 10 = 3,6 см. Принимаем С = 4. 3. Устанавливаем границы классов Нижняя граница Xmin - С/2 = 4 - 4 / 2 = 2 см. Верхняя граница Xmin + C/2 = 4 + 4/2 = 6 см. Вычисленные границы классов представлены в таблице 5. Таблица 5. Границы классов
После установления границ классов можно приступить к схематическому изображению вариационного ряда. Схематическое изображение вариационного ряда Классы I II III IV V VI VII VIII IX X Границы 2 - 6 - 10 - 14 - 18 - 22 - 26 - 30 - 34 - 38 - 42 Классов 46 Частота, шт. 8 19 32 47 50 61 46 19 15 7 Накопленная 8 27 59 106 156 217 263 282 297 304 частота, шт. Группировка данных, расчет средней величины и суммы квадратов отклонений
I 1) Средняя величина Xср = ? F • X I / n, где Xi - групповая варианта. Значит Xср = 6500 / 304 = 21,38 см. 2) Сумма квадратов отклонений СКО = ?(F • Xi2) - (?(F • X i))2 / n. Тогда СКО = 159280 - 42250000 / 304 = 159280 - 138980 = 20300 см 2. II 1) Средняя величина Xср = A + (?(F * Xй) / n) • C. Отсюда Xср = 24 + (- 199 / 304) • 4 = 24 + (- 0,6546) • 4 = 24 - 2,6184 = 21,38 см. Xср1 = Xср2 = 21,38 см. X1 = Xi - A / C. 2) Сумма квадратов отклонений СКО = ( ?(F • X12) - (?(F • Xй ) 2 / n ) • C2 . Отсюда получаем СКО = (1399 - (39601 / 304 )) • 16 = (1399 - 130,2664) • 16 = 20299,74 = 20300 см 2. 3) Дисперсия д 2 = СКО / n - 1. Находим д 2 = 20300 / 303 = 66,78 см 2. 4) Рассчитываем стандартное отклонение - основной показатель вариации, характеризующий варьирование значений признака вокруг центра распределения: д = v д 2 . Тогда д = v 66,78 = 8,172 см. 5) Вычислим коэффициент вариации - показатель изменчивости признака. Он определяется как Cv = д • 100%/ Xср. Имеем Cv = 8,172 / 21,38 • 100 = 38,22 %. По шкале Мамаева (см. таблица 2) для установления уровня изменчивости признака определяем, что уровень изменчивости в данном случае высокий. 6) Находим коэффициент дифференциации, характеризующий изменчивость признака. Он определяется как Vд = д • 100 % / (Xср - X0) + C/2, где X0 - значение первого класса ряда распределения. В нашем случае X0 = 2 см. Тогда Vд = 8,172 • 100 / (21,38 - 2) + 2 = 44, 17 %. Степень дифференциации признака определим с помощью таблицы 3, из которой следует, что эта степень значительная, т.к. ее коэффициент находится в интервале 39 - 53 %. 7) Расчет ошибок репрезентативности. Ошибка средней величины вычисляется по формуле: m x = + д / vn . В нашем случае: mx = + 8,172 / v304 =+ 8,172 / 17,44 =+ 0,47 см. Ошибка стандартного отклонения: m д = + д / v2n . Значит m д = + 8,172 / v2 • 304 = + 8,172 / 24,66 =+ 0,331 см. Ошибка коэффициента вариации: m c = + Cv / vn • v0,5 + (Cv/100)2. Тогда m c = + 38,22 / 17,44 • v0,5 + (38,22/100) 2 = + 2,192 • 0,804 =+ 1,762 %. Ошибка точности: m p = + m c / vn . Отсюда m p = + 1,762 / 17,44 = + 0,101 %. 8) Находим точность определения средней величины p = + (m x / Xср) • 100 %. Отсюда p = + (0,47 / 21,38) • 100 = + 2,2 %. Данный показатель позволяет сделать заключение о достоверности эмпирических данных для получения достоверных результатов. 9) Достоверность статистических показателей (надежность) Достоверность - отношение величины статистического показателя к его ошибке репрезентативности. Это отношение должно быть ? 3, определяется по t - критерию. Достоверность средней величины: tx = Xср / mx . Значит tx = 21,38 / 0,47 = 45,49. Достоверность стандартного отклонения: tд = д / mд . Тогда tд = 8,172 / 0,331 = 24,69. Достоверность коэффициента вариации: tc = Cv / mc . Имеем tc = 38,22 / 1,762 = 21,69. Достоверность точности: tp = p / mp . Получаем tp = 2,2 / 0,101 = 21,78. Все статистические показатели достоверны, т. к. их отношение к ошибкам репрезентативности больше 3 во всех случаях 10) Доверительный интервал для генеральной средней ДИГС - интервал нахождения средней величины для всей генеральной совокупности. ДИГС = Xср + mx • t0,5 , где t0,5 - критерий Стьюдента на 5% уровне значимости, определяется по числу степеней свободы (см. приложение). Число степеней свободы - число свободно варьирующих вариант (v) v = n - 1 = 304 - 1 =303 t0,5 = 1,96 Находим ДИГС = 21,38 + 0,47 • 1,96 = 21,38 + 0,92; ДИГС 20,46 ? 22,3 см. Чем меньше расстояние между точками интервала, тем точнее выборочная совокупность характеризует генеральные параметры. В нашем случае интервал несколько завышен. 11) Необходимое число наблюдений для будущих исследований n = ((Cv • K)/p)2, где Cv - расчетный коэффициент вариации; p - заданная точность (3 %); К - коэффициент порогового уровня доверительной вероятности (К1 =1; К2 = 1,98; К3 =2,63) . n1 = (38,22 • 1 / 3)2 = 162 штуки. n2 = (38,22 • 1,98 / 3)2 = 636 штук. n3 = (38,22 • 2,63 / 3)2 = 1123 штуки. Статистическое заключение В результате анализа большой выборочной совокупности в виде измерения объема деревьев получили следующие статистические показатели с их ошибками репрезентативности: - средняя величина 21,38 + 0,47 см; - стандартное отклонение 8,172 + 0,331 см; - коэффициент вариации 38,22 + 1,762 %, которому по шкале Мамаева соответствует повышенный уровень изменчивости; - коэффициент дифференциации 44,17 %, которому по классификации соответствует значительная степень дифференциации. Точность определения средней величины 2,2 + 0,101 %. Доверительный интервал генеральной средней 20,46 - 22,3 см. Необходимое число наблюдений для будущих исследований, которое бы обеспечивало заданную точность 3 % при известном коэффициенте вариации 38,22 % и трех пороговых уровнях доверительной вероятности следующее: - для первого порогового уровня 162 штуки; - для второго порогового уровня 636 штук; - для третьего порогового уровня 1123 штук. Графическое представление вариационного ряда После того как произведена группировка совокупности по классам, характер распределения более или менее проясняется. Однако более наглядное представление этого распределения дает графическое изображение. Графическое представление вариационного ряда с использованием Microsoft Excel Задание 3. Расчет среднеквадратических ошибок При проведении полевого и других опытов проявляются три вида ошибок. Ошибка - это расхождение между различными значениями выборочной совокупности или отдельных наблюдений от истинных значений измеряемых величин. Основные свойства ошибок и причины их возникновения Случайные (среднеквадратические ошибки) - это ошибки, возникающие под воздействием факторов, действие которых не значительно и их нельзя выделить и учесть отдельно. Случайные ошибки в полевом опыте неизбежны. Математическая статистика дает методы их определения. Систематические - искажают измеряемую величину в сторону преувеличения или преуменьшения в результате действия вполне определенной постоянной причины. Исключить действие этой причины можно путем применения правильной методики. Случайные ошибки имеют знак +. Они взаимопогашаются, а систематические нет. Грубые (промахи) - возникают в результате нарушения основных требований полевого опыта. Грубые ошибки не погашаются, а результат бракуется. Для математической обработки подходят лишь результаты наблюдений без систематических и грубых ошибок. Таблица 6. Расчет среднеквадратических ошибок.
Таблица 7
Статистическое заключение Второй таксатор определил запас древесины глазомерным способом точнее, так как его ошибка для всех случаев меньше чем у первого таксатора. Задание 4. Расчет теоретических частот для кривой нормального распределения Расчет теоретических частот эмпирического ряда производим следующим образом: 1. Находим значение функции плотности вероятности нормального распределения через величину нормированного отклонения по приложению учебника. 2. Вычисляем теоретические частоты ряда распределения n` по соответствующим данным объема выборки при величине классового промежутка по формуле: n` = (nC / д) • f(x), где n - объем выборки; C - классовый интервал; д - стандартное отклонение; f(x) - плотность вероятности. Таблица 8 Вычисление выравнивающих частот по уравнению Лапласа - Гаусса
- в первый столбец вписаны групповые варианты - Xi , см; - во втором столбце - эмпирическая частота n, шт.; - в четвертом столбце - нормированное отклонение, показывающее, насколько «д» отдельные члены данной совокупности отклоняются от среднего уровня учитываемого признака. Нормированное отклонение рассчитываем по формуле: t = ¦(Xi - X ср) / д¦. Например, для первого значения варианты Xi = 4 получим: t = ¦(4 - 21,38) / 8,172 ¦= 2,126774. В пятом столбце находятся значения функции для нормированного отклонения - f(x), взятые из таблицы в соответствии с полученными значениями t . В шестой столбец сведены значения теоретически рассчитанной частоты - n`, штук. Например: n` = (304 • 4 / 8,172) • 0,0413 = 6,145. По результатам вычислений построим графики распределения эмпирических и теоретических частот. Задание 5. Статистическое сравнение эмпирического распределения с теоретическим по критерию ч - квадрат Пирсона Критерий ч- квадрат (ч 2) впервые был предложен К. Пирсоном в 1901 году. Пользуясь этим критерием можно произвести оценку различий между эмпирическим и теоретическим распределением частот. Он рассчитывается по формуле: ч 2 = ? (ni - n`)2 / n`, где ni - эмпирическая частота; n` - теоретическая частота. Оценка значимости критерия ч 2 производится по специальной таблице (приложение 3 учебника Герасимов, Хлюстов), в которой приведены стандартные значения этого критерия (ч 2st) для трех пороговых уровней доверительной вероятности и для разных чисел степеней свободы. Число степеней свободы равно числу классов без трех k = n - 3. Если ч 2ф < ч 2st , то расхождение между эмпирическим и теоретическим распределением подчиняется тому закону, по которому рассчитаны теоретические частоты. Таблица 9 Оценка различий между эмпирическим и теоретическим распределением деревьев сосны по диаметру на уровне груди.
Теоретические частоты берутся неокругленными. ч 2ф = 7,231. ч 205/01 = 14,10 / 18,50, при k = 10 - 3 = 7. ч 2ф < ч 205/01 . Следовательно, нулевая гипотеза H0 не отвергается, т.к. различия между эмпирическим и теоретическим распределением частот не существенны. Статистическое заключение Так как ч 2ф < ч 205/01, то можно сделать вывод о том, что опытное распределение деревьев по диаметру на уровне груди подчиняется закону предполагаемого теоретического распределения. Задание 6. Статистическое сравнение частот взвешенных рядов эмпирических распределений по критерию Колмогорова
Если два эмпирических распределения имеют различное количество классов и объем совокупности, то согласие между ними устанавливается по критерию л , рассчитанному по формуле: л = ¦(?n 1 /N1) - (?n 2/N2)¦max • v N1N2 / N1 + N2 , где ¦(?n 1 /N1) - (?n 2/N2)¦max = d max , тогда л = d max • v N1N2 / N1 + N2 , где n 1 и n 2 - частоты первого и второго сравниваемых рядов; N1 и N2 - объемы первого и второго рядов. |
РЕКЛАМА
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
БОЛЬШАЯ ЛЕНИНГРАДСКАЯ БИБЛИОТЕКА | ||
© 2010 |