|
||||||||||||
|
||||||||||||
|
|||||||||
МЕНЮ
|
БОЛЬШАЯ ЛЕНИНГРАДСКАЯ БИБЛИОТЕКА - РЕФЕРАТЫ - Розподіл ПуасонаРозподіл Пуасона21 ЗМІСТ
Центральним поняттям програмування є, безперечно, поняття алгоритму. З нього починається робота над програмою і від якості алгоритму залежить її успішне створення. Тому вміння програмувати в значній мірі означає розробляти хороші алгоритми і застосовувати вже відомі. На сьогодні існує велика кількість різноманітних мов програмування, кожна з яких має свої певні переваги та недоліки. В цьому розмаїтті не завжди легко зробити свій вибір на користь якоїсь певної мови програмування. Для реалізації поставленої задачі вибрано середовище Turbo Pascal. Алгоритмічна мова Паскаль була створена Н.Віртом на початку 70-х років. Завдяки зусиллям розробників ця мова програмування стала потужним інструментом професійних програмістів‚ не втративши простоти і ясності, властивих цій мові від народження. Розробник системи Turbo Pascal - фірма Borland International виникла в 1984 році і за порівняно короткий час неодноразово дивувала користувачів персональних ЕОМ своїми Turbo системами. Було випущено кілька версій Turbo Pascal: 3.0‚ 4.0‚ 5.0‚ 5.5‚ 6.0‚ 7.0‚ Pascal for Windows, Borland Pascal. Головні особливості середовища Turbo Pascal: широкий спектр типів даних‚ можливість обробки рядкових та структурних типів даних; достатній набір операторів управління розгалуженнями та циклами; добре розвинутий апарат підпрограм та зручні конструкції роботи з файлами; великі можливості управління усіма ресурсами ПЕОМ; різноманітні варіанти стикування з мовою Асемблера; підтримка ідей об'єктно-орієнтованого програмування (ООП). Саме з огляду на ці особливості програмна реалізація курсового проекту було здійснено в середовищі Turbo Pascal. Розробник системи програмування Turbo Pascal - фірма Borland International виникла в 1984 році і за порівняно короткий час неодноразово дивувала користувачів персональних ЕОМ своїми Turbo системами. Було випущено на ринок програмних продуктів декілька версій Turbo Pascal: 3.0, 4.0, 5.0, 5.5, 6.0, 7.0, Pascal for Windows, Borland Pascal. Курсовий проект складається зі вступу, двох розділів, висновків, списку використаної літератури, графічної частини та додатків. Текст пояснювальної записки набрано та роздруковано з використанням текстового редактора Word. Графічна частина виконана з допомогою графічного редактора Visio. 1. Теоретична частина 1.1 Постановка задачіУ наукових дослідженнях часто для встановлення справедливості певного факту висловлюють гіпотези‚ які можна перевірити статистично‚ тобто виходячи з результатів спостережень випадкової вибірки з генеральної сукупності. Сукупність усіх можливих значень досліджуваної величини (ознаки) називають генеральною сукупністю. Генеральна сукупність може бути скінченною і нескінченною. Результати обмеженого ряду спостережень випадкової величини Х називають вибіркою з генеральної сукупності. Кількість елементів вибірки називають її обсягом‚ а окреме значення ознаки - варіантою. Число‚яке показує‚ скільки разів варіанта зустрічається у вибірці‚ називають частотою. Сума всіх частот вибірки дорівнює її обсягу. Щоб вивчити закономірності частоти появи варіант‚ їх розміщують у зростаючому або спадаючому порядку і вказують частоту появи кожної варіанти у вибірці. При цьому отримують таблицю‚ яка називається варіаційним рядом‚ або емпіричним рядом. Варіаційні ряди дають уявлення про варіацію ознаки у вибірковій сукупності. Для повнішої характеристики вибірки використовують узагальнюючі числові характеристики. Характеристики розподілів ймовірностей у генеральній сукупності називають параметрами‚а вибіркові (емпіричні) характеристики - оцінками‚ або статистиками. Нехай маємо експериментальні значення випадкової величини (ознаки) Х‚ тоді можемо визначити деякі вибіркові статистики. Середнє значення визначаємо за формулою ‚ (1) яке є наближеним значенням (оцінкою) математичного сподівання М(Х) ознаки Х генеральної сукупності. Якщо за даними спостереження побудовано варіаційний ряд‚ то вводять поняття середньої зваженої ‚ (2) де - варіанта‚ якщо ряд дискретний і центр інтервалу‚ якщо ряд інтервальний; - частота варіанти або статистична вага‚ - кількість інтервалів. Характеристикою розсіяння навколо середньої є емпірична дисперсія‚ яку визначають за формулою . (3) Середнім квадратичним відхиленням називають корінь квадратний з дисперсії: . (4) Середнє квадратичне має ту розмірність‚ що й значення ознаки і є абсолютною характеристикою коливання ознаки навколо середнього значення. Під статистичною гіпотезою розуміють будь-яке твердження щодо генеральної сукупності‚ яке перевіряється на основі вибірки. Статистичні гіпотези висловлюють як щодо законів розподілу‚ так і відносно параметрів розподілу. Наприклад‚ гіпотеза про те‚ що число відмов у телефонній мережі підпорядкований розподілу Пуассона‚ є гіпотезою про закон розподілу. Гіпотеза про те‚ що середні розміри деталей‚ які виготовляються на однотипних‚ паралельно працюючих станках‚ приблизно однакові‚ є гіпотезою про параметри розподілу. Зроблений на основі статистичних даних висновок про те‚ що між кількома генеральними сукупностями або між емпіричним і теоретичним розподілом істотних відмінностей немає‚ називають нульовою (основною) гіпотезою. Гіпотезу‚ яка заперечує основну‚ називають альтернативною гіпотезою. Нульову гіпотезу зазвичай позначають літерою H0‚ альтернативну - літерою H1. В результаті перевірки статистичної гіпотези‚ яка ґрунтується на статистичних спостереженнях‚ можна прийняти або відхилити нульову гіпотезу. Помилкове рішення можна допустити в обидвох випадках. Тому розрізняють помилки двох видів. Помилка першого виду полягає в тому‚ що нульова гіпотеза заперечується‚ тоді як насправді вона правильна. Помилка другого виду полягає в тому‚ що нульова гіпотеза приймається‚ тоді як правильною є альтернативна гіпотеза. Ймовірність допустити помилку першого типу називають рівнем значущості і позначають грецькою літерою б. Рівень значущості встановлює дослідник залежно від важливості досліджуваної задачі. Рівень значущості - це та мінімальна ймовірність‚ починаючи з якої можна вважати подію практично неможливою. Найчастіше рівень значущості беруть рівним 0,05 або 0,01‚ значно рідше 0,1. Є два типи задач перевірки гіпотез. Задачі першого типу пов'язані з перевіркою гіпотез про достовірність істотної відмінності між параметрами статистичних сукупностей. Відмінність між параметрами статистичних сукупностей вважають істотною‚ якщо вона перевищує ту‚ яку б можна було б пояснити випадковими коливаннями. Прикладом задачі першого типу є‚ наприклад‚ оцінка достовірності істотної відмінності між дисперсіями дох вибірок або між їх середніми значеннями. Задачі другого типу пов'язані з оцінкою ступеня розбіжності емпіричного та теоретичного розподілів. Прикладом задачі цього типу може бути перевірка гіпотези про те‚ що емпіричний розподіл узгоджується з нормальним законом розподілу. Перевірка гіпотези полягає в тому‚ що з вибірковими даними обчислюються значення деякої величини‚ яка має відомий стандартний розподіл (нормальний‚ Пуассона‚ Стьюдента‚ Пірсона та ін.). Цю величину називають статистикою критерію або просто значенням критерію. Якщо обчислене за вибіркою значення критерію не перевищує граничного (критичного) значення‚ взятого з відповідних таблиць‚ то нульову гіпотезу визнають за вірну при заданому рівні значущості б. У цьому разі отриману за вибірковими даними відмінність можна пояснити тільки випадковістю вибірки. Але прийняття гіпотези зовсім не означає‚ що рівність параметрів генеральних сукупностей доведена‚ або те‚ що теоретичний закон відповідає емпіричному розподілу. Наявний статистичний матеріал не дає підстав про відхилення нульової гіпотези. Якщо обчислене значення критерію буде більше ніж критичне значення при заданому рівні значущості б‚ то відмінність генеральних сукупностей не модна пояснити тільки випадковістю вибірки. У цьому разі нульову гіпотезу відхиляють і кажуть‚ що при заданому рівні значущості відмінність є істотною. Для статистичної перевірки гіпотез використовують ряд критеріїв: Фішера‚ Колмогорова_Смірнова‚ Стьюдента‚ Краскалла-Уолліса‚ Манна-Уїтні‚ Бартлета‚ Спірмена та ін. В даному курсовому проекті реалізовано задачу побудови теоретичного ряду за розподілом Пуассона і обчислення ступеня згоди цього ряду з емпіричним за критерієм (хі-квадрат) Пірсона. 1.2 Методи розв'язування задачі Критерії значущості забезпечують найкращу достовірність статистичних висновків‚ якщо вибірку беруть з нормально розподіленої генеральної сукупності. При відхиленнях від нормального розподілу точність критеріїв значущості дещо зменшується. На практиці використовують ряд розподілівё досить близьких до нормального: біноміальний, поліноміальний, розподіл Пуассона, розподіл Фішера, розподіл Стьюдента. Завданням куросового проекту є побудова теоретичного ряду з арозподілом Пуассона та перевірка гіпоетзи про узгодження теоретичного та емпіричного рядів за критерієм згоди (хі-квадрат) Пірсона. Розподіл Пуассона є додатнім цілочисленим розподілом‚ який відіграє величезну роль в теорії ймовірностей та математичній статистиці. В якості прикладів випадкових величин‚ які розподілені за законом Пуассона‚ звичайно наводять наступні: число альфа-частинок‚ які випромінюються радіоактивним джерелом за певний проміжок часу; кількість бактерій‚ які видно під мікроскопом; число зірок в просторі і т.п. цей розподіл часто зустрічається при дослідженні проблем‚ пов'язаних з телефонною мережею. Випадкова величина Х, яка має розподіл Пуассона, приймає значення , причому ймовірність того, що вона прийме значення , обчислюється за формулою (5) де , тобто параметр є математичним сподіванням випадкової величини Х. Знайдемо дисперсію випадкової величини Х: , тобто параметр є середнім квадратичним відхиленням величини Х. Виконавши деякі перетворення‚ отримаємо . Через параметр можна виразити ще дві характеристики розподілу Пуассона: коефіцієнт асиметрії і ексцес . Однією з суттєвих особливостей розподілу Пуассона є його стійкість відносно лінійних операцій над випадковими величинами. Тепер перейдемо до критерію Пірсона. Нехай теоретичний розподіл задано функцією (5)‚ а - теоретичні частоти відповідних значень ознаки . Потрібно встановити‚ якою мірою розподіл Пуассона відображає емпіричний ряд. Щоб зробити висновок про міру узгодження між емпіричним і теоретичним розподілом‚ розглядають сумарну розбіжність між емпіричними та теоретичними частотами. Сумарна розбіжність між частотами залежить від функції розподілу‚ який дає нам теоретичні частоти‚ і від випадкових причин‚ внаслідок яких маємо емпіричний розподіл. Якщо сумарна розбіжність мала‚ то можна припустити‚ що вона зумовлена випадковими причинами‚ а тому теоретичний розподіл добре відображає емпіричний ряд. Якщо сумарна розбіжність велика‚ то вона зумовлена істотними причинами‚ а саме тим‚ що теоретичний розподіл погано відображає емпіричний ряд. Критерій згоди Пірсона полягає в тому‚ що за міру розбіжності між емпіричними і теоретичними частотами беруть величину . (6) Величина - середня зважена квадратів відхилень емпіричних і теоретичних частот‚ при цьому вагою є величини‚ обернені теоретичним частотам. Статистика є випадковою величиною‚ яка сама має свій закон розподілу. Пірсон показав‚ що не залежить ні від функції розподілу‚ ні від обсягу вибірки‚ а залежить лише від параметра - числа степенів свободи і дорівнює різниці між числом частот ‚ які порівнюються і числом зв'язків‚ які на ці частоти накладено. При застосуванні критерію Пірсона вважають‚ що сума теоретичних частот дорівнює сумі емпіричних‚ а теоретичні середня і дисперсія дорівнюють вибірковій середній і вибірковій дисперсії. Тому число степенів вільності (свободи) становить . Критерій Пірсона застосовують за таким алгоритмом. Формулюють гіпотезу H0 - емпіричний розподіл відповідає розподілу Пуассона і альтернативну гіпотезу - емпіричний розподіл не відповідає розподілу Пуассона. Задають рівень значущості . Розглядають вибірку обсягом незалежних спостережень і емпіричний розподіл представляють у вигляді інтервального варіаційного ряду. Обчислюють вибіркові характеристики і S. Їх використовують замість генерального параметра розподілу Пуассона‚ з яким порівнюватимемо емпіричний розподіл. Обчислюють значення теоретичних частот для кожнго з інтервалів групування. Для цього використовується формула Якщо буде встановлено‚ що обчислені частоти деяких інтервалів групування менше п'яти‚ то сусідні інтервали об'єднуються так‚ щоб сума обчислених теоретичних частот була не меншою п'яти. Частоти об'єднаних інтервалів при цьому додають. Обчислюють значення критерію за формулою (6). Знаходять табличне критичне значення для заданого рівня значущості і числа ступенів свободи . Якщо ‚ то емпіричний розподіл не відповідає розподілу Пуассона при заданому рівні значущості . Якщо ‚ то це дає право стверджувати‚ що гіпотеза H0 допустима‚ тобто припущення про те‚ що в генеральній розподіл не суперечить дослідним даним. В розділі 2 описано програму визначення ступеня згоди емпіричного розподілу з теоретичним розподілом Пуассона. 2. практична частина 2.1 Архітектура програмиДля реалізації поставленої задачі розроблено програму PUASSON (лістінг програми представлено в додатку 4). Програма складається з головного блоку, трьох процедур: VVID; OBCHYSL; VYVID_REZ т функції FAKT. Запуск програми здійснити таким чином: з середовища операційної оболонки Norton Commander шляхом запуску PUASSON.EXE (попередньо програма повинна буди відкомпільована з опцією Destination To Memory). з головного меню інтегрованого середовища Turbo Pascal шляхом вибору опції Run (попередньо програма повинна бути завантажена в ОП - F10, File, Open, PUASSON.PAS); Програма виводить на дисплей головного меню, котре пропонує користувачеві вибір однієї з опцій: ВВІД ДАНИХ РОЗРАХУНОК РЕЗУЛЬТАТ ВИХІД. При виборі певної опції активізується відповідна процедура. Завершення роботи програми і повернення в середовище системи програмування Turbo Pascal здійснюється при натисканні клавіші Esc, що відповідає вибору опції «ВИХІД». Програма здійснює побудову теоретичного варіаційного ряду та перевіряє гіпотезу про розподіл Пуассона генеральної сукупності за критерієм згоди Пірсона‚ виводить результати обчислень та висновок щодо гіпотези на екран дисплею. Опишемо процедури програми PUASSONS.PAS. Процедура VVID. Призначення - ввід емпіричного варіаційного ряду‚ впорядкування емпіричного ряду за зростанням. Процедура викликається з головного меню програми при виборі пункту «ВВІД» шляхом натискання функціональної клавіші F2. Після впорядкування емпіричного масиву даних процедура припиняє роботу і повертає керування в програму. Процес виконання процедури представлено екранною копією (див. додаток 1). Процедура OBCHYSL. Призначення - групування емпіричних даних в інтервали‚ підрахунок емпіричних частот‚ обчислення вибіркових характеристик - середньої‚ вибіркової дисперсії та середнього квадратичного відхилення. Процедура викликається з головного меню програми при виборі пункту «РОЗРАХУНОК» (функціональна клавіша F3). Після обчислення вибіркових статистик та виводу їх на дисплей процедура передає керування головному блокові програми. Блок схема процедури представлена в додатку 3. Процедура VYVID. Призначення - обчислення значення критерію за формулою (6)‚ вивід результату обчислень на екран на дисплею‚ перевірка гіпотези про розподіл Пуассона емпіричного варіаційного ряду. Процедура викликається з головного меню програми при виборі пункту «ВИВІД» (функціональна клавіша F4). Результат роботи процедури представлено не екранній копії (див. додаток 5). Для отримання друкованого результату потрібно натиснути клавішу PrtScr (при роботі в режимі MS DOS) або комбінацію клавіш Shift+PrtScr (при роботі з ОС Windows 3.xx, Windows 9x). Функція FAKT використовується для обчислення значення n!. Головний блок програми реалізовано у вигляді горизонтального меню з використанням функціональних клавіш. Вибір опції меню здійснюється за допомогою натискання відповідної функціональної клавіші‚ вихід з меню (а тим самим і з програми) здійснюється при натисканні клавіші Esc. Блок-схема головного блоку програми подано в додатку 2. 2.2 Опис програмиПрограма складена‚ відкомпільована і відлагоджена в середовищі Turbo Pascal 6.0. Оператори програми мають таке призначення: 001 Заголовок програми 002 Підключення зовнішніх модулів Crt та Printer 003 Опис типованої змінної для збереження емпіричних даних 004 Опис робочих змінних програми 005 Процедура CLEAN - очистка вікна екрану починаючи з 7 і закінчуючи 20 стрічкою 006-012 Процедура FAKT - обчислення значення n! 013 Заголовок процедури VVID 014 Початок процедури 015-018 Ввід обсягу вибірки 021-027 Ввід елементів емпіричного ряду та їх частот 028 Підрахунок обсягу вибірки 030 Кінець процедури VVID 031 Заголовок процедури OBCHYSL 032 Початок процедури 033-035 Присвоєння початкових значень для обчислення вибіркової середньої та вибіркової дисперсії 036-040 Обчислення середньої зваженої та вибіркової дисперсії 042 Обчислення згладженої вибіркової дисперсії 043 Обчислення середньої емпіричного ряду 044 Обчислення середнього квадратичного відхилення 045 Кінець процедури OBCHYSL 046 Заголовок процедури VYVID 047 Початок процедури 048 Очистка вікна виводу (виклик процедури CLEAN) 049 Присвоєння початкового значення для обчислення характеристики 050-062 Вивід екранної форми для виведення результатів роботи процедури 063 Визначення емпіричного значення параметра 064 Початок циклу розрахунку теоретичних варіант 065-067 Обчислення значень варіант теоретичного розподілу 068 Обчислення сумарної характеристики 069-071 Вивід результатів обчислень на екран дисплею 072 Кінець циклу розрахунку теоретичних варіант та характеристики емпіричного розподілу 073-077 Ввід критичного значення та числа ступенів свободи 078 Ввід критичного значення характеристики 079-080 Перевірка умови і вивід повідомлення про прийнятність чи неприйнятність гіпотези про розподіл Пуассона емпіричного ряду 081 Організація паузи в роботі програми для збереження результатів обчислень на екрані 082 Кінець процедури VYVID 083 Початок головного блоку програми 084 Початок циклу виводу головного меню програми 085-086 Встановлення основного та фонового кольорів 088-111 Вивід головного меню та інформаційної стрічки програми 112 Сканування клавіатури і присвоєння коду натиснутої клавіші змінній vybir 113-114 Зміна основного та фонового кольорів (для виводу результатів) 115 Заголовок оператора вибору 116 Аналіз коду натиснутої клавіші і виклик процедури VVID при натисканні клавіші F2 117 Аналіз коду натиснутої клавіші і виклик процедури OBCHYSL при натисканні клавіші F3 118 Аналіз коду натиснутої клавіші і виклик процедури VYVID при натисканні клавіші F4 119 Аналіз коду натиснутої клавіші‚ завершення роботи програми при натисканні клавіші ESC 120 Кінець оператора вибору 121 Кінець оператора циклу виводу меню 122 Кінець програми Лістінг програми представлено в додатку 4‚ блок-схему головного блоку програми наведено в додатку 2‚ блок-схему процедури OBCHYSL - в додатку 3. 2.3 Контрольний приклад та аналіз результатів машинного експериментуВипробування будь-якої системи є найбільш відповідальним і пов'язаний з найбільшими труднощами і найбільшими втратами часу. Відладка і тестування - найважливіші етапи життєвого циклу програм. Не можна робити висновок про правильність програми лише на тій підставі, що програма повністю протрансльована (відкомпільована) і видала числові результати. Все, чого досягнуто в даному випадку - це отримання деякої вихідної інформації, необов'язково правильної. В програмі все ще можуть міститись логічні помилки. Тому необхідно здійснювати «ручну» перевірку результатів‚ отриманих внаслідок машинного експерименту. Існує кілька способів перевірки правильності машинних результатів: обчислення результатів вручну; отримання результатів з довідкової літератури, документації або сукупності таблиць; отримання результату з допомогою іншої програми. Контрольний приклад для перевірки правильності розробленої програми виконано вручну з використанням статистичних таблиць розподілу Пірсона. Для перевірки роботи програми розв'яжемо наступну задачу. Досліджено 79 телефонних автоматів на протязі певного часу на предмет виявлення відмов. За цей час було спостерігалась така кількість відмов: Жодної відмови - 4 автомати; 1 відмова - 13 автоматів; 2 відмови - 14 автоматів; 3 відмови - 24 автомати; 4 відмови - 16 автоматів; 5 і більше відмов - 8 автоматів. З рівнем значущості перевіримо гіпотезу про розподіл Пуассона генеральної сукупності числа відмов телефонних автоматів. Висловлюємо гіпотезу H0: емпіричний ряд відмов телефонних автоматів розподілений за законом Пуассона. Для перевірки гіпотези використовуємо критерій згоди (критерій Пірсона). Розрахунки подаємо в таблиці (табл.1). Таблиця 1.
Обчислене значення критерію =6,6721/ Число ступенів вільності становить . Критичне значення для вибираємо з таблиць розподілу Пірсона. Оскільки , то зроблена нами гіпотеза про те‚ що емпіричний ряд розподілений за законом Пуассона приймається з 5% рівнем значущості. Розрахований результат співпадає з вихідними даними програми, представленими в додатку 5. Незначна розбіжність ( порядку 0.01) пояснюється неточністю ручних обчислень. Таким чином‚ розроблена програма може бути використана для практичної побудови теоретичного ряду та перевірки гіпотези про розподіл Пуассона емпіричних рядів. Висновки Розв'язування задач обчислювального характеру з використанням персональних комп'ютерів має велике практичне значення, оскільки дає можливість значно економити час при виконанні простих але громіздких обчислень. Використання з цією метою готових пакетів прикладних програм (типу MathCad) для виконання математичних обчислень має певні вади. Ліцензовані пакети програм мають високу вартість і достатньо висока складність експлуатації. Тому їх використання для розв'язування не дуже складних задач (а саме такою є задача перевірки статистичних гіпотез) є недоцільним. Надзвичайно важливо вміти самостійно складати прості програми для розв'язування задач обчислювального характеру. В даному курсовому проекті розроблено і описано програму перевірки гіпотези про розподіл Пуассона емпіричного ряду за допомогою критерію Пірсона. Для розробки програми вибрано мову Паскаль (середовище Turbo Pascal 6.0). Програма розроблена із застосуванням методики процедурного програмування. Програма відкомпільована з отриманням незалежного ехе-файла та відладжена з використанням набору тестових даних‚ які розроблено вручну. Результат машинного експерименту та контрольного прикладу повністю співпали, тому можна зробити висновок про можливість використання розробленої програми на практиці. Вибір алгоритмічної мови Паскаль для реалізації поставленої задачі повністю виправдав себе. Однак інтерфейс програми можна покращити‚ використавши‚ наприклад‚ розвиток мови Паскаль - середовище Object Pascal або систему програмування Delphi. Список використаної літератури В.Я. Сердюченко. Розробка алгоритмів та програмування мовою Turbo Pascal. - Харків: «Паритет», 1995. - 349 с. М.Я. Ляшенко‚ М.С.Головань. Чисельні методи. К: "Либідь"‚ 1996. - 285 с. Дж. Вайнберг‚ Дж. Шумейкер. Статистика. М.:"Статистика"‚ 1979. - 367 с. Дж. Поллард. Справочник по вычислительным методам статистики. М.: "Финансы и ститистика"‚ 1982. - 344 с. Д. Ван Тассел. Стиль, разработка, эффективность, отладка и испытание программ. Москва: «Мир», 1985. - 332 с. Я.К. Колде. Практикум по теории вероятностей и математической статистике. М.: "Высшая школа"‚ 1991. - 155 с. |
РЕКЛАМА
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
БОЛЬШАЯ ЛЕНИНГРАДСКАЯ БИБЛИОТЕКА | ||
© 2010 |