|
||||||||||||
|
||||||||||||
|
|||||||||
МЕНЮ
|
БОЛЬШАЯ ЛЕНИНГРАДСКАЯ БИБЛИОТЕКА - РЕФЕРАТЫ - Разработка подсистемы оперативного анализа данных в информационной системе анализа динамики посетителей веб-сайта crimusic.infoРазработка подсистемы оперативного анализа данных в информационной системе анализа динамики посетителей веб-сайта crimusic.info2 МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ УКРАИНЫ СЕВАСТОПОЛЬСКИЙ НАЦИОНАЛЬНЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ Кафедра менеджмента и экономико-математические методы КУРСОВАЯ РАБОТА по дисциплине: "Информационные системы в менеджменте" на тему: Разработка подсистемы оперативного анализа данных в информационной системе анализа динамики посетителей Веб-сайта crimusic. info Выполнил: ст. гр. МО-24 Ниязиева Д.З. Руководитель: Результат защиты Председатель комиссии Севастополь 2008 Содержание
Рисунок 1.3 - Таблицы БД сайта crimusic. info, спроектированные в MS Access В таблице "Посетители" находятся следующие поля: "Имя", "Код пользователя", "Дата регистрации". Их тип данных следующий: "Имя" - текстовый, "Код пользователя" - счетчик, "Дата регистрации" - дата/время. В данной таблице ключевым полем будет являться "Код пользователя". Таблица "Разделы". Здесь ключевым полем будет являться "Номер раздела". Поля и тип их данных: "Номер раздела" - счетчик, "Имя раздела" - текстовый. Следующая таблица имеет название "Посещения сайта". Ключевое поле - "Номер". Тип данных полей таблицы: "Код пользователя" - числовой, "Номер" - счетчик, "Дата и время входа" - дата/время, "Дата и время выхода" - дата/время, "IP - адрес" - текстовый. Последняя таблица называется "Посещения раздела". Ключевое поле - "Номер". В ней 4 поля, которые имеют разные типы полей: "Номер" - счетчик, "Номер посещения" - числовой, "Номер раздела" - числовой и "Время посещения" - дата/время. Установим связи между таблицами по ключевым полям (рисунок 1.4).
Рисунок 1.4 - Таблицы и межтабличные связи БД сайта crimusic. info, спроектированные в MS Access Таблица "Посетители" связана с таблицей "Посещения сайта" ключевым полем "Код пользователя" (связь между таблицами один ко многим). Таблица "Посещения сайта" связана с таблицей "Посещения разделов" по полю "Номер посещения" (связь один ко многим). Таблица "Разделы" связана с таблицей "Посещения разделов" отношением один ко многим. 1.3 OLAP-технологии в подсистеме анализа объекта исследованийТермин OLAP, или оперативная аналитическая обработка, был введен в 1993 г. Эдгаром Коддом (Edgar Codd), автором реляционной модели. Первоначально OLAP использовался как профессиональное словечко, обозначающее принципиальное отличие от OLTP (On-Line Transaction Processing, Оперативная обработка транзакций). Буква T была заменена на A, что подчеркивало аналитические возможности OLAP в отличие от транзакционных характеристик технологии реляционных баз данных. Сегодня термин OLAP используется родовое понятие для различных технологий, включая системы поддержки принятия решений, Business Intelligence и управленческие информационные системы.Основная функция OLAP - управление измерениями, которые применяются для моделирования основных характеристик объекта исследований.Управлять этими измерениями несложно, во-первых, потому что манипулирование выполняется с помощью графического интерфейса. Во-вторых, внесенные изменения переносятся на все задействованные данные, хранящиеся в базе данных OLAP.С помощью OLAP-технологий можно легко создавать и рассматривать "альтернативные отношения". При использовании же электронных таблиц одновременный просмотр всех измерений невозможен. В этом случае, данные, скорее всего, поступали бы в виде иерархии связанных электронных таблиц, причем каждая таблица более высокого уровня консолидировала и суммировала бы информацию таблиц более низкого уровня. Поскольку такие электронные таблицы оказываются несвязанными и не обеспечивают прозрачность всей модели, чрезвычайно сложно модифицировать модель в приемлемые временные сроки. Возможность визуального моделирований иерархий и управления ими, а также отображения различных представлений отношений между элементами измерений является неоспоримым преимуществом OLAP. В данной курсовой работе будет спроектирован OLAP - куб по данным посещения сайта: таблицы "Посетители", "Посещения сайта", "Разделы", "Посещения разделов".Он схематично представлен на рисунке 2.12 Рисунок 2.1 - OLAP - кубОси построенного OLAP - куба имеют названия: "имя пользователя", "Дата и время входа"В результате пересечения размерностей данного OLAP-куба образовалась мера, то есть узловая точка. Этот агрегат называется "Длительность посещения".Данный OLAP-куб был построен по следующим этапам:Работа по построению OLAP куба начинается с построения сводной таблицы. в Microsoft Excel через путь Данные - Сводная таблица.Открывается Мастер сводных диаграмм и таблиц. В ней предложено, по каким данным можно создать таблицу. Выбираем вариант: по внешним источникам данных.Чтобы извлечь данные из внешнего источника с помощью Microsoft Query, нажимаем кнопку "Получить данные". В появившемся окне Выбор источника данных выбираем Базы данных в MS Access.Необходимо выбрать созданную нами базу данных.Появляется окно: Создание запроса: выбор столбцов. В нем имеющиеся созданными нами таблицы переносим в столбцы запроса.Следующие окна по созданию запроса оставляем без изменений (отбор данных, порядок сортировки).Когда мы доходим до окна Создание запроса: заключительный шаг следующим нашим действием будет - Вернуть данные в MS Excel.Таким образом, мы получили данные. Далее в Мастере сводных таблиц и диаграмм выбираем, куда поместить таблицу.В результате из списка полей свободных таблиц перетаскиваем элементы в сводную таблицу. Соответственно в поля строк - "Имя" и "Дата и время входа", а в элементы данных - "Длительность". Также необходимо выбрать окне Вычисление поля сводной таблицы операцию: Сумма для агрегата "Длительность". Далее следует изменить формат ячеек данной меры на "Время".Таким образом, был сформирован OLAP-куб.2. Разработка подсистем анализа веб - сайта с использованием microsoft access и olap - технологий2.1 Разработка базы данных веб-сайта crimusic. info с использованием MS AccessОсновной целью создания базы данных в данной курсовой работе является облегчение поиска информации. База данных изучаемого объекта, то есть веб-сайта crimusic. info содержит сведения о посещении пользователями главной страницы и отдельных разделов. Составление таблиц в соответствии с этапом 1.2 - СУБД Microsoft Access в разработке базы данных объекта исследований. Для начала необходимо составить таблицы, которые должна содержать данная база данных. В этой работе их четыре. Итак, таблица "Посетители" изображена на рисунке 2.1Рисунок 2.1 - Таблица "Посетители"В таблице "Посетители" находятся следующие поля: "Имя", "Код пользователя", "Дата регистрации". Их тип данных следующий: "Имя" - текстовый, "Код пользователя" - счетчик, "Дата регистрации" - дата/время. В данной таблице ключевым полем будет являться "Код пользователя".Таблица "Разделы". Здесь ключевым полем будет являться "Номер раздела". Поля и тип их данных: "Номер раздела" - счетчик, "Имя раздела" - текстовый. (Рисунок 2.2)Рисунок 2.2 - Таблица "Разделы"Следующая таблица имеет название "Посещения сайта" и изображена на рисунке 2.3 Ключевое поле - "Номер". Тип данных полей таблицы: "Код пользователя" - числовой, "Номер" - счетчик, "Дата и время входа" - дата/время, "Дата и время выхода" - дата/время, "IP - адрес" - текстовый.Рисунок 2.3 - Таблица "Посещения сайта"Таблица "Посещения раздела". Ключевое поле - "Номер". В ней 4 поля, которые имеют разные типы полей: "Номер" - счетчик, "Номер посещения" - числовой, "Номер раздела" - числовой и "Время посещения" - дата/время.Рисунок 2.4 - Таблица "Посещения разделов"Определим связи между таблицами.Таблица "Посетители" связана с таблицей "Посещения сайта" следующим ключевым полем - "Код пользователя". Связь между таблицами один ко многим и она изображена на рисунке 2.5Рисунок 2.5 - Связь между таблицами "Посетители" и "Посещения сайта"Таблица "Посещения сайта" связана с таблицей "Посещения разделов" по полю "Номер посещения". Связаны они как один ко многим. (Рисунок 2.6)Рисунок 2.6 - Связь между таблицами "Посещения сайта" и "Посещения разделов"Таблица "Разделы" связана с таблицей "Посещения разделов" отношением один ко многим по полю "Номер раздела". Такая связь изображена на рисунке 2.7Рисунок 2.7 - Связь между таблицами "Посещения разделов" и "Разделы"2.2 Построение OLAP-куба в MS Excel для анализа данныхДля того чтобы построить OLAP - куб, необходимо освоить его основную задачу: получение любых многомерных таблиц за короткое время. Строится он поэтапно.Открываем новый лист в MS Excel и создаем в нем сводную таблицу через путь: Данные - Сводная таблица.В открывшемся окне "Мастер сводных таблиц и диаграмм" выбираем данные для создания таблицы, находящиеся во внешнем источнике данных.Чтобы извлечь данные из внешнего источника с помощью Microsoft Query, нажимаем кнопку "Получить данные" в открывшемся окне.В окне "Выбор источника данных" выбираем "База данных MS Access"Далее следует выбрать базу данных, созданную ранее в Microsoft Access.В вновь появившемся окне "Создание запроса: выбор столбцов" переносим из имеющихся таблиц и столбцов таблицы "Посетители", "Посещения разделов", "Посещения сайта", "Разделы" в столбцы запроса.В окнах "Создание запроса: отбор данных" и "Создание запроса: порядок сортировки" ничего не изменяем.В появившемся окне "Создание запроса: заключительный" следующим действием будет "Вернуть данные в Microsoft Excel".Таким образом, мы получили данные для составления сводной таблицы.В появившемся окне выбираем местоположение таблицы.Необходимо заполнить эту таблицу следующим образом: из списка полей сводной таблицы перетаскиваем поле "Имя" в поле столбцов и "Дата и время входа" в поле строк. Это будут оси нашего OLAP-куба.Далее в элементы данных перетаскиваем поле "Длительность", которое будет являться мерой.В результате, изменив формат ячеек агрегата, мы получаем OLAP-куб, отражающий длительность посещения пользователя со времени его входа на веб-сайт:2.3 Анализ данных с использованием OLAP-технологииВ данной курсовой работе были сформирован ряд запросов с использованием OLAP-технологий в Microsoft Excel. В соответствии с построенным OLAP-кубом в пункте 2.2 данной работы создаем запросы.1. Запрос по конкретному посетителю. В результате такого запроса можно узнать, когда и как долго был конкретный посетитель на веб-сайте crimusic. info. Кроме того, можно узнать общий итог его посещения за определенный период времени.Запрос изображен на рисунке 2.8Рисунок 2.8 - Запрос по конкретному посетителюДругими словами, пользователь "baster" посетил веб-сайт crimusic. info 7 раз и общая длительность посещения составила 6 часов 14 минут и 31 секунды.2. Запрос по конкретной дате. По итогам этого запроса видно, кто посещал сайт и какова длительность его посещения на определенную дату. (Рисунок 2.9)Рисунок 2.9 - Запрос по конкретной датеТаким образом, делаем вывод, что 1 января 2007 года в 11 вечера и 23 минуты заходил только один пользователь - "closer", который находился там 1 час 25 минут и 53 секунды.3. Запрос по средней продолжительности пользователей на сайте. Запрос создается через вычисление поля свободной таблицы. (Рисунок 2.10)Рисунок 2.10 - Запрос на среднюю продолжительностьВ результате формирования запроса видно, какова средняя продолжительность каждого пользователя и средняя продолжительность посещения в отдельные дни пользователями.4. Запрос по минимальной длительности конкретным пользователем. В результате такого запроса, который изображен на рисунке 2.11 можно узнать, сколько раз и когда пользователь посещал сайт, а по итогам вывести его минимальную длительность посещения портала.Рисунок 2.11 - Запрос на минимальную длительность посещения конкретным пользователемТаким образом, делаем вывод, что минимальная длительность посещения пользователя "closer" 1 час 25 минут и 53 секунды.5. Запрос на дату минимального посещения пользователем. Из этого запроса мы можем узнать, какой именно пользователь имеет минимальную продолжительность на определенную дату. (Рисунок 2.12)Рисунок 2.12 - Запрос на определение пользователя, с минимальным посещением по конкретной датеПо итогам этого запроса находим, что на 14 января 2007 года наименьшую продолжительность посещения веб-сайта crimusic. info имеет пользователь "long".ЗаключениеНа основе проведенных научных исследований были сделаны следующие выводы:была разработана база данных в Microsoft Access в информационной системе анализа динамики посетителей веб-сайта crimusic. info;был проведен анализ данных с использованием OLAP - технологии;Библиографический список1. Барсегян А.А. Методы и модели анализа данных: OLAP и Data Mining / А.А. Барсегян, М.С. Куприянов, В.В. Степаненко, И.И. Холод. - СПб.: БХВ-Петербург, 2004. - 336 с. 2. Бергер А. Microsoft SQL Server 2005 Analysis Services. OLAP и многомерный анализ данных / А. Бергер. - СПб: БХВ-Петербург, 2007. - 928 с. 3. Киселев М. Средства добычи знаний в бизнесе и финансах / М. Киселев, Е. Соломатин // Открытые системы. - 1997. - № 4. - С.41-44. 4. Коннолли Т. Базы данных: проектирование, реализация, сопровождение. Теория и практика / Т. Коннолли, К. Бегг. - М.: Изд-во "Вильямс", 2003. - 1436 с. 5. Коровкин С.Д. Решение проблемы комплексного оперативного анализа информации хранилищ данных / С.Д. Коровкин, И.А. Левенец, И.Д. Ратманова, В.А. Старых, Л.В. Щавелёв // СУБД. - 1997. - № 5-6. - С.47 - 51. 6. Кречетов Н. Продукты для интеллектуального анализа данных / Н. Кречетов // Рынок программных средств. - 1997. - № 14-15. - С.32-39. 7. Пржиялковский В.В. Сложный анализ данных большого объема: новые перспективы компьютеризации / В.В. Пржиялковский // СУБД. - 1996. - № 4. - С.71 - 83. 8. Раден Н. Данные, данные и только данные / Н. Раден // ComputerWeek-Москва. - 1996. - № 8. - С.28. 9. Рудикова Л.В. Microsoft Office Access 2007/Л.В. Рудикова, И.А. Харитонова. - М: BHV, 2008. - 1280 с. 10. Сахаров А.А. Концепция построения и реализации информационных систем, ориентированных на анализ данных / А.А. Сахаров // СУБД. - 1996. - № 4. - С.55 - 70. 11. Сахаров А.А. Принципы проектирования и использования многомерных баз данных (на примере Oracle Express Server) / А.А. Сахаров // СУБД. - 1996. - № 3. - С.44 - 59. 12. Туо Дж. Инструменты для анализа информации на настольных ПК / Дж. Туо // ComputerWeek-Москва. - 1996. - № 38. - С 34-46. 13. Туо Дж. Каждому пользователю - свое представление данных / Дж. Туо // ComputerWeek-Москва. - 1996. - № 38. - С.32-33. 14. Федоров А. Введение в OLAP-технологии Microsoft / А. Федоров, Н. Елманова. - М.: Диалог-МИФИ, 2002. - 268 с. 15. http://www.olapreport.com 16. http://www.olap.ru 17. http://www.crimusic. info |
РЕКЛАМА
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
БОЛЬШАЯ ЛЕНИНГРАДСКАЯ БИБЛИОТЕКА | ||
© 2010 |