|
||||||||||||
|
||||||||||||
|
|||||||||
МЕНЮ
|
БОЛЬШАЯ ЛЕНИНГРАДСКАЯ БИБЛИОТЕКА - РЕФЕРАТЫ - Разработка и отладка формального языкаРазработка и отладка формального языкаВведение В современном программировании большой популярностью пользуются языки высокого уровня. Это вызвано тем, что программировать на этих языках существенно проще и программы, написанные с их помощью нагляднее, чем эквивалентные им программы, выполненные на языках низкого уровня. Именно поэтому в данной работе необходимо разработать свой небольшой язык и осуществить его подготовку к написанию компилятора к данному языку. Этот язык должен показать некоторые возможности современных языков программирования и позволить разработчику данного языка укрепить знания, полученные ранее и более глубоко изучить предмет «Теория трансляции». Для этого необходимо выполнить задание, описанное выше с учетом предъявляемых технических требований к разрабатываемому языку. Данная курсовая работа имеет большое учебное значение, так как в настоящее время всё больше внимания уделяют языкам программирования высокого уровня, потому что писать программы на них намного проще (программы стали большими) и удобнее. В будущем эти знания могут пригодиться нам в разработке собственных языков или участвовать в разработке мощного языка высокого уровня. Именно поэтому большое практическое значение имеет разработка собственного языка, пусть не слишком мощного, но высокоуровневого, на котором будут видны все возможности языков современных. Чтобы создать подобный язык в рамках данной курсовой работы необходимо в соответствии с требованиями к языку разработать грамматику, в которой будет описан синтаксис языка, а затем отладить её с помощью методов простого и параллельного предшествований. Для метода параллельного предшествования необходимо разработать алгоритм машинного представления метода; затем провести лексический анализ, построить автоматные грамматики выделения лексем и схему сканера, описать принцип его работы. Назначение и область применения Разработка языка C++ несет исключительно обучающую цель и производится с целью углубить и расширить познания автора в дисциплине «Теория трансляций», а также в приобретении навыков разработке учебного языка и проведения работы, подготавливающей язык к построению транслятора. Разрабатываемый язык позволяет мне, систематизировать и укрепить знания, полученные в прошлом и подготовиться к дальнейшему углублению их. Именно поэтому данный язык является учебным и не имеет практической области применения. Технические характеристики Постановка задачи на разработку Перечень требований к разрабатываемому языку программирования: Процедура Sub. Оператор объявления констант. Описание типа переменных с помощью суффикса: Sin 99gle, Integer. Массивы фиксированного размера с макс. размерностью 2 Операторы ввода / вывода MsgBox, InputBox. Арифметические операции: + \ ^. Логические операции: Not, And, Or. Операции сравнения. Условный оператор типа If…Then Оператор цикла типа For… Next. Оператор присваивания. Оператор безусловного перехода. Функции: конкатенация строк, Cbool, Format, GetAllSettings. Элементы управления: TextBox, CommandButton, CheckBox, PictureBox. Описание применяемых математических методов Введём несколько определений: Определение 1. Контекстно-свободной грамматикой G называется четверка упорядоченных множеств: G = {Vт, Vn, P, S}, где Vт - словарь терминальных символов грамматики; Vn - словарь нетерминальных символов грамматики; P - множество правил грамматики: P = (A, ?) S - начальный символ грамматики (S?Vт); V* - множество строк, составленных из символов полного словаря V (V=Vт ? Vn); V* = ? п - пустая цепочка. Определение 2. Цепочка ?o порождает нетривиальным образом цепочку ?o (записывают ?o=>+W), если существует последовательность непосредственных выводов: ?o =>?1 =>… ?n, n>=1. Определение 3. Цепочка ? порождает цепочку Q (записывают ?=>*Q), если ?=>+Q, или ?=Q. Определение 4. Цепочка называется сентенциальной формой грамматики G, если она выводится из начального символа грамматики, т.е. если S->*?. Определение 5. Предложение языка - это сентенциальная форма, состоящая только из терминальных символов. Определение 6. Язык L(G) - это множество предложений L(G) = S->+? ? ??Vт*. Определение 7. Символы A, B контекстно-свободной грамматики связаны отношением FIRST, если выполняется условие A->B?, где A?Vn, B?V, ??V*. Определение 8. Символы A и B грамматики связаны отношением.=., если в грамматике имеется правило вида: W??AВ?. Определение 9. Отношение >. Между символами A и B грамматики находится из правила: (>.)=(LAST+)T (.=.). Определение 10. Отношение <. Между символами A и B грамматики находится из правила: (<.)=(.=.) (FIRST+). Разработка грамматики по неформальному описанию языка В соответствии с техническим заданием на разработку языка напишем грамматику, листинг которой приведен в Приложении 1. Чтобы проверить ее корректность составим контрольный пример: Sub D11 () Dim A As Integer, B% As Integer Const D As Single Dim M (2) As Integer A = (B*2 + 9)^10 If ((IsNumeric (A) <>0 and A>0) Then MsgBox («A is number», vbOkOnly) EndI Text. Text = A End Sub Дерево к данному примеру приведено на листе А1. Разработка сканера Лексический анализ проводится сканером (лексическим анализатором). Сканер выделяет простейшие языковые конструкции (лексемы) и классифицирует их тип. Сканер работает с таблицами, которые являються базой данных сканера. Таблицы делятся на постоянные и временные. Постоянные таблицы создаются разработчиком сканера и включают в себя: ТТС1 - таблица терминальных символов (однолитерных). ТТС2 - таблица терминальных символов (двулитерных). ТКС - таблица ключевых слов. Временные таблицы создаются в процессе работы сканера и зависят от исходного модуля (программы, проверяемой сканером). Временные таблицы включают в себя: ТИ - таблица идентификаторов. ТК - таблица констант. ТФ - таблица функций. ТСС - таблица стандартных символов. ТСС является результатом работы сканера. Это взаимно-однозначное отображение исходного модуля. Формальное определение лексем. Лексические единицы: арифметические операции: «+», «/», «^». операции сравнения: «>», «<», «=», «>=», «<=», «<>» операция присваивания: «=» скобка открывающая «(« скобка закрывающая «)» служебные слова: «Dim», «As», «Private», «Public», «Sub», «End», «goto», «Optional», «MsgBox», «InputBox». условный оператор: «If», «Then» оператор цикла: «For», «Next» типы данных: «Single», «Byte»,» Date», «Integer», «Boolean», «String», «Variant», «Object». элементы управления: «TextBox», «ComandButton», «CheckBox», «PictureBox» свойства элементов управления: «Caption», «Text», «With», «Height», «Visible» специальные константы: «VbOkOnly», «VbOkCansel», «VbAbortRetryIgnore», «VbCritical» логические функции: «Not», «And», «Or» функции: «Format», «CBool», «GetAllSettings». нижнее подчеркивание: «_» точка: «.» кавычки: «@» десятичные целые константы идентификатор Разрабатываем структуры данных, которые будут использоваться сканером. Таблица 1. Однолитерные терминальные символы TTC1:
Таблица 2. Двулитерные терминальные символы
Таблица 3. Классы текущих литер
Таблица 4. Функции
Таблица 5. Тип лексической единицы
Для каждой лексической единицы составляем автоматную грамматику. Идентификатор: S = бK K = бK|цК|%F |#F Десятичная целая константа: S = «ц» D D = «ц» D | e2 F Степень: S = «^» F Деление: S = «\» F Cложение: S = «+» F Знаки отношения: S = «<» A | «>» B | «=» F A = «=» D |«>«D| e3 F B = «=» D | e4 F D = e5 F Скобка открывающая «(»: S = «(«F Скобка закрывающая»)»: S = «)» F Операция «=»: S = «=» F Точка «.»: S = «.» F Нижнее подчеркивание «_»: S = «_» F Функции, служебные слова, специальные константы, логические функции, элементы управления, события, свойства элементов управления, псевдоним функций резервируем, поэтому для них автоматной грамматики не строим. Схема обобщенного конечного автомата Сканер выполняет следующие действия: 1. Выделяет лексические единицы. 2. Классифицирует лексические единицы. 3. Определяет лексические ошибки; 4. Создает некоторые внутренние формы представления - таблицы стандартных символов (ТСС). Построим обобщенный автомат для всего сканера (схема сканера). Для этого объединим начальные символы описания всех лексем в стартовую вершину. Схема сканера приведена нa Рис. 12. В данном сканере использованы следующие сокращения: A - входная цепочка; NA - количество символов входной цепочки; TL - текущая литера; NTL - номер текущей литеры; KTL - класс текущей литеры; TLE - тип лексической единицы; LE - лексическая единица; MDLE - максимальная длина лексической единицы; NLE - текущая длинна LE; ALE - компонента записи ТСС, которая определяет адрес лексической единицы в соответствующей таблице. На рис. 12 изображена схема сканера Рис. 12. Схема сканера Семантические подпрограммы сканера Конечный автомат необходимо доопределить семантическими подпрограммами для того, чтобы он был преобразован в сканер. В основе работы семантических подпрограмм лежат простейшие действия по преобразованию строк: 1) выделение текущей литеры; 2) объединение строк; 3) выполнение арифметических операций. В данном сканере задействованы следующие подпрограммы: Подпрограмма PODGOT (подготовка): NTL = 0; NLE = 0; TLE = A[NTL]; KTL = KLASS(TL); {определяем класс TL} STRCOPY (LE, "»); Подпрограмма TIP (определение типа): IF KTL = 2 {цифра} THEN {можно определить тип лексической единицы} TLE = 2; MDLE = 7; ELSE ERROR («ошибка»); Подпрограмма BKL (включение): NLE++; IF NLE>MDLE THEN ERROR («ошибка») ELSE LE = LE || TL; Подпрограмма SLL (следующая литера) NTL++; TL=A [NTL]; KTL = klass (TL); Подпрограмма ZAPTAB (LE, TLE, ALE, REZ): Осуществляет поиск лексической единицы в ТК. Для постоянных таблиц эта подпрограмма только определяет адрес LE, однако, во временные таблицы она еще и записывает лексическую единицу. Запись элемента в ТСС можно осуществить с помощью процедуры OUT (TLE, ALE). Таблицы сканера для тестовой цепочки Private Sub D11 () Dim A As Integer, B% As Integer Const D As Single Dim M (2) As Integer A = (B/2 + 9)^10 If ((IsNumeric (A) <>0 and A>0) Then MsgBox («A is number», vbOkOnly) EndIf Text. Text = A End Sub Таблица 6. Константы
Таблица 7. Идентификаторы
Таблица 8. Стандартные символы
Отладка формальной грамматики Отладка грамматики - это процесс преобразования грамматики к виду, удовлетворяющему используемый метод синтаксического анализа. В исходной грамматике 42 конфликта. Среди них встречаются конфликты трех типов: Конфликты типа =<
Рис. 13. Конфликт типа =< Для того, чтобы показать как отладить этот конфликт, рассмотрим его на примере: Из рисунка 3.13 видно, что между терминальным символом «(» и нетерминальным uslovie конфликт типа =<. Чтобы его отладить необходимо опустить нетерминал uslovie вниз по дереву. Таким образом, между символами «(» и uslovie осталось только отношение <. Все остальные конфликты этого типа разрешаются аналогично. Конфликт типа => Чтобы показать как разрешаются конфликты этого типа, разрешим конфликт между символами Вody и Еnd. Этот конфликт изображен на рисунке 15.
Рис. 15. Конфликт типа => Синтаксический анализ В процессе синтаксического анализа требуется для нескольких предложений входного языка построить синтаксическое дерево, провести синтаксический разбор методом простого предшествования. Задачи синтаксического анализатора: 1) выделение синтаксических единиц; 2) определение всех синтаксических ошибок (если они есть); 3) преобразование таблицы стандартных символов (ТСС) в некоторую внутреннюю форму представления программы(ВФПП). Схема программы синтаксического анализатора Схема программы синтаксического анализа методом простого предшествования приведена в графическом приложении (лист1). Принятые обозначения: X - массив символов анализируемой цепочки; MP - матрица простого предшествованя; P - множество правил грамматики, которые описывают язык; ST - стек для определения хвоста основы; ST1 - стек для определения головы основы; TL - текущая литера; NTL - номер текущей литеры; OSN - массив, в котором будет накапливаться основа; NOSN - количество символов в массиве OSN (текущее количество символов в основе); A->?, где ? - правая часть правила, которая совпадает с массивом OSN, A - левая часть правила, на которую заменяется основа; REZ - результат. Чтобы выделить основу необходимо сначала найти конец основы, а затем ее начало, после чего выделяется основа (блоки J2 - O8). Если после выделения строки OSN находится правило, у которого правая часть правила совпадает с OSN то, переменной REZ присваивается 1, если такого правила нет - ошибка, синтаксический анализ может быть прекращен или нужно исправить ошибку (блок R8). Операции выполняемые над строковыми переменными: st.push(i) - поместить элемент i в стек; st.pop() - удалить элемент из стека; st.top() - получить доступ к вершине стека; st.nst() - определить количество элементов в стеке. Работа данного алгоритма представлена в таблице синтаксического анализа в графическом приложении (лист1). Заключение В процессе выполнения курсовой работы были разработаны синтаксический и лексический анализаторы, семантические процедуры для сканера, а также был разработан алгоритм реализующий синтаксический анализ методом простого предшествования. В целом язык оправдал надежды, возложенные на него в начале работы, и получился довольно стройным и гибким. |
РЕКЛАМА
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
БОЛЬШАЯ ЛЕНИНГРАДСКАЯ БИБЛИОТЕКА | ||
© 2010 |