XLog - язык обработки HTML- и XML-документов - page 1

ХLog – язык обработки HTML- и XML-документов
1
УДК 004.432.4
ХLog – язык обработки HTML- и XML-документов
© С.С. Магазов, Д.О. Чугунов
МГТУ им. Н.Э. Баумана, Москва, 105005, Россия
Дано описание основных идей декларативного языка XLog, предназначенного для
разработки систем интеллектуальной обработки Internet-информации. Приведе-
ны синтаксис и семантика основных конструкций языка, краткое описание архи-
тектуры интерпретатора, а также примеры.
Ключевые слова:
декларативный язык, XML/HTML-документ, обработка тек-
стов, Internet, интерпретатор.
Введение.
Аналитики Cisco прогнозируют, что к 2015 г. Internet-
трафик документов в формате HTML достигнет 245 терабайт в се-
кунду. Постепенно складываются новые реалии в Internet-сообществе
и появляются совершенно новые требования к обработке информа-
ции. IT-компании все больше уделяют внимание разработке интел-
лектуальных систем обработки информации. На рынке появляются
технологии, ориентированные на разработку таких систем. На насто-
ящий момент разработаны языки XPath, XQuery, XSLT [1, 2].
Язык XPath предназначен для навигации по XML-документам.
Язык XQuery, используя конструкции XPath, позволяет организовы-
вать алгоритмы обработки XML-документов [3], а язык XSLT – пре-
образовывать XML-документы в формат HTML.
Разработчики языка ХLog ставили перед собой цель создания де-
кларативного языка для анализа и синтеза XML- и HTML-документов.
Под анализом понимается извлечение частей XML/HTML-документа и
их лингвистическая обработка. Под синтезом понимается преобразо-
вание и структурирование текстовой информации в виде XML/HTML-
документа.
ХLog предназначен для разработки интеллектуальных систем об-
работки XLog-документов, которые являются расширением формата
XML/HTML, в нем допускается использование переменных. Синтак-
сис языка ХLog похож на синтаксис языка PROLOG, тело программы
состоит из разделов: правила и цель. Но есть и существенные разли-
чия, например, разработан оригинальный механизм унификации
XLog-документов. Для анализа и синтеза XML/HTML-документов
адаптированы механизмы возврата и рекурсии. Синтаксис функций и
операторов стал более лаконичным. В ХLog включены адаптирован-
ные конструкции языков XPath, XQuery и XSLT. ХLog имеет меха-
низмы интеграции с web-серверами и базами данных (БД). В статье
сформулированы основные идеи языка XLog и дается краткий обзор
конструкций языка.
1 2,3,4,5,6,7,8,9,10,11,...14
Powered by FlippingBook