Семантическая модель языковых объектов для автоматизации процесса…
3
мантической целостности) как фрагменты нормативной базы (НБ),
так и языковые конструкции текстов ТД на ПО. В результате после-
дующей машинной обработки полученных результатов может быть
сформирован НП требований к объекту сертификации.
Постановка задачи.
Исходными данными для формирования
обобщенной модели текстов НБ и ТД для сертификации систем с ин-
тенсивным использованием ПО служат представительный набор тек-
стов документов из подмножества профилеобразующей базы, непо-
средственно относящейся к данной предметной области, а также
полный комплект ТД к сертифицируемому программному продукту.
Создаваемая модель должна в автоматическом режиме декомпози-
ровать анализируемый текст до простых предложений; находить среди
членов простых предложений анализируемого текста подлежащие; пу-
тем обращения к терминосистеме выделять среди найденных подле-
жащих ключевые слова и формировать в пределах анализируемого
фрагмента текста набор ключевых слов (НКС); формировать «смысло-
вые вехи» (компрессия текста) путем отыскания в анализируемом тек-
сте сказуемых и связанных с ними ключевых слов; путем сравнения
соответствующих «смысловых вех» установить наличие ядер семан-
тической целостности (ЯСЦ) в анализируемых текстах НБ и ТД; фор-
мировать запрос к СА в случае невозможности определения ЯСЦ.
Результатом работы модели является набор ЯСЦ с указанием их
позиций в анализируемых текстах.
Синтаксический анализ НБ программной инженерии и ТД на
ПО.
Проведенный синтаксический анализ текстов показал, что син-
таксические структуры предложений в текстах стандартов и ТД в
большинстве случаев однотипны. Так, был проанализирован стан-
дарт «МЭК 60880. Атомные электростанции. Системы контроля и
управления, важные для безопасности. Аспекты программного обес-
печения компьютерных систем, выполняющих функции категории
А». В основных разделах этого стандарта имеется 513 предложений
(вводная часть и приложения не рассматривались), из которых 294
являются простыми предложениями, 220 — сложными, в том числе к
сложным предложениям были отнесены и перечисления, которых в
тексте стандарта было 59.
Простые предложения могут быть усложнены причастными и дее-
причастными оборотами, которые модифицируют значение того члена
предложения, к которому они относятся. Сложносочиненные предло-
жения встречаются реже, чем сложноподчиненные. Поскольку сложно-
сочиненное предложение состоит из двух простых предложений и бо-
лее, то их разбор идентичен разбору простых предложений [9].