Разработка специализированной базы знаний для рекурсивного анализатора слабо связанной естественно-языковой текстовой информации Web-приложений.
База знаний по обработке и структуризации естественно - языковой информации, которую осуществляет рекурсивный синтаксический анализатор, строится на основе новой формальной модели структурного уровня организации языкового материала, который предусматривает рекурсивную схему организации, где четко определен элемент рекурсии - базовая семантико-синтаксична структура, которая описывается расширенной моделью.
Для большей полноты этого описания используются наборы метаданных, которые создают многомерные метаиндексы, которые описывают не только сами языковые объекты, но и содержательные фрагменты текстовых структурных единиц, которые и создают дополнительные классификационные индексы метаданных, и на их основе формируют фактически базу знаний. Это позволяет проводить параллельную обработку фрагментов текста рекурсивным синтаксическим анализатором, повысить скорость обработки текстов естественно - языковой информации и унифицировать процессы их обработки.
Проектирование классификаторов базы знаний и разработка соответствующего пакета запросов для поиска всех объектов (текстов) или их фрагментов, которые относятся к понятию или ситуации (рубрике) классификатора, обеспечивают возможность полной автоматизации сбора и рубрикации информации из внутренних источников.
Таким образом, предлагается решение проблемы автоматизации формирования ограниченного количества структурных моделей за счет значительного сокращения структур представления естественно- языковой информации, а также за счет замещения структурного анализа - анализом параметрических моделей на основе метаданных. Это значительно упрощает синтаксический анализ и предоставляет возможность оперативной поддержки в реальном времени систематизированных баз данных и знаний, последующего языкового синтеза.