Методы организации высокоэффективных специализированных хранилищ данных научно-образовательного назначения на основе кластерных вычислительных технологий
Разработано ряд подходов и методов к созданию хранилищ данных научно-образовательного назначения, ориентированных, в отличие от большинства аналогов, на задачи анализа неструктурированных массивов данных, а не на задачи документооборота. Предложен метод архитектурной организации хранилищ, направленных на семантическую и развитую аналитическую обработку данных. Разработаны способы поддержки сверхбольших хранилищ текстовых данных, которые базируются на использовании кластерных вычислительных технологий. Созданы методы организации средств аналитической обработки информации в сверхбольших хранилищах текстосодержащих данных, в частности, для автоматического реферирования, классификации, кластеризации научно-образовательной информации. Созданы способы выявления и анализа структуры текстосодержащих информационных объектов, ориентированные в первую очередь на неструктурированные и частично структурированные данные. Разработаны способы установления ассоциативных связей между элементами данных информационных объектов. Разработан метод оценки оригинальности текстосодержащих научно-образовательных информационных объектов и ресурсов. Создан способ визуализации содержимого хранилищ данных преимущественно текстового типа на основе представления данных в виде графа. Разработанные способы и методы реализованы на практике в виде исследовательского прототипа хранилища гетерогенных данных. Таким образов в работе была предложена научная база для реализации нового типа кластерно-ориентированных хранилищ преимущественно неструктурированных или частично структурированных данных, которые предназначены для применения в научно-образовательной сфере. Также предложенные методы позволяют создавать средства, направленные на автоматизацию структурирования, каталогизации, семантически-ориентированного поиска научно-образовательных данных.
Вложение | Размер |
---|---|
2300-f.doc | 259.5 КБ |