Методи організації високоефективних спеціалізованих сховищ даних науково-освітнього призначення на основі кластерних обчислювальних технологій

Розроблено ряд підходів та методів до створення сховищ даних науково-освітнього призначення орієнтованих, на відміну від більшості аналогів, на задачі аналізу неструктурованих масивів даних, а не на задачі документообігу. Зокрема запропоновано метод архітектурної організації сховищ спрямованих на семантичну та розвинену аналітичну обробку даних. Розроблено способи підтримки надвеликих сховищ текстових даних, які базуються на використанні кластерних обчислювальних технологій. Створено методи організації засобів аналітичної обробки інформації у надвеликих сховищах текстомістких даних, зокрема для автоматичного реферування, класифікації, кластеризації науково-освітньої інформації. Створено способи виявлення та аналізу структури текстомістких інформаційних об’єктів, орієнтовані перш за все на неструктуровані та частково структуровані дані. Розроблено способи встановлення асоціативних зв’язків між елементами даних інформаційних об’єктів. Розроблено метод оцінки оригінальності текстомістких науково-освітніх інформаційних об’єктів та ресурсів. Створений спосіб візуалізації вмісту сховищ даних переважно текстового типу на основі представлення даних у вигляді графу. Розроблені способи та методи практично реалізовані у дослідному прототипі сховища гетерогенних даних. Таким чином у роботі була запропонована наукова база для реалізації нового типу кластерно-орієнтованих сховищ переважно неструктурованих або частково структурованих даних, які призначені для застосування у науково-освітній галузі. Також запропоновані методи дозволяють створювати засоби, спрямовані на автоматизацію структурування, каталогізації, семантично-орієнтованого пошуку науково-освітніх даних.

ДолученняРозмір
Іконка документу Microsoft Office 2300-f.doc259.5 КБ