Проекты и грантыФинансируемые проекты 2009 года

Разработка технологии хранения и обработки квазиструктурированных данных

Руководитель проекта — к.т.н., доцент И.В. Влацкая


За время развития компьютерной техники понятие "документ" изменилось кардинальным образом. В процессе эволюции структура документа становится все сложнее и разнообразнее. Это приводит к усложнению процессов работы с документами.

При анализе документов одного вида можно выделить общую модель данных документа, но оформление, порядок следования информации будет различен. В этом случае мы имеем дело с квазиструктурированной информацией. Под квазиструктурированной информацией будем понимать информацию, в которой можно выделить некую структуру, однако структура эта заранее целиком или частично неизвестна, либо может меняться с течением времени. При поступлении однотипных документов от различных источников (предприятий) информационное содержимое документов идентично, но оформление и даже формат данных могут кардинально отличаться. Например: гидродинамические исследования нефтяных и газовых скважин производятся несколькими различными организациями. Отчет о выполненных исследованиях по предприятиям формируется как в MS Word, так и в MS Excel. Оформление и порядок следования информации в документах различен, хотя информационное наполнение документов идентично. Анализировать такие документы — затруднительная и порой невыполнимая задача.

Настоящее исследование направлено на разработку методов оптимального проектирования автоматизированных систем обработки электронных документов с квазиструктурированным информационным наполнением.

В зависимости от характера обрабатываемых информационных ресурсов, автоматизированные информационные системы подразделяются на два основных класса — документальные и фактографические. Перспективной является разработка автоматизированной системы, совмещающей в себе преимущества документальных и фактографических систем. Такая необходимость обусловлена отсутствием жесткой связи между документом и извлеченными из него данными. При обработке документа извлеченные из него данные сохраняются в специально разработанной модели данных, и связь с документом-первоисточником ослабевает или пропадает совсем. Информация, извлекаемая из документа, как правило, представляет собой квазиструктурированные данные.

Разработка и поддержание технической документации в актуальном состоянии вызывают множество проблем, связанных, как правило, с необходимостью многократного внесения корректировок в документацию, состоящую из множества отдельных файлов. Ручная корректировка большого числа документов является трудоемкой и часто приводит к появлению неточностей и ошибок в документации. Задача усложняется тем, что формирование и модификацию документации осуществляет, как правило, группа сотрудников. Решение этих проблем обеспечит система автоматизации разработки технической документации.

Применение этой системы позволит:

  • повысить качество технической документации;
  • сократить сроки ее разработки;
  • снизить трудоемкость поддержания комплекта документов в актуальном состоянии.

Использование новых технологий в процессах работы с электронными документами позволяет получить ряд преимуществ: контроль корректности передаваемых данных, поддержку квазиструктурированной модели информации и поддержку концепции единого источника.

Анализ современных средств обработки электронных документов позволил сформировать пространство критериев для оценки этих средств. На основании проведенного анализа были выделены основные характеристики проектируемой системы:

  • обеспечение безопасности персональных данных,
  • кросс-платформенность,
  • возможность коллективной работы с документом,
  • поддержка открытых форматов данных;
  • обеспечение восстанавливаемости данных.

При составлении критериев необходимо охватить наиболее широкий спектр возможностей программного обеспечения в данной области. Пространство критериев имеет иерархическую структуру. Большинство критериев было разбито на подкритерии. Было предложено 12 критериев, для которых разработана некоторая шкала оценок. На основе системы критериев была проведена оценка наиболее используемых средств обработки документов. Был проведен анализ существующих моделей хранения квазиструктурированной информации.

Всё это позволило сформировать план проведения теоретических и экспериментальных исследований.

В результате проведенного исследования были получены следующие результаты:

  • проведен аналитический обзор литературных источников;
  • выбран обоснованный вариант направления исследований;
  • разработан план проведения экспериментальных и теоретических исследований;
  • проведен анализ существующих моделей хранения квазиструктурированной информации;
  • проведен анализ современных средств формирования электронных документов по моделям их информационного наполнения с целью выбора оптимального средства формирования электронных документов;
  • проведена классификация документов по структуре информационного наполнения на основе функционально-структурного подхода.
Последнее обновление: 09.04.2010
Ответственный за информацию: Лисицкий Иван Иванович, помощник проректора по научной работе (тел.91-22-07)

Для того, чтобы мы могли качественно предоставить вам услуги, мы используем cookies, которые сохраняются на вашем компьютере (сведения о местоположении; ip-адрес; тип, язык, версия ОС и браузера; тип устройства и разрешение его экрана; источник, откуда пришел на сайт пользователь; какие страницы открывает и на какие кнопки нажимает пользователь; эта же информация используется для обработки статистических данных использования сайта посредством аналитической системы «Спутник» и интернет-сервиса Яндекс.Метрика). Нажимая кнопку «Согласен», вы подтверждаете то, что вы проинформированы об использовании cookies на нашем сайте. Отключить cookies вы можете в настройках своего браузера.

424242
Почтовый адрес:

460018, г. Оренбург,

просп. Победы, д. 13

Телефон:

+7 (35-32) 77-67-70

Горячая линия Минобрнауки России:

- по обеспечению правовой и социальной защиты обучающихся: 8 800 222-55-71 (доб. 1)

- по психологической помощи студенческой молодежи: 8 800 222-55-71 (доб. 2)

       

Официальный сайт федерального государственного бюджетного образовательного учреждения высшего образования «Оренбургский государственный университет».

Соглашение об использовании сайтаПолитика обработки персональных данных веб-сайтов ОГУ

© ОГУ, 1999–2024. При использовании материалов сайта гиперссылка обязательна!