Назначение, задачи и особенности применения технологии оперативного анализа данных в АС АДППР “Аналитика 2000”
Реферат, 03 Декабря 2012, автор: пользователь скрыл имя
Описание работы
Основные цели создания ПК «Аналитика» заключаются в:
сокращении времени и трудозатрат, необходимых для получения оперативной агрегированной информации;
повышении производительности труда сотрудников УТСиА
улучшении качества аналитических данных, выдаваемых, по запросам вышестоящих организаций;
предоставлении возможности руководителям высшего и
среднего звена, а также аналитикам ориентироваться в огромных
объемах данных и выбирать информацию, необходимую для принятия решений;
обеспечении возможности графического представления
данных, а также получения отчетов сводной информации.
Работа содержит 1 файл
Реферат Аналитика 2000.doc
— 172.50 Кб (Скачать)
Реферат
по дисциплине
“Информационные таможенные технологии”
тема
“Назначение, задачи и особенности применения технологии оперативного анализа данных в АС АДППР “Аналитика 2000””
Содержание
Введение
Основные цели создания ПК «Аналитика» заключаются в:
- сокращении времени и трудозатрат, необходимых для получения оперативной агрегированной информации;
- повышении производительности труда сотрудников УТСиА
- улучшении качества аналитических данных, выдаваемых, по запросам вышестоящих организаций;
- предоставлении возможности руководителям высшего и
среднего звена, а также аналитикам ориентироваться в огромных
объемах данных и выбирать информацию, необходимую для принятия решений; - обеспечении возможности графического представления
данных, а также получения отчетов сводной информации.
Таможенный процесс, реализуемый с помощью ПК “Аналитика”, относится к аналитической части деятельности центрального аппарата ГТК России в области использования информации таможенной статистики внешней торговли России на федеральном уровне.
Исходной информацией
для решения аналитических
Результатом работы конечного пользователя (аналитика) являются различные (произвольные в рамках определенных размерностей) табличные формы и их графические представления.
ПК «Аналитика» связан с другими комплексами, входящими в технологическую схему сбора и обработки информации ЕАИС ГТК России, единством используемых данных ЦБД ГТД и связанных с ней данных нормативно-справочной информации. ЦБД ГТД, сформированная программным комплексом загрузки и ведения ЦБД ГТД ЕАИС ГТК России, является источником данных для программного комплекса «Аналитика».
Программный комплекс «Аналитика» позволяет формировать и исполнять нерегламентированные («гибкие») запросы к базе агрегированных данных ГТД в среде СУБД Oracle и Oracle Express и относится к классу систем динамического анализа данных .
структура комплекса
Программный комплекс «Аналитика» имеет структуру, приведенную на рис.1.
Служебные подсистемы программного комплекса «Аналитика» обеспечивают работу функциональной подсистемы. К служебным относятся:
- подсистема администрирования — обеспечивает выполнение
операций по разграничению доступа к ЦБД ГТД и базам агрегированных данных, по настройке сессии для осуществления взаимодействия с ЦБД ГТД, по определению параметров физического размещения файлов агрегированных данных; - подсистема загрузки — обеспечивает выполнение операций
по загрузке данных, подлежащих анализу из ЦБД ГТД (Хранили
ща Данных1), в базы агрегированных данных (Витрины Данных2).
Подсистема загрузки состоит из:
— задачи загрузки технологической БД — обеспечивает формирование промежуточной, технологической БД, используемой как источник данных для последующей загрузки агрегированных баз данных;
— задач загрузки баз агрегированных данных (БАД)- обеспечивает загрузку целевой базы данных Витрин Данных - в реляционном (задача загрузки реляционных БАД) и многомерном представлении (задача загрузки многомерных БАД);
— Функциональная подсистема программного комплекса «Аналитика» обеспечивает конечных пользователей — аналитиков (сотрудников УТСиА) возможностями анализа данных в рамках, определенных техническим заданием задач:
- Задача 1 — «Общие итоги по всем товарам»;
- Задача 2— «Распределение экспорта-импорта РФ по странам и товарам»;
- Задача 3 — «Категории участников»;
Задача 4 — «Подакцизные товары».
Рис. 1 Структура программного комплекса “Аналитика”3
Подсистема администрирования
Подсистема обеспечивает выполнение стандартными средствами функций администрирования СУБД Oracle и Oracle Express в целях обеспечения функционирования программного комплекса «Аналитика».
Администрирование сервера Oracle включает выполнение следующих основных операций:
- создание базы Oracle и выделение необходимого табличного пространства для технологической базы и реляционной базы агрегированных данных;
- создание пользователя - «хозяина (OWNER)» таблиц технологической базы и реляционной базы агрегированных данных;
- обеспечение доступа «хозяину» технологической базы к базе
ЦБД ГТД на сервере Oracle для осуществления DATABASE LINK
(связи) между технологической базой и ЦБД ГТД; - обеспечение доступа «хозяину» технологической базы к базе
НСИ на сервере Oracle для осуществления DATABASE LINK (связи) между технологической базой и базой НСИ.
Администрирование сервера Oracle Express включает выполнение следующих основных операций:
- определение и установку прав доступа пользователей на определенные базы Oracle Express либо через права доступа на файлы (Windows NT), либо через указание пользователей определенных баз данных (Oracle Express Administrator);
- определение оптимального размера файла многомерной
базы агрегированных данных, задание имени базы данных, определение ее размещения; - обеспечение связи Oracle Express с Oracle для выполнения
загрузки многомерной базы агрегированных данных и для обеспечения взаимодействия многомерной и реляционных баз агрегированных данных в ходе решения аналитических задач.
Подсистема загрузки
Подсистема загрузки обеспечивает выполнение операций по загрузке данных, подлежащих анализу, из ЦБД ГТД (Хранилища Данных) в технологическую базу данных и далее в реляционную и многомерную базы агрегированных данных (БАД) (Витрины Данных), рис. 2.
Задача загрузки технологической базы данных
Загрузка данных из ЦБД ГТД (Хранилища Данных) в целевые БД Витрин Данных осуществляется через промежуточную, технологическую реляционную БД (стрелка 1, рис.2). Выбор такого решения обусловлен следующим:
- существующая сегодня реализация ЦБД ГТД допускает наличие ГТД, имеющих несуществующие или неопределенные ссылки на кодификаторы НСИ. Очевидно, что для задач анализа данных, где кодификатор выступает в роли одного из измерений многомерного куба, такое не допустимо. При загрузке в промежуточную базу данных эта проблема решается путем установки принудительной ссылки на специальное дополнительное значение классификатора. Например, в исходной ЦБД ГТД имеется запись ГТД, содержащая код страны отправления отсутствующих в кодификаторе стран мира и территорий, в этом случае в классификатор вводится дополнительное значение кода «неизвестная страна», а в данной записи ГТД делается ссылка на это значение. При загрузке данных из ЦБД в технологическую БД также производится дополнительная проверка;
- формирование целевых баз данных Витрин Данных с выполнением функций агрегации информации ЦБД ГТД является весьма продолжительным (около 68 часов за два года) и ресурсоемким процессом. Поэтому с целью снижения нагрузки на ЦБД ГТД целесообразнее производить агрегацию данных и загрузку БД Витрин Данных из промежуточной технологической БД, более того, такую БД можно использовать в монопольном режиме опять же для ускорения выполнения операций агрегации данных, что практически невозможно при работе с ЦБД ГТД.
- процедура
формирования целевых баз
— для увеличения производительности процедуры формирование целевых баз данных Витрин Данных при использование отдельной схемы исходной (технологической) БД можно создать столько индексов, сколько для этого нужно;
— для загрузки технологической БД право на доступ к ЦБД ГТД необходимо лишь на ограниченное время (4 часа) при помощи создания временного DATABASE LINK. С точки зрения информационной безопасности - чем меньше время доступа к информации, тем лучше.
Задачи загрузки базы агрегированных данных
Целевая база данных (Витрины Данных) программного комплекса «Аналитика», на которой непосредственно решаются задачи анализа данных, представлена реляционной и многомерной базами агрегированных данных.
При загрузке данных из технологической базы в таблицы базы агрегированных данных (стрелка 2, рис.2) производится помесячное суммирование (агрегация) информации о статистической стоимости и количестве товара, обеспечивающая требуемые уровни агрегации информации для решения функциональных задач комплекса.
Гибридное решение, реализованное в программном комплексе «Аналитика», при котором одна, наиболее часто используемая, часть агрегированных данных хранится в многомерной базе данных л среде МСУБД Oracle Express, а другая часть данных хранится в реляционной базе данных в среде РСУБД Oracle, откуда и выбирается в случае необходимости — обеспечивает быстрый доступ к агрегированным данным при оптимизации дисковой памяти.
Многомерная база агрегированных данных представляет собой набор объектов и данных, специальным образом организованных для просмотра информации в различных перспективах или срезах. Наиболее важными объектами многомерной базы данных .являются переменные, размерности, отношения (зависимости). При загрузке информации в объекты многомерной базы агрегированных данных из технологической базы (стрелка 3, рис.2) берется нормативно-справочная информация (кодификаторы), а из реляционной базы агрегированных данных - агрегированные данные о стоимости и количестве товара в соответствии с выбранным уровнем гибридного размещения агрегированных данных.
Функциональная подсистема
Функциональная подсистема программного комплекса «Аналитика» используется его конечным пользователем (аналитиком) дня непосредственного решения функциональных задач анализа данных, находящихся в целевых реляционной и многомерной базах агрегированных данных (Витринах Данных) ПК «Аналитика».
Решение конечным пользователем задач, входящих в функциональную подсистему программного комплекса «Аналитика», заключается в анализе агрегированных данных посредством последовательности интерактивных динамических отчетов (таблиц и диаграмм), называемых брифингами.
Каждая из перечисленных ниже задач характеризуется параметрами соответствующего операционного пространства - элементами данных, на множестве которых выполняется решение задачи анализа информации. Операционное пространство включает в себя:
- Размерности
(или Измерения)
- атрибуты данных в модели,
комбинация значений которых однозначно определяет экземпляр набора значений данных (показателей) в базе агрегированных данных; - Показатели - значения агрегированных данных, подлежащие анализу. Для каждой допустимой комбинации значений размерностей в базе агрегированных данных может храниться только одно значение показателя.
Задача №1: «Общие итоги по всем товарам»
Характеристики операционного пространства:
Размерности:
- временной интервал выпуска ГТД - год, квартал, месяц;
- товарная номенклатура ВЭД нотации года;
- товарная номенклатура ВЭД нотации года;
- страна-получатель товара (при направлении перемещения ЭКСПОРТ);
- страна-отправитель товара (при направлении перемещения ИМПОРТ);
- направление перемещения товара (экспорт-импорт);
- таможенное управление, на территории которого производилось таможенное оформление.
Анализируемые показатели:
- статистическая стоимость товара;
- количество товара по основной единице измерения;
- количество товара по дополнительной единице измерения.
Перечень размерностей, имеющих возможности по агрегации-дезагрегации: - таможенное управление (по всем управлениям, выборочно
по множеству управлений); - страны (по экономическим и географическим ареалам, по всем странам, выборочно по множеству стран);
- коды ТНВЭД (с возможностью группировки по 2,4,6 и 9-ти знакам кода ТНВЭД, по множеству кодов).
Формы представления анализируемых показателей: