Автоматизація роботи в офісі. Розпізнання документів в програмі FineReader. Інвентаризація запасів підприємства, відображення вобліку її резу
Дипломная работа, 12 Февраля 2013, автор: пользователь скрыл имя
Описание работы
Головна заслуга ІВМ – у виготовлені і встановлені єдиного стандарту на основні частини комп'ютера. До того кожний виробник ПК створював власне унікальне “желізо” – тому, що в результаті він ставав монополістом на збір і обслуговування своїх приладів. Але в результаті ринок був переповнений спільними один з одним спільними апаратами, для кожного із котрих треба було створити власні програми. В період встановлення ринку персональних комп’ютерів, прилади кожного ПК було тайною фірми – виробника, і про ніяке копіювання однією фірмою виробника другою в масових масштабах просто не могло.
Содержание
Вступ ………………………………………………………………………..………4
Розділ І. Коротка характеристика матеріалів, необхідних для виконання роботи……………………………………………………………………….………6
Розділ ІІ.Перелік та опис інструментів………………………….………….....…7
Розділ IІІ. Автоматизація роботи в офісі. Розпізнаня документів в програмі FineReader ……………………………………………………………………….....9
Розділ ІV.Інвентаризація запасів підприємства, відображення в обліку її
результатів……………………………………………………………………….…21
Розділ V. Робоче місце оператора ПК…………………………………………..54
Розділ VI. Охорона праці……………………………………………………...…56
Висновок…………………………………………………………………………..58
Список використаної літератури………………………………………………...59
Відгук…………………………………………………………………………..…..60
Работа содержит 1 файл
Островська Олена Валентинівна.docx
— 293.94 Кб (Скачать)1.1Автоматизація вводу інформації в комп’ютер
Основним методом переводу паперових документів в електрону форму являється сканування. Сканування - це технологічний процес, в результаті якого створюється графічний образ паперового документа. Існує декілька видів сканерів, але в їх основу покладено один і той же принцип. Документи освітлюються світлом від спеціального джерела, а відображене світло сприймається світло відображаючим елементом. Мінімальний елемент зображення передається сканером, як кольорова точка. Таким чином в результаті сканування документа створюється графічний файл в, якому зберігається растрове зображення первинного документа. Растрове зображення складається, як відомо з точок. Кількість точок визначається, як розміром зображення так і розширенням сканера.
1.2Автоматичне розпізнання тексту
Після обробки документа сканером виходить графічне зображення документа. Але графічний вигляд не являється текстом документа. Людині досить подивитись на листок паперу з текстом, щоб зрозуміти, що на ньому написано. З точки зору комп’ютера, документ після сканування перетворюється в набір різнокольорових точок, а не в текстовий документ. Проблема розпізнання тексту в складі точкового графічного зображення являється дуже складною. Подібні задачі вирішуються за допомогою спеціальних програмних засобів, називаються вони засоби розпізнання зображень. Реальний технічний прорив в цій області пройшов лише в останні роки. До того розпізнання тексту було можливо лише шляхом порівняння знайдених конфігурацій точок із стандартним зразком. Автори програми критерій “схожості” використовуваний при ідентифікації символів. Такі системи називаються ОСR(OptikalCharacted Recognition-оптичне розпізнання символів) і оперались на спеціально вироблені шрифти. З часом наукові дослідження в області розпізнання зображень буквально перевернули представлення при оптичному розпізнані символів. Сучасні програми можуть ставитись з різноманітними шрифтами без перенастройки. Багато розпізнають навіть малюнковий.
1.3 Програми розпізнання текстів
Оскільки потреба в розпізнані
тексту відсканованих
2.Розпізнання документів в програмі Fine Reader
Програма Fine Reader виготовляється вітчизняною компанією АВВУУ Software(w.w.w. bitsoft.ru.). Ця програма призначена для розпізнання текстів на російському, англійському, німецькому, українському, французькому і багатьох інших мовах, а також для розпізнання змішаних двох мовних текстів. Програма має ряд можливостей. Вона дозволяє об’єднати сканування і розпізнання в одну операцію, працювати з пакетами документів і бланками. Програму можна навчити для кращої якості розпізнання неправильно надрукованих текстів і складних шрифтів. Вона дозволяє редагувати текст і провіряти його орфографію. Fine Reader працює з різними моделями сканерів. Програма дотримується стандарту TWAIN. Ми розглянемо програму на прикладі версії 4.0 одну із основних версій.
2.1Вікно програми
Після включення програми Fine Reader в меню програми головного меню появляються пункти, забезпечуючи роботу з нею. Вікно програми має типовий для Windows 9х вид і має стрічку меню, ряд панелей інструментів і робочу область.
- В лівій частині робочої області
розміщується панель Пакет, містить список графічних документів які повинні бути перетворені в текст. Ці графічні файли розглядаються, як частинки одного документа. Результати її обробки в подальшому об’єднуються в єдиний текстовий файл. Форма значка, відмічає початковий файл і вказує чи було проведено розпізнання. - Панель в нижній частині робочої області має фрагмент графічного документа в збільшиному виді. З його допомогою можна оцінити якість розпізнання. Цю панель також використовують для “навчання” програми в ході розпізнання тексту.
- А всю іншу частину робочої області займають вікна документів. Тут розміщується вікно графічного документа, а також вікно текстового документа після розпізнання.
- У верхній частині вікна під стрічкою меню розміщується панель інструментів.
- Панель інструментів Стандартна містить кнопки для відкриття документа і для операції з буфером обміну. Інші кнопки цієї панелі служать для зміни представлення документа.
- Панель Scan Read містить кнопки, які відповідають всім етапам перетворення паперового документа в електронний текст. Перша кнопка дозволяє виконати таке перетворення в рамках єдиної операції. Остальні кнопки відповідають відокремленим етапам роботи і містять відкриваючи меню службові для управління відповідною операцією.
- Панель Розпізнання дозволяє вказати мову документа і вид шрифта. Остані вимагаються роботи тільки в тих випадках, коли документ має не достатню кількість друку.
- Панель Інструменти використовується при роботі з вихідними зображеннями. Вона дозволяє управляти сегментацією документів. З допомогою елементів управління цієї панелі задають послідовність фрагментів текстів в заключному документі.
- Елементи управління панелі Формативна використовується для зміни представленні готового тексту або при його редагуванні.
2.2.Порядок розпізнання текстових документів
Перетворення паперового документа в електронний проходить в три етапи. Кожний із цих етапів програми Fine Readerможе виконувати, як автоматичний так і під контролем користувача. Якщо всі етапи проходять автоматично, то перетворення документа проходить за один прийом.
- Перший етап роботи – сканування. На цьому етапі завжди використовується сканер. Однак зображення з листка паперу може бути перетворена в цифрову форму і
з допомогою других засобів таких, як наприклад цифрові фотоапарати і цифрові відеокамери.
- Другий етап роботи – сегментація тексту. Діло в тому, що в паперових документах, на сторінках книжки чи журналу, текст не завжди розміщується в зазначеному порядку. Він може розміщуватись в декількох коло
нках. Містить малюнки (підписи до них). Доповнюючі вирізки і дані представлені в таблиці, а також можуть заплутати порядок тексту. Тому перш за все, як включити текст документа його розбивають на блоки, вміст фрагментів. Блоки розпізнають послідовно. Отриманий текст включається в документів порядку номера блока.
- Останній етап роботи програми-розпізнання. Цей етап не потребує втручання користувача, за винятком тих випадків, коли розпізнання супроводжується ”н
авчанням”.
- Розпізнання тексту відображається у окремому вікні у виді форматованого тексту. Він “втрачає зв’язок” з вихідним зображенням і може редагуватися і форматуватися незалежно від нь
ого. програма виділяє кольором ті символи, які вона сама розглядає, як неоднозначно розпізнання. Це спрощує пошук помилок засобами програми в отримані тексту, можна також провести перевірку граматики.
- Отриманий текст можна зберегти у виді форматованого документа. Передбачено також можливість прямої передачі отриманого тексту в програму Word чи Excel, а також в буфер обміну Windows.
2.3Сканування документа
Сканування – це технічна операція, яку виконує пристрій для сканування. Задача програми Fine Readerна цьому етапі складається з того, щоб приняти получену інформацію і прийняти значки від сканування сторінок на панелі Пакет. Так сторінки готуються до розпізнання.
- Для того щоб провести сканування за допомогою програми Fine Reader, необхідно запустити цю програму і включити сканер. Проскановані сторінки проходять по клацані на кнопки Сканувати на панель інструментів або при написанні комбінації клавіш Ctrl+K.
- Програма здатна працювати із сканером, як безпосередньо так і через протокол. При безпосередній взаємодії із сканером можливість сканування кольорових зображень не використовується так, як текст являється в любому випадку одноколірним.
- Програма використовується для сканування, яке задано по зменшенню. Для того щоб вибрати таке обладнання чи змінити його настройку, потрібно клацнути на відкриваючій кнопці поруч з кнопкою Сканувати і вибрати у відкритому меню пункт Опції – відкривається діалогове вікно Опції.
- Якщо до комп’ютера підключено декілька сканерів або сканер був підключений після установки програми, слід клацнути на кнопці Вибрати сканер. В тому випадку програма проведе пошук підключених до комп’ютера сканерів і дозволити вибрати потрібний.
- Для зміни настройки сканера використовують кнопку Настройки сканера.
- Коли сканер вибраний появляється два флажка, в нижній частині діалогового вікна. Якщо поставити флажок Показувати діалог TWAIN-драйвера сканера, то сканування проходить через протокол з відображенням діалогового вікна. В протележному випадку програма працює напряму із сканером. Використати протокол має значення тільки в тому випадку, коли робота напряму неможлива або дає неякісні результати.
- Флажок Показати опції перед початком сканування застосовують лише в тому випадку, коли паперові сторінки документа сильно відрізняється одна від другої. Це може бути викликано, наприклад, розмірами паперу або тим, що різні сторінки друкувались в різний час і різними засобами. В такому випадку перед скануванням кожної сторінки відкривається діалогове вікно настройки сканера, щоби користувач міг відрегулювати якість процесу.
Сам процес сканування проходить в автоматичному режимі. Якщо потрібно проробити багато сторінок, то краще всього спочатку їх усіх просканувати, а уже потім проводити розпізнання. Це зв’язано з тим, що сканування потребує присутності користувача через управління сканером, а розпізнання може проводитися в автоматичному режимі.
2.4 Сегментація документа
Під порядком розпізнання
Автоматична сегментація – це проста
задача для програми. Програма шукає проміжки
між стрічками, а також зони початку і
кінця стрічок. Якщо послідовність стрічок,
ідуть підряд, має одинакові зони початку
і кінця, то програма розглядає таку область
як текстовий блок. Якщо проміжки між стрічками
взагалі існують, то по всій можливості,
мова іде про ілюстрацію. Якщо знайдеться
велике число вертикальних і горизонтальних
фрагментів, які відображають правильну
структуру, то напевне в текст включена
таблиця.
2.5 Розпізнання документа
Після сегментації і встановлення порядку текстових блоків виконує останній етап роботи – розпізнання. Якщо документ надрукований не стандартним шрифтом, який добре відсканований, по клацанню кнопки Розпознать відкриту сторінку досить, щоб документ був розпізнаний. Якщо паперовий документ має нестандартний шрифт, то процес розпізнання ускладнюється. В такому випадку програма може не справитись з розпізнанням символів і допускати однотипні помилки. В таких випадках для великих документів перш за все спочатку треба провести навчання програми з особливостями даного документа. Це досить великий процес, але він все таки простіший, ніж ручний ввід багато сторінкового документа. Настройку розпізнання починають із створення еталону в, якому зберігаються особливості даного документа. Для цього потрібно виконати команду Сервіс – Редактор еталонів, клацнути у відкритому діалоговому вікні Еталони на кнопці Нові еталони і ввести ім’я створення еталона.
Для підключення еталона при розпізнані, треба клацнути на відкриваючі кнопці поруч з кнопкою Розпізнати відкриту сторінку і вибрати пункт Опції. У відкритому діалоговому вікні в групі Обучение слід вибрати тільки, що створений еталон. Якщо розпізнання документа відповідає еталону, який був створений і настроєний раніше, то вибрати не новий, а старий еталон.
- Для “навчання” еталона слід встановити прапорець Розпізнання з навчан
ням.
- Режим розпізнання в такому випадку змінюється. Коли програма не може розпізнати символ, то вона видає діалогове вікно “навчанн
я еталона”. У верхній частині цього вікна проводиться збільшення зображень розпізнання стрічки. Текучий символ обведений рамкою.
- В полі із списком Символ, який розуміє програма, знаходиться в рамці.
- Необхідно переконатись, що символ в полі вказаний правильно і замінити його у випадку необхідності. Після цього треба клацнути на кнопці “навчання”.
- Якщо неправильно вказані грани
ці символу, то кнопки Зсунути вліво і Зсунути вправо , дозволять поправити положення рамки.
- Якщо правильно розмістити рамку не вдається або в тексті зустрічається незнайомий символ, який правильно перекласти не можливо, слід клацнути на кнопці “Пропустити”.