Інформаційний пошук

Автор: Пользователь скрыл имя, 18 Апреля 2012 в 16:41, курсовая работа

Описание работы

Мета і завдання дослідження. Метою роботи є аналіз і характеристика особливостей інформаційного пошуку.
Реалізація поставленої мети передбачає вирішення таких завдань:
– зробити аналіз терміносистеми дослідження;
– проаналізувати сутність електронного інформаційного середовища;
– зазначити сутність інформаційного пошуку.

Содержание

ВСТУП
4
Розділ 1. ТЕОРЕТИЧНІ АСПЕКТИ ПРОБЛЕМИ ДОСІЛДЖЕННЯ

1.1. Аналіз терміносистеми дослідження
6
1.2. Електронні інформаційні середовища: сутність , аналіз
9
1.3. Інформаційний пошук: сутність
17
ВИСНОВКИ
23
СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ

Работа содержит 1 файл

(ГОТОВО) Електронні інформаційні середовища.docx

— 49.38 Кб (Скачать)

Розвиток аудіовізуальних  засобів передачі інформації (телефон, радіо, кіно, телебачення) і, особливо, комп'ютерних технологій у багато разів розширило та якісно змінило інформаційний потік який є невід’ємною складовою нашого суспільства. Засоби інформаційного впливу роблять величезний впливу на свідомість людини і культуру. У нашому суспільстві діти значною мірою засвоюють ролі і правила поведінки в суспільстві з телевізійних передач, газет, фільмів та інших засобів масової інформації.

Електронна інформаційна середа — сукупність технічних і програмних засобів зберігання, обробки і передачі інформації, а також соціально-економічних і культурних умов реалізації процесів інформатизації [8, c.94].

Складові електронної  інформаційної середовища - комп'ютерні мережі і цифрові технології - дозволяють якісно змінити традиційні підходи до інформаційного обслуговування. Найбільшому впливу в цьому відношенні схильні такі технологічні елементи:

1) організація процесів  обслуговування;

2) організація доступу  до ресурсів;

3) організація окремих  форм обслуговування.

Однією з основних тенденцій  ери інформаційних технологій є  перехід на електронний документообіг. Це проявляється у побутовій та професійній  сфері і виражається в збільшенні обсягу зберігання і передачі інформації в електронному вигляді, в тому числі  і по електронній пошті.

Робота з інформацією  в електронній формі має цілу низку переваг. Ось тільки деякі  з них:

Спрощена процедура структурування та каталогізації даних;

Спрощена процедура зберігання і резервування інформації;

Можливість ефективного  автоматизованого пошуку та аналізу;

Більш висока швидкість обміну даними між віддаленими офісами;

Можливість одночасного  редагування і читання одного документа або бази даних кількома користувачами, які перебувають  на видаленні.

Нові інформаційні технології призвели до подальшого розвитку систем електронного інформаційного середовища.

Сьогодні до кожного виробу або компоненту можна «прив'язати» практично необмежену кількість  інформації, зокрема:

Історію виробництва даного виробу;

Різні технічні параметри, вимоги щодо умов зберігання, номер партії і т.д.

Список компонентів використаних при виробництві вироби;

Інформація про працівників, причетних до виготовлення та тестування продукції;

І багато іншого.

При цьому немає необхідності переміщати з кожним виробом товсту папку паперів і витрачати  безліч часу на ведення записів вручну. Сьогодні досить забезпечити друковану  плату 1D/2D-кодом або виріб RFID-міткою з унікальним номером вироби і  зіставити це з записами в базі даних підприємства, в яких зберігається вся інформація, і реєструються всі  технологічні операції і переміщення  матеріальних цінностей.

Такі системи вже встигли  стати галузевим стандартом в  економічно розвинених країнах. Є ціла маса рішень, які дозволяють підвищити  прозорість виробничих процесів, розширити  можливості контролю якості, підвищити  оперативність паспортизації та аналізу причинно-наслідкових зв'язків, а також здійснювати оперативний  обмін даними між різними офісами  підприємства.

Інформаційні технології та телекомунікаційний зв'язок, завдячуючи яким людство має таке явище, як електронне інформаційне середовище, дають змогу здійснювати комплексне обслуговування абонентів бібліотек на якісно новому рівні, відкриваючи інформаційний кладезь книгозбірень широкому колу споживачів, незалежно від їх місцезнаходження. Однак при цьому загострюється проблема захисту авторського права в глобальній мережі, невизначеність якої сьогодні гальмує розвиток багатьох напрямів інформаційно-бібліотечного сервісу [7, c.56].

Пропоную більше ретельно розглянути Інтернет, як набільше електронне інформаційне середовище.

Інтерне́т (від англ. Internet) — всесвітня система взаємосполучених комп'ютерних мереж, що базуються  на комплекті Інтернет-протоколів. Інтернет також називають мережею  мереж. Інтернет складається з мільйонів  локальних і глобальних приватних, публічних, академічних, ділових і  урядових мереж, пов'язаних між собою  з використанням різноманітних  дротових, оптичних і бездротових  технологій. Інтернет становить фізичну  основу для розміщення величезної кількості  інформаційних ресурсів і послуг, таких як взаємопов'язані гіпертекстові  документи Всесвітньої павутини (World Wide Web — WWW) та електронна пошта [7, c. 63].

В повсякденній мові слово  Інтернет найчастіше вживається в значенні Всесвітньої павутини і доступної  в ній інформації, а не у значенні самої фізичної мережі. Також вживаються терміни Всесвітня мережа, Глобальна  мережа чи навіть одне слово Мережа, Іне́т, Тенета, Міжмережжя, Інтерне́трі  або Не́трі. Все частіше Інтернет вживається і з малої літери, що можна пояснити паралелями з термінами  «радіо», «телебачення», які пишуть з малої.

Історія Інтернету сягає  досліджень 1960-х років, які проводилися  на замовлення уряду США і мали на меті створення надійних розподілених комп'ютерних мереж, стійких до пошкоджень. Попередницею Інтернету стала мережа ARPANET (англ. Advanced Research Projects Agency Network), яка  почавши функціонувати в кінці 1960-х, в кінці 1970-х об'єднувала близько 200 вузлів [7, c.43].

Урядове фінансування магістральної  мережі Національного наукового  фонду США в 1980-х, а також приватне фінансування для інших комерційних  магістральних мереж в усьому світі призвело до участі в розробці нових мережевих технологій і  злиття багатьох мереж. Комерціалізація  в 1990-х міжнародної мережі привела  до її популяризації та впровадження в практично кожен аспект сучасного  життя людини. З 2011 року більше 2,1 мільярда людей користуються послугами Інтернету.

Інтернет не має централізованого управління, правил використання чи доступу. Кожна складова мережа встановлює свої власні стандарти. Централізовано визначаються правила використання адресного  простору Інтернет-протоколу та Системи  доменних імен. Керує цим Інтернет корпорація з присвоєння імен та номерів (англ. Internet Corporation for Assigned Names and Numbers, або ICANN), міжнародна некомерційна організація  з головним офісом у США. Технічне обґрунтування і стандартизацію основних протоколів (IPv4 та IPv6) проводить Internet Engineering Task Force (IETF), некомерційна організація, відкрите міжнародне співтовариство проектувальників, учених, мережевих операторів і постачальників послуг.

Усі комп'ютери, що підключені до Internet, повинні використовувати  однаковий протокол.

Інтернет складається  з багатьох тисяч корпоративних, наукових, урядових та домашніх мереж. Об'єднання різнорідних за архітектурою мереж стало можливо завдяки  протоколу IP (англ. Internet Protocol) і принципу маршрутизації пакетів даних. Протокол ІР був спеціально створений агностичним  у відношенні до фізичних каналів  зв'язку. Тобто будь-яка мережа передачі цифрових даних може передавати інтернет-трафік [9, c.82].

Мережа побудована на використанні протоколу IP і маршрутизації пакетів  даних. В наш час Інтернет відіграє важливе значення у створенні  інформаційного простору глобального  суспільства, слугує фізичною основою  доступу до веб-сайтів і багатьох систем (протоколів) передачі даних.

У основі роботи Інтернет лежить мережевий протокол TCP/IP - загальноприйнята система кодування, що дозволяє комп'ютерам обмінюватися даними по мережі в зрозумілій один для одного формі. Як неважко  відмітити, термін TCP/IP складається  з двох частин: TCP (Transmission Control Protocol - протокол управління передачею даних) і IP (Internet Protocol - протокол Інтернет). Кожен  комп'ютер в мережі «розуміє» ці два протоколи і використовує їх для передачі даних за певним маршрутом. Спочатку TCP розбиває інформацію - електронний лист, HTML-документ або  що-небудь ще - на невеликі фрагменти, які  називають пакетами. Кожний з пакетів  поміщується в «електронний конверт» з адресами одержувача і відправника. Тепер до справи береться IP-протокол, який повинен визначити, як краще  всього доставити електронний пакет  з пункту А в пункт В. Для  кожного пакету окремо він знаходить  шлях, що проходить через ряд маршрутизаторів, - подібно тому, як звичайні листи  на шляху від відправника до одержувача проходять через декілька поштових відділень.

Маршрутизатор аналізує адресу одержувача і передає пакет наступному маршрутизатору, розташованому в  потрібному напрямі. Якщо ваш електронний  лист було розбито на декілька пакетів, кожний з них міг дістатися  до місця призначення по своєму маршруту. Проте ви про це так і не дізнаєтеся, оскільки при їх отриманні в кінцевому  пункті знову вступає в справу TCP-протокол. Він переконується, що всі  пакети дійшли непошкодженими, а потім  збирає з них первинне повідомлення.

TCP/IP - це найважливіший  зі всієї безлічі протоколів  Інтернет.Часто термін TCP/IP використовується  для опису додаткових протоколів, включаючи SMTP (Simple Mail Transfer Protocol - простий  протокол для передачі пошти), FTP (File Transfer Protocol - протокол передачі  файлів) і Telnet [7].

 

 

 

1.3. Інформаційний пошук: сутність

Під інформаційним пошуком  розуміють сукупність логічних та технічних  операцій, кінцева мета яких – пошук  документів, відомостей про них, фактів, релевантних із запитом користувача [8].

Головним поняттям інформаційного пошуку є релевантність документів, тобто ступінь відповідності документа запиту споживача.

Серед видів інформаційного пошуку розрізняють:

• документальний (пошук  відомостей про документ – реферат, бібліографічний опис, анотацію; власне документ)

• фактографічний (пошук  даних, фактів – характеристики приладів, матеріалів).

У кожному виді пошуку по-різному  використовується семантика документа. За цією ознакою відрізняють такі типи пошуків:

– формально-механічний (при роботі з картковими каталогами);

– семантичний (зміст документа скорочують у різні способи, утворюючи пошуковий образ документа);

– ситуаційний (в інформаційно-логічних системах), який передбачає глибоку переробку змісту документів.

Автоматичні системи інформаційного пошуку використовують для зменшення  так званого «інформаційного  перевантаження». Багато університетів  та публічних бібліотек використовують системи ІП для полегшення доступу  до книжок, журналів та інших документів. Найвідомішим прикладом систем ІП можна  назвати пошукові системи в Інтернеті [12, c.95].

Об’єктом інформаційного пошуку є текстова інформація, зображення, аудіо, відео інформація.

З інформаційним пошуком  змикаються проблеми:

  • розсилки інформації (information routing);
  • сортування інформації (information filtering);
  • упорядкування (класифікація) інформації (information categorization);
  • відбір інформації (information extraction).

Для інформаційного пошуку розробляють:

  • алгоритми інформаційного пошуку (retrieval algorithms);
  • підходи інформаційного пошуку(retrieval approaches);
  • стратегії інформаційного пошуку (retrieval strategies).

Для його здійснення створюють:

  • методи інформаційного пошуку (retrieval utilities);
  • засоби інформаційного пошуку (information retrieval systems);
  • комп’ютерні пошукові програми (search engines).

До проблем інформаційного пошуку належать питання:

  • представлення даних, інформації, знань (data, information, knowledge);
  • представлення інформації в сучасних інформаційних сховищах (representation of information);
  • багатомовний інформаційний пошук (cross-language information retrieval);
  • одночасний інформаційний пошук (parallel information retrieval);
  • розподілений інформаційний пошук (distributed information retrieval);
  • суспільний інформаційний пошук (social information retrieval).

Напрям інформаційний  пошук відносять до проблем:

  • застосовної (прикладної) лінгвістики (applied linguistics);
  • обробки природної мови (natural language processing);

Завданням інформаційного пошуку є знаходження відповідних (до пошукового запиту) інформаційних об’єктів, або  документів серед доступного для  пошуку матеріалу. Завдання для інформаційного пошуку задається у вигляді інформаційного запиту (query), який може містити слова, фрази чи речення або комбінацію їх. Переважна більшість пошукових  систем орієнтована на роботу з пошуковими термінами — словами або словосполученнями, які пошукова система розпізнає  як одне ціле. Для здійснення інформаційного пошуку потрібно мати збірку інформаційних  об’єктів (бібліотека, комп’ютерні файли) і систему (алгоритм або програму) яка здійснює пошук. Для здійснення інформаційного пошуку користувач (людина або інформаційна система) формує інформаційний запит (information query). Результатом пошукової роботи є список документів який укладається згідно з певним принципом. Такий список називають впорядкованим (ranked list, ranked results) [8, c.75].

Пошукова система переглядає всі доступні інформаційні одиниці (документи) зі збірки і відбирає документи  відповідні до інформаційного запиту. Оскільки реальні пошукові системи  знаходять не всі відповідні документи, говорять про точність пошукових  систем (system accuracy). Результатом роботи пошукової системи є список відібраних документів (retrieved documents list), серед яких є відповідні до запиту документи (relevant documents). Для ідеальної пошукової  системи список відібраних документів та відповідних документів повинні  збігатися. В реальних пошукових  системах в списках відібраних документів знаходяться і невідповідні до запиту документи. Тому говорять про ефективність пошукових систем. Ефективність пошукових  систем оцінюється двома параметрами: пошукова відповідність (precision) та пошукова якість (recall). Пошукова відповідність  визначає частку відповідних документів серед відібраних на запит. Пошукова відповідність визначає якість отриманого результату інформаційного пошуку. Пошукова якість визначає частку отриманих системою відповідних до запиту документів серед  загального числа відповідних до запиту документів у збірці. Загальне число відповідних до запиту документів завжди є невідомим і може бути встановлене лише при повному  перегляді збірки людиною. Крім того роботу пошукових систем оцінюють швидкодією — часом, за який отримують список відповідних до запиту документів.

Информация о работе Інформаційний пошук