Информационно-поисковые системы
Контрольная работа, 10 Февраля 2012, автор: пользователь скрыл имя
Описание работы
ИПС (информационно-поисковая система) - это система, обеспечивающая поиск и отбор необходимых данных в специальной базе с описаниями источников информации (индексе) на основе информационно-поискового языка и соответствующих правил поиска.
Содержание
Информационно-поисковая система. Определение, главная задача, релевантность……………………………………………………………………
3
Поисковые машины…………………………………………………….. 4
Адреса наиболее популярных поисковых машин за рубежом и в России…………………………………………………………………………….
5
Каталожная система…………………………………………………….. 6
Адреса популярных каталогов…………………………………………. 7
Язык запросов…………………………………………………………… 8
Перевод…………………………………………………………………... 10
Основные характеристики поисковой системы……………………….. 11
Список использованных источников…………
Работа содержит 1 файл
КОНТРОЛЬНАЯ РАБОТА ИПС.doc
— 74.00 Кб (Скачать)Мурманский филиал
НОУ ВПО МОСКОВСКОЙ АКАДЕМИИ ПРЕДПРИНИМАТЕЛЬСТВА
при
Правительстве Москвы
КОНТРОЛЬНАЯ РАБОТА
Студента
Деньгиной Анастасии Олеговны
Специальности:
Мировая экономика
Учебная
дисциплина: Информационные системы в
экономике
Тема
работы: Информационно-поисковые системы
Номер
зачётной книжки: МВУ-09/119
Номер
и дата регистрации работы в деканате:
___________________
Мурманск
2012
Содержание
| Информационно- |
3 |
| Поисковые машины…………………………………………………….. | 4 |
| Адреса наиболее
популярных поисковых машин за рубежом
и в России…………………………………………………… |
5 |
| Каталожная система…………… |
6 |
| Адреса популярных каталогов…………………………………………. | 7 |
| Язык запросов………………………… |
8 |
| Перевод………………………………………… |
10 |
| Основные характеристики поисковой системы……………………….. | 11 |
| Список использованных источников…………………………………... | 15 |
- Информационно-поисковая система. Определение, главная задача, релевантность
ИПС
(информационно-поисковая
Главной задачей любой ИПС является поиск информации релевантной информационным потребностям пользователя. Очень важно в результате проведенного поиска ничего не потерять, то есть найти все документы, относящиеся к запросу, и не найти ничего лишнего. Поэтому вводится качественная характеристика процедуры поиска - релевантность.
Релевантность - это соответствие
результатов поиска
Виды релевантности:
- Содержательная релевантность (соответствие документа информационному запросу, определяемое неформальным путем. Одним из методов для оценки релевантности является TF-IDF-метод. Его смысл сводится к тому, что чем больше локальная частота термина (запроса) в документе (TF) и больше «редкость» (то есть чем реже он встречается в других документах) термина в коллекции (IDF), тем выше вес данного документа по отношению к термину — то есть документ будет выдаваться раньше в результатах поиска по данному термину. Автором метода является Gerard Salton (в дальнейшем доработан Karen Sparck Jones))
- Формальная релевантность (соответствие, определяемое путем сравнения образа поискового запроса с поисковым образом документа по определенному алгоритму)
- Поисковая
машина
Поисковая машина - поисковая система с формируемой роботом базой данных, содержащей информацию об информационных ресурсах.
Отличительной
чертой поисковых машин является
тот факт, что база данных, содержащая
информацию об Web-страницах, статьях Usenet
и т.д., формируется программой-
Поиск
в такой системе проводится по
запросу, составляемому пользователем,
состоящему из набора ключевых слов или
фразы, заключенной в кавычки. Индекс
формируется и поддерживается в
актуальном состоянии роботами-
В описании документа чаще всего содержится несколько первых предложений или выдержки из текста документа с выделением ключевых слов. Как правило, указана дата обновления (проверки) документа, его размер в килобайтах, некоторые системы определяют язык документа и его кодировку (для русскоязычных документов).
Что
можно делать с полученными результатами?
Если название и описание документа
соответствует вашим
- 1 Адреса наиболее популярных поисковых машин за рубежом и в России
Зарубежные
поисковые машины:
- Google - www.google.com
- Altavista - www.altavista.com
- Excite - www.excite.com
- HotBot - www.hotbot.com
- Nothern Light - www.northernlight.com
- Go (Infoseek) - www.go.com (infoseek.com)
- Fast - www.alltheweb.com
Российские
поисковые машины:
- Яndex - www.yandex.ru (или www.ya.ru)
- Google - www.google.ru
- Рэмблер - www.rambler.ru
- Апорт - www.aport.ru
- Mail - www.mail.ru
- Каталожная система
Каталог-
поисковая система с
Поиск в каталоге очень удобен и проводится посредством последовательного уточнения тем. Тем не менее, каталоги поддерживают возможность быстрого поиска определенной категории или страницы по ключевым словам с помощью локальной поисковой машины. База данных ссылок (индекс) каталога обычно имеет ограниченный объем, заполняется вручную персоналом каталога. Некоторые каталоги используют автоматическое обновление индекса.
Результат
поиска в каталоге представляется в
виде списка, состоящего из краткого описания
(аннотации) документов с гипертекстовой
ссылкой на первоисточник.
3.1 Адреса популярных
каталогов
Зарубежные
каталоги:
- Yahoo - www.yahoo.com
- Magellan - www.mckinley.com
Российские
каталоги:
- @Rus - www.aport.ru
- Weblist - www.weblist.ru
- Улитка - www.ulitka.ru
- Язык запросов
Язык запросов — это искусственный язык, на котором делаются запросы к базам данных и другим информационным системам, особенно к информационно-поисковым системам.
Язык, на котором формулируются запросы к поисковым системам называется языком поисковых запросов или информационно-поисковым языком.
В различных поисковых системах язык запросов может различаться, однако обычно он является некоторым подобием языка регулярных выражений с дополнениями, связанными со спецификой работы той или иной поисковой системы. Знание и правильное применение языка запросов конкретной поисковой машины улучшает и упрощает пользователю процесс поиска информации.
Язык поисковых запросов состоит из логических операторов, префиксов обязательности, возможности учета расстояния между словами, морфологии языка, регистра слов, расширенных операторов, возможностей расширенного поиска, уточнения поиска.
Информационно-
ИПЯ
должен располагать лексико-
В
большинстве ИПЯ основной словарный
состав (лексика) задаётся его перечислением
и представляет собой фрагмент лексики
того или иного естественного языка. Отобранные
из естественного языка слова и словосочетания,
в совокупности образующие основной словарный
состав, служат как бы алфавитом данного
ИПЯ. Правила образования в таких ИПЯ выполняют
функцию синтаксиса. В некоторых ИПЯ основной
словарный состав задаётся (полностью
или частично) методом порождения, который
заключается в том, что для таких ИПЯ правила
образования устанавливают, как из данного
алфавита строить слова ИПЯ, а из этих
слов — выражения (фразы) и какие из них
будут правильно построенными. В середине
20 в. в качестве ИПЯ широко применяются
классификации библиотечно-библиографические
и языки дескрипторного типа.
- Перевод
Информационно-
- Software that is used on Unix Platform
- будет преобразован в:
- Unix AND Platform AND Software
что будет означать примерно следующее: "Найди все документы, в которых слова Unix, Platform и Software встречаются одновременно".
Возможны и варианты. Так, в большинстве систем фраза "Unix Platform" будет опознана как ключевая фраза и не будет разделяться на отдельные слова. Другой подход заключается в вычислении степени близости между запросом и документом. Именно этот подход используется в Lycos. В этом случае в соответствии с векторной моделью представления документов и запросов вычисляется их мера близости. Сегодня известно около дюжины различных мер близости. Наиболее часто применяется косинус угла между поисковым образом документа и запросом пользователя. Обычно эти проценты соответствия документа запросу и выдаются в качестве справочной информации при списке найденных документов.