Электронные словари. Их классификация

Автор: Пользователь скрыл имя, 05 Мая 2012 в 23:35, реферат

Описание работы

Слово «лексикография» греческого происхождения, lexikos - относящийся к слову, словарный и grapho - пишу. Следовательно, лексикография означает: «пишу слова».
В современном значении лексикография - это теория и практика составления словарей, главным образом языковых, лингвистических, в отличие от неязыковых, энциклопедических.
Видный испанский лексикограф X. Касарес в своей широко известной книге «Введение в современную лексикографию» (которая переведена на русский язык) утверждает, что лексикография - это техника и искусство составления словарей.

Работа содержит 1 файл

ТПП индив.docx

— 39.13 Кб (Скачать)

Министерство науки и  образования

Запорожский национальный университет

Факультет иностранной филологии

 

 

 

 

 

 

 

Индивидуальное задание  на тему:

Электронные словари. Их классификация.

 

 

 

 

 

 

 

Выполнила

студентка 4 курса 

группы 2338 – 401 – н

Фефелова Анна

 

 

 

 

 

 

 

Запорожье 2012

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 Слово «лексикография» греческого происхождения, lexikos - относящийся к слову, словарный и grapho - пишу. Следовательно, лексикография означает: «пишу слова».

В современном значении лексикография - это теория и практика составления  словарей, главным образом языковых, лингвистических, в отличие от неязыковых, энциклопедических.

Видный испанский лексикограф X. Касарес в своей широко известной книге «Введение в современную лексикографию» (которая переведена на русский язык) утверждает, что лексикография - это техника и искусство составления словарей.

Даже Ф. Гоув, главный редактор третьего издания словаря Уэбстера, крупнейшего лексикографического предприятия нашего времени, пишет в программной статье «Успехи лингвистики и лексикографии»: «Лексикография еще не наука. По-видимому, они никогда не будет наукой. Однако это сложное, топкое и порой всепоглощающее искусство, требующее субъективного анализа, произвольных решений и интуитивных доказательств".

Изучение опыта автоматизации процедур обработки информации показывает, что в настоящее время необходимо создание специальных технологий, позволяющих оптимальным образом использовать предоставляемые компьютером возможности в области русской лексикографии и лексикологии.

В центре внимания лексикографии находятся методы создания словарей. По мнению французского писателя Анатоля Франса, словарь – это Вселенная, расположенная в алфавитном порядке. Словари необходимы не только, когда не знаешь написания того или иного слова, но и являются важной единицей национальной культуры.

В отличие от лексикологии – теоретической дисциплины, являющейся частью семантики и занятой разработкой  методов описания значения слов (в  том числе и методов их толкования), проблематика лексикографических работ  лежит в сфере словарной практики. Центр ее интереса – способы организации  словарной статьи, устройство словарей и технология их создания. Лингвисты  принимают участие как в разработке лингвистических (филологических) словарей, так и в создании энциклопедических  изданий. Национальные словарные проекты  толковых и орфографических словарей тесно связаны с государственной  языковой политикой, также представляющей собой одну из областей прикладной лингвистики.

          Современная лексикография существенно расширила и усилила свой инструментарий компьютерными технологиями создания и эксплуатации словарей. Это направление прикладной лингвистики получило название компьютерной лексикографии. Специальные программы – базы данных, компьютерные картотеки, программы обработки текста – позволяют в автоматическом режиме формировать словарные статьи, хранить словарную информацию и обрабатывать ее. Множество различных компьютерных лексикографических программ можно разделить на две большие группы: программы поддержки лексикографических работ и автоматические словари различных типов, включающие лексикографические базы данных.

Таким образом, современная  лексикография невозможна без широкой  компьютеризации. Постепенно традиционные методы заменяются компьютерной обработкой лексикографических данных. Кроме очевидной экономии времени, интеллектуальных ресурсов и мн. др. это даёт возможность поддерживать точность и тщательность контроля лексикографического процесса, оперативно исправлять допущенные, ранее не замеченные ошибки, создавать новые лексикографические комплексы.

Компьютер может обеспечивать, по крайней мере, упрощать, многие логические операции, основательно вмешиваться  в сам процесс создания словаря. Только компьютер может предоставить немедленный доступ к словнику, набору цитатного материала и т.п., обнаружить несогласованность различных кусков текста словарной статьи, левой и  правой частей словаря, дефиниций, переводных эквивалентов и т.д. Компьютер может  по желанию лексикографа отслеживать  семантические изменения лексемы, сферу её употребления, фиксировать  изменения в деривационном, синтаксическом, грамматическом аспектах описываемой  единицы.

Компьютер способен расположить  словарный материал в любом необходимом  лексикографу порядке, выполнить рисунки, схемы, графики с высокой степенью точности.

Ученые отмечают следующие  очевидные практические преимущества компьютера в создании словарей:

-   исчерпывающая проверка различного рода ссылок и отсылочной информации;

- контроль за полной  согласованностью как в терминологии описываемого материала, так и в метаязыке словаря;

-   нормализация толкований и дефиниций;

- обеспечение последовательности  среди различных кусочков информации;

- возможность избежать  дефиниций «замкнутого круга»  и т.д.

Чего не может компьютер, так это предвидеть движений человеческого  разума, установить тип возможных  ассоциаций, вербальных и невербальных реакций на ту или иную информацию. Важно заметить, что компьютер  «живёт» умом и чувствами лексикографа, который использует его для совершенствования  и ускорения, обработки данных. Лишь в общении, когда лексикограф  и компьютер ведут диалог в  режиме полного взаимопонимания, машина преображается, она становится незаменимой в процессе создания и использования словаря.

Компьютеризация лексикографической деятельности заключается прежде всего в создании специализированных машинных банков данных и в разработке методов формирования этих банков, представления информации в банках и её использовании.

Современная лексикография  всё шире пользуется машинными банками  данных, в частности, большими корпусами  текстов на  магнитных носителях, в которых компьютер по запросу  осуществляет поиск нужных слов. На этой основе формируется целое новое  направление лингвистики и лексикографии  – корпусная лингвистика и лексикография.

 

        Машинный перевод — процесс перевода текстов (письменных, а в идеале и устных) с одного естественного языка на другой с помощью специальной компьютерной программы. Так же называется направление научных исследований, связанных с построением подобных систем.

        С развитием МП как области прикладной лингвистики появилось множество лингвистических работ, предлагавших структуру описания свойств живого слова в словарной статье машинного словаря. При этом совершенно отдельно появлялись исследования, описывающие, например, "структуру именной группы" или "способы выражения прямого дополнения для глаголов говорения".

Например, на основе признака "принадлежность к части речи" описывалась грамматика такого типа:

• именная группа - это  существительное 

• именная группа - это  прилагательное + именная группа

• глагольная группа - это  глагол + именная группа

• предложение - это именная  группа + глагольная группа

Понятно, что некоторая часть предложений  естественного языка описывается такой грамматикой, но эта часть очень незначительна, и на ее основе нельзя правильно анализировать и переводить хоть сколько-нибудь реальный текст. Но зато можно использовать эффективные методы построения преобразователя по заданной грамматике или, на худой конец, написать программу, которая путем перебора построит деревья зависимостей для ограниченного множества предложений.

Стало принятым делить системы  перевода на системы типа TRANSFER и  системы типа INTERLINGUA. Это разделение основано на особенностях архитектурных решений для лингвистических алгоритмов.

Алгоритмы перевода для систем типа TRANSFER строятся как композиция трех процессов: анализ входного предложения в терминах структур входного языка, преобразование этой структуры в аналогичную структуру выходного языка (TRANSFER) и затем синтез выходного предложения по полученной структуре.

Системы типа INTERLINGUA предполагают априори наличие некоторого метаязыка структур (INTERLINGUA), на котором можно описать все структуры как входного, так и выходного языков в общем случае; поэтому алгоритм перевода в системе типа INTERLINGUA предполагается как более простой: анализ входного предложения в терминах метаязыка и затем синтез из метаструктуры соответствующего предложения выходного языка. "Единственная" сложность в этом случае – разработать сам метаязык и описать естественный язык в соответствующих терминах.

Хотелось  бы надеяться, что эти сведения позволят потенциальным пользователям систем перевода понять, что создание системы  МП – задача не такая уж простая, и, что называется, наукоемкая. А, следовательно, количество действительно пригодных к использованию систем перевода, которое может появляться в единицу времени, принципиально ограничено.

В любом случае, стилистические и грамматические огрехи машинного перевода компенсируются потрясающей скоростью получения его чернового варианта.

  Часто приходится слышать от критиков систем МП: «Программы-переводчики переводят плохо, непонятно кому они вообще нужны. Гораздо проще отдать текст "живому" переводчику или выучить язык самому». Причем, к сожалению, резкость критики зачастую бывает обратно пропорциональна знанию языка. Компания, безусловно, не пытается обвинить в этом критиков и полагает, что лично им движет стремление к совершенству.

Итак, компьютер пока во многом не может заменить переводчика. Стоит  ли тогда вообще применять системы  машинного перевода? Конечно, стоит. Если компьютер используется для перевода литературных текстов, то получается черновой вариант текста, так называемый подстрочник, который превращается в произведение искусства человеком, слабо владеющим языком оригинала, но являющимся хорошим литературным редактором. Если же речь идет о переводе технических текстов, то здесь при правильном выборе словаря по специальности, в рамках которой написан текст, получается вполне удовлетворительный результат, иногда не требующий последующего вмешательства. Вообще необходимость редактирования компьютерного перевода очень часто возникает в связи с проблемами, перечисленными выше. Для этого системы машинного перевода обязательно имеют средства редактирования текстов.

У нас наиболее распространены системы PROMT 98 или Stylus (фирма ПРОМТ) и ПАРС (фирма «Лингвистика 93»). PROMT 98 (Stylus) предназначена для профессионального перевода больших объемов информации, но ее лицензионная копия достаточно дорога. Что же касается использования пиратских копий, то они, как правило, имеют всего один-два словаря с относительно небольшим количеством слов.

Рассмотрим это  на примере:

Оригинал:

Nokia 9000i Communicator now supports short messages with up to 2 280 characters, the current standard being 160 characters. With the Text Web service based on Smart Messaging, the end-user is able to obtain information in a simple text format without graphics or logos from the Internet by using the short message service. Text Web information can include flight schedules, weather or traffic reports, or the stock news.

Перевод без подключения  специализированного словаря:

Nokia 9000i Коммуникатор теперь поддерживает короткие сообщения с до 2280 характеров (знаков), текущий стандарт, являющийся 160 характерами (знаками). С обслуживанием (службой) Ткани (сети) Текста, основанным на Шикарном (сильном) Messaging, конечный пользователь способен получить информацию в простом формате текста без графики или эмблем от Internet, используя короткое обслуживание (службу) сообщения. Информация Ткани (сети) Текста может включать списки (графики) рейса (полета), погоду или сообщения движения, или новости запаса (акции).

Перевод с подключенным словарем “Телекоммуникации и связь”:

Nokia 9000i Коммуникатор теперь поддерживает короткие сообщения с до 2280 символов, текущий стандарт, являющийся 160 символами. С Текстовым обслуживанием Сети, основанным на Smart Messaging, конечный пользователь способен получить информацию в простом текстовом формате без графики или эмблем от Internet, используя систему передачи коротких сообщений. Текстовая информация Сети может включать список рейса (полета), погоду или сообщения трафика, или новости фондового рынка.

         Всем хорошо известно, что хороший перевод текста – это не только творческая, но и достаточно трудоемкая работа. Причем даже самый хороший перевод, как правило, нуждается в редакторской правке. Что касается творческой части, то в обозримом будущем в соревновании компьютер-человек всегда победит "живой" переводчик. Однако для решения проблем, обусловленных трудоемкостью процесса перевода, системы МП могут оказаться хорошим подспорьем. Для того чтобы это лучше понять, перечислим достоинства программ машинного перевода (общие для всех систем МП вообще и систем PROMT в частности):

1. Высокая скорость.  Всего несколько секунд и Вы получаете перевод многостраничного текста. Это позволяет быстро понять смысл текста, а если система настроена на перевод текстов этой тематики, требуется минимальная редакторская правка.

2. Низкая стоимость.  Это очень легко оценить: если вы обращатесь к профессиональным переводчикам, приходиться платить за каждую страницу переведенного текста (в зависимости от региона и уровня квалификации переводчика страница перевода будет стоить от 5 до 20 долларов), либо вы нанимаете штатного переводчика, которому приходится платить зарплату. В случае с системой машинного перевода, вы платите деньги только один раз – при покупке программы. Что вы предпочтете – разовое капиталовложение или регулярные издержки? По данным пользователей компании ПРОМТ при переводе от 50 страниц текста в месяц программа-переводчик PROMT 98 окупается примерно за месяц.

3. Доступ к услуге.  Немаловажный фактор, который многие критики систем МП не принимают в расчет. Программа-переводчик всегда под рукой, а обращаться в переводческое бюро во многих случаях связано с дополнительными затратами времени и сил.

4. Конфиденциальность.  Системе МП вы можете доверить любую информацию. Приятно ли вам отдавать на перевод личную переписку? Готовы ли Вы к тому, чтобы посвятить в свои финансовые дела постороннего переводчика? Пойдете ли вы в переводческое бюро для того, что бы перевести какую-нибудь эротическую литературу? Если да, то действительно вопросов нет. Но даже в этом случае, согласитесь, немногие пользователи Вас в этом поддержат. Мы знаем, что многие пользователи регулярно используют наши системы для перевода личных писем, поскольку часто получаем письма от людей, которым наша система помогла устроить личную жизнь. Программа-переводчик сохранит в тайне любые тексты, которой Вы ей доверите.

Информация о работе Электронные словари. Их классификация