Главная страница
Навигация по странице:

  • Инструменты информационного поиска

  • Yahoo!

  • Логичностью

  • Возможности поискового механизма

  • Google

  • Советы и примеры поиска.

  • Переключатели области поиска

  • ЛАБОРАТОРНАЯ 1. Лаб. работа № 1.docx. Упражнения и задания к работе 1


    Скачать 332.5 Kb.
    НазваниеУпражнения и задания к работе 1
    АнкорЛАБОРАТОРНАЯ 1
    Дата17.05.2020
    Размер332.5 Kb.
    Формат файлаdoc
    Имя файлаЛаб. работа № 1.docx.doc
    ТипОтчет
    #57732
    страница1 из 4

    Подборка по базе: 1 этап - тестовые задания.pdf, ОСНОВЫ МЕТОДИКИ САМОСТОЯТЕЛЬНЫХ ЗАНЯТИЙ ФИЗИЧЕСКИМИ УПРАЖНЕНИЯМИ, Практика задания.docx, Отчет по лабораторной работе.docx, ГОСТ 7.32-2017 Правила оформления. Отчет о научной работе .docx, Методические указания к самостоятельной работе по дисциплине «Ме, Задание по работе с графическим редактором Paint (кубики).docx, Отчёт по лабораторной работе №7 Решение параболических задач в с, Вопросы и задания.doc, Вопросы и задания.doc
      1   2   3   4

    УПРАЖНЕНИЯ И ЗАДАНИЯ К РАБОТЕ № 1

    Цель заданий – научиться ориентироваться в ресурсах Интернет и получить навыки поиска необходимой информации.

    Напечатать Отчет о проделанной работе на практическом занятии №1. Отчет должен содержать ответы на поставленные в заданиях вопросы.

    1. Охарактеризуйте инструменты информационного поиска.

    2. Опишите назначение и принципы работы справочников. Перечислите наиболее значительные справочники и укажите их URL-адреса.

    3. Опишите назначение и принципы работы поисковых систем. Перечислите наиболее авторитетные поисковые системы и укажите их URL-адреса.

    4. Проведите анализ расширенного поиска в различных поисковых системах. Приведите в отчете в табличной форме синтаксис языка запросов нескольких поисковых систем (не менее трех).

    5. Опишите назначение и принципы работы мета-поисковых систем. Перечислите наиболее авторитетные мета-поисковые системы и укажите их URL-адреса.

    6. Найдите файл в формате PDF на русском языке с информацией об оптоэлектронных приборах, используя различные поисковые системы (не менее трех), например, Google, Rambler, Yandex. Сравните общее количество найденных ссылок и проанализируйте первые десять ссылок. Сделайте выводы.

    7. Найдите доску бесплатных объявлений. Проанализируйте результаты поиска.

    8. Найдите картинку с изображение компьютера. Сохраните найденный файл в Вашей папке в папке вашей группы. Покажите результат преподавателю.

    Найдите производителей вакуумного оборудования. Опишите заданные Вами условия поиска. Проанализируйте результаты.

    Инструменты информационного поиска

    Не прекращающееся ни на секунду обновление информационного массива Интернет в сочетании с одновременным ростом объема данных крайне усложняет учет имеющихся документов. Никакие списки серверов, которыми наполнены печатные руководства по работе в Интернет, не могут дать действительно точных сведений. В лучшем случае они в состоянии лишь помочь сделать первые шаги: сверхбыстрая смена ситуации в киберпространстве приводит к тому, что подобные перечни устаревают уже в момент своего выхода в свет, а поддерживать их в актуальном состоянии становится принципиально невозможно из-за стремительного роста новых и новых узлов.

    Необходимость и важность проблемы информационного поиска привела к образованию в самом Интернет целой отрасли, задача которой заключается именно в оказании помощи пользователю в его навигации в киберпространстве. Составляют эту отрасль специальные поисковые службы или сервисы. Условно их можно разделить на справочники (directories) и поисковые системы (search engines).

    Эти разновидности внешне очень похожи, поскольку каждый справочник, как правило, обладает собственной поисковой системой, а каждая поисковая система - собственным справочником. Однако принципы их работы базируются на абсолютно разных подходах и технологиях. При этом каждая разновидность поисковых сервисов применяется для решения определенного типа задач. Правильным выбором инструмента во многом определяется стратегия поисковой деятельности и, в конечном итоге, результат разысканий.

    Поисковые средства первой группы, называемые еще каталогами или рубрикаторами, представляют собой электронные справочники, имеющие четкую иерархическую систематическую или логико-тематическую структуру, во многом напоминающую структуру систематического каталога библиотеки. Работа со справочниками позволяет ориентироваться в ресурсах Интернет в пределах отдельных отраслей знания, углубляясь от общего к частному, меняя иерархические ветви, возвращаясь на несколько шагов назад и т.д. К наиболее значительным справочникам всемирного масштаба относятся Yahoo! (www.yahoo.com), Open Directory (dmoz.org), About (www.about.com). Среди российских разработок в этой области значатся Апорт (www.aport.ru), List.ru (list.mail.ru), Weblist (www.weblist.ru), Иван Сусанин (www.susanin.net) и Улитка (www.ulitka.ru).

    Главной отличительной особенностью справочников является то, что все они сделаны вручную. Редакционные коллегии каждого из справочников, которые по характеру труда более всего напоминают отделы каталогизации и систематизации крупных библиотек, регулярно просматривают содержимое вновь появившихся серверов и следят за изменениями на уже существующих. Выявленные данные анализируются и заносятся в разделы справочника в соответствии с принятой классификацией. Описание сервера в целом или его раздела, если он представляется вполне самостоятельным блоком, снабжаются краткой аннотацией, содержащей самые общие сведения о характере имеющейся информации. В некоторых случаях добавляются сведения о языке документов, посещаемости ресурса, его физическом месторасположении и т.п. Естественно, что подобным образом можно описать лишь часть ресурсов Сети, да и то только весьма крупные объекты, такие, как, например, сервера организаций и учреждений. По причине огромной трудоемкости такой работы, справочники отражают лишь незначительную часть ресурсов Сети, в первую очередь наиболее заметные сайты. Не может исправить ситуацию и то, что в последние несколько лет владельцы серверов получили возможность самостоятельно регистрировать собственные сайты, занося в специальные формы всю необходимую информацию, включая краткую аннотацию. Это в незначительной степени экономит время редакторов, которые обязаны проверить правильность всех введенных данных по каждому ресурсу.

    Основными параметрами, характеризующими достоинства справочников являются:

    • объем;

    • оперативность отражения новых или изменившихся ресурсов;

    • логичность и последовательность иерархической схемы классификации;

    • перекрестность структуры.

    Объемом справочника определяется степень его надежности или "информационная прочность". От этого зависит уровень доверия, который пользователи питают к конкретному каталогу. Так как материалы в Интернет появляются, изменяются, а порой и бесследно исчезают ежедневно, важно то, насколько оперативно появляются ссылки на новые сайты и исправляются или удаляются ссылки на устаревшие ресурсы. В некоторых системах существует специальный механизм, периодически проверяющий доступность сайта и исключающий его из перечня при долгом "отсутствии" в Сети. Логичностью (научностью) применяемой схемы классификации определяется степень простоты, с которой пользователи могут находить требуемые сведения. Система же перекрестных ссылок позволяет выявлять информацию, используя разные подходы (например, территориальный или отраслевой). В этом случае схема классификации должна автоматически выводить пользователя на искомый объект, какой бы путь поиска не был выбран.

    Возможности составления запроса для этого вида поисковых средств особой роли не играют, так как сложные разыскания, требующие большой детализации запроса, с помощью каталогов не проводятся.

    Справочники предназначены для решения трех типов задач:

    • ориентация в незнакомой отрасли знания;

    • разыскание крупных объектов, каковыми являются, к примеру, серверы целых организаций или значительных проектов;

    • получение готового перечня ресурсов, имеющих размытый поисковый образ, например, клиник пластической хирургии, библиотек определенного типа, транспортных расписаний или сайтов различных политических партий.

    Следует помнить, что, обращаясь к справочникам, мы изначально можем рассчитывать на получение лишь очень общих сведений по тематике, и никогда - детальных данных. Понять это помогает простой пример, когда от сервера крупной корпорации, например, "Газпром", содержащего тысячи страниц, в справочнике будет представлено лишь название и несколько строк аннотации. Другим примером является сравнение справочника ресурсов Интернет с систематическим каталогом библиотеки, в котором от книги (в данном случае целого сайта) остается лишь описание и аннотация.


    Описания ресурсов в одном из российских справочников

    В основу работы поисковых систем (поисковых машин) заложены совершенно иные технологические принципы. Задача поисковых машин - обеспечивать детальное разыскание информации в электронной вселенной, что может быть достигнуто только за счет учета (индексирования) всего содержания максимально возможного числа web-страниц. В отличие от справочников, все они функционируют в автоматизированном режиме и имеют одинаковый принцип действия. Поисковые системы состоят из двух базовых компонентов. Первый компонент представляет собой программу-робот, задача которого путешествовать с сервера на сервер, находить там новые или изменившиеся документы и скачивать их на главный компьютер системы. При этом робот, просматривая содержимое документа, находит новые ссылки, как на другие документы данного сервера, так и на внешние сайты. Программа самостоятельно направляется по указанным ссылкам, находит новые документы и ссылки в них, после чего процесс повторяется вновь, напоминая хорошо известный в библиографии "метод снежного кома". Выявленные документы обрабатываются (индексируются) вторым компонентом поисковой системы. При этом, как правило, учитывается все содержание страницы, включая текст, иллюстрации, аудио- и видеофайлы и пр. Индексации подвергаются все слова в документе, что как раз и дает возможность использовать поисковые системы для детального поиска по самой узкой тематике. Образуемые гигантские индексные файлы, хранящие информацию о том, какое слово, сколько раз, в каком документе и на каком сервере употребляется, и составляют базу данных, к которой происходит обращение пользователей, вводящих в строку запроса сочетания ключевых слов.

    Выдача результатов осуществляется с помощью специального модуля, который производит интеллектуальное ранжирование результатов. При этом берется в расчет местоположение термина в документе (название, заголовок, основной текст), частота его повторения, процентное соотношение искомого термина к остальному тексту страницы, а также число и авторитетность внешних ссылок на данную страницу с других сайтов.

    К основным параметрам поисковых систем относятся:

    • объем индексных файлов (число проиндексированных серверов и отдельных документов);

    • степень оперативности обновления базы данных за счет включения сведений о новых материалах и удаления устаревших;

    • возможности для составления запроса;

    • интеллектуальность системы ранжирования результатов поиска;

    • наличие дополнительных сервисных функций, облегчающих работу пользователя.

    Первая величина, являющаяся ключевой, устанавливает широту охвата материала и определяется числом проиндексированных документов. Сейчас эта цифра для лидеров мирового сетевого поиска колеблется в пределах от 2 до 4 с лишним миллиардов.

    Учитывая тот факт, что в среднем интернетовский адрес сохраняет актуальность до полугода, после чего документ или меняет местоположение или убирается с сервера, большое значение имеет уровень оперативности обновления данных, характеризующий степень соответствия индексного файла поисковой системы реальному местоположению документов на сайтах. В настоящее время этот параметр колеблется от двух недель до полутора месяцев.

    Возможности поискового механизма выражать запрос максимально точно в значительной степени предопределяют долю релевантных документов в перечне полученных результатов. Каждая машина имеет свою собственную лексику, которая по-разному позволяет детализировать поисковое предписание.

    Все поисковые машины обладают модулем ранжирования результатов поиска. Создание таких модулей - целая область программирования, в которой конкурируют сложнейшие алгоритмы, созданные разными компаниями. Перечень факторов, принимаемых во внимание при определении места документа в перечне ссылок, необычайно широк: от местоположения слова на странице до рейтинга (авторитета) страниц, имеющих ссылки на найденный документ.

    Не последнюю роль играет и простота интерфейса, наличие дополнительных сервисных функций, как, например, возможность перевода текста документа на иностранный язык, способность выделять все документы с определенного сайта, сужение критериев в ходе поиска, нахождение документов "по образцу" и т.д.

    По этим параметрам среди внушительного числа поисковых систем выделяются несколько наиболее признанных, позволяющих выявлять информацию с высокой степенью полноты и надежности. К наиболее авторитетным поисковым системам всемирного масштаба в настоящее время относятся Google (www.google.com), AlltheWeb (www.alltheweb.com) и Alta Vista (www.altavista.com). Российские системы этого класса ныне представлены Яндекс (www.yandex.ru), Rambler (www.rambler.ru) и Апорт (www.aport.ru).

    Практически все всемирно известные справочники и поисковые системы в настоящее время превратились во внушительные информационные корпорации с многомиллионными доходами. Заработав авторитет наиболее посещаемых мест в Сети, они предоставляют свои страницы для размещения рекламной информации, доходы от которой и составляют основу их бюджета. Постепенно поисковые сервера превращаются в многофункциональные порталы, в которых поисковый сервис остается главной приманкой для пользователей, но далеко не единственной и даже не основной из предоставляемых услуг. Помимо разыскания информации, такие сервера обычно предоставляют пользователям бесплатную электронную почту, возможность бесплатно размещать собственные страницы, сведения о погоде, текущих новостях, биржевые котировки, карты местности и т.д.

    (http://textbook.vadimstepanov.ru)


    Расширенный поиск. Поисковые системы

    Яndex

    Поисковая система Япаех находится по адресу www.yandex.ru и под- Держивается компанией CompTek International. Дата официального выпуска системы — 23 сентября 1997 года.

    Компания CompTek International занимается внедрением новых компьютерных и телекоммуникационных технологий и работает на российском рынке с 1989 г. Компания имеет обширный опыт работы в таких областях, как беспроводные компьютерные сети, компьютерная телефония и полнотекстовые поисковые системы.

    Что же такое Яndex? Вот как отвечают на этот вопрос создатели системы.

    Яndex — это полнотекстовая информационно-поисковая система (ИПС), учитывающая морфологию русского и английского языков. Система Яndex предназначена для поиска информации в электронных текстах различной структуры и разных способов представления (форматов). Hndex (произносится «япдекс») расшифровывается как Языковый Индекс или, в английском написании, Yandex — Yet Another iNDEX. Также можно рассматривать Andex как частичный перевод слова «Index» с английского на русский язык («I» означает «Я»).

    В основе поисковой системы Yandex. Ru лежит системное ядро, общее для всех продуктов с префиксом Andex (Hndex.Site, Hndex.Lib, Andex.Dict, Andex.CD).

    Первые продукты серии Andex (Hndcx.Site, Andex.Dict) были представлены широкой публике 18 октября 1996 года на выставке Netcom'96. Поисковая машина для «русского Интернета» явилась естественным продолжением линии Hndex.

    Как уже говорилось, в хорошем вопросе содержится половина ответа. Искать и находить нужное в ворохе текстов в Интерпете — умение не только поисковой системы, но и пользователя, задающего запрос.

    Andex не требует от пользователя знания специальных команд для поиска. Достаточно набрать вопрос («где найти дешевые компьютеры» или «нужны телефоны Москвы и московской области»), и вы получите результат — список страниц, где встречаются эти слова.

    Независимо от того, в какой форме вы употребили слово в запросе, поиск учитывает все его формы по правилам русского языка. Например, если задан запрос идти, то в результате поиска будут найдены ссылки на документы, содержащие слова «идти», «идет», «шел», «шла» и т. д. На запрос окно будет выдана информация, содержащая и слово «окон», а на запрос отзывали — документы, содержащие слово «отозвали».

    Сервер Yandex.Ru был основательно обновлен 31 мая 1999 года — появилась новая поисковая база с новыми возможностями. Новый Япс1ех работает не только с языковыми запросами, но и позволяет выполнять поиск только на определенных серверах или же исключить из поиска заведомо ненужные серверы. Появилась возможность поиска изображений по подписям к ним и по именам файлов. Также стали доступными для поиска такие объекты, как сценарии, апплеты и стили (поиск осуществляется по названию). Удобная работа с новыми возможностями предлагается на странице расширенного поиска, где сложный язык запросов сведен к заполнению полей в форме.

    Кроме стандартной сортировки результатов — по релевантности (то есть по степени соответствия запросу), можно отсортировать документы по дате обновления (чтобы получить самую свежую информацию). Появилась новая функция — группировка документов по серверам. Эта возможность, дополняющая список серверов, позволяет использовать широкий набор критериев сортировки.

    Интересной особенностью системы является возможность поиска в Япс1ех из бро-узера без ввода запроса. Для этого нужно с сайта Yandex.Ru (http://yandex.ru/info/ button.html) установить кнопку в Панель ссылок броузера (Personal Toolbar для Netscape Navigator или Ссылки (Links) для Internet Explorer). После этого достаточно выделить нужный текст на просматриваемой странице и щелкнуть на этой кнопке. Запрос будет передан Andex, а результаты поиска появятся в отдельном окне броузера.

    С 30 июня 1999 года для пользователей Яndex стала доступной новая услуга — бесплатная подписка на запросы.

    Вы можете оставить свой запрос на сервере Yandex.Ru, a Web-агент будет регулярно высылать вам по электронной почте информацию о появлении новых и (или) измененных документов, соответствующих этому запросу. При каждом обходе Сети робот индексирует найденные документы, а уже известные страницы проверяет на предмет изменения и при необходимости обновляет их в базе индекса. Проверка запросов происходит раз в сутки. Если по запросу было найдено что-нибудь новое, Web-агент отправляет пользователю соответствующее письмо. Можно выбрать, что именно должно приходить в письме — список найденных документов или ссылка на страницу, где этот список хранится.

    Подписаться на запрос очень просто — нужно заполнить форму по адресу http://yndex.ru/subscribe/regform.html, после чего вы получите по электронной почте имя пользователя и пароль, с которыми сможете зайти на страницу http://yandex.ru/subscribe/. Запросы для подписки создаются так же, как и обычные запросы в Yandex.Ru (4юрма аналогична странице расширенного поиска).

    На момент подготовки этого материала система Andex имела самую большую базу проиндексированных документов среди российских поисковых систем. Система обрабатывает более 14 000 000 документов с более чем 60 000 серверов русскоязычного Интернета.

    Апорт

     Поисковая система Апорт (www.aport.ru) была создана российской компанией Агама на базе собственных уникальных разработок и действует в Интернете с 1996 года.

    В 1997 году проект был одобрен московскими представительствами корпораций Intel и Microsoft и обеспечен их постоянной поддержкой.

    Апорт — уникальная двуязычная поисковая машина. Имея те же основные черты, что и AltaVista, Апорт содержит данные о намного большем числе современных ресурсов российского Интернета. Также Апорт входит в число ведущих поисковых систем, сертифицированных Microsoft как локальные поисковые системы для русской версии броузера Microsoft Internet Explorer. Очередной этап в истории проекта (конец 1998 года) связан с появлением у компании Агама нового стратегического партнера, привлекшего в Апорт иностранные инвестиции. Это еще более ускорило рост поисковой системы. В течение 1999 г. система Апорт несколько раз поменяла свой внешний вид и включила в себя ресурсы Интернет-каталога @Rus (бывшего «Ау!»).

    К третьему тысячелетию компания Агама выпустила новую, кардинально переработанную версию поисковой системы — Апорт 2000. На ее создание ушло несколько человеко-лет работы квалифицированных программистов.

    Успех системы Апорт 2000 во многом определяется стратегической линией, выбранной компанией. Важным шагом в этом направлении является новая степень интеграции поисковой машины с каталогом-рубрикатором @Rus: Апорт 2000 использует при выдаче результатов поиска аннотации сайтов, составленные редакторами каталога. Подробная аннотация — один из важных элементов нового формата выдачи, позволяющий системе Апорт 2000 сделать поиск информации в Интернете более быстрым и точным. Ведущие мировые ресурсы, работающие в области поисковых услуг, сегодня также развиваются в этом направлении: все больше и больше внимания навигационные системы уделяют участию человека в обработке информации. Если в начале 1996 года только один из шести ведущих поисковых серверов — Yahoo! — использовал в своей базе, а также при выдаче результатов информацию, обработанную людьми, то сегодня по этому пути пошли также MSN Search, Netscape Search, Lycos и AltaVista.

    Основные свойства поисковой системы Апорт:

    • перевод запроса и результатов поиска с русского на английский и наоборот;

    • автоматическая проверка орфографических ошибок запроса;

    • более информативный вывод результатов поиска для найденных сайтов (не только первое предложение!);

    • возможность поиска в любой грамматической форме (что особенно важно для русского языка);

    • мощный язык расширенных запросов для профессиональных пользователей.

    Дополнительные свойства:

    • поддержка пяти основных кодовых страниц (разных операционных систем) для русского языка;

    • технология поиска с использованием ограничений по URL (адресу) и дате документов;

    • поиск ведется не только по тексту, но и по заголовкам, комментариям и подписям к картинкам и т. д.;

    • сохранение параметров поиска и определенного числа предыдущих запросов пользователя;

    • объединение копий документа, находящихся на разных серверах.

    Новый формат представления информации в системе Апорт 2000 является, пожалуй, одним из самых удобных среди крупнейших поисковых систем российского Интернета. Группировка документов по сайтам и вывод на экран тех предложений, в которых были обнаружены искомые слова, очень помогают ориентироваться в найденных документах. ;-?-

    AltaVista

    Alta Vista (www.altavista.com) — одна из старейших поисковых систем в Интернете. Первый Web-индекс был представлен компанией в 1995 году. В настоящее время индекс AltaVista содержит данные о более чем 250 миллионах документов.

    Ядро поисковой системы обязано своим рождением странной особенности исследовательской лаборатории компании Digital Equipment Corp. Сотрудники этой лаборатории зачем-то хранили всю свою электронную переписку за последние 10 лет. Чтобы эта куча информации не просто занимала дисковое пространство, а приносила хоть какую-то пользу, была создана программа для индексирования документов и поиска нужных слов в ворохе пожелтевшей от времени электронной корреспонденции. Система получилась настолько удачной, что впоследствии с успехом перекочевала на просторы Всемирной паутины.

    Индекс Alta Vista содержит документы на 25 языках. В область поиска можно включить документы на всех поддерживаемых языках или только в документах на определенном языке, а на специальной странице можно указать несколько языков для поиска на всех выбранных языках одновременно.

    Окно поиска AltaVista содержит следующие элементы (рис. 4.3).

    • Поле ввода запроса (Find this:). В это поле вводится запрос для поиска интересующей вас информации. Запрос может представлять собой вопрос, утверждение, фразу или просто несколько слов, определяющих предмет поиска.

    • Советы и примеры поиска. Под полем ввода запроса на экран выводится совет или пример, показывающий способ более эффективного поиска с помощью AltaVista. Советы и примеры периодически обновляются, поэтому с их помощью можно приобрести ценный опыт в таком непростом деле, как поиск информации в Интернете.

    • Меню выбора языка. С помощью раскрывающегося списка выбора языка можно ограничить область поиска только документами, написанными на указанном языке. В настоящее время поддерживаются 25 языков.

    • Переключатели области поиска (Find results on:). Переключатели под полем запроса используются для того, чтобы указать системе, где искать интересующую вас информацию. По умолчанию установлен переключатель The Web, означающий, что AltaVista будет искать информацию среди всех ресурсов World Wide Web. В зависимости от предмета поиска можно ограничиться поиском только в новостях (News), зонах предложения товаров через Интернет (Products) или конференциях (Discussion Groups).

    • Ссылки. В окне поиска имеются ссылки на раздел справочной информации (Help), страницу настройки «семейного фильтра» (Family Filter) и страницу настройки языковых параметров AltaVista (Language Settings).

    • Вкладки. Над полем ввода запроса находится пять вкладок. Первая вкладка (Search) открывается по умолчанию и содержит описанные выше элементы. Вторая вкладка (Advanced Search) предназначена для ввода усложненных запросов. Третья, четвертая и пятая вкладки (Images, Audio/МРЗ и Video) предназначены, соответственно, для поиска изображений, звуковых файлов и видео. Если требуется найти элемент мультимедиа вместо текстовой информации, то следует использовать эти вкладки.

    AltaVista является одной из крупнейших систем поиска в Интернете. Она обладает развитым языком запросов и отлично подходит для поиска в Сети как специальной информации в определенной области, так и информации более общего характера.

      1   2   3   4


    написать администратору сайта