Рубрика: Истины интернета
Web-страницы создают с помощью языка HTML (HyperText Markup Language — язык гипертекстовой разметки) Именно благодаря гипертекстовой разметке Web-страницы и выглядят столь красочно. HTML позволяет не только придать должную форму тексту (разбить его на абзацы, снабдить заголовком, подзаголовками и т.д.), но и разместить на Web-странице таблицы, изображения, аудио- и видеофайлы, любую другую информацию в электронном виде. Более того, HTML позволяет установить связь как между отдельными элементами одной Web-страницы, так и между Web-страницами, даже если они находятся на компьютерах, установленных на разных континентах. HTML одинаково работает на всех компьютерных платформах, именно поэтому “путешествовать” по Internet одинаково удобно и со “стандартным” компьютером, сердцем которого является Pentium, и с элегантным iMac, и с карманным Palm либо Psion. Это обусловлено тем, что файлы формата HTML представляют собой простые текстовые файлы, которые одинаково хорошо открываются в любом броузере (или текстовом редакторе).
Рубрика: Введение | Отзывов нет »
Внешний вид HTML-документа определяется его особыми элементами, которые называются дескрипторы.
Дескрипторы – это элементы НТМL-документа, определяющие внешний вид Web-страницы. Как правило, дескрипторы используются парами, и их действие относится к элементу Wcb-страницы (тексту, изображению и т.п.), имя которого заключено между открывающими и закрывающими дескрипторами.
Дескрипторы стандартизованы Консорциумом World Wide Web (World Wide Web Consortium — W3C). В этой международной организации работают около 180 представителей разных коммерческих, академических и правительственных структур. Именно благодаря деятельности W3C появились протоколы, на основе которых работает WWW — “Всемирная паутина”, с которой у многих пользователей ассоциируется понятие Internet.
Читать полностью »
Рубрика: Введение | Отзывов нет »
Благодаря гиперссылкам (ИХ Все чаще называют просто ссылки) просмотр Web-страниц становится столь же увлекательным, как серфинг (именно поэтому посетителей Web-страниц иногда называют Web-серферам, а процесс перемещения с одной страницы на другую — Web-серфингом). Пользователь может легко перейти со страницы со спортивными новостями на сайт с финансовой информацией, один-единственный раз щелкнув мышью на ссылке (которая к тому же может быть оформлена как забавное изображение). Столь же легко открываются всевозможные документы. Происходит это благодаря тому, что у каждого из них есть свой неповторимый (программисты говорят— уникальный) адрес. Этот адрес называется URL (Uniform Resource Location — универсальный указатель информационного ресурса).
По мере распространения стандарта XML термин URL будет вытесняться новым — URI (Uniform Resource Identifier — универсальный идентификатор ресурса).
Для того чтобы создать на странице гиперссылку, следует использовать дескриптор <а>, который часто называют “якорь” (от англ. anchor). В отличие от многих других дескрипторов, у него обязательно должны быть атрибуты. Синтаксис создания гиперссылки, ведущей с одной Web-страницы на другую, таков (приведен только открывающий дескриптор): <а href=”URL объекта, на который необходимо сделать ссылку”>
Читать полностью »
Рубрика: Введение | Отзывов нет »
Как уже говорилось, между дескрипторами заголовка <head> и </head> должны находиться дескрипторы <title> и </title>, между которыми, в свою очередь, вводятся титульные данные страницы, т.е. ее заглавие, которое будет отображаться в заголовке броузера. Но в заголовке страницы содержатся и другие характеризующие ее данные (метаинформация о странице), которые остаются невидимыми для пользователя, открывшего Web-страницу в своем броузере. Именно этой информацией пользуются (но не всегда) поисковые машины при определении того, соответствует ли ее содержимое запросу пользователя, и если да, то в какой степени. Кроме того, эта информация может выводиться в результатах поиска в качестве описания найденной Web-страницы. Если ее разработчик пренебрег вводом мета информации, выводятся 256 или 512 первых символов найденной страницы.
Для ввода информации, характеризующей Web-страницу, используется дескриптор <meta>. Он имеет два атрибута: name и contents. Вся метаинформаиия, которой должна сопровождаться страница, присваивается этим атрибутам. Атрибут name указывает на тип мета информации, атрибут contents содержит сам текст. В частности, атрибуту name могут быть присвоены следующие значения:
Читать полностью »
Рубрика: Введение | Отзывов нет »
Как уже говорилось в предыдущем разделе, HTML позволяет отформатировать текст Web-страницы, а также — с помощью гиперссылок — разместить на ней таблицы, изображения, аудио- и видеофайлы и любую другую информацию в электронном виде.
Тип файла и пользователь, и броузер может легко определить по расширению файла. Для чего это нужно броузеру, понятно: чтобы правильно этот файл обработать. Но и пользователь должен уметь определять типы файлов по их расширениям примерно так же, как опытный автолюбитель по буквам либо цифрам номера автомобиля может определить, из какой области он приехал. Особенно полезно это бывает при поиске файлов на FTP-серверах. Но даже при поиске файлов с помощью обычной поисковой машины часто удается значительно сузить область поиска, выбрав, допустим, опцию МР3-файлы или Искать только PDF-файлы.
Итак, в Internet чаще всего встречаются файлы следующих типов.
Читать полностью »
Рубрика: Введение | Отзывов нет »
В предыдущем посте мы уже говорили об операторах. Используя их совместно с ключевыми словами, пользователь может достаточно ”доходчиво” объяснить ПС, что же именно он ищет. Правда, поисковой машине нужно математически точно поставить задачу — запроси типа “Меня интересуют компьютерные программы, облегчающие работу в Internet” и ПС не поймет. Она ведь машина и “думает” иначе, чем человек. Но если вы четко сформулировали запрос, результат может оказаться впечатляющим: всего несколько ссылок, и кяждая из них, что называется, “в тему”. Благодаря хорошо сконструированному запросу вы найдете не сайты на интересующую тему, а конкретные страницы и даже отдельные документы.
Правила составления сложных запросов на одном сервере могут отличаться от таковых на другом, но в любом случае вы будете пользоваться логическими операторами И (AND), ИЛИ (OR), HE (NOT), БЛИЗКО (NEAR) и аналогичными последнему.
Оператор NEAR (его называют оператор контекстной близости) иногда используются и другие операторы такого типа — FAR, BEFORE и ADJ), строго говоря, не относится к числу логических и при программировании не используется. Тем не менее его можно однозначно (а значит, точно) использовать ь запросах на поиск. При формулировке сложного запроса нужно придерживаться следующих правил.
Читать полностью »
Рубрика: Сложный поиск | Отзывов нет »
Поскольку далеко не все пользователи владеют языком запросов, а искать в Internet информацию приходится практически всем, многие ИПС идут им навстречу и упрощают задачу формирования сложных запросов. Для этого используются специальные формы. Вызывается такая форма в результате шелчка на кнопке Расширенный поиск (на зарубежных поисковых машинах — Advanced search, иногда Search Assistant), расположенной обычно недалеко от кнопки Поиск (Search), По сути, после заполнения вами предложенной формы машина выполняет то, что мы называем “сложный поиск”, поэтому термины “расширенный поиск” и “сложный поиск” часто используются как синонимы. Но мы далее все же будем подразумевать под расширенным поиском таковой, проводимый с использованием формы, а под сложным — с использованием операторов и ключевых слов.
Рассмотрим методику проведения расширенного поиска на примере ИПС Rambler.
В поле Что искать пользователь должен ввести ключевые слова, наиболее точно, по его мнению, выражающие суть запроса. Далее он должен указать, где должны искаться ключевые слова — в текстах документов, их заголовках или в гипересылках. Для этого служит переключатель Поиск по тексту.
Следующий переключатель позволяет указать, должны ли в результатах поиска присутствовать все введенные ключевые слова, хотя бы одно из них или введенная фраза целиком. Как видите, это равносильно применению соответственно оператора И, ИЛИ либо двойных кавычек из языка запросов. Но если применение этих операторов в разных ИПС имеет свои особенности, при заполнении формы о них можно забыть.
Путем установки переключателей вы можете также указать, следует ли ограничивать расстояние между словами запроса (по умолчанию в результаты включаются только документы, в которых между введенными пользователем ключевыми словами присутствует не более 40 “посторонних” слов), исключить документы, содержащие указанные вами слова, выбрать язык документов и даже указать диапазон дат создания, к которому они должны относиться.
Как видите, форма, применяемая для расширенного поиска, также позволяет повышать релевантность поиска. Но возможности запроса, в котором используются операторы, вес же гораздо шире. Так, описываемая поисковая машина Rambler позволяет точно указывать, сколько слов могут разделять введенные пользователем ключевые слова. При заполнении формы, как уже говорилось, будет использовано лишь одно значение, принимаемое по умолчанию.
Многие поисковые серверы после проведения первого этапа поиска позволяют установить флажок Искать в найденном. Этой функцией удобно пользоваться для уточнения некоторых параметров поиска. Например, вам могут предложить (путем вывода на экран соответствующей формы) более точно указать, какого рода документы вас интересуют — статьи, новости, рефераты, доклады и курсовые работы либо статьи в словарях и энциклопедиях. Некоторые ИПС позволяют уточнить тематику поиска (называется эта функция, однако, как правило уточнение области поиска), для чего на экран после щелчка на соответствующей ссылке выводится специальная форма. Многие ИПС дают возможность сразу же, еще при заполнении формы расширенного поиска, ограничить область поиска, для чего в форме предусматриваются специальные поля.
Рубрика: Сложный поиск | Отзывов нет »
Как правило, “с первого захода” найти нужный документ не удается. Но это не значит, что его нет в internet. Для того чтобы все же отыскать нужную информацию, иногда бывает достаточно изменить какие-то параметры поиска. В самом общем случае можно изменить тип ИПС (например, если вы пользовались каталогом, обратитесь к поисковой машине), иногда — перейти с русскоязычной ИПС на англоязычную (или наоборот). В некоторых случаях бывает полезно провести поиск с помощью метапоисковой системы. Но даже если поиск оказывается относительно успешным, очень часто бывает полезно изменить его параметры. Именно это мы будем иметь в виду, когда будем говорить о варьировании поиска. При профессиональном поиске (следующий раздел рубрики Истины интернета) варьирование необходимо для того, чтобы провести поиск максимально эффективно.
Перейдем к конкретным примерам.
Допустим, вы ишете документы, в которых говорится об эффективности поиска в Internet. Если вы введете только ключевые слова эффективность поиска, релевантность поиска будет низкой, потому что в результатах запроса будет много ссылок на документы, относящиеся к поиску подводных лодок, воздушных целей и т.п. Поэтому нужно использовать не менее трех ключевых слов. Очевидно, третьим должно быть слово Internet. Но если здесь используется латинское написание этого термина, то в Сети все чаше используется термин Интернет. Результаты поиска при использовании одного и того же термина, написанного латиницей и кириллицей, получаются существенно разными. В частности, если вас интересовали коэффициенты, которыми оценивается эффективность поиска в Internet, то в одном случае ссылка на статью, содержащую исчерпывающую информацию по данному вопросу, имеет порядковый номер один (можно только удивляться тому, что среди шестнадцати с лишним тысяч сайтов и почти 154 тысяч документов ИПС Rambler отыскала весьма релевантный), в другом среди первых 15-ти ссылок нужный нам документ (не обязательно тот же самый, ссылка на который была первой при предыдущем варианте поиска) отсутствует. Пришлось бы потратить немало времени на проведение расширенного поиска с помощью формы или уточнение логического выражения, используемого в качестве запроса, чтобы найти нужную информацию.
Читать полностью »
Рубрика: Сложный поиск | Отзывов нет »
Многие поисковые машины позволяют не только проводить расширенный поиск, но и настраивать себя под конкретного пользователя. Например, вы можете указать, какую информацию о найденном документе поисковая машина должна выводить вместе с его адресом — URL, дату размещения, размер, кодировку, степень соответствия запросу и др. На поисковых машинах предлагаются для этого специальные формы, похожие на те, которые используются при расширенном поиске. Заполнив один раз такую форму (точнее, установив дополнительные флажки либо сняв некоторые из предлагаемых по умолчанию), вы в дальнейшем все время будете получать результаты поиска отданной ИПС в удобном (или привычном) для вас виде. Однако для того чтобы помнить о ваших предпочтениях, ИПС должна установить на ваш компьютер файлы cookies. Эти файлы предназначены именно для таких случаев — запоминать и в дальнейшем учитывать интересы конкретных пользователей. В принципе эти файлы выполняют полезную функцию. Они хранят информацию об адресе, имени, номере телефона, предпочтениях пользователя и о его предыдущих запросах. Благодаря им вы можете сэкономить время, оформляя следующий заказ в Internet-магазине. Доступ к такому cookie-файлу имеет только Web-узел, создавший его, и и принципе особой угрозы для вашего компьютера такой файл не представляет. Но иногда вам подбрасывают cookie-файл, не спрашивая на то разрешения, те узлы, которые вы даже не посещали. Такие cookie-файлы называются сторонними, они могут проникнуть на ваш компьютер, например через рекламный баннер. Internet-фирма, занимающаяся рекламой, с помощью такого cookie-файла может проследить, какие Web-страницы вы посещаете, а потом воспользоваться этой информацией для ‘”рекламной атаки” или продать собранную информацию спаммерам — людям, использующим Internet для “впаривания” товаров. Именно они забивают ваш электронный почтовый я шик спамом — рекламными сообщениями о товарах, которые вам сто лет не нужны. Internet Explorer позволяет ограничить активность сторонних cookie-файлов, а также cookie-файлов, легально оставленных Web-узлами. Вы можете ограничить информацию, доступную cookie-файлам, и способы ее использования, выбрав соответствующий уровень конфиденциальности. Для этого откройте соответствующую вкладку (Сервис=>Свойства обозревателя=>Конфиденциальность). Установить желаемый уровень конфиденциальности можно очень просто: переместите бегунок вверх, чтобы повысить его, и вниз — чтобы понизить. При этом справа от бегунка будет указан уровень (Средний, Умеренно высокий, Высокий) и разъяснено, какие именно cookie-файлы будут блокированы или ограничены в своих действиях. При крайних положениях бегунка cookie-файлы или полностью блокируются, или им полностью “развязываются руки”.
Читать полностью »
Рубрика: Сложный поиск | Отзывов нет »
С помошью умело введенных в поле запроса операторов и ключевых слов пользователь может довольно доходчиво объяснить ИПС, что именно его интересует.
Язык запросов к ИПС в настоящее время не стандартизован, поэтому одинаково все без исключения поисковые машины понимают лишь несколько наиболее употребительных операторов: AND, OR, NOT и двойные кавычки, с помощью которых поисковой машине поручают найти документы, в точности содержащие заключенную в кавычки фразу. Множество других операторов по-разному трактуется разными ИПС или попросту не воспринимается ими. Но каждая ИПС предоставляет пользователю справочную информацию, благодаря которой он сможет научиться формулировать весьма сложные запросы для этой ИПС.
Читать полностью »
Рубрика: Сложный поиск | Отзывов нет »