Особенности поисковых систем. Последний лист дипломной работы. Языки типа "Like this"

2.2 Особенности поисковых систем

Особенности поисковых систем. В работе поисковый процесс представлен четырьмя стадиями: формулировка (происходит до начала поиска); действие (начинающийся поиск); обзор результатов (результат, который пользователь видит после поиска); и усовершенствование (после обзора результатов и перед возвращением к поиску с иной формулировкой той же потребности). Более удобная нелинейная схема поиска информации состоит из следующих этапов:

Факторы вне страницы - это те, которые не находятся непосредственно на самом сайте, и в большинстве случаев более трудно влиять. Внешние факторы являются солью в еде и всегда должны уделяться особое внимание. Это ссылки с других сайтов на ваш сайт. Термин «Оптимизация сайта вне страницы» суммирует все факторы, которые касаются «внешней» оптимизации и продвижения страницы, чтобы улучшить рейтинг сайтов в поисковых системах. Описание - это метатег, фрагмент кода веб-сайта, который предоставляет как пользователю, так и поисковой системе базовую информацию о содержании данной подстраницы веб-сайта.

– фиксация информационной потребности на естественном языке;

– выбор нужных поисковых сервисов сети и точная формализация записи информационной потребности на конкретных информационно-поисковых языках (ИПЯ);

– выполнение созданных запросов;

– предварительная обработка и выборка полученных списков ссылок на документы;

Вы можете найти его в разделе страниц, и это выглядит так. В органических результатах поиска это выглядит так. Несколько лет назад описания описаний сыграли большую роль в видимости сайта в результатах поиска. Их оптимизация часто сводилась к использованию наиболее важных ключевых фраз для них. Их сочетание с использованием фраз в теге и достаточно для достижения высоких позиций в результатах поиска.

С потерей «власти» этого элемента интерес к его правильной оптимизации ослабел. Это, в свою очередь, является фактором ранжирования, поэтому описание описания может косвенно влиять на видимость страницы в результатах поиска под конкретными ключевыми фразами.

– обращение по выбранным адресам за искомыми документами;

– предварительный просмотр содержимого найденных документов;

– сохранение релевантных документов для последующего изучения;

– извлечение из релевантных документов ссылок для расширения запроса;

– изучение всего массива сохраненных документов;

– если информационная потребность не полностью удовлетворена, то возврат к первому этапу.

Описание описания важно еще по одной причине. Если он оставлен пустым, поисковая система решит его содержимое путем копирования, например, части контента. Таким образом, мы теряем контроль над тем, как страницы наших веб-сайтов отображаются в результатах обычного поиска.

Лучший способ предварительно оптимизировать описания описаний - избегать основных ошибок, которые чаще всего возникают при их создании. Самая безопасная длина описания - 156 символов, включая пробелы. Если сама поисковая система загружает описание из содержимого страницы, ролики этого типа могут отображаться в середине описания.


3 Строение поисковой системы

3.1 Архитектура поисковой системы

Рассмотрим классическую архитектуру, которая чаще всего реализована на корпоративных сайтах и информационных порталах. Такая архитектура изображена на рисунке 3.1

Рисунок 3.1 Архитектура поисковой системы

Разберем по частям то, что изображено на рисунке. Существует клиентская вычислительная машина под управлением ОС Windows и существует Web-сервер под управлением UNIX-подобной ОС. На стороне клиента запущен типичный браузер, такой как Netscape. На стороне сервера запущен web сервер, который обслуживает запросы от браузера, передавая запросы презентационному слою понимающему CGI. Презентационный слой передает запросы к поисковому механизму в случае вызова услуги поиска или отображает наполнение (content) сайта. При работе администратора презентационный слой также может передавать запросы на инициализацию механизма индексации нового контента, который еще не индексирован. Это необходимо по той причине, что пока текст не индексирован, поиск в нем с помощью поисковой машины невозможен.

Очень часто в описаниях описаний появляется весь контент, скопированный с данной подстраницы. Это может быть связано с использованием решений, создающих описания автоматическим способом или из-за халатности. Поэтому, если мы хотим, чтобы описание описания содержало полное сообщение для пользователя, его можно расположить в пределах доступных 156 символов.

Дубликаты - описание многократного использования. Повторяющееся как часть всей страницы, дублированное описание описания является еще одним «проклятием» многих веб-сайтов. Чаще всего описание готовится только для главной страницы, а затем копируется для остальных подстраниц веб-сайта.

Идея заключается в следующем. Существуют мегабайты текстовой информации, и скорость поиска документов содержащих заданные ключевые слова отнимает очень многопроцессорного времени. Предположим, в 10 мегабайтах текстовой информации ключевое слово будет находиться в течение 10 секунд. И вот заходит посетитель на Ваш сайт, задает ключевые слова, вызывает услугу поиска и ждет 10 секунд, пока ваш сервер не выдаст ему результат. Предположим, случилось так, что одновременно запросило поиск 5 человек. Естественно, время ответа увеличится в 5 раз. Получается, что в среднем по 50 секунд пользователь будет ждать ответа от вашего сервера. Это не приемлемо, особенно если у Вас сотни мегабайт текстовой информации и время реакции системы будет катастрофически велико. Необходимо использовать другой подход при поиске ключевых слов в текстовой информации - время ответа сократить до миллисекунд.

Если серфер ищет кроссовки для детей, а описание описания отображаемого результата сообщит ему, что через мгновение он отправится в «онлайн-магазин спортивных товаров с широким предложением», он, скорее всего, не посетит наш сайт, а отправится в магазин в соседнем результате, который в его описании имеет эту конкретную информацию.

Помните: пользователи приходят на наш сайт из результатов поиска из разных подстраниц, а не только с домашней страницы. Это стоит того, чтобы у каждого из них было уникальное описание. Неоконченные описания - это еще одна, часто повторяющаяся ошибка. Позвольте мне еще раз повторить: оставляя мета-описание пустым, мы добровольно теряем часть элемента управления, который у нас есть, по сравнению с нашей страницей в результатах поиска. Поисковая система сама выбирает описание, копируя его прямо из содержимого страницы.

3.2 ER-модель поискового механизма

Существует такая хорошая характеристика реляционных баз данных, как очень маленькое время выборки конкретной записи из миллионов других. Это достигается созданием, так называемого, индекса к таблице на какое-то из полей этой таблицы. Обычно индексы реализуются с применением алгоритма сбалансированного двоичного дерева. Предположим, у нас есть таблица, в которой всего один столбец и в каждой записи таблицы хранится фамилия человека. Предположим, мы загнали в такую таблицу 1 миллион фамилий. Нам необходимо проверить существует ли в этой таблице фамилия ИГУМНОВ. Предположим, что мы еще никаких индексов на эту таблицу не сделали, так же фамилия ИГУМНОВ стоит посередине таблице. Когда мы пошлем вот такой запрос: select surname from ourtable where surname="ИГУМНОВ" база данных переберет пол миллиона записей пока не дойдет до фамилии ИГУМНОВ и не выдаст результат. Получается слишком медленно. Но как только мы сделаем индекс на поле нашей таблицы, как сразу все наши запросы будут обрабатываться за миллисекунды, чего мы и добиваемся. Естественно, одной таблицы будет мало для решения нашей проблемы. Классическая структура базы данных, которая позволит решить нашу проблему, изображена на рисунке 3.2:

Они часто выводятся из контекста, неполные предложения, которые не полностью отражают содержание данной подстраницы. Кроме того, если на данной подстранице нет контента, поисковая система представит описание в виде элементов меню или названий продуктов, указанных в запятой, из списка, отображаемого на дополнительной странице. Это описание не будет поощрять пользователя к покупке.

В этой ситуации стоит решить эту проблему вместе с автором страницы или поставщиком сценариев. Вы часто можете найти описания, которые, по-видимому, авторы, по-видимому, не понимают, что поведение пользователя по отношению к сайту, а не содержание самого маркера описания, является фактором ранжирования и, согласно старой школе, наполняет его десятичными словами.


Рисунок 3.2 Классическая структура базы данных

Начнем с таблицы document. В этой таблице хранятся имена файлов или URL"ы страниц и каждой такой записи сопоставлен уникальный ключ id. В таблице dictionary хранятся все слова, которые могут встретиться в наших документах, и каждому слову сопоставлен уникальный id. Естественно, создаются индексы на поле word в таблице dictionary и на поле id в таблице document. В нашем примере существует отношение многие ко многим. Это необходимо, так как в таблице match мы храним соответствие слова и документа. Другими словами, в таблице match хранится информация о том, какие слова есть в каждом документе. На таблицу match создают индекс, на поле dict_id.

Если мы уже имеем дело с вышеупомянутыми недостатками и ошибками при создании описания, пришло время для следующих шагов. Язык, описание которого должно быть написано, является ориентированным на действие языком. Предоставить преимущество или решение.

Постройте описания описаний таким образом, чтобы пользователь знал, что он получит, нажав на данный результат, представленный в поисковой системе. Вспоминая доступный предел символов, создайте короткое предложение, которое заменяет то, что находится на странице. В то же время постарайтесь не раскрыть все, что ждет вас после перенаправления на подстраницу.

Прежде чем ваши документы будут доступны для поиска, их необходимо проиндексировать. Объем индексной информации, полученной из текста, может быть в два раза больше чем сам тексте. А может еще больше, в случае если вы будете не оптимально использовать память. Алгоритм выглядит следующим образом:

1. получаем документ для индексирования;

Не вводите в заблуждение. Использовать ключевые слова. Однако поведение пользователя «спровоцировано» данным контентом. Использование ключевых фраз, при которых мы хотим, чтобы страница была видимой, оправдана в одной ситуации. Если используемая нами фраза совпадает с введенной пользователем в окне поиска, она будет выделена в поисковой системе в отображаемом результате.

Это указывает на внимание искателя, давая ему уверенность в том, что по ссылке от данного результата будет то, что он ищет. Применение технических параметров. При создании описания подстраниц продукта стоит использовать такую ​​информацию, как технические характеристики, имя производителя, количество единиц или цена. Эта информация особенно важна, если мы отправляем наше сообщение людям, заинтересованным в покупке. Элементы, такие как цена или рейтинг пользователя с использованием звезд, могут быть добавлены к описанию описания в форме.

2. регистрируем его в таблице document, запоминаем полученный его уникальный id и будем его называть doc_id;

3. разбиваем документ на отдельные слова;

4. узнаем уникальные id этих слов из таблицы dictionary и будем их называть dict_id;

5. потом заносим записи с нашим одним doc_id и разными dict_id (для каждого слова в документе) в таблицу match.

3.4 Поисковый механизм

Последним из правил подготовки описания эффективных описаний является «Напишите человеку не роботу поисковой системы». Это правило несколько сочетает элементы всех руководящих принципов, описанных выше. Помните: получатель сообщения - это человек, который интересуется нашим сайтом и добирается до него по результатам поиска. Такое поведение пользователя повлияет на ее позицию. Настало время отказаться от старых практик, таких как набивка ключевых слов, и принять участие в разработке привлекательного, описательного для потенциального клиента.

После того как мы проиндексировали наши документы, нужно понять какие запросы посылать в базу, что бы искать эти документы по ключевым словам. Предположим, есть поисковая фраза "река объ". Пользователю необходимо получить все документы содержащие эти два слова. Сначала нужно обратиться к таблице dictionary и узнать уникальные id этих слов, далее будем их называть $dict_id1 и $dict_id2. Потом необходимо послать такой запрос в таблицу match, который выдаст только те номера документов, которые содержат эти два слова. Вот пример этого запроса: SELECT doc_id FROM match where dict_id =$dict_id1 group by doc_id INTERSECT SELECT doc_id FROM match where dict_id=$dict_id2 group by doc_id. В случае если пользователь введет три слова, то вам придется добавить еще раз INTERSECT и третью часть SQL запроса. По полученным в результате запроса doc_id можно извлечь информацию об имени файла документа из таблицы document.



Шкалы оценка пертинентности // НТИ. Сер. 2.- 1992.-№5.-С.19-27 Кноп К. Поиск в Интернете как хроническое заболевание // Мир Internet. - 2002. - N 10. - С. 33-35 Конжаев А. Стратегия информационного поиска // http://www.msiu.ru. Попов С. Поиск информации и принятие решения // НТИ. Сер.2.-2001.-№1.-С.1-4 Степанов В.К Русскоязычные поисковые механизмы в Интернет // ComputerWorld Россия.-1997.-N11 ...




11,375 53,7 Google 3,932 18,6 Rambler 2,939 13,9 Mail.ru 1,863 8,8 Апорт 0,155 1,5 Другие 0,39 3 Диаграмма 2 – Рейтинг основных Российских поисковых систем (2007г.) 1.4 Обзор основных мировых поисковых систем На сегодняшний день всемирная сеть Интернет насчитывает огромное множество поисковых систем во всех странах мира, из них всех можно выделить несколько самых крупных и...

Реализованы как простая программная система, которая запрашивает информацию из удаленных участков Интернет, используя стандартные cетевые протоколы. 4. Наиболее популярные русскоязычные справочно-поисковые системы в интернет 4.1 Rambler Поисковая система Рамблер начала свое существование с 1996 года. На сегодняшний день она является одной из самых популярных в РуНете, уступая лишь...

Управления, ее разработки и внедрения в жизнь. Второй раз потоки информации используются для адекватного управления в рамках уже сложившейся системы логистики. 2. Стратегия и организация информационного обеспечения логистики На уровне фирмы логистическая система распадается на ряд структур, которые можно представить в виде горизонтальных функциональных субсистем в сфере закупок, ...

  • Введение 2
  • Глава I. Теоретическая часть 4
    • 1.1 Краткая история развития поисковых систем 4
    • 1.2 Рейтинг основных мировых поисковых систем 5
    • 1.3 Рейтинг основных Российских поисковых систем 6
    • 1.4 Обзор основных мировых поисковых систем 7
      • 1.4.1 Google 7
      • 1.4.2 Yahoo 9
      • 1.4.3 Baidu 10
    • 1.5 Обзор основных Российских поисковых систем 11
      • 1.5.1 Yandex 11
      • 1.5.2 Rambler 13
      • 1.5.3 Апорт 13
      • 1.5.4 Mail.ru 15
  • Глава II. Обработка информации в маркетинговом исследовании 17
    • 2.1 Текстовый процессор Microsoft Word 17
    • 2.2 Табличный редактор Excel 17
    • 2.3 Редактор Microsoft Power Point 17
  • Глава III . Организация рабочего места оператора ЭВМ 19
    • 3.1 Общие требования безопасности 19
    • 3.2 Требования безопасности перед началом работы 20
    • 3.3 Требования безопасности во время работы 20
    • 3.4 Требования безопасности в аварийных ситуациях 21
  • Заключение 22
  • Список литературы 23
  • Введение
  • Всемирная сеть очень важна и полезна практически для любого! Каждый пользователь Интернета может найти в нем массу разнообразной и интереснейшей информации, а также использовать все богатейшие возможности сети. Для меня решающими обстоятельствами в выборе темы «Обзор современных поисковых систем в интернете», для своей квалификационной работы, стала во-первых достаточная известность мне этой темы, в силу частого посещения мной всемирной сети, а также актуальность темы на сегодняшний день. Ресурсы Интернета давно перестали быть просто игрушкой, превратившись в незаменимый инструмент для повседневной работы людей многих профессий. Быстрый рост информации в сети сделали его океаном разнообразнейших данных, важность которых растет пропорционально их объему. По оценке экспертов объем информации, передаваемой по каналам Интернет, удваивается каждые полгода. Ежедневно в сети появляются миллионы новых документов, и естественно, что без систем поиска они в подавляющем своем большинстве остались бы не востребованными, вообще не были бы не кем найдены, и все то огромное количество информации оказалось бы никому не нужным. Возникла необходимость создания таких средств, которые позволили бы легко ориентироваться в информационных ресурсах глобальных сетей, быстро и надежно находить нужные сведения. В интернете появились специальные поисковые средства. Еще несколько лет назад бытовало такое мнение: в Интернете есть все, но найти там ничего невозможно. Однако с появлением и быстрым развитием поисковых каталогов, поисковых машин, и всевозможных поисковых программ ситуация изменилась, и теперь в Сети срочно понадобившуюся информацию иногда можно найти быстрее, чем в книге, лежащей на столе.
  • Наиболее популярным и используемым способом поиска в Интернете является использование поисковых систем. Что же такое поисковая система? Поисковая система - портал, осуществляющий поиск, сбор и сортировку информации в сети Интернет. Поисковые системы это инструмент, позволяющий пользователю глобальной сети в кратчайшие сроки найти интересующую его информацию.
  • Первоочередная задача любой поисковой системы - доставлять людям именно ту информацию, которую они ищут.
  • Получая результат, пользователь оценивает работу системы, руководствуясь несколькими основными параметрами. Нашел ли он то, что искал? Если не нашел, то сколько раз ему пришлось перефразировать запрос, чтобы найти искомое? Насколько актуальную информацию он смог найти? Насколько быстро обрабатывала запрос поисковая машина? Насколько удобно были представлены результаты поиска? Был ли искомый результат первым или же сотым? Как много ненужного мусора было найдено наравне с полезной информацией? Найдется ли нужная информация, при обращении к поисковой системе, скажем, через неделю, или через месяц?

Моя работа имеет следующую структуру:

1) Введение.

2) I глава - включает в себя краткую историю развития поисковых систем, основных поисковых систем, а также обзор основных мировых и российских поисковиков.

3) II глава - методы использования компьютерных программ и аппаратных средств для маркетинговых исследований.

4) III глава - включает в себя организацию рабочего места оператора ЭВМ и технику безопасности и охрану труда на рабочем месте.

5) Заключение - общие выводы по всей квалификационной работе, а так же точку зрения автора о том какими поисковиками лучше всего пользоваться.

6) Список литературы.

Глава I. Теоретическая часть

1.1 Краткая история развития поисковых систем

Одним из первых способов организации доступа к информационным ресурсам сети стало создание каталогов сайтов, в которых ссылки на ресурсы группировались согласно тематике. Первым таким проектом стал сайт Yahoo, открывшийся в апреле 1994 года. После того, как число сайтов в каталоге Yahoo значительно увеличилось, была добавлена возможность поиска информации по каталогу. Это, конечно же, не было поисковой системой в полном смысле, так как область поиска была ограничена только ресурсами, присутствующими в каталоге, а не всеми ресурсами сети Интернет.
Каталоги ссылок широко использовались ранее, но практически утратили свою популярность в настоящее время. Причина этого очень проста - даже современные каталоги, содержащие огромное количество ресурсов, представляют информацию лишь об очень малой части сети Интернет. Самый большой каталог сети DMOZ (или Open Directory Project) содержит информацию о 5 миллионах ресурсов, в то время как база поисковой системы Google состоит из более чем 8 миллиардов документов.

Первой полноценной поисковой системой стал проект WebCrawler появившийся в 1994 году.

В 1995 году появились поисковые системы Lycos и AltaVista. Последняя долгие годы была лидером в области поиска информации в Интернет.

В 1997 году Сергей Брин и Лари Пейдж создали Google самую популярную на сегодняшний момент поисковую систему в мире.

23 сентября 1997 года была официально анонсирована поисковая система Yandex, самая популярная в русскоязычной части Интернет.

В настоящее время существует 3 основных международных поисковых системы - Google, Yahoo и MSN Search, имеющих собственные базы и алгоритмы поиска. Большинство остальных поисковых систем (коих можно насчитать очень много) использует в том или ином виде результаты 3 перечисленных. Например, поиск AOL (search.aol.com) и Mail.ru используют базу Google, а AltaVista, Lycos и AllTheWeb - базу Yahoo.

В России основной поисковой системой является Яндекс, за ним идут Rambler, Google.ru, Aport, Mail.ru и КМ.ru

По данным исследования про водившегося на конец 2007 года доминирующие место в рейтинге стабильно занимает компания Google. В декабре на долю гиганта пришлось 41,3 миллиардов поисковых запросов, это - 62,4% рынка. Второе место (с большим отрывом) у Yahoo! - 8,5 миллиардов запросов, 12,8% рынка и крупнейшего китайского поисковика Baidu.com - 3,4 млрд. запросов, 5,2% рынка. К слову, уверенные позиции последнего связаны с тем, что на территории Китая заблокированы и Google, и Yahoo!

Название поисковой системы

Число запросов, миллионов .

Доля, процентов

Всего в интернете

Time Warner Network

На сегодняшний день самой популярной русскоязычной пои сковой системой является Яндекс - 54% всех поисковых запросов.

1.4 Обзор основных мировых поисковых систем

На сегодняшний день всемирная сеть Интернет насчитывает огромное множество поисковых систем во всех странах мира, из них всех можно выделить несколько самых крупных и пользующихся наибольшей популярностью среди пользователей:

1.4.1 Google

Лидер поисковых машин Интернета, Google занимает более 60 % мирового рынка, а значит, шесть из десяти находящихся в сети людей обращаются к его странице в поисках информации в Интернете. Сейчас регистрирует ежедневно около 50 миллионов поисковых запросов и индексирует более 8 миллиардов веб-страниц.

Была разработана в 1998 выпускниками Стэндфордского университета Сергеем Брином и Лари Пейджем, которые применили для ранжирования документов технологию PageRank, где одним из ключевых моментов является определение "авторитетности" конкретного документа на основе информации о документах, ссылающихся на него. Говоря общими словами, чем больше документов ссылается на данный документ и чем они авторитетнее, тем более авторитетным данный документ становится. Количественное значение авторитетности документа (другими словами, взвешенное количество ссылок или PageRank) относится к так называемым статическим факторам (то есть независящим от конкретного запроса) и учитывается при определении релевантности документа конкретному запросу как весовой коэффициент. Наряду с этим Google применил для определения релевантности документа не только текст самого документа, но и текст ссылок на него. Эта технология позволила ему обеспечить выдачу довольно релевантных результатов на фоне других поисковиков. Довольно быстро Google стал лидировать в различных опросах по такому показателю, как удовлетворенность пользователей результатами поиска.

Google осуществляет поиск по документам на более чем 35 языках, в том числе русском. В настоящее время многие порталы и специализированные сайты предоставляют услуги поиска информации в Интернете на базе Google, что делает задачу успешного позиционирования сайтов в Google еще более важной. Google проводит переиндексацию своей поисковой базы примерно раз в четыре недели. Во время этого усовершенствования, неофициально называемого Google dance, происходит обновление базы на основе информации, собранной роботами за время, прошедшее с предыдущего усовершенствования, и перерасчет значений PageRank документов. Также существует определенное количество документов с достаточно большим значением PageRank, информация о которых в поисковой базе обновляется ежедневно, однако значение PageRank пересчитывается только во время Google dance. Нормированное значение PageRank для конкретного документа, загруженного в браузер, можно узнать, скачав и установив Google ToolBar - специальную панель инструментов для работы с этим поисковиком. Не смотря на то, что в поисковике имеется форма для бесплатного добавления страницы в базу, Google предпочитает сам находить новые документы по ссылкам с уже известных и не будет индексировать добавленную через форму страницу, если в его базе не найдется ни одной страницы, ссылающейся на нее.

1.4.2 Yahoo

Одна из самых первых Поисковых систем (создана Дэвидом Фило и Джерри Янгом в апреле 1994года) по сей день остается и самой популярной из них, традиционно сочетая поиск, как по ключевым словам, так и с помощью иерархического дерева разделов.

Нынешнее развитие Yahoo можно определить как движение в он-лайн, интерактивность. Yahoo быстро осваивает эту область Интернет-услуг, но возникает одна проблема: ядро Yahoo! не было на это рассчитано. Не была в 1994 году заложено в него "онлайновая" составляющая, ее "приклеил" Тим Кугл несколькими годами позже. Естественно возникает угроза хакерских атак через эту незащищенную область.

Одно из новшеств поисковой системы Yahoo - панель задач для браузера Firefox,. Этот инструмент помогает пользоваться поиском Yahoo, не заходя на официальный сайт, а лишь используя функциональные кнопки панели.

1 сентября 2005 года поисковик Yahoo, которому принадлежит более 200 миллионов адресов электронной почты по всему миру, анонсировал запуск новой системы поиска текстов, фотографий и других документов, содержащихся в письмах.

Необходимость такого нововведения возникла вслед за увеличением объёма хранимых данных, ведь некоторые пользователи создают целые почтовые архивы. Подгоняемый конкурентом Google и его почтовым сервисом Gmail, Yahoo для хранения почты предлагает отныне 1 гигабайт бесплатного места, или 2 гигабайта по годовому абонементу. "Как только вы получаете возможность хранить больше информации, вам необходимы и расширенные поисковые возможности", - объясняет Эрик Петерсон, аналитик компании Jupiter Research.

Пользователи поисковой системы Yahoo, в свою очередь, смогут теперь использовать возможности детализированного поиска слов в названии или непосредственно в тексте письма, а также в присоединенных документах, не открывая их. Результат поиска отражается в трёх строках с указанием всех атрибутов. На панели справа отображаются все похожие документы. Найденные фотографии выводятся на экран в уменьшенном виде, что значительно облегчает поиск. Система также учитывает орфографические ошибки, позволяя искать слова лишь по первым буквам.

Для начала Yahoo планирует предложить новую систему небольшому числу американских пользователей, а затем распространить её по всему миру. Со стороны клиентов это не потребует никаких дополнительных усилий. "Когда услуга станет, доступна, в левом верхнем углу страницы вашего почтового ящика появится соответствующий баннер", - обещает компания Yahoo.

По данным comScore Media Metrix на июль этого года, домену Yahoo принадлежит 219 миллионов адресов электронной почты, что составляет 31,5% мирового рынка, уступая лишь Microsoft с 221 миллионом пользователей сервиса Hotmail (35,5% рынка).

1.4.3 Baidu

Baidu - лидер среди китайских поисковых систем. По количеству обрабатываемых запросов поисковый сайт Байду стоит на 3 месте в мире (3 миллиарда 428 миллионов; с долей в глобальном поиске 5,2 %). Хотя компания работает только в единственной стране: Китае! Но точно, что этот рынок растет неистово быстро: Уже в конце года в Китае свыше 170 млн. пользователей займутся поиском информации в Интернете. Аналитик J.P. Морган Дик Вей исходит в своем актуальном анализе из того, что это число вырастет в течение следующих трех, четырех лет до 100 млн. пользователей. Гигантский рынок с экстремально высокими доходами для Baidu. Сравнивают только прибыль, которую Google достигает в США с очень похожей бизнес-моделью.

1.5 Обзор основных Российских поисковых систем

Основное отличие русскоязычных поисковых систем от иностранных одно - это то, что глобальные поисковые системы, поддерживающие поиск на русском языке, не поддерживают русскую морфологию. В русскоязычной части сети Интернет работают около двух десятков поисковых систем, но подавляющие большинство пользователей работает лишь с несколькими, подробно остановимся на самых крупных:

1.5.1 Yandex

Яндекс - На сегодня наиболее популярная поисковая система, ежемесячно к ней обращаются более 35 миллионов пользователей Русскоязычной части Интернета. Начала свою работу во второй половине 1997 года учитывая морфологию русского языка. История компании "Яндекс" началась в 1990 году с разработки поискового программного обеспечения в компании "Аркадия". За два года работ были созданы две информационно-поисковые системы - Международная Классификация Изобретений, 4 и 5 редакция, а также Классификатор Товаров и Услуг. Обе системы работали локально под DOS и позволяли проводить поиск, выбирая слова из заданного словаря, с использованием стандартных логических операторов. В1993 году "Аркадия" стала подразделением компании CompTek. В 1993-1994 годы программные технологии были существенно усовершенствованы благодаря сотрудничеству с лабораторией Ю. Д. Апресяна (Институт Проблем Передачи Информации РАН). В частности, словарь, обеспечивающий поиск с учетом морфологии русского языка, занимал всего 300Кб, то есть целиком грузился в оперативную память и работал очень быстро. С этого момента пользователь мог задавать в запросе любые формы слов.

Слово Яндекс придумал за несколько лет до этого один из основных и старейших разработчиков поискового механизма. "Яndex" означает "Языковой index", или, если по-английски, "Yandex" - "Yet Another indexer". За 4 года публичного существования Яndex возникли и другие толкования. Например, если в слове "Index" перевести с английского первую букву ("I" - "Я"), получится "Яndex".

В начале 1996 года был разработан алгоритм построения гипотез. Отныне морфологический разбор перестал быть привязан к словарю - если какого-либо слова в словаре нет, то находятся наиболее похожие на него словарные слова и по ним строится модель словоизменения. В это время Интернет в России только начинался. Еще через полгода стало очевидно, что ничто не отделяет CompTek от создания собственной глобальной поисковой машины. Объем Рунета составлял тогда всего несколько гигабайт. Осенью 1997 года был открыт Yandex.Ru.

Помимо поисковой системы, сегодня Яндекс - огромный портал с целым набором широко используемых сервисов, такими как каталог, Яндекс. деньги, и другие. Официально поисковая машина Yandex.Ru была анонсирована 23 сентября 1997 года на выставке Softool. Основными отличительными чертами Yandex.Ru на тот момент были проверка уникальности документов (исключение копий в разных кодировках), а также ключевые свойства поискового ядра Яндекс, а именно: учет морфологии русского языка (в том числе и поиск по точной словоформе), поиск с учетом расстояния (в том числе в пределах абзаца, точное словосочетание), и тщательно разработанный алгоритм оценки релевантности (соответствия ответа запросу), учитывающий не только количество слов запроса, найденных в тексте, но и "контрастность" слова (его относительную частоту для данного документа), расстояние между словами, и положение слова в документе. Сегодня Яндекс имеет внутри мощный поисковый робот, позволяющий производить поиск по самым различным критериям.

1.5.2 Rambler

Rambler - Старейшая поисковая система российского Интернет, запущена в 1996 году, на сегодня - вторая по популярности с обращением более 25 миллионов посетителей в месяц. Помимо поисковой системы, сегодня Рамблер - один из крупнейших порталов Русскоязычной части Интернета с большим набором широко известных сервисов, таких как каталог Рамблер, Рамблер-почта, Рамблер-ICQ или Рамблер-ТВ. По сути сегодня Рамблер - больше, чем просто поисковая система и набор сервисов, это крупная медиагруппа. Поисковая машина "Рамблер" начала работу в октябре 1996 года, на стартовом этапе содержала всего 100 тысяч документов. "Рамблер" не был первой отечественной поисковой системой, однако в первый год своего существования (когда весь русский веб с приемлемой степенью правдоподобия индексировался "Рамблером", "Апортом", "Русской поисковой машиной", а также шведской и калифорнийской AltaVista) вынес основной груз поисковых запросов. Вторая версия "Рамблера" начала разрабатываться летом 2000 года, в марте нынешнего года приняла достаточно законченные очертания. В нее были введены функции, давно уже имевшиеся в конкурирующих системах. Она учитывает координаты слов, обучена строгой и нечеткой морфологии, связывает поиск с каталогом, в качестве которого используется Top100 (http://top100.rambler.ru/), группирует результаты поиска по сайтам, ищет по числам. Достаточно удачная архитектура продукта позволяет "Рамблер" иметь для поисковика количество серверов в 2 раза меньшее, чем у "Яндекса", и в 3 раза меньшее, чем у "Апорта".

1.5.3 Апорт

Апорт- Третья популярности на сегодня поисковая система с обращением более 16 миллионов посетителей в месяц. Апорт позволяет пользователям осуществлять полнотекстовый поиск документов c учетом морфологии русского языка в запросах. Поисковая система построена на основании новейших достижений в области информационного поиска и использует уникальные алгоритмы сортировки найденных результатов. Разнообразные специализированные поиски (Знакомства, Товары, Новости, Рефераты, MP3 и др.) дают пользователям дополнительные возможности находить различную информацию в Сети. В поисковую машину интегрирован один из крупнейших в Русскоязычной части Интернет каталогов Интернет-ресурсов "Апорт-каталог".

Поисковая машина "Апорт" была впервые продемонстрирована в феврале 1996 года на пресс-конференции "Агамы" по поводу открытия "Русского клуба". Тогда она искала только по сайту russia.agama.com. Потом она начала искать по четырем, потом по шести серверам... Короче, день рождения и фактический старт системы сильно "размазались" по времени, а официальная презентация "Апорта" состоялась только 11 ноября 1997 года. К тому времени в его базе был проиндексирован первый миллион документов, расположенных на 10 тысячах серверов. Создателем системы выступила компания "Агама" - разработчик программного обеспечения для платформы Windows, главным из которых являлся корректор орфографии "Пропись". Лингвистические разработки "Агамы" использовались при создании поисковой машины, в которой, скажем, в отличие от "Рамблер", изначально учитывалась морфология слов и осуществлялась по желанию клиента проверка орфографии запроса.

Важнейшими свойствами первой версии "Апорта" являлся перевод запроса и результатов поиска на английский язык и обратно, а также реконструкция всех проиндексированных страниц из собственной базы (что означает возможность просмотра страниц, уже несуществующих в оригинале).

Апорт 2000" стал первой российской поисковой машиной, практически реализовавший две базовых технологии американской поисковой машины Google. Первая - учет "ранга страницы" (Page Rank), который характеризует ее популярность (вычисляется по количеству ссылок на ресурс из внешнего Интернета: вес ссылки с популярного сайта выше, чем вес ссылки с менее популярного; ссылки, включающие слова запроса, имеют больший вес, чем, скажем, слово "здесь"). Вторая - обработка запроса, ориентируясь на HTML-код страницы. В "Апорт 2000" учитывается также вхождение слов запроса в URL. Среди недокументированных особенностей - больший приоритет сайтам, получившим высшую и элитную лигу в каталоге AtRus.

Можно отметить и то, что "Апорт" первым устроил поиск по новостным лентам (какие бы ложные сведения о приоритете "Яндекса" в этом сервисе не распускал в свое время Internet.ru). И, наконец, еще одно первенство "Апорта" - использование платной нулевой строки в выдаче (кстати, "Апорт" первым среди наших поисковиков начал покупать такой сервис у AltaVista, которая за небольшую плату выдавала его ссылку первой при запросе "Russian Search"). Однако в "Апорте" нельзя купить не нулевое, а просто более высокое место для своего сайта в результатах поиска. Пользователи "Апорта" (в отличие завсегдатаев "Яндекса") мало пользуются расширенным поиском (на 8000 загрузок простой страницы приходится 300 вызовов страницы "Расширенный поиск").

Организация масштабируемости в архитектуре "Апорт 2000" такова, что можно дробить поисковую базу "Апорта" на несколько отдельных баз, каждый маленький "Апорт" работает на своем компьютере. "Апорт 2000" считает, что весь Интернет поделен на фрагменты. После проведения поиска по этим фрагментам, пользователю интегрируется и выдается общий ответ. Добавлять новые маленькие "апортики" можно путем не очень сложной процедуры. В случаях аварий отдельных машин выдаются несколько отличные от штатных интегральные результаты, что мы можем время от времени наблюдать.

1.5.4 Mail.ru

Национальная почтовая служба Mail.ru - это не только поисковая система но и один из крупнейших порталов российского Интернета. Ежедневная аудитория Mail.ru - более 5 миллионов пользователей. Общее число регистраций со дня основания около 60 миллионов. Mail.ru - самый быстроразвивающийся российский Интернет-ресурс. Через почтовые ящики Mail.ru ежедневно проходит более 25 миллионов писем. Mail.ru занимает лидирующую позицию среди бесплатных почтовых сервисов, предоставляя своим пользователям почтовый ящик неограниченного размера с защитой от спама и вирусов, переводчиком, проверкой правописания, архивом для хранения фотографий и многое другое.

В 1998-м году программисты, работающие в питерском офисе американской софтверной компании DataArt, создали новое ПО для почтового веб-сервера, которое в дальнейшем предполагалось продавать западным компаниям. Чтобы протестировать сервис, его временно выложили в открытый доступ для российских пользователей, а сервис вдруг стал стремительно набирать популярность.

20 февраля 2001 года произошло слияние двух крупных игроков российского Интернет-рынка, компаний Port.ru и netBridge под брендом Port.ru. В результате объединения родилась компания, которая сразу заняла лидирующие позиции среди российских Интернет - холдингов по доле рынка и охвату аудитории.

· Первоочередная задача любой поисковой системы - доставлять людям именно ту информацию, которую они ищут.

· Основные характеристики поисковых систем:

1. Полнота

2. Точность

3. Актуальность

4. Скорость поиска

5. Наглядность

В состав поисковой системы входят компоненты:

1. Модуль индексирования

2. База данных

3. Поисковый сервер

Подводя итог можно сказать что, как правило, несмотря на обилие поисковых систем, пользователь предпочитает обращаться к услугам лишь одной - двух из них (точно также как при обилии газет или новостных сайтов мы регулярно просматриваем лишь некоторые, привычные и любимые). Самой популярной поисковой системой в мире является Google. Но по оценкам аналитиков, на просторах бывшего СССР чаше используется Яндекс.

Глава II. Обработка информации в маркетинговом исследовании

Маркетинговые исследования - форма исследования, которая фокусируется на понимании поведения, желаний и предпочтений потребителей в диктуемой рынком экономике. Маркетинговое исследование предполагает сбор и анализ данных, которые требуются для маркетинговой деятельности. Обработка информации полученной в ходе маркетингового исследования возможна при помощи комплекта программ Microsoft Office.

2.1 Текстовый процессор Microsoft Word

В программе MsWord кроме обработки текстовой информации осуществляется описание технологического процесса исследования, цели, методов которыми оно осуществлялось, а также основные результаты (аналитическая часть) исследования. После ввода текстовой информации, в программе возможно форматирование текста (изменение шрифтов текста, полей, абзаца, размера текста, а также вставка диаграмм, картинок, таблиц и многие другие функции необходимые для визуального представления информации полученной в ходе маркетингового исследования).

2.2 Табличный редактор Excel

Табличный процессор Excel позволяет выполнять вычисления с помощью формул и встроенных функций, строить диаграммы и графики по результатам вычислений, анализировать данные и работать со списками в таблицах. Самый эффективный метод представления данных с помощью графика. Он позволяет увидеть те закономерности, которые не всегда усматриваются в таблице чисел.

В программе Ms Excel создается база данных и осуществляется ввод и обработка числовой информации полученной в ходе исследования. По этим данным в дальнейшем осуществляется построение графиков и таблиц, для обеспечения большей наглядности полученной информации. Диаграммы и гистограммы делаются по всем вопросам представленным в анкете.

2.3 Редактор Microsoft Power Point

Программа Ms Power Point предназначена для визуального представления результатов исследования, проведения презентаций с использованием слайдов. Слайды могут содержать информация любого типа и использовать документы других приложений MS Office. Power Point также используется для создания презентации по маркетинговому исследованию, после обработки информации в текстовых и числовых редакторах Основная информация полученная в ходе исследования размещается на слайдах, тем самым описывается в вкратце ход, методика, цели и результаты исследования, также возможна вставка таблиц, диаграмм и добавление анимации и звука к слайдам для большей наглядности представленных данных.

Глава III . Организация рабочего места оператора ЭВМ

3.1 Общие требования безопасности

3.1.1 К самостоятельной работе с ЭВМ допускаются лица прошедшие специальную подготовку, в том числе на III группу электробезопасности, обязательный медицинский осмотр и инструктаж по охране труда, не имеющие противопоказаний по состоянию здоровья. Женщины со времени установления беременности и в период кормления ребенка грудью к выполнению всех видов работ, связанных с использованием ЭВМ, не допускаются.

3.1.2 Пользователи ЭВМ должны соблюдать правила внутреннего трудового распорядка, установленные режимы труда и отдыха.

3.1.3 При работе с ЭВМ возможно воздействие на работающих следующих опасных и вредных производственных факторов:

Ионизирующие и неионизирующие излучения видеотерминалов;

Поражение электрическим током при работе на оборудовании без защитного заземления, а также со снятой задней крышкой видеотерминала;

Зрительное утомление, а также неблагоприятное воздействие на зрение мерцаний символов и фона при неустойчивой работе видеотерминала, нечетком изображении на экране.

3.1.4 При работе с ЭВМ необходимо использовать защитные экраны.

3.1.5 Помещение с ЭВМ должно быть оснащено медицинской аптечкой первой помощи, системой кондиционирования воздуха или вытяжной вентиляцией.

3.1.6 Пользователи ЭВМ обязаны соблюдать правила пожарной безопасности, знать места расположения первичных средств пожаротушения. Помещение с ЭВМ должно быть оснащено двумя углекислотными огнетушителями и автоматической системой пожарной сигнализации.

3.1.7 О каждом несчастном случае с работником пострадавший или очевидец несчастного случая обязан немедленно сообщить администрации учреждения. При неисправности оборудования прекратить работу и сообщить администрации учреждения.

3.1.8 В процессе работы пользователи ЭВМ должны соблюдать правила использования средств индивидуальной и коллективной защиты, соблюдать правила личной ни иены, содержать в чистоте рабочее место.

3.1.9 Лица, допустившие невыполнение или нарушение инструкции по охране труда, привлекаются к дисциплинарной ответственности в соответствии с правилами внутреннего трудового распорядка и, при необходимости, подвергаются внеочередной проверке знаний норм и правил охраны труда.

3.2 Требования безопасности перед началом работы

3.2.1 Тщательно проветрить помещение с ЭВМ, убедиться, что микроклимат в помещении находится в допустимых пределах: температура воздуха в холодный период года - 22-24°С, в теплый период года -23-25°С, относительная влажность воздуха - 40 - 60 %.

3.2.2 Убедиться в наличии защитного заземления оборудования, а также защитных экранов видеомониторов.

3.2.3 Включить видеомониторы и проверить стабильность и четкость изображения на экранах.

3.3 Требования безопасности во время работы

3.3.1 При paботе с ЭВМ значения визуальных параметров должны находиться в пределах оптимальною диапазона.

3.3.2 Клавиатуру располагать на поверхности стола на расстоянии 100-300 мм от края, обращенного к пользователю.

3.3.3 Тетрадь для записей располагается на подставке с наклоном 12-15° на расстоянии 55 - 65 см от глаз, которая должна быть хорошо освещена.

3.3.4 При работающем видеотерминале расстояние от глаз до экрана должно быть 0,6 - 0,7 м, уровень глаз должен приходиться на центр экрана или на 2/3 его высоты.

3.3.5 Изображение на экранах видеомониторов должно быть, с обильным, ясным и предельно четким, не иметь мерцаний символов и фона, на экранах не должно быть бликов и отражений светильников, окон и окружающих предметов.

3.3.6 Не работать с ЭВМ без защитных экранов.

3.3.7 Суммарное время непосредственной работы с ВДТ и ПЭВМ в течение рабочего дня должно быть не более 6 часов, для преподавателей высших и средних специальных учебных заведений, учителей общеобразовательных школ - не более 4 часов в день.

3.3.8 Продолжительность непрерывной работы с ЭВМ без регламентированного перерыва не должна превышать 2-х часов. Через каждый час работы следует делать регламентированный перерыв продолжительностью 15 мин.

3.3.9 Во время регламентированных перерывов с целью снижения нервно-эмоционального напряжения, утомления зрительного анализатора, устранения влияния гиподинамии и гипокинезии, предотвращения развития познотонического утомления следует выполнять комплексы упражнений для глаз, физкультурные минутки и физкультурные паузы.

3.4 Требования безопасности в аварийных ситуациях

3.4.1 В случае появления неисправности в работе видеотерминала выключить его, сообщить об этом администрации учреждения. Работу продолжать только после устранения возникшей неисправности.

3.4.2 В случае возникновения у пользователя зрительного дискомфорт и других неблагоприятных субъективных ощущений следует ограничить время работы ЭВМ, провести коррекцию длительности перерывов для отдыха или провести смену деятельности на другую, не связанную с использованием ЭВМ.

3.4.3 При поражении пользователя электрическим током немедленно отключить электросеть, оказать первую помощь пострадавшему, при необходимости вызвать скорую помощь (03) и дождаться медиков.

Заключение

По итогам сделанной мной работы я могу заключить что; поисковые системы уже давно стали неотъемлемой частью Интернета. Поисковые системы сейчас - это огромные и сложные механизмы, представляющие собой не только инструмент поиска информации, но и заманчивые сферы для бизнеса.

По моему мнению, самой лучшей иностранной поисковой системой является Google, так как для меня основное значение имеет точность и полнота предоставляемых данных. Но можно заключить также что, каждая поисковая система будь то Российская или зарубежная предоставляет различные возможности поиска, из различных баз данных, поэтому сказать точно какой именно лучше пользоваться было бы не правильно. Поэтому для удобства поиска и полноты информации следует пользоваться несколькими поисковиками вводя в них нужные запросы. По моему мнению, из многих Российских поисковиков выделяются Яндекс и Рамблер, для них характерно постоянное обновление баз данных что, обеспечивает именно актуальность и точность предоставляемой информации.

Список литературы

1. Экслер А.Б. Самоучитель работы в Интернете - Москва.: NT Press, 2007г.

2. Кузьмин А.В. Золотарева Н.Н. Поиск в Интернете - Санкт - Петербург.: Издательство НиТ, 2006г.

3. Гусев В.С. Яндекс. Эффективный поиск - Москва, Санкт - Петербург, Киев.: Диалектика,2007г.

4. Егоров А.Б. Поиск в Интернете - Санкт - Петербург.: НиТ, 2007г.

5. Гусев В.С. Поиск, Internet -Москва, Санкт - Петербург, Киев.: Диалектика, 2004г.

6. Гусев В.С. Google. Эффективный поиск - Москва, Санкт - Петербург, Киев.: Диалектика, 2007г.

7. www . citforum . ru - CIT forum, Поисковые системы в сети Интернет

8. www . ru . wikipedia . org - Википедия - свободная энциклопедия

9. www . clx . ru - Описание зарубежных поисковых систем

10. www.seop.ru - Search engine optimization project, рейтинг основных поисковых систем

Последний лист дипломной работы



Понравилась статья? Поделиться с друзьями: