Расширенный поиск и язык запросов. Язык запросов поисковой системы

Расширенный поиск и язык запросовЯзык запросов представляет собой искусственно разработанный язык программирования, который используется для того, чтобы создавать запросы в информационных системах и базах данных.


Такие способы запросов в целом можно классифицировать в зависимости от того, используются ли они для поиска информации или для базы данных. Разница состоит в том, что запросы к подобным сервисам совершаются для получения ответов на поставленные вопросы, в то время как поисковая системы пытается найти документы, в которых содержаться сведения, относящиеся к области, интересующей пользователя.

Базы данных

Языки запросов по базам данных содержат в себе следующие примеры:

— QL– объектно-ориентированный, относится к реляционным базам данных;

— CQL – формальный язык, используемый для представления запросов для информационно-поисковых систем;

— CQLF – для CODASYL – TYPE баз данных;

— COQL – концепт-ориентированный язык запросов – применяется в соответствующих моделях com. Основан на принципах моделирования данных construpt ииспользует операции типа проекции и де-проекции многомерного анализа данных;

— Datalog — представляет собой язык запросов к дедуктивным базам данных;

— GellishEnglish – представляет собой язык, который может быть использован для запросов в базы данных GellishEnglish. Он позволяет вести диалоги в форме ответов и запросов, а также служит для информационного моделирования знаний;

— HTSQL – используется для перевода запросов http в SQL;

— ISBL – используется для PRTV (одной из первых реляционных систем управления БД);

— LDAP – протокол для служб каталогов и запросов, работающий по протоколу TCP/IP;

— MDX – нужен для баз данных OLAP.

Поисковые системы

В свою очередь язык поисковых запросов направлен на нахождение данных в поисковых системах. Отличается он тем, что часто запросы содержат гипертекст или обычный текст с дополнительным синтаксисом. От стандартных подобных языков, которые содержат позиционные параметры и регулируются строгими правилами синтаксиса команд, он значительно отличается.

Классификация поисковых запросов

Существует целых три категории поисковых запросов, которые охватывают широкое число поисковых запросов: навигационная, информационная и транзакционная. Данная классификация не была закреплена теоретически. Эмпирически она подвержена наличием фактических запросов в поисковых системах. Информационные запросы охватывают широкие темы, в отношении которых может быть получено несколько тысяч релевантных результатов. Навигационные поисковые запросы представляют собой запросы, которые ищут одну веб-страницу или сайт на определенную тему. Транзакционные запросы отражают намерение пользователя осуществить определенное действие, например, купить автомобиль или заказать билет на самолет. Довольно часто поисковые системы поддерживают и четвертый тип запроса, используемый намного реже. Это запросы подключения, которые содержат отчет о связанном проиндексированном веб-графике.

Как осуществляется поиск информации?

Большая часть поисковых ресурсов не раскрывает свои журналы поиска. По этой причине информацию о том, что в сети ищут пользователи, может быть очень сложно найти. Однако первые научные исследования по этому вопросу появились еще в 1998 году. Чуть позже в 2001 году было выполнено повторное исследование, которое проанализировало запросы, которые отображаются как высокорелевантные. Также стало ясно, как язык запросов используется поисковыми роботами. Некоторые характеристики, которые касаются веб-поиска:

— средняя длина поискового запроса составляет 2,4 слов;

— примерно половина всех пользователей направляли один запрос, немного меньше трети пользователей просматривали только первые одну-две страницы из полученных результатов;

— менее 5% пользователей используют расширенные возможности поиска, такие как поиск в поиске или выбор каких-либо определенных категорий.

Особенности действий пользователя

Как показало исследование, около 19% всех запросов содержат географический термин вроде географических объектов, адресов, почтовых индексов и так далее. Стоит также отметить, что кроме коротких запросов часто присутствуют предсказуемые схемы, по которым пользователи осуществляют изменение своих поисковых фраз. Как было установлено, около 33% запросов от одного пользователя повторяются. В 87% случаев пользователь будет нажимать на один и тот же результат. Это свидетельствует о том, что многие пользователи повторно используют запросы для того, чтобы заново найти и пересмотреть нужную информацию.

Частотное распределение запросов

Специалистами было обнаружено, что частотные распределения запросов соответствуют степенному закону. Это значит, что небольшая часть ключевых слов встречается в самом большом списке запросов. Они используются чаще всего. Остальные фразы в раках различных тематик могут использоваться более индивидуально. Данное явление получило название принципа Парето. Это позволило поисковым системам использовать такие методы оптимизации, как разбиение базы данных или индексирование, кэширование и упреждающую нагрузку. Также это позволило усовершенствовать язык запросов поисковой системы. Как было выявлено в последние годы, средняя длина поисковых запросов с течением времени неуклонно растет. Среднестатистический запрос на английском языке стал намного длиннее. В связи с этим компания Googleвнедрила обновление «Колибри». Оно способно обрабатывать длинные поисковые запросы, написанные непротокольным или разговорным языком. Для длинных и сложных запросов используется специальная обработка – сначала они разбиваются на фразы, сформулированные стандартным языком. Ответы на разные части фразы выводятся по отдельности.

Структурированные запросы

Системы, которые поддерживают логические операции и синтаксис, могут использовать расширенные языки запроса. Если пользователю нужно найти документы, которые охватывают несколько граней или тем, то он может описывать каждую из них по логической характеристике слова. Логический язык запросов представляет собой по сути совокупность определенных знаков препинания и фраз.

Расширенный поиск: что это?

Язык запросов GoogleиYandex при соблюдении некоторых условий может осуществлять узконаправленный поиск. Расширенный поиск может искать по префиксу заголовка или части названия страницы. Также поиск может осуществляться в определенных категориях и перечнях имен. Он может ограничить поиск страниц, которые содержат определенные слова в названии или находятся в определенных тематических разделах. В случае правильного использования языка запросов, появляется возможность обрабатывать более сложные параметры, чем поверхностные результаты выдачи большинства поисковых системы, в том числе и по заданным пользователем словам с похожим написанием и переменным окончанием. В представленных результатах расширенного поиска будет отображаться ссылка на соответствующие разделы страницы. Также имеется возможность поиска всех страниц, которые содержат определенную фразу. При стандартном запросе, поисковые системы не могут остановиться на любой странице обсуждения. Язык запросов во многих случаях может привести на любую страницу, которая расположена в тегах noindex. Правильно сформированный запрос в некоторых случаях позволяет найти информацию, которая содержит специальные символы или буквы других алфавитов.

Символы языка запросов: как они читаются?

Нижний и верхний регистр, а также определенные диакритические знаки при поиске не учитываются. Некоторые лигатуры соответствуют отдельным буквам. Так, например, поиск по слову «Аероскобинг» скорее всего найдет страницу, которая содержит «Эрескебинг». Некоторые не алфавитно-цифровые символы поисковыми системами игнорируются. Так, например, нельзя будет найти информацию по запросу, который содержит строку |L|. В результатах будут отображаться только данные с «ЛТ». Некоторые фразы и символы обрабатываются немного по-разному. Так, например, при запросе «кредит (финансы)» отобразятся статьи со словами «Кредит» и «Финансы», скобки будут проигнорированы даже в том случае, если имеется статья, точное название которой «Кредит (Финансы)». Существует также множество специальных функции, которые можно применять с использованием языка запросов.

Синтаксис языка запросов

Язык запросов поисковых систем Google и Yandex может использовать для уточнения запроса некоторые знаки препинания. Можно привести в качестве примера фигурные скобки {}. Заключенная в них фраза будет целиком подвергаться поиску без каких-либо изменений. Фраза, записанная в двойных кавычках, позволит определиться с объектом поиска. Так, например, записанное в кавычках слово, будет распознаваться в переносном смысле, как вымышленный персонаж, а без кавычек в поиске будет отображена информация документального характера. Основные поисковые системы также поддерживают символ «-», который обозначает логическое «не». Исключение составляют термины, которые не могут быть разделены при помощи тире или префикса дефисом. Для обозначения неточного соответствия поисковой фразы используется символ ~. Так, например, если вы не помните точную формулировку названия или термина, вы можете указать ее в строке поиска вместе с указанным символом. В результате вы получите результаты, которые имеют максимальное сходство с заданным запросом.

Специализированный поиск: параметры

Существуют и такие параметры поиска, которые носят название incategory или intitle. Данные параметры представляют собой фильтры, которые отображаются через двоеточие. Выглядит это примерно следующим образом «фильтр: строка запроса». В строке запроса может содержаться фраза или термин. Функция «intitle:запрос» будет отдавать приоритет выдаче по названию. Также она отображает и обычные результаты по содержанию заголовка. Можно одновременно использовать несколько таких фильтров. Как же использовать данную возможность? Если запрос имеет вид «intitle:название книги», то в результаты попадут все статьи, которые содержат название книги в заголовке. Если же сформулировать запрос как «автор intitle: название книги», то вы получите статьи с названием книги в заголовке и упоминанием в тексте автора. Фильтр «incategory: категория» работает по принципу первоначальной выдачи статей, которые принадлежат к определенному списку или группе страниц. Так, например, запрос «костелы incategory: история» выдает результаты на тему истории костелов. Также эту функцию при задании различных параметров можно использовать как расширенную.

Отблагодари меня, поделись ссылкой с друзьями в социальных сетях:


Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *