Разширено търсене и език на заявката. Език на търсещата машина
Езикът на заявката е изкуствено създаден език за програмиране, използван за подаване на заявки в бази данни и информационни системи.
съдържание
- Данни на guide-bulgaria.com
- Търсачки
- Как се класифицират заявките за търсене?
- Как се извършва извличането на информация?
- Характеристики на персонализираните действия
- Разпределения на честотните заявки
- Структурирани заявки
- Какво представлява разширеното търсене?
- Как се четат символите на езика за заявка?
- синтаксис
- Параметри за персонализирано търсене
По принцип такива методи за заявки могат да бъдат класифицирани в зависимост от това дали служат за база данни или за извличане на информация. Разликата е, че исканията за такива услуги се правят, за да се получат реални отговори на поставените въпроси, докато търсещата машина се опитва да намери документи, съдържащи информация, отнасяща се до региона, представляващ интерес за потребителя.
Данни на Guide-Bulgaria.com
Езиците за заявки за бази данни включват следните примери:
- QL - обектно ориентирано, се отнася до релационни бази данни - наследник на Datalog.
- Контекстуалният (CQL) е формален език за представяне на заявки за системи за извличане на информация (като уеб индекси или библиографски указатели).
- CQLF (CODYASYL) - за бази данни CODASYL-TYPE.
- Концепцията ориентиран език на заявката (COQL) се използва в съответните модели (com). Той се основава на принципите на моделирането на данни и използва такива операции като прогнозиране и разрушаване на многоизмерния анализ, аналитичните операции и изводите.
- DMX - използва се за модели за извличане на данни.
- Datalog е езикът на заявките за дедуктивни бази данни.
- Gellish English е език, който може да се използва за заявки в Gellish английски бази данни и ви позволява да провеждате диалози (запитвания и отговори) и също така служи за информационно моделиране знание.
- HTSQL - превежда заявките за http към SQL.
- ISBL - използва се за PRTV (един от първите релационни системи за управление на бази данни).
- LDAP е протокол за заявки и директории, който се изпълнява през TCP / IP.
- За OLAP бази данни се изисква MDX.
Търсачки
Езикът на заявките за търсене, от своя страна, е насочен към намиране на данни в търсачките. Тя се различава, тъй като често заявките съдържат обикновен текст или хипертекст с допълнителен синтаксис (например "и" / "или"). Тя се различава значително от стандартните подобни езици, които се регулират от строги правила за команда синтаксис или съдържат позиционни параметри.
Как се класифицират заявките за търсене?
Има три широки категории, обхващащи по-голямата част от заявките за търсене: информация, навигация и транзакции. Макар че тази класификация не бе теоретично фиксирана, те бяха емпирично потвърдени от наличието на реални заявки в търсачките.
Исканията за информация са тези, които обхващат широки теми (например конкретен модел на град или камион), за които могат да бъдат получени хиляди съответни резултати.
Навигация - това са заявки, които търсят един сайт или уеб страница по конкретна тема (например YouTube).
Транзакционен - отразява намерението на потребителя да извърши определено действие, например да направи покупка на автомобил или да резервира билет.
Търсачките често поддържат четвъртия тип заявка, която се използва много по-рядко. Това са така наречените заявки за свързване, които съдържат отчет за свързването на индексираната уеб графика (броя на връзките към конкретен URL адрес или колко страници се индексират от конкретен домейн).
Как се извършва извличането на информация?
Повечето ресурси за търсене не разкриват своите дневници за търсене, така че информацията за това, което потребителите търсят в мрежата, е много трудно да се намери. Въпреки това първите научни изследвания се появиха през 1998 година. По-късно през 2001 г. бе проведено последващо проучване, в което бяха анализирани заявките, които бяха показани като изключително подходящи. Стана ясно също как търсене на роботи език на заявката.
Интересни характеристики, свързани с търсенето в мрежата, станаха известни:
Средната дължина на заявката за търсене беше 2,4 думи.
- Около половината от потребителите изпратиха една заявка и малко по-малко от една трета от потребителите направиха по три или повече уникални заявки един по един.
- Почти половината от потребителите са гледали само първите една или две страници от резултатите.
- По-малко от 5% от потребителите използват възможностите за разширено търсене (например избор на определени категории или търсене в търсенето).
Характеристики на персонализираните действия
Изследването също така показва, че 19% от запитванията съдържат географски термин (например имена, пощенски кодове, географски обекти и др.). Заслужава да се отбележи, че в допълнение към кратките заявки (т.е. при няколко условия) често са налице предвидими схеми, според които потребителите променят своите фрази за търсене.
Също така бе установено, че 33% от заявките от един потребител се повтарят, а в 87% от случаите потребителят ще кликне върху същия резултат. Това показва, че много потребители използват многократни заявки за преглед или повторно намиране на информация.
Разпределения на честотните заявки
Освен това, специалистите потвърдиха, че разпределението на честотите на заявките съответства на закон за захранването. Това означава, че малка част от ключовите думи се намира в най-големия списък с искания (например повече от 100 милиона) и те най-често се използват. Останалите фрази в същите теми се използват по-рядко и по-индивидуално. Това явление се нарича Принцип на Парето (Или "80-20 правило"), и е възможно да се използват такива търсачките техники за оптимизация като индексирането или разделяне на база данни, кеширане и предварителното натоварване, а също така даде възможност за подобряване на езика на заявки за търсене.
През последните години се установи, че средната продължителност на заявката непрекъснато се увеличава с течение на времето. Така че средната заявка на английски става по-дълга. В тази връзка, Google представи актуализацията на име "Hummingbird" (August 2013 г.), който е в състояние да се справят с дълги фрази за търсене, без протокол "говори" команден език (като "Къде е най-близкото кафене?").
За по-дълги заявки се използва тяхната обработка - те са разделени на фрази, формулирани на стандартния език, а отговорите на различните части се показват отделно.
Структурирани заявки
Търсачките, които поддържат логични операции и синтаксиса, използвайте по-разширени езици за заявки. Потребител, който търси документи, покриващи няколко теми или лица, може да опише всеки от тях чрез логическата характеристика на думата. В основата си логическият език на заявката е колекция от конкретни фрази и препинателни знаци.
Какво представлява разширеното търсене?
Езикът на заявката на "Yandex" и "Google" е в състояние да извърши по-конкретно търсене, при определени условия. Разширеното търсене може да търси част от името на страницата или префикса на заглавката, както и в някои категории и списъци с имена. Той може също така да ограничи търсенето на страници, които съдържат конкретни думи в заглавието или са в определени групи от теми. С правилното използване на езика на заявката той може да обработва параметри с порядък по-сложен от повърхностните резултати на повечето машини за търсене, включително тези, които потребителят дава с думи с променлив край и с подобен правопис. Когато покажете резултатите от разширено търсене, ще се покаже връзка към съответните секции на страницата.
Също така е възможно да се търсят всички страници, съдържащи конкретна фраза, докато при стандартна заявка търсачките не могат да спрат на нито една страница от дискусията. В много случаи езикът на заявката може да доведе до всяка страница, разположена в маркерите noindex.
В някои случаи добре формулирана заявка ви позволява да намерите информация, която съдържа определен брой специални знаци и букви от други азбука (китайски йероглифи например).
Как се четат символите на езика за заявка?
Горните и долните букви, както и някои диакритични знаци (букви и акценти) не са включени в търсенето. Например, търсенето на ключовата дума Citroen не намира страници, съдържащи думата "Citroen". Но някои лигатури съответстват на отделни букви. Например, търсенето на думата "аероскоп" лесно ще намери страници, съдържащи "Ereskebing" (AE = Æ).
Много не-буквено-цифрови знаци непрекъснато се игнорират. Например, не е възможно да се намери информация за заявка, съдържаща низовете | L | (буквата между две вертикални ленти), въпреки че този символ се използва в някои шаблони за реализация. Само данните от LT ще бъдат в резултатите. Някои символи и фрази се обработват по различни начини: заявката "заем (финанси)" показва статията с думите "кредит" и "финанси", игнорирайки скоби, дори и да има една статия с точното име "кредит (финанси)".
Има много функции, които могат да се използват с езика на заявката.
синтаксис
Езикът на заявката на "Yandex" и "Google" може да използва някои препинателни знаци, за да прецизира търсенето. Например, къдравите скоби са {{search}}. Фразата, включена в тях, ще бъде претърсена изцяло, без промени.
Фразата в двойни кавички ви позволява да определите обекта на търсенето. Например цитираната дума ще бъде разпозната като използвана фигуративно или като измислен характер, без кавички - като информация с по-документален характер.
В допълнение, всички големи търсачки поддържат знака ";" за логическия "не", както и / или. Изключение са термините, които не могат да бъдат разделени с тире на тире или тире.
Неточната кореспонденция на фразата за търсене е маркирана със символа ~. Например, ако не помните точната формулировка на даден термин или заглавие, можете да го посочите в търсещия низ с посочения знак и ще можете да получите резултати с най-голямо сходство.
Параметри за персонализирано търсене
Съществуват и параметри за търсене като intitle и incategory. Те са филтри, показвани чрез двоеточие, под формата на "филтър: низ на заявката". Въпросният низ може да съдържа думата или фразата за търсене или частичното или пълното име на страницата.
Функцията "intitle: query" дава приоритет на резултата от търсенето по име, но също така показва обичайните резултати за съдържанието на заглавието. Няколко такива филтъра могат да се използват едновременно. Как да използваме тази възможност?
Искането за типа "intitle: name на летището" ще даде всички заглавия, съдържащи заглавието на летището. Ако го формулирате като "паркинг intitle: име на летището", ще получите статии с името на летището в заглавието и ще посочите паркинг в текста.
Филтърно търсене "Категория: Категория" работи на принципа на първоначалното издаване на статии, принадлежащи към определена група или списък със страници. Например, заявка за търсене за типа "Temples incategory: History" ще даде резултати за историята на храмовете. Тази функция може да се използва и като разширена, чрез задаване на различни параметри.
- Разпределени бази данни
- SQL файл. SQL файлов формат: описание на разширението
- MySQL е какво и къде се прилага?
- Общ преглед на системите за управление на бази данни
- Как да съставя SQL заявки - подробни примери
- Списък на езиците за програмиране. Програмни езици на ниско и високо ниво
- Какво да търсите в интернет? Как правилно да търсите информация в Интернет
- Работа с базата данни: какви са исканията
- DB е ... Типове и свойства на базата данни
- MySQL - искане в заявката. MySQL: примери за заявки. Вложени заявки за MySQL
- SQL Къде: методи на прилагане и примери
- Подробности за това, какво да отворите ACCDB
- SQL заявката е какво?
- Създаване на заявки в Access. Видове искания
- Инсталиране на SQL с
- Изтриване на изявление Изтриване на MySQL
- Изтриване на MySQL дубликати
- Как да създадем база данни и какво е SQL?
- Структура на базата данни
- Достъп до извадкови резултати чрез извличане на MySQL масив
- Как да създадете заявки в Access: стъпка по стъпка инструкции и препоръки