muzruno.com

Видове и възможности на системите за извличане на информация

Концепцията за системите за извличане на информация се появи в края на 80-те години на миналия век. Способността да се търсят, обработват, избират данните, изисквани от активния потребител в специално създадената им база данни, съдържаща описания на различни източници на информация и списък на правилата за тяхното използване, се предоставят от търсачките. Основната цел е да се търси информация. Системите за извличане на информация бяха създадени и разработени, за да се направи търсенето по-ефективно. При разработването си те разчитат на уместността или последователността на резултатите от търсенето към генерираната заявка.

Виртуален свят.

Видове търсачки

Ние изброяваме основните видове системи за търсене:

  1. Библиотеката като система за извличане на информация. Изборът се извършва с традиционна или виртуална директория.
  2. Диалогови търсачки. Те осигуряват диалогово търсене.
  3. Системи за извличане на документална информация. Те служат за работа с документи, съхраняват данни под формата на текстове и графики.
  4. Автоматизирани търсачки. Най-популярният тип търсачки днес.

Видове търсене

Основните видове системи за извличане на информация са:

  1. Directory. Това е специално оформена референтна система за извличане на информация. Тя е организирана по различни популярни теми. Каталозите включват описания на източници с връзки към ресурси във виртуална мрежа. Това могат да бъдат сайтове, портали, блогове, страници, социални профили, които се намират в мрежата. Разработването на каталози беше съвременна технология на системите за извличане на информация. Благодарение на директорията системите могат да извършват търсене в реално време в една или друга категория за ключови думи. Популярните директории са Yahoo, Magellan, Weblist.
  2. Към системите за извличане на информация е търсеща машина. Извършва структурирано търсене, което използва специално проектирани роботи за създаване на база данни. Системата съдържа необходимата информация за ресурсите във виртуалната мрежа. Най-важното несъмнено предимство е неговите автоматизирани функции. Нейната основа се формира от търсещия робот. За да извършите търсене в системата, активният потребител издава заявка, която включва набор от ключови фрази. Описанието на документа съдържа: първото изречение на статията, част от текстовия фрагмент, където се открояват главните ключови думи. Документът съдържа датата и кодирането. Най-често срещаните търсачки включват Google, Altavista, Excite.
  3. В света има голям брой различни автоматизирани системи за извличане на информация, съдържащи много източници на необходимата информация. Дори наличието на модерен и мощен сървър не може да отговори на всички искания на милиони активни потребители на виртуално пространство. Във връзка с актуална информация и търсачки позволяват на потребителите едновременно да подават заявления за повече търсачки и въз основа на тяхната консолидация, са в състояние да покажат на потребителя резултата във връзки с необходимият ресурс.

История на творението

Първите търсачки се появиха в средата на деветдесетте години на миналия век. Те приличат на информационни индекси, които са в справочните книги. В информационната им база са били ключовите думи, събрани по всички възможни начини от претендираните сайтове във виртуалната мрежа. Информационните технологии тогава не бяха съвършени. Изборът бе извършен само чрез ключови думи в референтните системи за извличане на информация. По-късно беше разработено специално търсене на комбинации от думи, изречения и текстове, което улесни търсенето на данните, изисквани от потребителя. Системата направи фиксиране на думи, съдържащи ключове. Благодарение на това потребителите успяха да направят необходимите заявки за ключови думи и различни комбинации от думи в Интернет.

Системата за извличане на информация Wandex е изобретена от програмиста Матю Греъм в края на миналия век. По-късно имаше Aliweb, която все още функционира успешно и днес. Те обаче имат многофункционална йерархична структура и не разполагат с модерни технологии.

Една от първите е системата WebCrawler. Неговата уникална функция и основното предимство, което я отличава сред другите търсачки, е възможността да се намерят всякакви ключови думи на определена страница в Интернет. Той се превърна във вид на модел за всички други търсачки.

Много по-късно имаше и други търсачки, които се състезаваха за вниманието на потребителя помежду си. Интернет потребителите в нашата страна започнаха да работят с Rambler.

През 1997 г. Yandex е създаден, който се превръща в аналог на Google. Днес той е един от лидерите в търсещите заявки сред системите у нас.

Към днешна дата са създадени специални търсачки за решаване на задачите. Например, база данни за системата за извличане на информация "Патрон". Тя е предназначена за съхраняване и извличане на данни за касети за различни оръжия и сега се използва в органите на Министерството на вътрешните работи на Руската федерация, специални служби. Съществуват системи за извличане на правна информация за нотариуси, адвокати, медицински персонал и инженери. Те ги използват ежедневно и не представляват съвременни дейности без тях. Съществуват системи за извличане на документална информация за научния персонал на институтите.

Принцип на действие

Когато се описва функционирането на електронните системи за извличане на информация, следва да се отбележат следните точки:

  1. Има програма, наречена робот за търсене. Този робот систематично проверява и индексира различни страници.
  2. Сървърът в интернет генерира потребителска заявка за информация и след това подготвя заявената заявка към търсещата машина.
  3. Търсачката анализира необходимата база данни, след което създава пълен списък със страници, след което ги предава на сървъра.
  4. Сървърът генерира всички резултати от заявката и ги изпраща на персоналния компютър на потребителя.

Цели на IPS

Основните автоматизирани системи за извличане на информация са предназначени за:

  • съхраняване на информационни томове;
  • бързо търсене на необходимите данни;
  • местоположение и унищожаване на информацията;
  • обработка на данни.

Най-популярната IPS

В днешния свят е невъзможно да си представим живота без виртуална мрежа. С него ние купуват различни стоки и услуги, да общуват с колеги и приятели, работа, почивка, прекарват с полза и в полза на свободното си време. Основната роля на диригентите се осъществява във виртуалните мрежи на Интернет чрез системи за извличане на информация. Всеки пише заявката си в полето за търсене и търсачката произвежда огромен брой изречения за ключови думи или фрази.

На първо място е безспорен лидер на много години системи за извличане на информация - Google, който получава четири от петте заявки за най-разнообразни проблеми на активните потребители от цял ​​свят. Второто място е заето от Yahoo. На трето място е Yandex. Помислете за тези търсачки по-подробно и техните други аналози.

Google

Най-популярната търсачка.

Google е основната система за извличане на информация, която обработва повечето от заявките от цял ​​свят. Тази търсачка е известна на голям брой активни потребители на интернет. Всеки месец системата обработва над четиридесет милиарда заявки и индексира двадесет и пет милиарда страници във виртуална мрежа.

Търсачката е създадена от двама талантливи програмисти през 1996 г. Те го нарекоха просто и кратко - Google. В основата й беше поставен специален робот за търсене. Той направи сканиращи страници и ги индексира. Роботът осигурява как страниците ще бъдат генерирани от потребителя в резултатите от търсенето днес. В Google, един от първите, които разработват търсене с помощта на глас на няколко езика, улесняващи въвеждането на данни в системата.

Google има своя страна в нашата страна, в момента има повече от един милиард индексирани страници.

"Google" е една от търсачките, която дълбоко индексира вашия сайт. Големите и популярни сайтове по-лесно достигат високи позиции в резултатите от търсенето с Google, като по този начин защитават системата и потребителите от ненужна информация.

Yahoo

Yahoo система за търсене.

Yahoo е създадена през 1994 година. Той все още е много популярен, комбинирайки търсения за думи, съдържащи ключове, като използва йерархично конструирано дялово дърво.

Съвременното развитие на търсачката се определя като напредване към интерактивността. Yahoo овладява това пространство, но техническият компонент на системата не е предназначен за това при създаването на търсачка. Нямаше част от работата в Yahoo в реално време, така че съществува риск от хакерски атаки срещу тази незащитена част от търсачката.

Една от уникалните функции е функционалната лента за задачи за Firefox. Това уникално средство е асистентът на потребителя, когато използвате Yahoo. Потребителят търси данни без да отива на сайта на търсачката, но само с помощта на бутоните на панела.

През 2005 г. компанията обяви стартирането на система за търсене на текст и изображения, съдържащи се в букви. Необходимостта от такава функция възниква поради нарастването на обема на съхранените от потребителя данни. Някои хора създават цели архивни писма.

Активните потребители на Yahoo могат да използват възможностите за търсене на думи в заглавката или например в тялото на съобщението, както и в приложените файлове, без да ги отварят или четат. Резултатът от търсенето на текст се отразява в редовете, показващи всички необходими атрибути за искането за изпращане. Получените фотографски изображения се показват.

Yahoo притежава повече от двеста милиона пощенски адреса, което е повече от тридесет процента от световния пазар.

"Яндекс"

Търсачка Yandex.

Една от най-добрите системи на нашата страна е "Yandex". За текущия ден търсещата машина е четвъртата по отношение на общия брой заявки за потребители. "Yandex" в популярност днес е лидер сред потребителите в нашата страна. Общият брой на извършените запитвания надхвърля двеста и петдесет милиона всеки ден. Днес търсачката "Yandex" има петдесет уникални, специално разработени приложения.

От 2010 г., в допълнение към известната търсачка yandex.ru, имаше друга търсачка yandex.com, използвана за търсене на чужди портали.



За разлика от други системи за търсене, "Yandex" не пренебрегва морфологията на руския език. Търсачката е предназначена за работа в рускоезичната част на Интернет. Основната разлика между търсачките на руски език и чуждите такива е, че търсачките, които формално търсят на руски, игнорират морфологията на руския език. В рускоезичната част на виртуалната мрежа има около две дузини съвременни търсачки, но по-голямата част от потребителите работят с Yandex.

Днес Yandex е популярна търсачка на руски език. Всеки месец повече от тридесет и пет милиона потребители на виртуалната мрежа го адресират.

Основан през 1989 г. от съветския си програмист. Първо, е разработен алгоритъм за формиране на хипотези. Отсега нататък анализът на исканите комбинации от думи и текстове престава да бъде строго свързан с речника. Ако исканата дума в речника не беше, тогава имаше максимално подобни на нея коренни думи. Шест месеца по-късно става ясно, че нищо не възпрепятства създаването на нова търсачка на руски език. През есента бе представен на световната общност yandex.ru.

Системата Yandex.

В допълнение към търсещата машина, днес "Yandex" е огромен портал с набор от универсално използвани специално създадени услуги. Гъвкавият език за заявки ви позволява да проектирате търсене по различни критерии на заявката. По подразбиране търсенето ще покаже няколко връзки на страницата с резултати. Понякога класирането на сайтовете на тези страници се променя, тъй като актуализирането на базите данни, които се получават, не е моментално.

Периодично се променят алгоритмите на търсачката "Yandex", отговорни за релевантността на издаването, което води до корекции в резултатите от заявките. Тези промени са насочени срещу огромния спам за търсене, съществуващ в мрежата, което води до неправилни резултати по исканията на активните потребители.

Ebay

Ebay търсачка.

Ebay е американска компания, основана в средата на 90-те и специализирана в провеждането на търгове във виртуална мрежа. Управлява портала eBay.com. Ebay е посредник при покупката и продажбата на стоки. Продавачите правят необходимата покупка и допълнителна парична вноска, а купувачите имат възможност да използват сайта безплатно. Днес това е огромна платформа за придобиване и продажба на стоки от физически и юридически лица.

Основните принципи на Ebay са, че всички хора са добри, достойни и всеки от тях е способен да допринесе за развитието, а в комуникацията те показват своите качества.

От 2010 г. насам има версия на популярния виртуален търг на руски език. Плащането на търга се извършва чрез PayPal. За да реализирате някои елементи на Ebay, трябва да посочите цената на стоката, началната й цена, времето на започване на аукциона, както и колко ще продължи търга. Както при обикновения търг, стоките се получават от купувача, който посочва най-високата такса. От виртуални търг предимства може да се отбележи, че страните по сделка за продажба могат да бъдат разположени във всяка точка на земното кълбо, както и наличието на клонове, както и срока, предвиден възможност да участват във виртуални търгове за купувачи и продавачи от цял ​​свят.

MSN

MSN търсачка

Тази търсачка бе организирана от Microsoft през 1995 г. В Русия Microsoft е по-малко популярен, като дава път на Yandex, Google и някои други търсачки. Бързото разпространение на MSN Search спомогна за появата на версията на портала на руски език.

За разлика от огромните търсачки например като Google, MSN отчита съдържанието на мета таговете, което прави процедурата за оптимизиране на сайта за тази система за търсене лесна и удобна. Достатъчно е да включите главните ключови думи в маркерите и потребителите на MSN ще ви намерят. При класирането на страници в интернет, роботът за MSN взема предвид външните връзки и вътрешните, позволява повишената гъстота на думите, съдържащи ключове.

Днес MSN е не само система за търсене, но и огромен портал с разнообразие от специално разработени приложения и ресурси:

  1. Един от проектите на MSN беше пощата на MSN Hotmail. Основните предимства на този помощник за поща са обемно съхранение, възможността за обединяване на записи от виртуални ресурси, незабавно обмен на съобщения.
  2. Пълната технологична сигурност на системата се осигурява от технологиите на Microsoft.
  3. Вниманието заслужава услугата MSN "Пари", която поставя напредна информация за финансови събития.
  4. Сред популярните приложения от MSN, заслужава да се отбележи проектът за видео, съдържащ уникални уникални видеоклипове и интервюта със световни знаменитости.
  5. Специален проект "Майкрософт" е посветен на различни сфери на живота. В допълнение към чистата технология за потребителите, имаше популярни социални мрежи.
  6. Въпреки това порталът на Microsoft има значителен недостатък: като информационен продукт на компанията той е адаптиран за Internet Explorer, поради което има проблеми с преглеждането в други съществуващи браузъри.

"Rambler"

Най-простата система за извличане на информация "Rambler" беше истински пионер сред глобалните проекти за търсене. Днес "Rambler" се отказа от позицията си в класацията на търсачките. Когато въведете персонализирана заявка в линията за търсене "Rambler", той всъщност използва разработката на друга търсачка "Yandex". Днес "Rambler" е голям портал с множество специално разработени услуги.

Тя заема далеч от първото място в популярността сред другите търсачки. За дълго време е разработен специален класификатор "Rambler TOP-100". С помощта на това приложение можете да анализирате статистическите данни на много сайтове. Ако сте собственик на сайта, задължително го добавете към системата "Rambler". Има работещ и полезен каталог на недвижимите имоти - "Rambler.

Получавайки се на главната страница, потребителят получава достъп до пощенската кутия, може да научи времето, валутните курсове, телевизионната програма. Интерфейсът не е много модерен и удобен. Простотата играе важна роля. От търсещата машина няма добре приети букви.

"Rambler" има собствена търсачка, която не се отличава с модерни характеристики и специални разработки, но има място, където да бъде. Можете да го стартирате от главната страница. Тя работи бързо, но се забавя малко, когато зареждате главната страница.

Не може да се каже, че Rambler порталът няма полезни характеристики. Това е удобно място за забавление и разходване на пасивен отдих, използвайки системата за извличане на информация от документи. Порталът може да постигне голям успех с по-иновативен управленски подход своевременно. Това се счита за причината, че веднъж успешният проект за стартиране на проекта бързо изгуби водещата си позиция. Търсещата машина "Rambler" работи върху алгоритмите на "Yandex", която неизменно е начело (на равна нога с чудовища като "Google"). "Rambler" прекара известно преизбиране, латински букви в името се промениха на кирилица, актуализираха дизайна, но нямаше сериозни нововъведения. Порталът и търсачката не разполагат с нови разработки, които биха могли да ги възстановят на водеща позиция в обозримо бъдеще.

Търсачката "Mile.ru"

През 1998 г. благодарение на талантливите програмисти една от най-мощните пощенски услуги се роди в град Санкт Петербург - "Mile.ru". Днес тази пощенска и търсеща система има оперативен имейл, разклонен каталог от Интернет ресурси и удобни информационни секции в модерната библиотека. Система за извличане на информация "Mile.ru" има редица специално разработени проекти, много популярни и жизненоважни за съвременните потребители на виртуалната интернет мрежа.

верните му аудитория от абонати и потребители "Mayl.ru" е намерил дълго време благодарение на мощни услуги, генериране на трафик, но с уникален дизайн на търсачката може да се похвали сравнително наскоро.

Цялата история на развитието на Mile.ru започна с предоставянето на безплатни пощенски кутии на всички, които желаят да използват мрежата. След като получи огромна популярност и търсене, "Mail.ru" започна да се превръща в огромен портал. Сега компанията притежава "Odnoklassniki", "[email protected]" и много други услуги, които са популярни сред активните потребители на виртуалната мрежа. Търсачката е съсобственик на социалните мрежи "Vkontakte" и Facebook.

Общата аудитория на гигантската виртуална мрежа сега е около осемдесет милиона посетители всеки месец. Аудиторията на потребителите "Mile.ru" расте заедно с компанията. Повече от една трета от феновете на тази търсачка са активни потребители на услугата "[email protected]", една четвърт на "Съученици" и "Моят свят". Броят на посетителите, използващи активно търсещата машина, е избран от двадесет милиона души.

Като процент, това е около десет процента от общия дял от търсенето в рускоезичната част на интернет. Това позволява "Mail.ru" да заема честно трето място след такива гиганти като "Yandex" и "Google". Ако този резултат достигне търсещата услуга, без да се вземат предвид социалните мрежи, най-големият в рускоезичната част на интернет, класирането на сайтовете, това би било просто феноменален резултат.

Въпреки това, говорим за търсачката "Mile.ru" изолирано от всичко, което принадлежи на компанията, поне не би било съвсем правилно. Качеството на издаване на исканата информация не свети с резултатите в сравнение с резултатите от заявките за търсене от основните конкуренти.

Официалната страница на търсачката се намира на go.mail.ru и представлява синтез на Google и "Yandex", има способността да свързва картини. Линейната търсачка "Mile.ru" се намира на главната страница на портала, която наскоро промени дизайна.

Основните системи за извличане на информация, които съществуват в съвременния интернет, бяха представени по-горе.

Споделяне в социалните мрежи:

сроден