Інформаційно-пошукові системи Internet 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Інформаційно-пошукові системи Internet



За тисячі років свого існування і безперервного потягу передової його частини до наукових знань людство накопичило величезну кількість інформації з різноманітних областей науки, техніки культури і т.п. Попри всі намагання до наукових знань найбільшою перепоною до швидкого прогресу, на мій погляд була не відсутність знань, а відсутність інформації про те, що такі знання вже є, хтось зробив уже такі дослідження і треба всього лиш отримати інформацію про них.

Але не знаючи цього людство знову і знову “ винаходило велосипед” тобто витрачало сили і кошти на здобуття знань, які вже були в його розпорядженні. Таким чином конче необхідним було об’єднати всі цю інформацію про життєдіяльність людей і зробити її досяжною для тих, кому вона потрібна. Ситуація змінилася докорінно з появою Інтернету.

Народжений дитиною ВПК він швидко виріс з коротеньких штанців військових проблем і зумів стати тим, про що мріяло не одне покоління дослідників. Він зумів об’єднати знання сотень поколінь землян в єдиний інформаційний простір, що відкритий для кожного, хто б цього забажав. Неможливо перерахувати що є в Інтернеті (власне як і чого нема). Одним словом було б тільки бажання…

Причому ці глобальні інформаційні ресурси знаходяться в стані постійної систематизації, тобто людство постійно вишукує найбільш оптимальні способи зберігання і пошуку необхідної інформації. Для цього в Інтернеті існує купа пошукових і файлових серверів, DNS серверів. В Інтернеті є багато ресурсів, але офіційній перелік їх відсутній. Кожен хто має вихід в Інтернет може в любий момент, нікому не кажучи створити новий ресурс, тому складність заключається в тому, щоб з’ясувати, що ж насправді є в Інтернет. Треба пам’ятати, що Інтернет – динамічна система і що її період напіврозпаду складає близько чотирьох років.

Це значить що за рік ресурси в мережі Internet старіє приблизно 25% даних. Ще одна проблема в тому, що якість мережевих ресурсів не однакова. Одним словом в глобальній інформаційній мережі приховані глобальні інформаційні ресурси і отримати іх може кожен, але найбільшого успіху досягне той, хто знає як це зробити.

Як відомо, поява всесвітньої мережі Internet називають одним з важливих досягнень сучасної цивілізації. І справа не тільки в тім, що вже зараз Internet – це практично нескінченний інформаційний ресурс, а в тім, що він є дійсно всесвітнім джерелом знань, глобальним і загальнодоступної по своїй суті. І це джерело постійно поповнюється все новими і новими знаннями, поєднує їх, дає можливість використовувати необхідну інформацію тоді, коли вона дійсно потрібна.

Простір Internet воістину величезний, і немає необхідності докладно розповідати про те, що саме можна в ньому знайти. В даний момент уже практично неможливо перелічити всі області знань, що охоплює ця всесвітня мережа. Однак не секрет, що для більшості користувачів перша ж спроба пошуку чого-небудь у цьому морі інформації звичайно розчаровує.

Дійсно, разом зі збільшенням обсягів доступної інформації усе гостріше встає проблема пошуку дійсно потрібних користувачу даних. Варто визнати, що це дійсно складна задача, оскільки обсяг даних, доступних через Internet, воістину величезний, а серйозної класифікації представленої там інформації просто не існує.

Очевидно, що пошук інформації в Internet неможливий без спеціальних механізмів, що допомагають людині знайти в цьому безмежному просторі потрібну інформацію. І, звичайно ж, такі механізми існують. З'явившись у середині 70-х років, вони одержали назву інформаційно-пошукових систем, і з тих пір постійно удосконалюються. Саме про ці системи, без яких неможливий пошук даних у великих інформаційних масивах (а всесвітня Мережа – це найбільшої на сьогодні масив даних), і піде мова в цій роботі.

Як вже говорилося, пошукові системи існують уже давно. З появою Internet вони відразу ж зайняли своє місце й у цій області інформаційних технологій. У загальному випадку інформаційно-пошуковою системою називається система, що забезпечує пошук і добір необхідних даних на основі інформаційно-пошукової мови і відповідних правил.

Узагалі говорячи, кожен користувач Internet шукає інформацію в Мережі відповідно до своїх смаків і пристрастям. Однак існують деякі загальні принципи, випливаючи яким можна швидше знайти необхідну інформацію.

Найпростіший спосіб почати пошук у Internet – звернутися до однієї з пошукових служб мережі. Інформаційно-пошукові служби Internet – той самий інструмент, що дозволяє орієнтуватися у величезному інформаційному просторі мережі. Сьогодні багато користувачів знаходять необхідні матеріали, звертаючи до послуг пошукових служб.

Користувачам Internet добре відомі назви таких сервисов і інформаційних служб, як Lycos, Alta Vista, Yahoo, InfoSeek і багатьох інших. Без послуг цих систем сьогодні практично не можна знайти що-небудь корисне в ресурсах Мережі.

Усі ці відомі і популярні пошукові системи мають дуже простий інтерфейс, розрахований на недосвідченого користувача, мають безліч настроювань і досить прості у використанні. Як правило, у відповідь на запити видається список посилань на інформаційні джерела, на думку системи щонайкраще відповідають потребам користувача. Але від користувача залежить тільки формулювання запиту, пошук же здійснює убудований механізм пошукової системи.

Але що собою представляють ці системи зсередини, як вони улаштовані, чому результат пошуку в терабайтних масивах інформації здійснюється досить швидко і як улаштоване ранжирування документів при видачі – усе це звичайно залишається за кадром. Проте без правильного планування стратегії пошуку, знайомства з основними принципами роботи ІПС важко ефективно використовувати навіть такі сучасні і могутні пошукові служби. При роботі з цими системами варто враховувати ряд факторів.

По-перше, усі пошукові системи в Мережі мають свою спеціалізацію. Наприклад, Lycos і AltaVista містять одні з найбільших масивів посилань і відомі швидкістю додавання нових ресурсів мережі, однак багато ресурсів Internet недовговічні і рухливі, і посилання можуть указувати на відсутні ресурси. Infoseek – це найбільш стабільна база даних, де зручно знаходити відомі матеріали, але не слід шукати що-небудь нове, і т.д. у залежності від пошукової системи. У випадку пошуку якої-небудь спеціалізованої інформації користувачу треба відразу настроїтися на тривалу і кропітку працю.

Якщо в звичайній бібліотеці існує зрозуміла класифікація і досвідчений персонал, що розставляє книжки і журнали відповідно до предметного каталогу, загальним для всіх бібліотек, то – у Internet такого стандарту нема, і кожна інформаційна служба виробляє свою власну систему класифікації.

Крім того, зовсім очевидно, що Internet – це світовий інформаційний ресурс. Сюди поміщається усе, що так чи інакше цікавить людей в усьому світі, тому перш ніж починати що-небудь шукати, варто тверезо оцінити імовірність того, чи може дана інформація взагалі потрапити в мережу і де найбільш логічне для її місце.

По-друге, варто розуміти, що пошук здійснюється не природною мовою і не по всьому тексту документа. Звичайно документ представлений набором ключових слів – пошуковим образом документа (ПОД), а користувач здійснює пошук не в наборі документів, а в наборі їхніх пошукових образів. Крім того, для кожної пошукової системи характерний свій механізм створення ПОД. Природно, що це впливає на результати пошуку.

По-третє, самі запити і їхня інтерпретація в інформаційних системах Internet реалізовані по-різному, хоча поза залежністю від типу інформаційно-пошукової мови багато систем містять можливість сформулювати простий запит і запит з урахуванням специфіки пошукового апарата системи.

Простий запит – це фраза природною мовою без загальних слів, союзів і приводів. Складний запит – це запит, що враховує специфіку системи і дозволяє користувачу варіювати різні параметри пошуку. Після завершення обробки запиту користувачу видається список посилань на документи, де вже можна використовувати гіпертекстові посилання для перегляду. Ці посилання можуть указувати як на Web-сторінки, так і на одиниці збереження інших інформаційних ресурсів Internet.

По-четверте, у даний час для управління інформацією Web у пошукових вузлах застосовуються два різних механізми — покажчики і каталоги, і різні пошукові системи використовують у своїй роботі різні механізми.

Покажчики Web являють собою громіздкі бази даних, формовані комп'ютером в автоматичному режимі й утримуючі інформацію про мільйони сторінок Web. Коли користувач уводить ключові слова чи фрази, пошукова система шукає ці терміни в існуючій виданий момент базі даних і видає посилання на усі відомі їй сторінки із шуканими термінами. Покажчики Web будуються так званими краулерами Web — програмами, що переглядають і індексують вміст HTML-сторінок, виявляють гіпертекстові зв'язки, що містяться в них, і читають відповідні сторінки. Багато сотень таких програм із заданою періодичністю переглядають весь доступний вміст Internet.

Каталоги Web — це зв'язані між собою гіпертекстовими посиланнями списки вузлів Web, упорядковані по тематичних категоріях.

Каталоги Web створюються людьми, а не комп'ютерами і часто містять рекомендації чи анотації до вузлів. Вони охоплюють значно менше тим, чим зібрані комп'ютером покажчики Web, але незмінно краще сплановані.

Таким чином, кожна система має велику кількість унікальних характеристик, своїх особливостей, що накладають відбиток на результат пошуку в Мережі. Більш того, багато пошукових систем відрізняються друг від друга досить значно, оскільки побудовані на різних методах пошуку й індексування інформаційних ресурсів. Але проте цілком реально розібратися в тім, на: якому принципі заснована робота більшості пошукових систем Мережі, як у загальному випадку здійснюється пошук документальних ресурсів у Internet.

Хотілося б сказати, що існуючі на даний момент пошукові системи – це досить могутні і здебільшого досить гнучкі інструменти пошуку інформації. Якщо точно знати, що ж вам дійсно потрібно в Мережі і відповідно до цим уміло скласти запит, практично всі ІПС видадуть на ваш запит достатнє (і навіть надлишкове) кількість посилань на ресурси Internet, у яких не так вже і складно знайти потрібну вам інформацію.

Звичайно, потрібно навчитися користатися і цими досить зручними інструментами. Звичайно для того, щоб освоїтися в роботі з пошуковими системами і навчитися правильно формулювати запити, потрібно якийсь чаc.

Імовірно, що витрачене на цьому етапі час буде не таким вже і маленьким, можливо, буде загублена і визначена кількість нервів, але зрештою на пошук потрібної вам інформації будуть іти лічені хвилини.

Але не можна не сказати, що при єдності основних принципів пошуку всі нині існуючі пошукові системи мають ряд відмінних риc. Знання цих особливостей буває не тільки корисно, але іноді і необхідно при пошуку якої-небудь рідкої чи специфічної інформації. Ці особливості не вносять кардинальних змін у механізм пошуку, але кожна пошукова система має свій алгоритм і свої особливості роботи, що в остаточному підсумку впливають на результати пошуку. Користувач повинний чітко розуміти, який ІПС краще скористатися в кожнім конкретному випадку.

Так, якщо користувачу потрібна велика інформація з однієї з загальновідомих тем, йому варто скористатися пошуковою системою, що працює з каталогом, такий як Yahoo, Excite чи Lycos. Якщо йому необхідна інформація з якої-небудь специфічної чи малопоширеної у мережі тематиці, він скористається системами AltaVista, Infoseek, Rambler, що працюють з індексною базою даних.

Корисно було б сказати кілька слів про найбільш відомі пошукові системи Internet. Представлені характеристики засновані як на офіційно оголошених принципах роботи цих систем, так і на результатах опитувань користувачів Мережі. Отже, найбільш популярними й ефективними на сьогоднішній момент є такі інформаційно-пошукові системи, як Rambler, Meta-Ukraine, Yahoo, Lycos, AltaVista, Infoseek, WAIS та ін.

Варто згадати і про такі пошукові системи, що мають своє поле для введення запиту, але не обробляють його, а розсилають по всіх пошукових машинах, з якими користувач хотів би працювати. Дочекавшись відповіді від усіх пошукових систем, ці програми надають користувачу можливість скористатися заданою кількістю найбільш релевантних посилань, отриманих від кожного пошукового сервера. Такі програми з'явилися недавно й одержали назву позначок-систем. Їхнє число зовсім невелике, і на сьогоднішній момент скільки-небудь відомі лише такі системи, як Metacrawler, Savvy, Metasearch і Dogpile.

Як видно з опису, кожен пошуковий сервер має свою специфіку, свої особливості, які необхідно враховувати при виборі самої придатної пошукової служби для кожного конкретного випадку. Звичайно користувач одержує досить гарні результати при роботі з кожною з представлених пошукових служб. Однак бувають випадки, коли отримана інформація або недостатня, або не задовольняє запитам користувача. У таких випадках багато фахівців і досвідчених користувачів радять відредагувати запит і скористатися декількома пошуковими службами. Практично завжди комбінація декількох пошукових систем дає гарний результат.

Інформаційні ресурси Internet воістину величезні і будь-яка людина, що має можливість користатися її ресурсами, одержує дійсно безмежне джерело інформації. У Internet можна знайти дійсно будь-які цікавлячі відомості, і чи не важливо зв'язані вони з роботою, з хобі, або з будь-якими можливими питаннями, які виникли при вивченні навчальних дисциплін. Але будь-якому користувачу Internet важливо пам'ятати, що в мережі Internet знаходиться просто величезна кількість інформації, і вона не має класифікації ні по типах представлення, ні по областях знань, ні по місцю розташування. Єдиною можливістю відшукати потрібну вам інформацію були і залишаються інформаційно-пошукові системи.



Поделиться:


Последнее изменение этой страницы: 2020-03-02; просмотров: 282; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.145.115.195 (0.012 с.)