Какова процедура поиска и размещения информации в Интернет? 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Какова процедура поиска и размещения информации в Интернет?



Сеть Интернет похожа на огромную мировую библиотеку, имеющую только одно, но существенное отличие: для поиска книги в библиотеке есть каталог, в крайнем случае, можно обратиться к опытному библиотекарю. Полного каталога Интернета не существует. Но, тем не менее, поиск в глобальной компьютерной сети возможен, и это, пожалуй, является одной из наиболее важных его сторон. Для поиска данных в сети используются специальные серверы, информация на которых поддерживается и обновляется практически автоматически.

 

Сегодня, когда Интернет стал одним из основных источников информации, поиск в Сети приобретает все большую практическую ценность. Но с быстрым увеличением объема доступных данных все более усложняется и сама процедура поиска.

 

Интернет - это глобальная компьютерная сеть, которая связывает между собой как пользователей компьютерных сетей, так и пользователей ПК. Интернет медленно, но верно становится основным средством корпоративного общения, уступая пока телефону.

 

В Сети наличествует гигантское количество информационных ресурсов. По некоторым оценкам, число документов превысило 65 млн. и продолжает стремительно расти. Такой объем информации требует правильной организации процесса поиска и применения специальных технических средств, таких как поисковые машины. Простой поиск по достаточно распространенному ключевому слову дает обычно от десятков тысяч до нескольких миллионов ссылок. Очевидно, что работа с таким большим количеством документов практически невозможна, тем более что подавляющая их часть содержит информацию, не относящуюся к делу.

 

Источники информации в Интернете различаются по способу представления информации, а следовательно, и по методу доступа к ним.

 

Из всего выше сказанного вытекает актуальность темы данной курсовой работы.

 

Целью курсовой работы является выявление основных источников информации, методов поиска и сбора данных в сети Интернет

 

Для реализации поставленной цели необходимо решить следующие задачи:

 

Изучить источники маркетинговой информации и методы поиска;

 

оценить ситуации на рынке рекламных услуг в РБ при помощи источников Интернет;

 

оценить эффективность методов сбора и источников информации в интернет

 

Объектом исследования в данной курсовой работе является источники информации

 

Предметом исследования курсовой работы является оценка эффективности методов поиска, источников информации в Интернет.

 

Следует отметить, что вопросы, связанные с рассматриваемой темой освещены в научной и периодической литературе в объеме, достаточном для написания работы.

 

Теоретической и методологической основой работы послужили теоретические положения работ отечественных и зарубежных ученых. Весомый вклад в теорию исследуемых проблем внесли Ф. Котлер, М. Портер, А.М.Годин, Т.П. Данько, Н.Б. Завьяловой, О.В. Сагиновой. Нэреш К. Малхотра, дал основные теоретические сведения о проведения опроса и анализа полученных данных.

 

В числе основных информационных источников работы использовались публикации в таких периодических изданиях, как «Маркетинг в России и за рубежом», «Маркетинг. Идеи и технологии», «Маркетинг и маркетинговые исследования».

 

 

1.Интернет как источник маркетинговой информации. Методы поиска информации

 

 

Каждый пользователь Всемирной паутины сталкивается с проблемой поиска информации. Будь то реферат, курсовая, поиск этой информации может занять от пяти минут до нескольких часов - все зависит от умения искать и находить нужные данные в Интернете. В этом случае на помощь приходят всевозможные поисковые машины, каталоги и базы знаний. Рассмотрим их по отдельности.

 

 

.1 Каталоги сайтов

 

 

С этой категорией все довольно просто. Каталог представляет собой электронную библиотеку ссылок на ресурсы (сайты) определенной направленности. Здесь действительно все как в настоящей библиотеке - все сайты разложены по категориям, с краткими описаниями для более удобного восприятия. Главным минусом данной системы является так называемый «ручной набор» сайтов, т. е. далеко не все странички глобальной сети размещены.

 

Поисковые машины

 

 

Рис. 1.1 поисковик Google

 

 

Если, во всевозможных каталогах, вы так и не нашли, что искали. На помощь уже спешат многочисленные поисковики, благо их существует достаточное количество. Главными русскоязычного рынка являются Яндекс, Рамблер и Google. Также, вы можете обратиться к таким поисковикам, как Апорт, Yahoo! и прочим.

 

 

Рис. 1.2 поисковик Яндекс

 

 

Главный плюс любой поисковой машины кроется в механизме ее работы. В отличие от каталогов, поисковики для добавления сайтов в свою базу данных, используют специального робота-паука, который вполне удачно просматривает и индексирует все общедоступные сайты своей Глобальной Паутины. Но для удачного поиска будет мало лишь огромной базы спутника, ведь среди всех этих терабайт информации нам нужно найти именно нужную. Поэтому на любой из предложенных поисковиков и рассмотрим главные правила поискового дела.

 

 

1.2 Точность и простота запроса

 

 

Рис. 1.3 поисковик Апорт[17]

 

 

Важнейшим фактором и залогом нашего успеха является правильность поискового запроса. К примеру, если вы хотите найти информацию о чемпионате по футболу Евро 2012 в Украине, вам следует вводить в строке поиска Евро 2012 Украина, а не просто футбол Украине. Машина ищет именно слова и словосочетания, она не знает, что вы имели ввиду, запросив какую-либо информацию, она не будет думать за вас! Также полезно знать, что любой современный поисковик сортирует найденную информацию по релевантности (степени совпадения вашего запроса с информацией на сайте), т. е. самый подходящий вам сайт будет находиться на первом месте и т. д. Также, обратите внимание, что поисковая система не индексирует и не ищет по предлогам и таким частым словам, как «где», «когда», «кто»; также она опускает знаки пунктуации (исключения составляют лишь очень распространенные комбинации, как $10 или С++).

 

 

1.3 Поиск цитаты или точного названия

 

 

С поиском цитат или точных названий фирм, музыкальных групп и пр., если поисковик не берет во внимание сильно распространенные слова? Очень просто. Стоит лишь заключить в кавычки весь запрос, и система тотчас же воспримет его как единое целое, не смея менять слова местами либо опускать какие-либо слова или символы. К примеру, если вы ищете текст песни «Белые розы», просто наберите фразу «что с вами сделали лед и морозы». Также можно заставить поисковую машину искать любое слово или символ, поставив пред ним «+». Результатом запроса «Обитель зла +3», будет именно ссылки на сайты о третьей части этого фильма.

 

 

1.4 Поиск по сайту или домену

 

 

Предположим, вы читали интереснейшую статью на каком-либо сайте, однако забыли сохранить ссылку в Избранном и теперь не можете ее найти. И с этой задачей способен справиться поисковик. К примеру, Google стоит лишь указать, на каком сайте искать, например: Как купить компьютер Данный запрос направит поисковую систему на указанный сайт, и найдет там нужную информацию. В Яндексе такой запрос выполняется немного сложнее: Как собрать компьютер. Также эта функция позволяет искать информацию в определенном домене, например, для поиска с помощью Google информации, расположенной на сайтах с адресом *.ru, можно ввести: Как купить компьютер site:ru - что может быть полезно для поиска данных определенного региона. Исключение из поиска. Поисковую машину можно не только «заставлять» искать нужный текст в Интернете, но и исключать некоторые слова из запроса. Если вы не хотите, что бы при поиске реферата на тему «История Древнего Египта» вам были предложены документы с его Культурой, просто введите в поисковое поле Google: история древнего египта -культура. В Яндексе вместо знака «-» используется сочетание знаков «~~». При таком запросе, слово «культура» было полностью исключено из критериев поиска.

 

 

.5 Поиск с учетом регистра

 

 

Поисковые системы не учитывают регистр, все заглавные символы воспринимаются машинами как строчные, за исключением использования специального операнда. Таковым является знак восклицания «!», стоящий перед словом. Эта функция очень полезна, чтобы искать села или города с распространенными названиями, к примеру «село!Кошки». В данном случае, поисковик не будет искать сайты, где речь ведется о селе, где живут кошки, а будет вести поиск с учетом заглавной буквы.

 

 

1.6 Базы знаний

 

 

Рис. 1.4 поисковик Wikipedia

 

 

Существуют сайты, которые не только предоставляют нам информацию, но и позволяют дополнять и редактировать ее. Такие проекты развиваются с огромной скоростью и очень быстро превращаются в огромные Базы знаний, к которым ежедневно обращаются люди, ищущие информацию в сети. Одним из самых грандиозных проектов по праву считается Википедия (#"justify">с337]

 

По источнику происхождения маркетинговую информацию можно разделить на первичную и вторичную. Первичная информация получается в результате специально проведенных исследований, вторичная уже существует в информационном пространстве как результат деятельности других субъектов.

 

Любое предприятие, в практической деятельности имеет дело преимущественно с вторичной информацией, получаемой как из внешней, так и внутренней среды. И только при отсутствии необходимой информации вторичного характера возникает необходимость в проведении маркетинговых исследований. Под маркетинговым исследованием понимают систематическое определение круга данных, необходимых в связи со стоящей перед фирмой маркетинговой задачей: их сбор, анализ и отчет о полученных сведениях, выводах и рекомендациях.

 

Интернет предоставляет отличные возможности для проведения маркетинговых исследований, даже силами самого предприятия, не прибегая к помощи специалистов по маркетингу. Маркетинговыми исследованиями могут заниматься как менеджеры по направлениям, так и руководители.

 

Можно выделить несколько направлений сбора информации с помощью сети Интернет:

 

мониторинг ключевых запросов;

 

изучение сайтов конкурентов;

 

изучение потребительского спроса.

 

Рассмотрим все эти направления подробнее.

 

Мониторинг ключевых запросов.

 

Ключевые запросы - это слова или комбинации слов, которые пользователи набирают в поисковых системах с целью нахождения необходимой информации. По статистике, около 70 % пользователей попадают на коммерческие сайты через различные поисковые системы. Самые популярные поисковые системы русскоязычной зоны Интернет:

 

Yandex

 

Rambler

 

Google

 

Mail.Ru

 

Мониторинг ключевых запросов - это изучение ключевых запросов в различных поисковых системах, по различным категориям и признакам с целью выявления потенциального потребительского спроса среди пользователей Интернет. Мониторингом ключевых слов может заниматься отдел маркетинга совместно с ИТ-отделом, а при их отсутствии - менеджеры по направлениям или штатный веб-мастер компании. Небольшие фирмы могут прибегать к помощи специалистов извне (сейчас очень много фирм занимаются продвижением сайтов), но крупным фирмам, которые хотят использовать возможности Интернет на 100 %, лучше иметь в своем штате специалиста по интернет-маркетингу и продвижению веб-сайтов.

 

Изучение сайтов конкурентов.

 

Любая фирма должна учитывать не только запросы потребителей, но и поведение конкурентов. Каждый товар или услуга имеет свою конкурентную среду, особенности которой влияют на сложность работы на конкретном рынке. Фирмы подвержены влиянию факторов, с которыми сталкивается любая компания, работающая на конкурентном рынке.

 

Поведение фирмы обусловлено конкуренцией и рыночными условиями. Она вынуждена реагировать не только на изменение структуры отрасли, но и выбирать свою позицию в этой структуре. Конкурентная стратегия каждой фирмы разрабатывается в соответствии со структурой спроса, своим положением в отрасли и на конкретном рынке. Даже небольшие предприятия нуждаются в собственной стратегии, от которой зависит успех их дела. Хорошо разработанная стратегия позволяет фирме активнее влиять на происходящие на рынке события.

 

Таким образом, руководитель предприятия либо отдел, занимающийся маркетинговым анализом и ценообразованием, может сразу видеть реальную картину конкуренции, как по ценовому признаку, так и по привлекательности и насыщенности предоставленной информации на сайтах конкурентов. Изучая веб-сайты конкурентов можно отслеживать последние тенденции и инновации в бизнесе.

 

Так, на сегодняшний день все большее распространение получают следующие инновации:

 

тиражирование сайта (экспорт базы данных);

 

создание аккаунтов («кабинетов»);

 

размещение видеороликов;

 

возможность оплаты с помощью кредитных карточек.

 

Интернет - это особая информационная среда, где за достоверность информации ответственность несет лишь ее автор, поэтому к отзывам стоит относиться объективно. Бывает такое, что один и тот же объект размещения может получить абсолютно противоположные отзывы от разных отдыхающих. [2, с37-44]

 

 

2. Методы поиска информации в Интернете

 

 

Более или менее серьезный подход к любой задаче начинается с анализа возможных методов ее решения. Поиск информации в Интернете может быть произведен несколькими методами, значительно различающимися как по эффективности и качеству поиска, так и по типу извлекаемой информации. В ряде случаев приходится использовать весьма трудоемкие методы - результат того стоит.

 

Можно выделить следующие основные методы поиска информации в Интернете, которые, в зависимости от целей и задач ищущего, используются по отдельности или в комбинации друг с другом:

 

Непосредственный поиск с использованием гипертекстовых ссылок

 

Использование поисковых машин

 

Поиск с применением специальных средств

 

Анализ новых ресурсов

 

Непосредственный поиск с использованием гипертекстовых ссылок

 

Поскольку все сайты в пространстве WWW фактически оказываются связанными между собой, поиск информации может быть произведен путем последовательного просмотра связанных страниц с помощью браузера. Хотя этот полностью ручной метод поиска выглядит полным анахронизмом в Сети, содержащей сотни миллионов узлов, "ручной" просмотр Web-страниц часто оказывается единственно возможным на заключительных этапах информационного поиска, когда механическое "копание" уступает место более глубокому анализу. Использование каталогов, классифицированных и тематических списков и всевозможных небольших справочников также относится к этому виду поиска.

 

 

2.1 Использование поисковых машин

 

 

Сегодня этот метод является одним из основных и фактически единственным при проведении предварительного поиска. Результатом последнего может являться список ресурсов Сети, подлежащих детальному рассмотрению. Как правило, применение поисковых машин основано на использовании ключевых слов, которые передаются поисковым серверам в качестве аргументов поиска: что искать. Если делать все правильно, то формирование списка ключевых слов требует предварительной работы по составлению тезауруса.

 

 

2.2 Поиск с применением специальных средств

 

 

Этот полностью автоматизированный метод может оказаться весьма эффективным для проведения первичного поиска. Одна из технологий этого метода основана на применении специализированных программ - спайдеров, которые в автоматическом режиме просматривают Web-страницы, отыскивая на них искомую информацию. Фактически это автоматизированный вариант просмотра с помощью гипертекстовых ссылок, описанный выше (поисковые машины для построения своих индексных таблиц используют похожие методы). Нет нужды говорить, что результаты автоматического поиска обязательно требуют последующей обработки. Применение данного метода целесообразно, если использование поисковых машин не может дать необходимых результатов (например, в силу нестандартности запроса, который не может быть адекватно задан существующими средствами поисковых машин). В ряде случаев этот метод может быть очень эффективен. Выбор между использованием спайдера или поисковых серверов являет собой вариант классического выбора между применением универсальных или специализированных средств.

 

 

2.3 Анализ новых ресурсов

 

 

Поиск по новообразованным ресурсам может оказаться необходимым при проведении повторных циклов поиска, поиска наиболее свежей информации или для анализа тенденций развития объекта исследования в динамике. Другой возможной причиной может явиться то, что большинство поисковых машин обновляет свои индексы со значительной задержкой, вызванной гигантскими объемами обрабатываемых данных, и эта задержка обычно тем больше, чем менее популярна интересующая вас тема. Это соображение может оказаться весьма существенным при проведении поиска в узкоспециальной предметной области.

 

 

2.4 Технология поиска с использованием поисковых машин. Определение географических регионов поиска

 

 

Рассмотрим основные этапы, которые так или иначе присутствуют при поиске информации с использованием поисковых машин.

 

Поскольку проведение информационного поиска преследует практические цели - маркетинговые, производственные, сугубо утилитарные и тому подобные, - практическая ценность информационного ресурса может зависеть и от географического расположения соответствующего источника.

 

 

2.5 Составление тезауруса

 

 

Для эффективного использования поисковых серверов необходим список ключевых слов, организованный с учетом семантических отношений между ними, т.е. тезаурус. При составлении тезауруса необходимо предусмотреть обработку синонимов, омонимов и морфологических вариаций ключевых слов.

 

 

2.6 Использование законов Зипфа

 

 

Число, показывающее сколько раз встречается слово в тексте, называется частотой вхождения слова. Если расположить частоты по мере убывания и пронумеровать, то порядковый номер частоты называется рангом частоты. Вероятность обнаружения слова в тексте = частота вхождения слова / число слов в тексте. Зипф нашел, что если умножить вероятность обнаружения слова в тексте на ранг частоты, то получившаяся величина приблизительно постоянна для всех текстов на одном языке:

 

С = (частота вхождения слов X ранг частоты) / число слов

 

Это значит, что график зависимости ранга от частоты - равносторонняя гипербола. Зипф также установил, что зависимость количества слов с данной частотой от частоты - также гипербола и постоянная для всех текстов в пределах одного языка.

 

Что можно извлечь из этих законов? Исследования вышеуказанных зависимостей для различных текстов показали, что наиболее значимые слова текста лежат в средней части диаграммы, так как слова с максимальной частотой как правило являются предлогами, частицами, местоимениями, в английском языке - артиклями (так называемые "стоп-слова"), а редко встречающиеся слова в большинстве случаев не имеют решающего значения. Основываясь на этой закономерности, можно предложить следующую методику.

 

 

2.7 Составление списка ключевых слов

 

 

Правильный набор ключевых слов имеет определяющее значение для оптимального поиска информации. К примеру, задав поисковой машине в качестве ключевого слова "МАРП", мы получим список документов, в которых встречается эта аббревиатура (Московское Агентство по Развитию Предпринимательства). Но если нас интересуют документы по более широкой теме, например: развитие предпринимательства, и мы сформируем простой запрос из этих двух слов, то поисковая машина выдаст нам список из сотен тысяч наименований, ориентироваться в котором будет весьма непросто.

 

Поэтому для составления оптимального набора ключевых слов используют процедуру, основанную на применении законов Зипфа, которая заключается в следующем: берут любой текст-источник, близкий к искомой теме, т.е. "образец", и анализируют его, выделяя значимые слова. В качестве текста-источника может служить книга, статья, Web-страница, любой другой документ.

 

Анализ текста производится таким образом:

 

Удаление из текста стоп-слов

 

Вычисление частоты вхождения каждого слова и составление списка, в котором слова расположены в порядке убывания их частоты.

 

Выбор диапазона частот, лежащего в середине списка, и отбор из этого диапазона слов, наиболее полно соответствующих смыслу текста.

 

Составление запроса к поисковой машине в форме перечисления отобранных таким образом ключевых слов, связанных логическим оператором ИЛИ (OR). Запрос в таком виде позволяет обнаружить тексты, в которых встречается хотя бы одно из перечисленных слов.

 

Число документов, полученных в результате поиска по этому запросу, может быть огромно. Однако, благодаря ранжированию документов (расположению их в порядке убывания частоты вхождения слов запроса в документ), применяемому в большинстве поисковых машин, на первых страницах списка практически все документы окажутся релевантными, причем документ-источник может находиться далеко от начала.

 

Более адекватной представляется структура тезауруса в виде так называемых семантических срезов, где для каждого основного термина отдельно строится таблица сопутствующих слов и слов шумовых (которые не должны встречаться в источнике), - некоторые поисковые машины (AltaVista) позволяют это использовать. Таким образом, вместо единой иерархической структуры терминов мы получаем пакет таблиц, которые могут расширяться и модифицироваться отдельно.

 

Отбор поисковых машин

 

Устанавливается последовательность использования поисковых машин в соответствии с убыванием ожидаемой эффективности поиска с применением каждой машины. Всего известно около 180 поисковых серверов, различающихся по регионам охвата, принципам проведения поиска (а следовательно, по входному языку и характеру воспринимаемых запросов), объему индексной базы, скорости обновления информации, способности искать "нестандартную" информацию и тому подобное. Основными критериями выбора поисковых серверов являются объем индексной базы сервера и степень развитости самой поисковой машины, то есть уровень сложности воспринимаемых ею запросов.

 

Составление и выполнение запросов к поисковым машинам

 

Это наиболее сложный и трудоемкий этап, связанный с обработкой большого количества информации (в основном шумовой). На основе тезауруса формируются запросы к выбранным поисковым серверам, после чего возможно уточнение запроса с целью отсечения очевидно нерелевантной информации. Затем производится отбор ресурсов, начиная с наиболее интересных, с точки зрения целей поиска. Данные с ресурсов, признанных релевантными, собираются для последующего анализа.

 

Формирование запросов

 

Как формат, так и семантика запросов варьируются в зависимости от применяемой поисковой машины и конкретной предметной области. Запросы составляются так, чтобы область поиска была максимально конкретизирована и сужена. Предпочтение отдается использованию нескольких узких запросов по сравнению с одним расширенным. В общем случае для каждого основного понятия из тезауруса готовится отдельный пакет запросов. Так же производится пробная реализация запросов - как для уточнения и пополнения тезауруса, так и с целью отсечения шумовой информации.

 

Языки запроса различных машин поиска в основном являются сочетанием следующих функций:

 

Операторы булевой алгебры AND, OR, NOT:(И) - осуществляется поиск документов, содержащих все термины, соединенные данным оператором;(ИЛИ) - искомый текст должен содержать хотя бы один из терминов, соединенных данным оператором;(НЕ) - поиск документов, в тексте которых отсутствуют термины, следующие за данным оператором.

 

Операторы расстояния - ограничивают порядок следования и расстояния между словами, например:- второй термин должен находиться на расстоянии от первого, не превышающем определенного числа слов;BY - термины следуют в заданном порядке;- термины, соединенные оператором, являются смежными.

 

Возможность усечения терминов - использование символа " * " вместо окончания термина позволяет включить в искомый список все слова, производные от его начальной части (шаблона).

 

Учет морфологии языка - машина автоматически учитывает все формы данного термина, возможные в языке, на котором ведется поиск.

 

Возможность поиска по словосочетанию, фразе.

 

Ограничение поиска элементом документа (слова запроса должны находиться именно в заголовке, первом абзаце, ссылках и т.д.).

 

Ограничения по дате опубликования документа.

 

Ограничения на количество совпадений терминов.

 

Возможность поиска графических изображений.

 

Чувствительность к строчным и прописным буквам.

 

Результат запроса (список ссылок) обрабатывается в два этапа. На первом этапе производится отсечение очевидно нерелевантных источников, попавших в выборку в силу несовершенства поисковой машины или недостаточной "интеллектуальности" запроса. Параллельно проводится семантический анализ, имеющий целью уточнение тезауруса для модификации последующих запросов. Дальнейшая обработка производится путем последовательного обращения на каждый из найденных ресурсов и анализа находящейся там информации.

 



Поделиться:


Последнее изменение этой страницы: 2016-12-16; просмотров: 1464; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.191.13.255 (0.114 с.)