Составитель: к.т.н., доцент Косолапова Н.А. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Составитель: к.т.н., доцент Косолапова Н.А.



ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ

Российиской федерации

Государственное образовательное учреждение

высшего профессионального образования

«Южный федеральный университет»

Экономический факультет

 

 

Рассмотрено и Рекомендовано На заседании кафедры Экономической кибернетики ЮФУ Утверждаю декан экономического факультета ____________________Алешин В.А.
Протокол № от зав. кафедрой________Крюков С.В. «____»_________2009г.

Учебно-методический Комплекс по курсу:

 

«Методы анализа и обработки первичных данных»

для студентов отделения «Математические методы в экономике»

 

 

Составитель: к.т.н., доцент Косолапова Н.А.

Ростов-на-Дону

 

 

Содержание

1. Пояснительная записка  
2. Учебно-тематический план дисциплины  
3. Модуль 1.Методы организации экономических исследований и исследовательские стратегии.  
3.1 Содержание модуля  
3.2 Проектное задание  
4. Модуль 2 Первичная обработка данных.  
4.1 Содержание модуля  
4.2 Проектное задание  
5. Модуль 3. Выборочные данные в исследованиях.  
5.1 Содержание модуля  
5.2 Проектное задание  
6. Модуль 4. Анализ неколичественных переменных  
6.1 Содержание модуля  
6.2 Проектное задание  
7. Анализ природы данных  
7.1 Содержание модуля  
7. 2 Проектное задание  
7. Список рекомендуемой литературы  
8. Материалы для подготовки к практическим занятиям  
9. Тестовые задания.  
10. Глоссарий  

 


Пояснительная записка.

 

Дисциплина «Методы анализа и обработки первичных данных» относится к уровню инструментальных предметов в подготовке экономистов и опирается на такие фундаментальные курсы, как «Общая теория статистики», «Социально-экономическая статистика», «Математическая статистика» и «Теория вероятностей», где формируется понятийный аппарат, и является дисциплиной специальной подготовки.

Знания, получаемые в курсе «Методы анализа и обработки первичных данных», необходимы для профессиональной подготовки современного экономиста к деятельности в качестве экономиста-аналитика, финансового менеджера, аудитора, портфельного менеджера, бизнес-аналитика. Знания, составляющие суть данной дисциплины, играют определяющую роль в подготовке современного специалиста-аналитика, так как современный уровень развития экономических взаимоотношений, требует от современного специалиста наличия навыков качественной обработки и адекватной интерпретации данных любой природы.

Для успешного освоения данного курса студенты должны обладать профессиональными компетенциями, полученными в результате изучения таких дисциплин как Экономическая теория, Общая теория статистики, Социально-экономическая статистика, Теория вероятностей и Математическая статистка.

В результате изучения данного курса студенты приобретают следующие компетенции:

Проводить подготовку и обоснование решений на основе практических расчетов с использованием статистической обработки данных.

Самостоятельно осваивать и учится применять новые методы, необходимые для практической работы.

Эффективно использовать современные компьютерные технологии и Интернет как для профессионального общения, так и в качестве средства получения необходимых дополнительных знаний и данных.

Владеть навыками самостоятельного получения знаний и повышения квалификации в сфере статистического анализа.

Наработать необходимый опыт практического применения статистических методов анализа конкретных проблем развития экономики.

Студент, прослушавший курс должен знать:

Теоретические и методологические основы статистического анализа функционирования финансового сектора экономики, ее основных институтов.

Результаты новейших исследований и публикаций в ведущих профессиональных журналах, посвященных вопросам статистического изучения различных аспектов национальной и международной экономики.

В результате изучения данного курса студент должен приобрести следующие качества:

Способность применять методы статистического анализа при изучении финансовой составляющей социально-экономических процессов.

Умение выбирать средства статистического анализа, наиболее эффективные для конкретных данных.

Владеть навыками сбора первичной организации и хранения данных для конкретного исследования.

Владеть навыками самостоятельного проведения статистических исследований с использованием современных профессиональных компьютерных статистических программ.

Уметь правильно понимать и интерпретировать полученные результаты статистического исследования, уметь критически оценивать возможности и ограничения используемых методов.

Составлять аналитические материалы по различным аспектам развития экономики.

2 Учебно-тематический план дисциплины

№ п/п Название темы Лекции, час Семинары, час Самостоя тельная работа, час
Модуль 1. Методы организации экономических исследований и исследовательские стратегии      
1. Информационная база статистических исследований      
2. Методы организации исследовательского процесса      
3. Методы сбора данных.      
Модуль 2. Первичная обработка данных      
1. Представление статистических данных      
2. Средние величины и изучение вариации      
3. Группировка статистических материалов      
Модуль 3. Выборочные данные в исследованиях      
1. Организация выборочного наблюдения      
2. Статистическое оценивание параметров выборки      
Модуль 4. Анализ неколичественных переменных      
1. Понятие о качественном анализе      
2. Шкалирование      
Модуль 5. Анализ природы данных      
1. Проверка независимости статистических наблюдений      
2. Проверка однородности рассматриваемых статистических совокупностей      
3. Приемы работы с «проблемными данными»      
  Итого      

Форма контроля: экзамен.

 


Содержание курса.

Тема 2: Шкалирование

Зависимость методов измерений связей от уровня измерения переменных. Виды шкал измерения социально-экономических явлений и процессов. Номинальная шкала. Порядковая и интервальные шкалы. Шкала разностей и шкала отношений. Абсолютная шкала. Возможности перехода при измерении признака от одного вида шкал в другой. Понятие о методах многомерного шкалирования.

 

Проектное задание: Опишите, с Вашей точки зрения, существующие ограничения на преобразование качественных данных.

Список рекомендуемой литературы

Основная литература:

1. Елисеева И.И., Юзбашев М.М. Общая теория статистики. – Финансы и статистика, 2004.

2. Сондерс М., Льюис Ф. и др. Методы проведения экономических исследований. М: Эксмо, 2006.

3. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики.-М.: ЮНИТИ, 2002.

4. Айвазян С.А., Мхитарян В.С. Прикладная статистика в задачах и упражнениях: учебник для ВУЗов.-М.: ЮНИТИ-ДАНА, 2001.

5. Боровиков В. Statistica: искусство анализа данных на компьютере. Для профессионалов. –СПб.: Питер, 2001.

6. Боровиков В.П., Боровиков И.П. STATISTICA- статистический анализ и обработка данных в среде Widows-2 изд.,- М.: Информационно-издательский дом «Филинъ», 1998.

7. Боровиков В. Система Statistica для инженеров и студентов. - СПб.: Питер, 2001.

8. Сигел Э. Практическая бизнес статистика.. – М.: Изд. дом «Вильямс», 2002.

9. Никитина Н.Ш. Математическая статистика для экономистов. – М.: ИНФРА – М, 2001.

10. Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере. – М.: ИНФРА-М, Финансы и статистика, 1995.

11. Справочник по прикладной статистике. /под ред. Ллойда Э., Ледермана У. – М.: Финансы и статистика, 1989.

12. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: основы моделирования и первичная обработка данных. М.: Финансы и статистика, 1983.

13. Л.И. Ниворожкина, З.А. Морозова. Основы статистики с элементами теории вероятностей для экономистов. - Ростов н/Д: Феникс, 1999.

14. О.О. Замков, А.В. Толстопятенко, Ю.Н. Черемных. Математические методы в экономике. - М.: МГУ им. М.В. Ломоносова, Издательство "ДИС", 2002.

15. Общая теория статистики / Под ред. М.Р. Ефимовой - М.: Финансы и статистика, 1997.

16. Сошникова Л.А., Тамашевич В.Н., Уебе Г., Шефер М. многомерный статистический анализ в экономике: Учебное пособие для ВУЗов/ под. ред. проф. Тамашевича В.Н..- М.: ЮНИТИ-ДАНА, 1999.

Дополнительная литература:

1. Общая теория статистики / Под ред. Р.А. Шмойловой - М.: Финансы и статистика, 1998.

2. И.И. Елисеева, А.А. Терехов Статистические методы в аудите.- М.: Финансы и статистика, 1998.

3. Ефимова М.Р., Ганченко О.И., Петрова Е.В. Практикум по общей теории статистики. –М.: Финансы и статистика, 2003.

4. Экономическая статистика. / Под ред. Иванова Ю.Н. – М.: Инфра-М, 2000.

5. А.С. Шведов. Теория вероятностей и математическая статистика. - М.: ВШЭ, 1995.

6. Дж. Бендат, А. Пирсол. Прикладной анализ случайных данных: Пер. с англ. - М.: Мир, 1989.

7. Г. Крамер. Математические методы статистики: Пер. с англ. - М.: Мир, 1975.

8. Практикум по общей теории статистики / Под ред. Г.Л. Громыко - М.: Финансы и статистика, 1999.

9. Методика и техника статистической обработки первичной социологической информации. М.: Наука, 1970

10.Дружинин Н.К. Выборочное наблюдение и эксперимент. М.: Статистика, 1978.

 

Материалы для подготовки к практическим занятиям

Тематика практических занятий:

Анализ природы данных.

Уже на первых этапах статистической обработки исходных данных X1, X2, … X n - наблюдаемых значений исследуемой случайной величины - приходится отвечать на следующие вопросы, от правильного ответа на которые зависит правомерность и эффективность применяемых методов анализа:

1) можно ли считать имеющиеся в нашем распоряжении данные X1, X2, … Xn результатами независимых наблюдений некоторой случайной величины.

2) при наличии нескольких “порций” исходных данных можно ли считать, что все они извлечены из одной и той же генеральной совокупности.

3) правомерно ли полагать, что закон распределения наблюдаемой случайной величины симметричен относительно центра группирования её значений.

4) какая модель больше подходит для описания закона вероятностного распределения обрабатываемых данных и, в частности, как проверить соответствие выбранной модели имеющимся в нашем распоряжении наблюдениям.

5) как строить обработку данных при наличии отдельных “пропусков” в них (например, в многомерном наблюдении X оказались неизмеримыми некоторые из его компонент).

6) как поступать с “подозрительными” наблюдениями, т.е. с данными, резко выделяющимися на общем фоне остальных наблюдений.

Решение этих вопросов достигается с помощью различных статистических критериев и приемов – критериев независимости и стационарности наблюдений, критериев однородности двух или нескольких выборок, критериев симметрии распределения, критериев согласия и т.д.

 

Если

, то

гипотеза о том, что исследуемая случайная величина действительно подчиняется закону распределения принимается.

Выполнение неравенства

Цензурирование выборки.

Этот приём заключается в приписывании ряду «хвостовых» членов вариационного ряда нулевых весов, а остальным одинаковых положительных. Если приписывание нулевых весов производится по признаку выхода текущих значений наблюдений за пределы заданного диапазона [a;b], то есть:

то говорят о цензурировании первого типа. Очевидно, в случае число u оставшихся в рассмотрении наблюдений есть величина случайная (u < n).

Если же нулевые веса приписываются фиксированной доле a крайних малых значений и фиксированной доле b крайних больших значений, то говорят, что производится цензурирование второго типа уровня (a и b). В этом случае число u оставшихся в рассмотрении наблюдений является величиной, заранее заданной и равной, в частности n(1-a-b).

Исследователь может прибегнуть к цензурированию вынужденно или добровольно. Вынужденное цензурирование обусловлено соответствующими условиями эксперимента: например, мы ставим на разрушающие испытания n изделий, но можем проводить эксперимент в течение ограниченного времени Т. Очевидно, мы будем вынуждены произвести в данном случае одностороннее цензурирование первого типа, при котором из дальнейшего рассмотрения исключаются точные значения долговечностей (времени до разрушения) всех тех изделий, которые не разрушились за время Т. С другой стороны, в классе оценок, построенных по цензурированным выборкам, часто можно найти оценки, хотя и не являющиеся наилучшими в рамках генеральной совокупности определённого типа, но обладающие выгодными свойствами устойчивости своих хороших качеств по отношению к тем или иным отклонениям от априорных допущений.

Урезание распределения.

Это понятие связано с ситуациями, когда исследуемый признак x не может быть наблюдаем в какой-либо области его возможных значений. Так, например, если мы исследуем распределение семей по доходу, то по условиям выборочного обследования лишены возможности наблюдать семьи со средне нулевым доходом, меньше некоторого заданного уровня a (тыс. руб.), то в подобных случаях говорят, что распределение урезано слева в точке a. В отличие от цензурированных выборок в выборках из урезанных распределений мы не имеем возможности оценить даже доли наблюдений, располагающихся за пределами порога урезания.

 

 

Задания для самостоятельного решения.

 

1. Аудиторская фирма хочет проконтролировать состояние счетов одного из коммерческих банков. Для этого случайно отбираются 50 счетов. По 20 счетам из 50 отобранных имело место движение денежных средств в течении месяца. Постройте 99% доверительный интервал, оценивающий долю счетов в генеральной совокупности, по которым имело место движение денежных средств в течении месяца.

2. Туристическую фирму крупного курортного города интересует связь между числом отпускников, остановившихся в отелях и расходами на рекламу отелей. Взято случайное число отелей - 6, сходных по размеру. Была собрана следующая информация за текущий сезон:

Отель              
Реклама, ф.ст.            
Число гостей              

 

А). Требуется определить коэффициенты корреляции и детерминации.

Б). Построить модель парной линейной регрессии.

В). Полученное уравнение регрессии использовать для прогноза. В частности, пусть отель 7 тратит на рекламу 5000 ф.ст. Определить возможное количество посетителей.

3. Имеются данные о годовой мощности предприятий цементной промышленности в 1996 г.

Предприятия с годовой мощностью, тыс. т Количество предприятий
До 500  
500 - 1 000  
1 000 - 2 000  
2 000 - 3 000  
Свыше 3 000  

 

А) Постройте гистограмму, кумуляту.

Б) Рассчитайте среднюю мощность предприятий.

В) Найдите дисперсию, среднее квадратическое отклонение, коэффициент вариации.

Объясните полученные результаты, сделайте выводы.

 

4. Менеджер компании, занимающейся прокатом автомобилей, хочет оценить среднюю величину пробега одного автомобиля в течение месяца. Из 280 автомобилей, принадлежащих компании, методом случайной бесповторной выборки отобрано 30. По данным этой выборки установлено, что средний пробег автомобиля в течение месяца составляет 1 342 км со стандартным отклонением 227 км. Считая пробег автомобиля случайной величиной, распределенной по нормальному закону, найдите 95%-й доверительный интервал, оценивающий средний пробег автомобилей всего парка в течение месяца.

 

5. С помощью собственно-случайного повторного отбора руководство фирмы провело выборочное обследование 900 своих служащих. Средний стаж их работы в фирме равен 8,70 года, а среднее квадратическое (стандартное) отклонение — 2,70 года. Среди обследованных оказалось 270 женщин. Считая стаж работы служащих фирмы распределенным по нормальному закону, определите: а) с вероятностью 0,95 доверительный интервал, в котором окажется средний стаж работы всех служащих фирмы; б) с вероятностью 0,90 доверительный интервал, накрывающий неизвестную долю женщин во всем коллективе фирмы.

 

6. Владелец автостоянки опасается обмана со стороны своих служащих (охраны автостоянки). В течение года (365 дней) владельцем авто стоянки проведено 40 проверок. По данным проверок среднее число автомобилей, оставляемых на ночь на охрану, составило 400 единиц, а среднее квадратическое (стандартное) отклонение их числа — 10 автомобилей. Считая отбор собственно-случайным, с вероятностью 0,99 оцените с помощью доверительного интервала истинное среднее число автомобилей, оставляемых на ночь на охрану. Обоснованы ли опасения владельца автостоянки, если по отчетности охранников среднее число автомобилей, оставляемых на ночь на охрану, составляет 395 автомобилей?

 

7. По данным таблицы исследуйте зависимость между доходами семей Х (тыс. руб) и их расходами на потребление у.

х 1,51 1,32 1,28 1,0 0,92 0,73 0,71 0,69 0,67 0,65
у 0,98 0,81 0,78 0,65 0,58 0,45 0,45 0,43 0,42 0,41

 

1. Определите коэффициенты корреляции и детерминации. Объясните полученные результаты.

2. Постройте уравнение регрессии.

3. Постройте интервальные оценки параметров уравнения регрессии.

8. Вычислите коэффициент ассоциации для следующих данных:

Степень активности работы в профсоюзе Уровень заработной платы Итого
высокий низкий
Высокая      
Низкая      
Итого      

 

9. Рассчитайте значение коэффициента λ-Гутмана:

Признак Х Признак У Итого
У1 У2 У3
Х1        
Х2        
Х3        
Итого        

 

10. Постройте систему рангов для следующих признаков:

Фамилия Краморов Алтухов Корям Тишин Байрук Демидов
Средний балл            

 

Тестовые задания

1. Пространственные данные характеризуются:

- большим количеством единиц наблюдения, сведения о которых относятся к одному интервалу времени;

- большим количеством единиц наблюдения, сведения о которых относятся к одному моменту времени;

- одной единицей наблюдения, сведения о которой относятся к различным интервалам времени.

 

2. По характеру вариации признаки могут быть:

- моментными;

-непрерывными;

- альтернативными;

- дискретными;

- интервальными.

3. Качественные признаки могут быть измерены с помощью:

- порядковой шкалы;

- номинальной шкалы;

-шкалы интервалов;

- шкалы отношений.

(несколько вариантов ответа)

 

4. Какое значение примет коэффициент ассоциации Юла, если хотя бы одна клетка таблицы сопряженности 2х2 равна 0:

- 1;

- 0;

-[0;1].

 

5. Чем меньше предельная ошибка простой случайной выборки, тем ее численность:

- больше;

- меньше;

- приведенный параметр не оказывает влияния на объем выборки.

 

6. Панельные данные характеризуются:

- большим количеством единиц наблюдения, сведения о которых относятся к одному интервалу времени;

- большим количеством единиц наблюдения, сведения о которых относятся к одному моменту времени;

- одной единицей наблюдения, сведения о которой относятся к различным интервалам времени.

 

7. По отношению ко времени признаки бывают:

- моментными;

-непрерывными;

- периодическими;

- дискретными;

- интервальными.

(несколько вариантов ответа)

 

8. Способ основного массива относится к наблюдению:

- сплошному;

-несплошному;

- монографическому.

 

9. Какой из типов шкал предполагает возможность упорядочения объектов по степени выраженности рассматриваемых свойств:

- порядковая шкала;

-шкала интервалов;

- шкала отношений.

 

10. Значение коэффициента контингенции лежат в интервале:

- -1;1

- 0; 1

- -1;0

 

11. При каком виде наблюдения подробно описываются отдельные единицы совокупности с целью их углубленного изучения:

- способе основного массива;

- выборочном;

- монографическом.

 

12. Для использования меры связей λ- Гутмана необходимо, чтобы среди рассматриваемых переменных была хотя бы одна:

-номинальная;

- порядковая;

- номинальная и недихотомическая

 

13. Если при построении таблицы статистическая совокупность разделяется на отдельные группы по какому-либо одному признаку, то таблица будет:

- простая;

- групповая;

- комбинационная.

 

14. При совпадающих ранжировках коэффициент ранговой корреляции Спирмена равен:

-1;

-0;

- -1.

 

15. Если при построении таблицы статистическая совокупность разделяется на отдельные группы одновременно по нескольким признакам, то таблица будет:

- простая;

- групповая;

- комбинационная.

 

16. Программа статистического наблюдения включает:

- объект наблюдения, территорию проведения наблюдения, критическую дату, признаки, подлежащие регистрации;

- признаки, подлежащие регистрации;

- объект наблюдения и территорию проведения наблюдения.

 

17. По отношению к характеризуемому объекту признаки могут быть:

-описательные;

- первичные;

-прямые;

-количественные;

- косвенные.

(Несколько вариантов ответа)

 

18.Какой из способов сбора данных может быть описан следующим образом: статистические или другие органы рассылают специально разработанные бланки и инструкции по их заполнению отдельным организациям или специально отобранным лицам, давшим согласие периодически их заполнять и присылать соответствующему органу в установленные сроки.

- экспедиционный;

-корреспондентский;

-саморегистрация.

 

19. Из перечисленных ниже коэффициентов для четырехпольной таблицы сопряженности могут использоваться:

- коэффициент конкордации;

- коэффициент контингенции;

- коэффициент ранговой корреляции Спирмена;

- коэффициент ассоциации;

- показатель λ-Гутмана.

(Несколько вариантов ответа)

 

20. Если значение коэффициента ранговой корреляции Спирмена составляет 0,98, то можно сделать вывод, что:

- ранжировки имеют совпадающие упорядочения сильной степени согласованности;

- ранжировки имеют противоположные упорядочения сильной степени согласованности;

- ранжировки имеют совпадающие упорядочения средней степени согласованности;

- ранжировки не являются согласованными.

 

21. Какая из шкал предполагает наличие единицы отсчета и масштаба:

- порядковая шкала;

-шкала интервалов;

- шкала отношений.

 

22. Если величина υ в коэффициенте ранговой корреляции Кэндалла равна 0, то его значение будет:

-1;

-0;

- -1.

 

23. Если при проведении группировки проводится одновременная классификация по комплексу признаков, то группировка:

- комбинационная;

- многомерная;

- типологическая.

 

24. К какой мере информации относится энтропия:

- семантическая;

-синтаксическая;

- прагматическая.

 

25. Для определения характеристики структуры исследуемой совокупности проводится группировка:

- комбинационная;

- многомерная;

- типологическая.

 


Глоссарий.



Поделиться:


Последнее изменение этой страницы: 2016-12-16; просмотров: 183; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.225.149.32 (0.166 с.)