Особенности и общие принципы статистического анализа биомедицинских данных 

Исходные данные и диаграмму оформите в соответствии с образцом.

Порядок выполнения задания

1. Откройте Microsoft Excel и создайте в своей папке Книгу (документ) Занятие 6.

2. Введите название таблицы, ее «шапку» и данные.

Для набора текста используйте шрифт Arial Cyr 10 пт. Название следует вводить в одну ячейку (A1); не обращайте внимание на то, что оно перекрывает соседние ячейки. Для правильного размещения названия над таблицей выделите ячейки А1-С2. Откройте диалоговое окно Формат ячеек из контекстного меню или из меню Формат. На вкладке Выравнивание установите флажки Объединение ячеек, Переносить по словам, а в полях Выравнивание по горизонтали и по вертикали выберите по центру.

Обратите внимание на то, что слова «Число родившихся» и «Число умерших» не помещаются в стандартную ячейку. Для того, чтобы расширить столбцы B и С перетягивайте их правые границы с помощью мыши установив указатель в области строки заголовка столбцов, расположенной непосредственно над Рабочей областью. Установите ширину столбцов по 130 пт. Примените к «шапке» таблицы полужирное начертание шрифта.

Введите в ячейку А4 первый год (1996) и воспользуйтесь автозаполнением. Выделите эту ячейку и, при нажатой клавише Ctrl, тяните выделение до ячейки А15 мышью, установив указатель (он принимает вид крестика со знаком «плюс») на квадратике в правом нижнем углу выделения.

Введите остальные данные. Выделите всю таблицу (ячейки А3-С15) и установите выравнивание по центру.

3. Оформите линии таблицы и выполните заливку цветом в соответствии с образцом.

Для оформления линий выделите таблицу, откройте диалоговое окно Формат ячеек, вкладку Границы, выберите подходящий тип линии и нажмите кнопки Внешние границы и Внутренние границы.

Заливку цветом осуществите с помощью соответствующей кнопки на Панели инструментов. Выберите цвет «Серый 25%».

4. Создайте диаграмму.

Выделите данные для построения диаграммы (ячейки В4-С13). Откройте Мастер диаграмм с помощью соответствующей кнопки Панели инструментов. В первом диалоговом окне на вкладке Стандартные выберите тип диаграммы (График) и ее вид (График с маркерами, помечающими точки данных). Нажмите кнопку Далее.

Во втором окне на вкладке Ряд в поле Ряд выберите Ряд 1, в поле Имя введите его название (Число родившихся). Это можно сделать при помощи клавиатуры, но удобнее поступить следующим образом. Нажмите на кнопку с красной стрелкой справа от поля Имя; диалоговое окно свернется до одной строки. Выделите ячейку таблицы с соответствующим текстом, и снова нажмите кнопку с красной стрелкой в диалоговом окне Мастер диаграмм. Аналогичным образом введите имя для второго ряда (Число умерших). Введите подписи оси Х. Воспользуйтесь описанным выше способом, выделив в таблице ячейки содержащие годы (А4-А13).



Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Особенности и общие принципы статистического анализа биомедицинских данных



 

Цель: Изучить особенности и общие принципы статистического анализа биомедицинских данных.

Необходимо знать: особенности анализа биомедицинских данных, этапы анализа данных, программные средства анализа данных: пакеты и их категории, электронные таблицы, принципы и технологию обработки числовой информации при помощи Microsoft Excel.

Необходимо уметь: вводить информацию в электронную таблицу Microsoft Excel; выделять ячейки; изменять их размеры; объединять ячейки; использовать функцию автозаполнения; оформлять таблицу; создавать и форматировать диаграммы, выполнять расчеты по формулам.

 

Особенности анализа биомедицинских данных

В медицинской практике и, особенно, в медицинских исследованиях часто применяются различные методы анализа и обработки данных. Математика, в частности статистика, широко используется в медицине. Математические методы позволяют объективно оценивать количественные результаты исследований.

Для любого врача, связанного с экспериментальными исследованиями, совершенно очевидна необходимость использования статистических методов в своей работе. При этом роль используемых статистических методов двояка: с одной стороны они позволяют обнаружить ранее неизвестные закономерности, с другой, с их помощью авторы проверяют достоверность априорно формулируемых выводов.

Важнейшим условием при анализе данных является корректность и грамотность применения статистических методов.

Долгое время анализ медицинских данных оставался уделом специалистов, так как требовал весьма серьезной математической подготовки. В настоящее время с появлением современных технологий необходимые статистические исследования врач может провести самостоятельно, используя разнообразные компьютерные пакеты программ.

Использование компьютера делает достаточно сложные методы анализа медицинских данных более доступными и наглядными: теперь не требуется вручную выполнять трудоемкие расчеты по сложным формулам, строить таблицы и графики. Если раньше для анализа данных в первую очередь требовалось глубокое знание статистики и владение методами расчетов, то в современной компьютерной технологии обработки данных более важным стало умение работать с пакетами для обработки данных.

Анализ данных с использованием статистического пакета включает несколько этапов.

1. Планирование исследования. Необходимо спланировать исследование с учетом последующей обработки данных, чтобы избежать ситуации, когда некоторые наблюдения оказываются лишними, а каких-то не хватает для реализации выбранных методов анализа. Однако на практике на начальных этапах исследования часто нет полной ясности о методах обработки результатов исследований. Поэтому следует ориентироваться на наиболее часто используемые методы обработки медицинских данных и требования к исходному материалу, предъявляемые ими.

2. Подготовка данных к анализу. Это крайне важный, часто недооцениваемый этап работы. Обычно он включает: ввод данных, предварительное преобразование данных, визуализацию данных с целью формирования представления об исходном материале. В настоящее время практически отпадает необходимость в предварительном структурировании, построении необходимых выборок, ранжировании и т.д. Эти задачи в современных пакетах автоматизированы и выполняются непосредственно при реализации выбранного метода анализа.

3. Предварительный анализ данных. На этом этапе формируется представления о типе анализируемых данных, когда выясняется структура, определяются зависимости между данными, производится их группировка.

4. Выбор и реализация метода анализа. В связи с многообразием методов выбор может быть весьма затруднителен. Однако в современных пакетах введенные данные достаточно просто обработать с использованием различных процедур, а затем можно выбрать метод, дающий наилучшие результаты.

5. Интерпретация результатов анализа. Этот этап часто вызывает затруднения у исследователей-медиков в связи с ограниченностью знаний в области статистики. Поэтому к интерпретации результатов анализа следует относиться особенно внимательно, точно следуя указаниям соответствующих руководств. Это же касается и практических рекомендаций и выводов, которые осуществляются на основе результатов статистического анализа.

6. Представление результатов. Является одним из важнейших компонентов качества применения статистических методов. Поэтому полнота и уровень описания, как самого анализа, так и его результатов, наглядность их представления не должны снижать общий уровень выполненной работы, что особенно важно при оформлении диссертации.

Программные средства анализа данных

Большое значение имеет программное средство (статистический пакет), которое используется при компьютерном анализе. Для обработки медицинских данных обычно используют два типа программных средств: пакеты обработки данных и электронные таблицы.

Пакеты обработки данных.

Число пакетов для обработки данных, получивших распространение в России, достаточно велико. Среди них, как отечественные программы, так и пакеты иностранного производства.

Основную часть имеющихся пакетов для обработки данных можно отнести к трем категориям:

1. Специализированные пакеты обычно содержат методы из одного – двух разделов статистики или методы, используемые в конкретной предметной области. (Data Scope, Класс-Мастер, САНИ и др.)

2. Пакеты общего назначения или универсальные. Благодаря отсутствию ориентации на специфическую предметную область, широкому диапазону статистических методов, дружелюбному интерфейсу пользователя они являются наиболее удобными и часто применяемыми. Практически все медицинские задачи по обработке данных могут быть решены с помощью универсальных пакетов. (STATISTICA, STADIA и др.)

3. Профессиональные пакеты предназначены для пользователей, имеющих дело со сверхбольшими объемами данных или узкоспециализированными методами анализа. (SAS, BMDP и др.)

Практически все статистические пакеты обеспечивают широкий набор средств визуализации данных: построение графиков, двух- и трехмерных диаграмм, а часто и различные средства деловой графики.

Электронные таблицы.

Электронные таблицы или табличные процессоры менее удобны для анализа медицинских данных. Тем не менее, простейшая статистическая обработка данных в диссертационных работах часто проводится с помощью электронных таблиц вследствие их широкой распространенности.

Электронные таблицы предназначены, в основном, для организации относительно несложных расчетов с большим количеством идентичных данных. Эти программы позволяют вычислять значения элементов таблиц по заданным формулам, строить по данным в таблице различные графики и т.д. Многие из них предоставляют и дополнительные возможности, например, трехмерные таблицы, связь с базами данных и другие функции.

Наиболее популярные электронные таблицы: Microsoft Excel, Suprecalc, Lotus 1-2-3 и другие. Остановимся подробнее на первой из них.

Основные принципы обработки информации при помощи табличного процессора Microsoft Excel

Для обработки и представления числовой информации часто используются таблицы. Компьютер позволяет создавать электронные таблицы, отображать и обрабатывать в них данные. Класс прикладных программ, используемых для этой цели, называется электронными таблицами или табличными процессорами. Особенность электронных таблиц заключается в возможности применения формул для описания связи между значениями различных ячеек. Расчет по заданным формулам выполняется автоматически. Изменение содержимого какой-либо ячейки приводит к пересчету значений всех, связанных с ней математическими соотношениями, ячеек, и, тем самым, к обновлению всей таблицы в соответствии с изменившимися данными.

Потребность в использовании для обработки числовой информации электронной таблицы возникает в том случае, если имеется большой объем данных, подлежащих однотипной обработке, а математические расчеты выполняются по сравнительно простым формулам. Если исходных данных сравнительно немного, а создание таблицы производится однократно, то удобнее воспользоваться калькулятором, а при необходимости выполнения сложных математических расчетов приходится разрабатывать специальные программы, ориентированные на решение только данной задачи.

Одним из наиболее распространенных табличных процессоров является Microsoft Excel. Он обладает широким кругом различных возможностей. Однако в практике врача наиболее важны следующие: построение таблиц, создание диаграмм, элементарная статистическая обработка данных.

Рабочее окно Excel в общих чертах идентично окну Word. Однако в отличие от последнего, оно имеет строку формул, строки имен столбцов и строк. Документ Excel называется рабочей книгой. Рабочая книга представляет собой набор рабочих листов, каждый из которых имеет табличную структуру – состоит из ячеек (минимальных элементов для хранения данных), образующих в совокупности строки и столбцы. Каждая ячейка имеет адрес, сочетающий в себе номер столбца и строки. При помощи адреса на ячейку можно ссылаться в формулах. Также можно ссылаться на группу рядом расположенных ячеек, как на единое целое. Такая группа называется диапазоном.

Вычисления в Excel осуществляются при помощи формул, которые составляются по определенным правилам. При составлении электронных таблиц беспрекословно следует соблюдать следующий принцип: если значение ячейки зависит от других ячеек, для его определения нужно всегда использовать формулу. Это гарантирует, что последующее редактирование таблицы не нарушит ее целостности и правильности вычислений.

Необходимо помнить, что Excel не является программой статистической обработки – это дополнительная функция программы и поэтому ее нельзя рекомендовать для работы с серьезным научным материалом. Для этого существуют специализированные пакеты для статистических расчетов. Наиболее приспособленной и доступной программой для работы с медицинскими данными является пакет STATISTICA.

 

ЗАДАНИЕ

Создайте диаграмму «Рождаемость и смертность в Ставропольском крае за 1996-2005 годы» по следующим данным:

Рождаемость и смертность в Ставропольском крае за 1996-2005 годы (в тыс. человек)  
 
Годы Число родившихся Число умерших  
  26,1 34,3  
  25,6 35,1  
  25,7 34,3  
  24,0 36,1  
  24,8 37,3  
  24,9 37,5  
  26,4 40,0  
  27,8 40,6  
  28,1 38,9  
  27,3 39,0  

В третьем диалоговом окне на вкладке Заголовки введите в соответствующие поля название диаграммы, осей Х (годы) и Y (тыс. человек). На вкладке Линии сетки снимите все флажки. На вкладке Легенда в разделе Размещение поставьте флажок Внизу.

В четвертом диалоговом окне нажмите кнопку Готово.

5. Отформатируйте диаграмму в соответствии с образцом.

Выделите диаграмму и растяните ее так, чтобы отображаемые закономерности явления было легко проследить. Выделяя соответствующие фрагменты, установите для названия диаграммы шрифт 12 пт, полужирное начертание, для названий осей – 12 пт, обычное начертание.

Выделите область построения диаграммы и откройте диалоговое окно Формат области построения (воспользуйтесь контекстным меню или двойным щелчком мыши). В разделе Рамка установите флажок Невидимая, в разделе ЗаливкаПрозрачная.

Выделите ось значений (ось Y) и откройте диалоговое окно Формат оси. На вкладке Шрифт установите размер 10 пт. На вкладке Шкала введите в поле Минимальное значение 20 (это необходимо для рационального использования области построения диаграммы).

По аналогии с осью значений установите размер шрифта 10 пт для оси категорий (ось Х).

С помощью диалогового окна Формат легенды сделайте рамку последней невидимой, заливку прозрачной, а начертание шрифта полужирным.

Выделите ряд данных «Число умерших» и откройте диалоговое окно Формат ряда данных. На вкладке Вид установите параметры линии и маркера в соответствии с образцом. Аналогично поступите с рядом данных «Число родившихся».

6. Рассчитайте число родившихся и умерших в Ставропольском крае за десятилетие с 1996 по 2005 годы.

В ячейку А14 введите «сумма». Выделите ряд данных «Число родившихся» и нажмите кнопку «Автосумма». Аналогично поступите с рядом данных «Число умерших».

7. Рассчитайте среднее число родившихся и умерших в Ставропольском крае за десятилетие с 1996 по 2005 годы.

В ячейку А15 введите «ср. знач.». Установите курсор в ячейку В15. В меню Вставка выберите пункт Функция (или воспользуйтесь кнопкой Вставка функции на Строке формул) - откроется диалоговое окно Мастер функций. В поле Категория выберите Статистические, в поле ФункцияСРЗНАЧ. Нажмите Ok. В следующем окне Мастера функций нажмите на кнопку с красной стрелкой справа от поля Число 1; диалоговое окно свернется до одной строки. Выделите ряд данных «Число родившихся» (ячейки В4-В13) и снова нажмите кнопку с красной стрелкой в диалоговом окне Мастер диаграмм. Нажмите Ok. Аналогично поступите с рядом данных «Число умерших».

8. Выберите максимальное число родившихся и умерших в Ставропольском крае за десятилетие с 1996 по 2005 годы.

Действуйте по аналогии с предыдущим пунктом. Выберите функцию МАКС.

9. Выберите минимальное число родившихся и умерших в Ставропольском крае за десятилетие с 1996 по 2005 годы.

Воспользуйтесь функцией МИН.

10. Проверьте соответствие документа образцу и сохраните окончательный вариант.

 

ВОПРОСЫ ДЛЯ САМОКОНТРОЛЯ

1. В чем преимущество компьютеризированного статистического анализа данных перед расчетами, проводимыми вручную.

2. Из каких этапов состоит анализ данных.

3. Какие категории пакетов программ для обработки данных вы знаете. На какие случаи ориентирована каждая из категорий.

4. Что такое электронная таблица.

5. В каких случаях, по вашему мнению, необходимо пользоваться электронной таблицей, а не статпакетом.

6. В чем заключается отличие таблицы, составленной в Microsoft Excel, от таблицы, подготовленной в Microsoft Word.

7. Какие основные задачи, возникающие в практике врача, позволяет решить табличный процессор Microsoft Excel.

8. Как устроено окно Microsoft Excel.

9. Что такое «Рабочая книга Excel», «Рабочий лист Excel».

10. Что такое ячейка, ее адрес, как он определяется.

11. Что такое диапазон ячеек.

12. Как выполняются вычисления в электронной таблице.

13. Почему нельзя выполнять в электронной таблице часть вычислений «вручную».

 

ЗАНЯТИЕ №7



Поделиться:


Читайте также:




Последнее изменение этой страницы: 2016-04-21; просмотров: 850; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.17.186.218 (0.047 с.)