Тема №9. Применение эвм для обработки медико - биологической информации 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Тема №9. Применение эвм для обработки медико - биологической информации



Тема №9. Применение ЭВМ для обработки медико - биологической информации

Цель: Уметь использовать простейшие компьютерные методы обработки фармацевтических и медицинских данных; получить практическое руководство по компьютерному анализу и обработке данных, получаемых в ходе исследований; получить общее представление об обрабатываемых данных; понимать в каких ситуациях применимы различные статистические методы, знать их свойства, уметь интерпретировать результаты.

Задачи обучения: Формирование умений и навыков работы с пакетом Statistics. Освоить статистиче­ский анализ в пакете Statistics: описательную статистику, подбор функций распределе­ния, сравнение двух независимых выборок.

Основные вопросы темы:

1. Пользовательский интерфейс и работа с пакетом Statistics.

2. Основные статистические характеристики.

3. Расчет корреляционной зависимости.

4. Законы распределения случайной величины.

5. Таблицы частот и гистограммы.

Методы обучения и преподавания: решение ситуационных задач

Теоретический блок

Введение

Все программы статистической обработки данных можно подразделить на профессиональные, популярные и специализированные. Профессиональные пакеты имеют большое количество методов анализа и цену, достигающую порой десятков тысяч долларов. Популярные пакеты имеют средний диапазон цен и количество функций, достаточное для универсального применения. Это программы SPSS, StatGraphics, STATISTICA, InStat и др. Специализированные пакеты ориентированы на какую-либо узкую область анализа данных.

STATISTICA включает большое количество методов статистического анализа (более 250 встроенных функций) объединенных в модули. В совокупности модули системы STATISTICA покрывают весь спектр современных методов статистического анализа.

Производителем программы является фирма StatSoft Inc. (США), которая выпускает статистические приложения начиная с 1985 года. Первый коммерческий продукт Statistica Supplement был создан для операционной среды Lotus 1-2-3. В 1991 году появляется версия STATISTICA для DOS, в 1992 году – для Macintosh, а в 1994 – первая версия для Windows. Программа позволяет проводить обмен данными с другими графическими приложениями посредством технологии DDE (динамического обмена данных). Можно также импортировать графические приложения из STATISTICA посредством технологий связывания и внедрения объектов OLE в Word, PowerPoint и др., а также осуществлять операции с буфером обмена данных.

Основная структура пакета STATISTICA

Система статистического анализа и обработки данных STATISTICA 6.0 состоит из набора модулей, в каждом из которых собрана определенная группа методов анализа. Переключение между отдельными модулями осуществляется в диалоговом окне STATISTICA. При этом с помощью указателя мыши нужно выбрать определенный раздел, после чего нажать кнопку ОК. Кроме этого, в состав пакета STATISTICA входят системы для работы с данными: электронные таблицы для ввода исходных данных — Spreadsheet и электронные таблицы для вывода результатов анализа — Scrollsheet. Программа обладает большими графическими возможностями, причем сотни графиков могут быть непосредственно построенными из таблиц результатов и исходных данных. В пакет STATISTICA встроены языки программирования Statistica BASIC и SCL, благодаря чему пользователь может выбрать тот или иной метод анализа.

Формирование таблиц Spreadsheet

Для ввода данных предназначена электронная таблица Spreadsheet, в которую можно вводить как численную, так и текстовую информацию. В столбцах указываются Переменные (Variables), а в строках — Случаи (Cases). Общее число Переменных достигает 4092, количество Случаев ограничено лишь объемом вашего жесткого диска.

Формирование электронной таблицы Spreadsheet проводится в модуле Основные статистики и таблицы (Basic Statistics and Tables). Перед тем как вводить данные, необходимо сначала создать сетку таблицы. Для этого нужно выбрать из меню Файл (File) команду Новый (New Data). Выполнение указанных действий приведет к появлению шаблона таблицы, содержащей 10 столбцов и 10 строк. Так как в большинстве случаев приходится работать с более крупными таблицами, необходимо сразу научиться добавлять дополнительные строки и столбцы. Следует отметить, что операции со строками и столбцами можно осуществить несколькими способами, однако удобнее всего для этих целей использовать либо меню Вставка, либо специальные команды панели инструментов Переменные (Variables) иСлучаи(Cases).

Чтобы добавить столбцы, необходимо из меню Вставка выбрать команду Добавление переменных. В появившемся окне Добавление переменных в верхней строке Сколько необходимо указать количество добавляемых столбцов, а в нижней Аfter набрать порядковый номер того столбца, после которого вам надо поместить новые. Добавление строк осуществляется аналогичным образом: необходимо выбрать из меню Вставка команды Добавление случаев, а затем задать в появившемся окне Добавить регистры количество добавляемых строк в регистр Сколько и номер строки в регистр Вставить после (после которой нужно поместить новый массив).

Другие, наиболее часто применяемые операции со строками и столбцами включают их удаление, перемещение в пределах таблицы, копирование. Удаление проводится через меню Редактирование (Edit), последовательным выполнением команд Удаление, Переменные (Variables) (или Случаи (Cases)). В появившемся диалоговом окне необходимо указать границы диапазона удаляемых строк и столбцов. Например, если в первой строке Из установить число 1, а во второй В — число 4, это приведет к удалению массива столбцов (строк) в диапазоне с 1-й по 4-ю. Если требуется удалить лишь одну строку или столбец, то в обеих строках указывается только ее номер.

Для перемещения столбцов (или строк) в пределах таблицы из меню Редактирование надо последовательно выполнить команды Перемещение, Переменные (Variables) (или Случаи (Cases)), затем установить в появившемся диалоговом окне границы перемещаемого массива и указать в строке Вставить номер столбца (или строки), после которого надо поместить данный массив.

Ввод числовых данных

Ввод числовых данных в таблицу Spreadsheet можно осуществить двумя способами: ввести вручную или же скопировать их из других таблиц. Перед тем, как вы будете осуществлять "ручной" набор числовых данных, следует установить курсор мыши в нужную ячейку и щелкнуть по ней. В этой ячейке можно набрать число, которое состоит не более чем из восьми знаков, причем по умолчанию три из них устанавливаются после знака запятой. Если вам приходится работать с числовыми данными, которые содержат более 8 знаков, то необходимо поменять количество знаков после запятой. Двойной щелчок по имени столбца вызывает диалоговое окно, где в строке Десятичный задается число цифр после запятой.

В ряде случаев при проведении статистического анализа необходимо проводить перегруппировку исходных данных. С этой целью в базовой таблице копируются определенные массивы, которые затем импортируются в новую таблицу в совершенно ином сочетании между собой (например, при проведении парного или двухвыборочного теста Стьюдента, анализа по Манну — Уитни и многих других методов). Чтобы скопировать данные из таблиц, сформированных в программе STATISTICA, необходимо выполнить следующую последовательность действий:

  1. Сформировать новую таблицу либо открыть уже существующий файл с расширением *.sta, в который вам необходимо скопировать данные. Чтобы часть данных при копировании не была утеряна, надо в таблице Spreadsheet создать адекватное количество пустых ячеек. Например, если копируемый массив данных сформирован в 3 столбцах и 5 строках, такое же количество строк и столбцов необходимо создать в таблице Spreadsheet.
  2. Открыть другой файл с расширением.sta, из таблицы которого копируются данные.
  3. Выделить с помощью мыши копируемый массив данных.
  4. Выполнить команду Копирование из меню Редактирование.
  5. Вернуться к исходной таблице, куда нужно вставить скопированные данные.
  6. Установить курсор мыши в верхнюю ячейку нужного столбца и выполнить команду Вставка из меню Редактирование.

В ряде случаев приходится сталкиваться с такими ситуациями, когда таблица сформирована в Excel, а статистические возможности этой программы не позволяют выполнить нужный анализ. Чтобы решить эту проблему, в систему STATISTICA встроены функции, которые позволяют обмениваться данными с электронными таблицами Excel, а также с базами данных Oracle, S SQL Server, MS Access, Informix.

Для того чтобы импортировать данные из таблиц Excel, необходимо:

  1. Выделить нужный массив в таблице Excel и скопировать его в буфер обмена.
  2. Открыть или создать таблицу Spreadsheet, установить курсор в верхней ячейке столбца и выполнить команду Вставка из меню Редактирование.

Контроль

Вопросы:

1. Назовите программы статистической обработки данных.

2. Назовите популярные пакеты статистической обработки данных.

3. Назовите производителя программы STATISTICA.

4. Чем отличается программное окно пакета STATISTICA от окон программ MS Office?

5. Что входит в основную структуру пакета STATISTICA?

6. Что входит в систему работы с данными?

7. Какие данные вводят в электронную таблицу?

8. Что указывают в столбцах?

9. Что указывают в строках?

10. Как можно добавить, удалить столбцы и строки?

11. Как вводят числовые данные в таблицу?

12. Как изменить названия столбцов и строк?

13. Что такое описательная статистика?

14. Как подбирать функцию распределения?

15. Как сравниваются две независимые выборки?

 

Тесты: См. Сборник тестовых заданий по «Информатике», тема «Работа с пакетом “STATISTIСS ».

Задания:

Задание 1. Введите имена переменных и случаев.

  SAP HR WEIGHT ВОЗРАСТ ЧССНАГР
Иванов          
Петрова          
Смирнова          
Козлов          
Орлов          
Степанова          
Федорова          
Блинов          
Белов          
Озерова          

 

Задание 2. Введите текстовые величины.

  ВОЗР ГРУП ПОЛ
Иванов Средний м
Петрова Средний ж
Смирнова Младший ж
Козлов Младший м
Орлов Средний м
Степанова Средний ж
Федорова Старший ж
Блинов Старший м
Белов Старший м
Озерова Младший ж

Подсказка: Вводим цифру 1 в столбец Числовой, в столбец Текстовая величина вводим имя группы младшая. Вводим цифру 2 в столбец Числовой, в столбец Текстовая величина вводим имя группы средняя. Вводим цифру 3 в столбец Числовой, в столбец Текстовая величина вводим имя группы старшая.

 

Задание 3. Преобразуйте данные: добавим два случая и удалим два столбца.

  SAP HR WEIGHT ВОЗРАСТ ЧССНАГР ВОЗРГРУП ПОЛ
Павлова           Старший ж
Фролов           Младший м

 

h Примечание: Незаполненные строки в конце таблицы следует удалять, поскольку при дальней­шем анализе они могут автоматически заполняться нулевыми значениями и участво­вать в обработке.

 

Задание 4. Получите расчетные величины.

В столбце Показатель получите частное от деления систолического артериального давления боль­ного на частоту его сердечных сокращений.

Подсказка: таблица должна выглядеть вот так:

Список больных

  SAP HR Вес Возраст ЧССНАГР Возр.групп Пол Показатель
Иванов           Средний М 2,013889
Петрова           Средний Ж 1,953846
Смирнова           Младший Ж 1,857143
Козлов           Младший М 1,846154
Орлов           Средний М 1,75
Степанова           Средний Ж 1,5
Федорова           Старший Ж 1,705882
Блинов           Старший М 1,875
Белов           Старший М 1,866667
Озерова           Младший Ж 1,688312
Павлова           Старший Ж 1,9375
Фролов           Младший Ж 1,838235

Задание 5. Отсортируйте данные по переменным HR. (Данные-Сортировка).

Задание 6. Визуализация данных.

Построить график Бокса-Вискера (часто называемое «ящик с усами»).

Результирующий график:

 

Задание 7. Визуализация данных.

Построить графики на нормальной вероятностной бумаге.

Результирующий график:

 

 

Задание 8. Визуализация данных.

Построить категоризированные графики «Бокса-Вискера» для частоты сердечных сокращений в покое (HR).

Результирующий график:

Задание 9. Выявите взаимосвязи.

Постройте корреляционную матрицу для показателей рассматривавшегося выше «Списка больных» (см. задание №1).

Результирующая таблица:

Интерпретация результатов: Наиболее значимые коэффициенты корреляции выделены красным цветом. Под каждым коэффициентом корреляции приводится его уровень значимости. Наиболее сильная прямая пропорциональная зависимость выявлена между SAP и ЧССНАГР r=0,86. Показатель вес больного WEIGHT с другими показателями не коррелирует.

Задание 10. Выявление взаимосвязей.

Постройте матричный график, сопоставляя его с корреляционной матрицей.

А) Матричный график:

Результирующий график:

 

Интерпретация результатов: Можно видеть, что ближе всего к прямой линии полной линейной зависимости точки лежат на кадре в пересечении столбцов и строк SAP и ВОЗРАСТ.

 

Б) Двумерные вычерчивания уравнения корреляции.

Результирующий график.

Тема №10. Работа с пакетом “STATISTIСS”

Цель: Изучить приемы описательной статистики: дескриптивные методы и визуальные методы.

Задачи обучения: Получить навыки работы с пакетом Statistics. Уметь строить статистические графики. Освоить статистический анализ в пакете Statistics: описательную статистику, подбор функ­ций распределения.

Основные вопросы темы:

1. Закон распределения Стьюдента.

2. Выявления различий между двумя выборочными средними.

Методы обучения и преподавания: решение ситуационных задач

Теоретический блок

Парный тест Стьюдента

В тех случаях, когда определенные параметры изменяются в динамике в одной и той же группе (например, уровень артериального давления до и после лечения), для сравнения используется парный тест Стьюдента. Следует отметить, что для проведения этого теста формируется обычная таблица (но без пустых ячеек!), в которой в каждом столбце приведены значения нужного вам параметра в определенный момент времени. В примере на рис. 14 в таблице приведен уровень лейкоцитов в периферической крови в группе пациентов в разные сроки: в столбце ИСХОДНОЕ — до лечения, а в столбце ПОС_ЛЕЧ — после проведенного лечения.


Рис. 14. Таблица для демонстрации парного критерия Стьюдента

Подобно двухвыборочному, парный тест Стьюдента также проводится в модуле Basic Statistics and Tables. Чтобы выполнить указанный тест, нужно выбрать из меню Analysis команду t-test for dependent samples. Это приведет к появлению диалогового окна, в котором нужно нажать кнопку Variables, a в появившемся втором окне Select one or two variable lists в строках First variable list и Second variable list (optional) укажите номера столбцов, содержащие анализируемые переменные. В приведенном примере указываются следующие номера: 1 — в строке First variable list, 2 — в строке Second variable list (optional) и нажимают кнопку ОК. После этого нужно установить флажок в строке Detailed table of results раздела Display и нажать ОК. Появляется таблица вывода, в которой приводятся нужные вам значения t и р.

Тест Манна—Уитни

Тесты Стьюдента хороши лишь в тех случаях, если распределение исходных величин подчиняется нормальному закону. В противном случае для определения достоверных различий используются ранговые непараметрические критерии Вилкоксона и Манна—Уитни. При этом тест Вилкоксона применяется в аналогичных ситуациях, что и парный тест Стьюдента, т. е. для сравнения показателей в двух независимых группах. В свою очередь, тест Манна—Уитни позволяет сравнить достоверность изменения определенного параметра в динамике и, таким образом, является аналогом двухвыборочного теста Стьюдента при работе с данными, распределяющимися не по нормальному закону.


Для того, чтобы провести тест Манна—Уитни, нужно сначала создать в модуле Basic Statistics and Tables таблицу с исходными для анализа данными, которая должна быть сформирована по такому же принципу, как и для проведения двухвыборочного теста Стьюдента, после чего переместиться в другой статистический модуль — Nonparametrics/Distrib. В диалоговом окне Nonparametric Statistics выполнить следующие операции:

1. Установить флажок в строке Nonparametric stats.

2. Выбрать пункт Mann-Whitney U test.

3. Нажать кнопку ОК.

Правильное выполнение всех перечисленных действий приведет к открытию окна Mann-Whitney U Test, где нужно нажать кнопку Variables и во втором диалоговом окне указать номера столбцов, содержащие независимые и зависимые переменные. Еще раз обратите внимание, на независимые переменные (или группирующие). Текстовые переменные и номер столбца, содержащего их, нужно указать в строке Indep. (grouping) variable. Номер столбца, содержащего зависимые (или числовые) переменные, вы должны ввести в строку Dependent variable list. После того как переменные будут указаны, нажмите ОК. Вы снова возвращаетесь в окно Mann-Whitney U Test, где снова нужно нажать кнопку ОК. Появляется таблица вывода, в которой после столбца Z находится столбец p-level, где приведено значение р.

Тест Вилкоксона

Для проведения теста Вилкоксона сначала в нужно сформировать в модуле Basic Statistics and Tables таблицу данных по такому же принципу, как и для проведения парного теста Стьюдента. После этого нужно переместиться и модуль Nonparametrics/Distrib, и там, в диалоговом окне Nonparametric Statistics, проделать следующие операции:

  1. Установить флажок в строке Nonparametric stats.
  2. Выбрать раздел Wilcoxon matched pairs test.
  3. Нажать кнопку ОК.

Открывается окно Wilcoxon Matched Pairs Test, где вы должны нажать на кнопку Variables: и ввести во втором диалоговом окне в строки First variable list: и Second variable list: номера столбцов, содержащих анализируемые переменные. Следует заметить, что ввод переменных для анализа проводится аналогичным способом, что и при парном тесте Стьюдента. После того как вы завершите ввод переменных, нажмите в диалоговом окне Wilcoxon Matched Pairs Test кнопку ОК. Появится таблица вывода, где в столбце p-level будет указано значение р.

Литература:

1. Боровиков В.П., Боровиков И.П. Статистический анализ и обработка данных в среде Windows. М. «Филинъ». 1998. – 592.

2. Гельман В.Я. Медицинская информатика. Питер. Санкт-Петербург.М.2001.

3. Гельман В.Я. Компьютерный анализ медицинских данных для аспирантов. СПб. СПбМАНО. 1999. -59.

4. Герасевич «Компьютер для врача» СПб.2005 г.

5. Боровиков В.П. Популярное введение в программу Statistica. М. 1998 г.

Под. Ред. Зайцева В.М. Прикладная медицинская статистика.СПбГМА, 2000г.

Контроль

Вопросы:

1. Что такое описательная статистика?

2. Как строить график Бокса-Вискера?

3. Как строить графики на нормальной вероятностной бумаге?

4. Как строить категоризированные графики «Бокса-Вискера»?

5. Как подбирать функцию распределения?

6. Как сравниваются две независимые выборки?

7. Как используют двухвыборочный тест Стьюдента?

8. Что такое тест Манна-Уитни? Как его считать?

9. Что такое тест Вилкоксона? Как его считать?

Тесты: См. Сборник тестовых заданий по «Информатике», тема «Работа с пакетом “STATISTIСS ».

Задания:

Задание 1. Откройте таблицу созданную на уроке1 по данной теме.

СПИСОК БОЛЬНЫХ

  SAP HR Вес Возраст ЧССНАГР Возр.групп Пол Показатель
Иванов           Средний М 2,013889
Петрова           Средний Ж 1,953846
Смирнова           Младший Ж 1,857143
Козлов           Младший М 1,846154
Орлов           Средний М 1,75
Степанова           Средний Ж 1,5
Федорова           Старший Ж 1,705882
Блинов           Старший М 1,875
Белов           Старший М 1,866667
Озерова           Младший Ж 1,688312
Павлова           Старший Ж 1,9375
Фролов           Младший Ж 1,838235

Задание 2. Получите результирующую таблицу (Descriptive Statistics): число случаев, среднее, максимум, минимум, стандартная ошибка, ошибка среднего.

Задание 3. Выявление достоверности различий.

Необходимо просмотреть, есть ли отличия между группами и/или между переменными, т.е. провести проверку статистических гипотез о равенстве генеральных средних.

Проверьте достоверны ли различия средних весов и ЧСС мужчин и женщин в рассматриваемом «Списке больных». Использовать двухвыборочный t-тест Стьюдента.

Результирующая таблица:

Интерпретация результата: Из таблицы видно, что достоверных различий между ЧСС мужчин и женщин нет – р=0,346>0,05. В тоже время существуют достоверные различия в весе мужчин и женщин – р=0,0008<<0,05

Задание 4. Выявление достоверности различий.

Необходимо просмотреть, есть ли отличия между группами и/или между переменными, т.е. провести проверку статистических гипотез о равенстве генеральных средних.

Проверьте достоверны ли различия ЧСС до и после физической нагрузки в рассматриваемом «Списке больных». Использовать парный t-тест Стьюдента.

Результирующая таблица:

Интерпретация результатов: р=0,0000<<0,05, что позволяет говорить о достоверном возрастании ЧСС после физической нагрузки.

Тема №9. Применение ЭВМ для обработки медико - биологической информации

Цель: Уметь использовать простейшие компьютерные методы обработки фармацевтических и медицинских данных; получить практическое руководство по компьютерному анализу и обработке данных, получаемых в ходе исследований; получить общее представление об обрабатываемых данных; понимать в каких ситуациях применимы различные статистические методы, знать их свойства, уметь интерпретировать результаты.

Задачи обучения: Формирование умений и навыков работы с пакетом Statistics. Освоить статистиче­ский анализ в пакете Statistics: описательную статистику, подбор функций распределе­ния, сравнение двух независимых выборок.

Основные вопросы темы:

1. Пользовательский интерфейс и работа с пакетом Statistics.

2. Основные статистические характеристики.

3. Расчет корреляционной зависимости.

4. Законы распределения случайной величины.

5. Таблицы частот и гистограммы.

Методы обучения и преподавания: решение ситуационных задач

Теоретический блок

Введение

Все программы статистической обработки данных можно подразделить на профессиональные, популярные и специализированные. Профессиональные пакеты имеют большое количество методов анализа и цену, достигающую порой десятков тысяч долларов. Популярные пакеты имеют средний диапазон цен и количество функций, достаточное для универсального применения. Это программы SPSS, StatGraphics, STATISTICA, InStat и др. Специализированные пакеты ориентированы на какую-либо узкую область анализа данных.

STATISTICA включает большое количество методов статистического анализа (более 250 встроенных функций) объединенных в модули. В совокупности модули системы STATISTICA покрывают весь спектр современных методов статистического анализа.

Производителем программы является фирма StatSoft Inc. (США), которая выпускает статистические приложения начиная с 1985 года. Первый коммерческий продукт Statistica Supplement был создан для операционной среды Lotus 1-2-3. В 1991 году появляется версия STATISTICA для DOS, в 1992 году – для Macintosh, а в 1994 – первая версия для Windows. Программа позволяет проводить обмен данными с другими графическими приложениями посредством технологии DDE (динамического обмена данных). Можно также импортировать графические приложения из STATISTICA посредством технологий связывания и внедрения объектов OLE в Word, PowerPoint и др., а также осуществлять операции с буфером обмена данных.



Поделиться:


Последнее изменение этой страницы: 2016-08-12; просмотров: 356; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.227.228.95 (0.1 с.)