3. Многофакторный анализ как один из методов формирования групп

Автореферат и диссертация по медицине (14.00.14) на тему:Использование морфологических и биохимических критериев крови для формирования групп повышенного риска при раке желудка и толстой кишки

3. Многофакторный анализ как один из методов формирования групп

На правах рукописи

БЕЛЕНИНОВА Ирина Артуровна

ИСПОЛЬЗОВАНИЕ МОРФОЛОГИЧЕСКИХ И БИОХИМИЧЕСКИХ КРИТЕРИЕВ КРОВИ ДЛЯ ФОРМИРОВАНИЯ ГРУПП ПОВЫШЕННОГО РИСКА ПРИ РАКЕ ЖЕЛУДКА И ТОЛСТОЙ

КИШКИ

14 00 14 – онкология

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата биологических наук

Санкт-Петербург 2005

Работа выполнена в Алтайском филиале Государственного учреждения «Российский онкологический научный центр им Н Н. Блохина РАМН» и в Алтайском государственном медицинском университете

Научные руководители:

члеп-корреспондент РАМН, доктор медицинских наук, профессор

Я.Н. Шойхет

доктор медицинских наук, профессор А.Ф. Лазарев

Официальные оппоненты:

доктор биологических наук, профессор В.А. Филов

доктор медицинских наук, профессор О.Н. Волков

Ведущая научное учреждение:

Государственное учреждение Центральный научно-исследовательский ренггенорадиологический институт федерального агентства по здравоохранению и социальному развитию

Защита диссертации состоится «_»_2005 г. в_часов

на заседании диссертационного совета Д208.052.01 ГУН НИИ онкологии им проф Н Н. Петрова (197758, г Санкт-Петербург, Песочный-2, ул Ленинградская, д.68)

С диссертацией можно ознакомиться в библиотеке Института Автореферат разослан «_»_2005 г

Ученый секретарь диссертационного совета доктор медицинских наук

Р.В. Орлова

1Ъ\0

ВВЕДЕНИЕ

Актуальность проблемы. В структуре онколей ической заболеваемости и смертности злокачественные опухоли желудка и толстого кишечника занимают особое место В России ежегодно регистрируются 126,5 тыс.

новых случаев рака желудочно-кишечного тракта (ЖКТ), что составляет около 30% в структуре онкологической заболеваемости (Аксель ЕМ, 2001) Ежегодно в мире регистрируется 876,3 тыс новых случаев рака желудка и 646,6 тыс смертей от этого заболевания (Аксель Е.М. Давыдов М.И, 2004, Сельчук В Ю.

, 2003) Его доля составляет 10 % всех злокачественных опухолей (Черноусов А Ф Волынчик К Е , 2004; Muñoz N.,1998, Valle J , Gispert J.P . 2001). Ежегодно в мире регистрируются более 944,7 тыс больных раком ободочной и прямой кишки и 492,4 тыс смертей от него. В 2002 годе в России выявлено 49,5 тыс.

новых случаев, а его доля в общей структуре оикозаболеваемости достигла 10,3% у мужчин и 11,6% у женщин [Воробьев Г.И. и соавт , 1998, Аксель Е М. Давыдов М.И, 2004] В Алтайском крае удельный вес выявленных больных раком желудка в 2001 году с 1-2 стадией составил 21,1%, в 2002 году – 20,5%, в 2003 году 19,6%, с 3-4 стадией соответственно – 66,8%; 69,7%; 68,2%.

Удельный вес больных колоректальным раком в Алтайском крае, выявленных с 1-2 стадией в 2001 году составил 39,2%, в 2002 году – 45,5%, в 2003 году – 45,3%, с 3-4 стадией соответственно 53,7%, 47,5%, 46,4% Очевидно, что у большинства больных заболевания диагностируют лишь в 3-4 стадии, чю неминуемо ведет к неудовлетворительным результатам лечения.

Используемые до последнею времени традиционные подходы в диагностике опухолей на ранней стадии, основанные на распознавании симптомов заболевания, мало приемлемы для решения данной ¡адачи, поскольку в ранних стадиях злокачественные опухоли протекают бессимптомно, или с невыраженной симптоматикой, или под маской предшествующей хронической патологии органов желудочно-кишечного тракта (Володин В.Д., 1986; Гарин A.M., 1998, Денисов и соавт., 1999)

Диагностика опухолевых заболеваний включает несколько этапов Начальным и очень важным для последующей уточняющей диагностики является первичный скрининг лиц с возможными онкологическими

заболеваниями. Результативность работы па , rrrrrci—ггапс существенно

1 И>С НАЦИОНАЛ i> иду ,

влияет на эффективность всего диагност 1чсск(Щ|цдЦ|И№в$;а РУ”

! ¿rszjüi

«мммммммшг,« «J

шествующие ныне общепринятые методы диагностики опухолевых заболеваний, во-первых, малодоступны для первичного скрининга при массовых медосмотрах; во-вторых, неэффективны именно на ранних стадиях заболевания: в-третьих, иногда небезопасны для -здоровья пациентов (Титов В Н .

1993, Ушаго Е ,1999) Таким образом, необходимы экономичные, доступные при широких обследованиях в условиях России методы, позволяющие выделить “группу онкологического риска”, и сокрашть, таким образом, круг обследуемых для последующей уточняющей диагностики Представляется важным, чтобы методы первичного онкологического скрининга отвечали следующим требованиям

■ высокая чувствительность и относительно высокая специфичность по отношению к опкопатологии;

■ практическая простота выполнения и высокая производительность;

■ экономичное и, и техническая доступность при массовых медосмотрах,

■ безопасное I ь для обследуемого

Для поиска и изучения различных факторов и критериев, позволяющих выделить среди населения группы повышенного онкологического риска можно использовать факторный анализ (Воробьев В П и еоавт , 1977, Кант В.И , 1989, Славин М Б , 1989, Лазарев А Ф , 1991. Заридзе Д.Г , 2001).

Оп позволяет по-новому оценить информативность традиционных (рушпных) клинических и лабораторных данных.

Оцениваются анамнез, данные фспо- и генотипа, клинические проявления и лабораторные показатели В результате последующей компьютерной обработки всего комплекса полученной информации для каждого пациента определяется факторное число По величине факторного числа определяется степень онкологического риска Ото позволяет формировать группы повышенного онкологического риска (Ла4арев А.Ф., 2001).

Цель работы. Совершенствование системы формирования групп онкологического риска для раннего выявления рака желудка и толстой кишки па основе оценки и учета изменений морфологических и биохимических показателей крови при этих злокачественных новообразованиях. . .

; (1 К I' ** |

» Л * – * л

Задачи исследования:

1 Выявить особенности изменений морфологических и биохимических показателей крови при развитии злокачественной опухоли в желудке и толстой кишке, их статистически значимые отличия от данных здоровых лиц

2 Определить взаимосвязь морфологических и биохимических изменений крови с развитием рака желудка и юлстой кишки

3. Оцени 1Ь возможность использования в качестве критерия при формировании групп онкологического риска для выявления рака желудка и толстой кишки интегрального показа юля морфологических и биохимических изменений крови при этой патологии.

4 Определение возможности использования дискриминантного анализа для выделения лиц с риском наличия рака желудка и толстой кишки

Научная новизна: Создана методология формирования групп онкологического риска для раннего выявления рака желудка и толстой кишки на основе определения характерных для этих опухолей изменений морфологических и биохимических показателей крови, установление их корреляционных зависимое!ей, интегральной оценке этих изменений и дискриминантного анализа.

Практическая значимость: Установление различий ряда морфологических и биохимических показателей крови у больных раком желудка и толстой кишки по сравнению с лицами, не имеющих каких-либо заболеваний, расчет интегрального корреляционного пока ¡а юля и дискриминангный аналш гкиволяо опшмизировать формирование групп риска и улучшить выявляемое! ь злокачественных новообразований этих локализаций.

Основные положения, выносимые на защиту

1 Наличие ряда изменений морфологических и биохимических показа!Слей крови у больных раком желудка и толстой кишки, имеющих значимые отличия от лиц, не имеющих признаков каких-либо заболеваний

2. Формирование групп онкологического риска для возможного выявления рака желудка и толстой кишки по интегральному

корреляционному показателю на основе характерных для этих заболеваний морфологических и биохимических изменений крови.

3 Использование дискриминантного анализа на характерных для рака желудка и толстой кишки морфологических и биохимических изменениях крови при формировании групп онкологического риска для выявления в целом и отдельно рака желудка и толстой кишки

Апробация работы Основные положения работы доложены на совместном заседании кафедр онкологии, факультетской хирургии, НИИ пульмонологии (Барнаул, 2005).

Публикации. Общее количество печатных работ составляет – 19, по гсмс диссертации опубликовано 10 печатных работ.

Структура и объем диссертации.

Диссертационная работа изложена на 154 страницах машинописного текста, состоит из введения, обзора литературы и 3 глав собственных материалов, заключения, выводов, практических рекомендаций, включает 83 таблицы и 5 рисунков Список использованной литературы содержит 197 источников, среди которых 102 – отечес1вснных и 95 – иностранных.

СОДЕРЖАНИЕ РАБОТЫ

Материалы и методы исследовании

В основу работы положены данные о 686 больных злокачественными новообразованиями желудочно-кишечного тракта (основная группа) и 345 лиц без признаков каких-либо заболеваний (контрольная группа) Из 686 больных рак желудка был у 343 (первая подгруппа) и рак толстой кишки у 343 (вторая подгруппа).

Основная и контрольная группа по возрасту и полу статистически значимо не различались У 18,7% больных раком желудка была установлена 1 стадия процесса, у 13,7% больных – II стадия, у 17,5% -III стадия, у 50,1% – IV стадия У 6,4% больных раком толстой кишки была усыновлена I стадия процесса, у 50,7% больных – II стадия, у 29,2% -III стадия, у 13,7%) – IV стадия.

У больных раком желудка превалировала (74,9%) аденокарцинома, перстневидно-клеточный рак отмечен у 14,3%, недифференцируемый у

6

10,8%. Л у больных раком толстой кишки аденокарцинома выявлена у 97,9%, перстневидно-клеточный у 0,6%, недифференнируемый – у 0,9% и плоскоклеточный – у 0,6% Радикальное лечение у больных первой подгруппы проведено в 45,2% случаев, у больных второй подгруппы в 67,1%о. Статистически значимых различий по структуре сопутствующих заболеваний между основной и группой контроля не выявлено

Группы крови ABO определялись стандартными сыворотками, методами агглютинации па плоскости Определение гематологических параметров проводили на гематологическом анализаторе «Coulter Microdiff 18», лейкоцитарную формулу считали в окрашенных мазках, СОЭ по унифицированному микрометоду Панченкова Определение параметров гемостаза определялось с использованием набора фирмы «Технология-Стандарт» Определение глюкозы проводили на анализаторе «Оксап-Г», определение ионов натрия и калия – на иономере «ЭЦ-59», определение мочевины – по унифицированной методике по цветной реакции с диацетиламиномопооксимом, билирубина – унифицированным методом по диазореакции в прису!с1вии акселератора Определение степени онкориска, общего белка, белковых фракций, холестерина, липидпых фракций, сыворотки крови проводили на акустическом приборе «Биом-1» Метод основан на использовании акустических характеристик сыворотки крови и других биологических жидкостей при помощи анализа параметров акустического резонатора с биологической средой.

Статистическая обработка проводилась методами вариационной статистики с определением показателя вероятности по таблице Стыодента Статистически значимыми (достоверными) принимались различия при величине достоверности р0,05 Корреляционный анализ проводили с использованием четырехпольной таблицы При наличии трех и более значений одного признака исследовалось каждое его значение отдельно в сравнении со всем остальным массивом наблюдений Использовался меюд определения относительного риска, свидетельствующий о том, во сколько раз возрастает или уменьшается вероятность определенного заболевания при наличии изучаемого признака Проводилось вычисление значений относительных рисков RR и их доверительных интервалов при раздельном изучении морфологических и биохимических показателей крови. С целью получить единое цифровое выражение множественных различий использовался метод дискриминантного анализа Определялись канонические дис-криминантные функции, коэффициенты стандартизированных канониче-

ских дискриминантных функций, коэффициенты классифицируемых функций показателей, а также показатели чувствительности, специфичности и диагностической точности Были использованы электронная таблица Microsoft Fxcel в операционной системе Microsoft Windows, стандартный пакет статистических программ, интегрированный в программный пакет STATISTICA, специализированная программа математического анализа SPSS

РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ

Частота группы крови А (/У) была у больных раком желудка выше на 8,6%, чем в контрольной группе (р-“0 02) По частоте групп крови В (а) и AB (о) больные раком желудка и контрольной группы статистически значимо не различались По частоте групп крови О (aß), А (ß), В (а) и AB (о) больные раком толстой кишки и контрольной группы статистически значимо не различались Не установлено также статистически значимых различий между основной и контрольной группой по частоте антигенов групп крови Rhesus.

У больных раком желудка частота снижения уровня гемоглобина периферической крови ниже 100 г/л в 26,66 (6,55-108,51) раз статистически значимо превышала данные контрольной группы.

Количество гемоглобина в пределах 100-120 г/л среди больных раком желудка наблюдалось чаще, чем в контрольной в 3,42 (1,96-5,96) раза Количество эритроцитов менее Зх10|:/л отмечено у 3,2% больных раком желудка, что не наблюдалось у лиц контрольной группы У больных раком желудка в 2,57 (1,56-4,2) раза чаще, чем в контрольной группе наблюдалось количество эритроцитов в интервале (3-4)х10':/л Показатели гематокрита меньше 35% среди больных раком желудка встречались чаще, чем в контрольной группе в 3,98 (2,58-6,13) раз гемоглобина в эритроците менее 27 иг у больных раком желудка встречалось чаще в 3,41 (2,31-5,07) раза, чем в контрольной 1 руппе.

Частота повышения уровня лейкоцитов выше 8х 10''/л у больных раком желудка в 2,83 (1,95-4,12) раза статистически значимо превышала данные контрольной группы

Количество палочкоядерных нейтрофилов свыше 6 среди больных раком желудка было выше, чем в контрольной группе в 2,93 (1,87-4,59) раза Количество лиц с числом сегментоядерных нейтрофилов более 72% у

больных раком желудка встречалось чаще в 3,87 (2,58-5,8) раза, чем в контрольной группе У больных раком желудка частота снижения количества лимфоцитов менее 20% в 5,27 (3,2-8,65) раз статистически значимо превышала данные контрольной группы По содержанию количества эозинофи-лов, базофилов и моноцитов в периферической крови больные раком желудка и контрольной группы статистически значимо не различались.

Частота показателя скорости оседания эритроцитов в интервале 2030 мм/час у больных раком желудка и более 30 мм/час в 2,73 (1,82-4,1) и 17,94 (7,99-40,27) раз соответственно, статистически значимо превышала данные контрольной группы.

У больных раком толстой кишки частота снижения уровня гемоглобина периферической крови ниже 100 г/л в 25,65 (6,29-104,52) раз статистически значимо превышала данные контрольной группы Количество гемоглобина в пределах 100-120 г/л среди больных раком толстой кишки наблюдалось чаще, чем в контрольной в 4,29 (2,5-7,38) раза Количество )ритроцшов менее 3,0х10|2/л отмечено у 1,2% больных раком толстой кишки, что не наблюдалось у лиц контрольной группы У больных раком толстой кишки в 2,46 (1,5-4,06) раза чаще, чем в контрольной группе наблюдалось количество эритроцитов в интервале (3,0-4,0) х 101 – /л Показатели гематокрша меньше 35% среди больных раком толстой кишки встречались чаще, чем в контрольной группе в 3,85 (2,49-5,94) раза. гемоглобина в эритроците менее 27 пг у больных раком толстой кишки встречалось чаще в 4,2 (2,86-6,17) раза, чем в контрольной группе

Частота повышения уровня лейкоцитов выше 8 0х10'7л в 2,7 (1,853,94) раза статистически значимо превышала данные контрольные группы

Количество палочкоядерных нейтрофилов свыше 6 среди больных раком толстой кишки было выше, чем в контрольной группе в 2,58 (1,634,08) раза Количество более 72% у больных раком толстой кишки встречалось чаще в 2,48 (1,61-3,81) раза, чем в контрольной группе У больных раком толе той кишки частота снижения количества лимфоцитов менее 20% в 4,32 (2,06-7,17) раза статистически значимо превышала данные контрольной группы По содержанию количества эозинофилов, базофилов и моноцитов в периферической крови больные раком толстой кишки и контрольной группы статистически значимо не различались.

Частота показателя скорости оседания эритроцитов в интервале 2030 мм/час у больных раком толстой кишки и более 30 мм/час в 3,13 (2,1-

4.66) и 21,29 (9,52-47,62) раз соответственно статистически значимо превышала данные контрольной группы

У больных раком желудка и толстой кишки изменения показателей гемоглобина, эритроцитов, гематокрита, среднего содержания гемоглобина в эритроците и лейкоцитов были выявлены однотипные и одинаковые по выраженности сдвиги.

У больных раком желудка количество сегментоя-дерных нейтрофилов менее 47% наблюдалось чаще в 3,75(1,74-8,06) раза, чем у больных раком толстой кишки Распределение сегментоядерных нейтрофилов в интервале 47-72 % отмечалось у больных раком желудка меньше на 17% (р''0 001), чем у больных раком толстой кишки, а количество более 72% у больных раком желудка встречалось больше на 10,5% (р-'О 0!). чем у больных раком толстой кишки. По частоте распределения лимфоцитов менее 20%) в периферической крови у больных раком желудка и толстой кишки статистически значимо не отличались Распределение лимфоцитов в интервале 20-40 % наблюдалось у больных раком желудка на 8,1% (р-'О 02)чаще, чем у больных раком толстой кишки Частота распределения лимфоцитов более 40% у больных раком желудка отмечалась чаще на 3,5% (р4 10 16(5.4-19 12) 11,57 (6,17-21,69) 088(07-1 1)

ПВ, с

18 3.02 (1 72-5.31) 2,21 (1 21-4,0) 1 36(0.89-2 08)

АПТВ, с

45 4,02(1.78-9 09) 3,16(1 37-7,3) 1 27(0.74-2.18)

РФМК, мг%

5,5 18.1 (9.41-34.83) 19,89(10,36-38,21) 0 91 (0.78-1 06)

Тромбоциты,

хЮ'/л

400 14 75 (4 62-47 06) 18,78 (5,93-59,41) 0 79(0 55-1 13)

ТВ, с

17 4 9 (3 43-7 0) 3,57 (2,47-5,16) 1 37 (1 13-1 67)

Примечание: *- контрольная группа – 1

** -11Я вторая подгруппа – 1.

У больных раком желудка частота снижения тромбинового времени (ТВ) в плазме крови в 3,69 (1,04-13,1) раз статистически значимо превышала данные контрольной группы и удлинение тромбинового времени свыше 17 с у больных раком желудка в 4,9 (3,43-7,6) раз наблюдалось чаще.

У больных раком толстой кишки частота увеличения фибриногена более 4 г/л в 11,57 (6,17-21,69) раз статистически значимо превышала данные контрольной группы.

Частота снижения протромбинового времени у больных раком толстой кишки менее 15 с в плазме крови в 7,64 (3,0519,19) раз статистически значимо превышала данные контрольной группы, а удлинение свыше 18 с наблюдалось у больных в 2,21 (1,21-4,0) раза чаще. У больных раком толстой кишки частота снижения АПТВ в плазме

11

крови менее 35 с в 49,29 (6,84-354,92) раз статистически значимо превышала данные контрольной группы и удлинение АПТВ свыше 45 с у больных раком толеюй кишки в 3,16 (1,37-7,31) раз наблюдалось чаще Частота содержания растворимых фибрин-мономерных комплексов (РФМК) свыше 5 5 мг% у больных раком толстой кишки в 19.89 (10.3638,21 ) раз статистически значимо превышала данные контрольной группы Частота повышения количества тромбоцитов у больных раком толстой кишки свыше 40010″/л в 18,78 (5,93-59,41) раз статистически значимо превышала данные контрольные группы У больных раком толстой кишки частота снижения громбипового времени в плазме крови в 5,36 (1,58-18,24) pas статистически значимо превышали данные контрольной группы и удлинение громбипового времени свыше 17 с у больных раком толстой кишки в 3.57 (2,47-5.16) раз встречалось чаще у больных

Удлинение громбипового времени свыше 17с наблюдалось чаще у больных раком желудка на 11,9% (р-0,01 чем у больных раком толстой кишки По часюгс содержания фибриногена, протромбиново!о времени, АПТВ. РФМК тромбоцитов больные раком желудка и толстой кишки статистически значимо не различались

У больных раком желудка частота снижения количества общего белка сыворотки крови ниже 65 г/л в 4,29 (2,66-6,91) раз статистически значимо превышала данные контрольной группы.

Частое снижения количества альбуминов менее 55% у ботьных раком желудка в сыворотке крови в 3.32 (2,21-4,97) раз статистически значимо превышало данные контрольной группы альфа 1-глобулинов у больных раком желудка свыше 4.

9% чаще па 33,8% (р, снижение ЛНП менее 2,0 ммоль/л па 13,7%>, чем у больных раком толстой кишки •

Для каждого исследуемого признака определялся коэффициент корреляции Всего в группе больных раком желудка и в группе больных раком толстой кишки было 44 исследуемых признака Каждый признак для

большей информативности делили еще на под1руппы, всего 122 подгруппы и, соо1вегственно, 122 коэффициента корреляции

У больных раком желудка инте1ральный показатель был в интервале от -7,152 до 4,842 У лиц контрольной группы интегральный показатель был в интервале от 7,867 до 0,784 (Табл. №3).

Таблица 3

Распределение интегрального показателя у больных раком желудка

Стадии рака Первая подгруппа Контрольная группа Р

X (т X +т

Без учета стадии -1,99 0,145 -5,61 0,069 Р

Источник: http://medical-diss.com/medicina/ispolzovanie-morfologicheskih-i-biohimicheskih-kriteriev-krovi-dlya-formirovaniya-grupp-povyshennogo-riska-pri-rake-zhelu

3.4.4. Бифакторный метод

3. Многофакторный анализ как один из методов формирования групп

К началу 30-х годов, после того как накопился значительный опыт по анализу корреляционных матриц, выяснилось, что двухфакторный метод Спирмэна может быть применен не ко всем эмпирическим данным. Иногда те переменные, которые не подходили к факторному решению, даже просто исключались.

Хользингер предложил бифакторный метод, в котором пытался преодолеть недостатки, присущие двухфакторному решению. Метод Хользингера разработан для факторного отображения, представленного на рис. 3.18.

Особенность бифакторной модели состоит в том, что кроме генерального она включает неперекрываемые групповые и характерные для каждой переменной факторы.

Ограничения, присущие бифакторному методу, менее жестки по сравнению с двумя предшествующими. Но сама процедура расчетов сложнее. Этим методом можно аппроксимировать большой класс корреляционных матриц, что явилось шагом вперед по сравнению с ранее разработанными методами.

Рис. 3.18. Схематическое изображение матрицы факторного отображения А в бифакторном методе: — переменные; — общие факторы; характерные факторы не указаны. Крестиками обозначены высокие факторные нагрузки

Так, метод Спирмэна не может быть применен к большим и сложным наборам психологических тестов, среди которых наблюдается к тому же отрицательная корреляция. Сегодня бифакторный метод расценивается как логическое звено на пути развития от двухфакторного метода к многофакторному анализу с любыми перекрываемыми групповыми факторами.

Перед применением бифакторного метода необходимо решить, какие переменные можно объединить в отдельную группу.

Чтобы более или менее избежать произвольности в группировке переменных, используют так называемый -коэффициент (коэффициент принадлежности coefficient, of belonging), который играет большую роль в кластерном анализе.

При этом исходят из того, что переменные, обусловленные действием одного фактора и, следовательно, относящиеся к одной группе, коррелируют между собой сильнее, чем с остальными переменными.

Сначала выделяются две переменные с наибольшим значением коэффициента корреляции между ними и вычисляется В-коэффициент. Затем к ним добавляется третья переменная, максимально связанная с предыдущими, и снова вычисляется В-коэффициент. Так постепенно к формирующейся группе добавляется по одной переменной.

Процесс продолжают до тех пор, пока не произойдет резкого спада значения коэффициента. Переменная, вызвавшая уменьшение значения В, относится не кэтой группе. Таким образом, делается попытка присоединить все переменные к первой группе и по величине В-коэффициента принимаются решения об их принадлежности к этой группе.

Затем начинают формирование второй группы, отыскивая среди оставшихся после исключения переменных первой группы две наиболее связанные между собой. Вся процедура вычисления В-коэффициента повторяется до тех пор, пока все переменные не окажутся распределенными по группам.

Распределения В-коэффициента для оценки значимости его расчетных значений не существует. Поэтому процесс формирования групп зависит от субъективных причин. Так как группировка переменных является предпосылкой бифакторного решения, то, следовательно, всему методу присуща субъективность.

К тому же имеется много корреляционных матриц, по которым нельзя получить решения в виде, представленном на рис. 3.18. Поэтому с течением времени были вынуждены отклонить бифакторный метод как универсальное средство факторного решения,

Многофакторный метод Тэрстоуна позволяет анализировать любую корреляционную матрицу и предлагает процедуры, удовлетворяющие принципу простой структуры.

Рис. 3.19. Схематическое изображение матрицы факторного отображения А в многофакторном анализе: – переменные; — общие факторы; характерные факторы не указаны. Крестиками обозначены высокие факторные нагрузки

Метод главных факторов и центроидный метод относятся к многофакторному анализу. Необходимое для многофакторного метода факторное отображение схематично представлено на рис. 3.19 с тем, чтобы его можно было сравнить с факторными отображениями других методов (рис. 3.15-3.18).

Модель многофакторного анализа отличается прежде всего тем, что в описание переменной может войти несколько групповых факторов, т. е. допускаются перекрывающиеся групповые факторы.

Разумеется, из-за этого анализ корреляционной матрицы усложняется по сравнению со всеми упомянутыми выше решениями, что выражается в необходимости введения таких процедур, как оценка общностей и вращение.

Источник: http://scask.ru/q_book_fan2.php?id=47

4.3.3. Методы многофакторного анализа

3. Многофакторный анализ как один из методов формирования групп

4.3.3. Методы многофакторного анализа

Чаще всего методы факторного анализа применяются в случае оценки уровня странового риска и инвестиционного климата страны — реципиента инвестиций, но могут быть использованы и в других случаях. Факторные методы анализа базируются на том, что каждый риск в отдельности характеризуется рядом факторов.

Значение этих показателей ранжируется и нормируется от 1 до 10 и определяется расчетным или экспертным путем. Естественно, в случае изменения внешней и/или внутренней для финансового сектора страны конъюнктуры проводится новая ранжировка.

Выделенные факторы в рамках каждого конкретного анализируемого риска могут оказывать различное (по степени и значению) влияние на эффективность деятельности финансового сектора в целом или на институциональные единицы отдельных подсекторов. Сумма веса внутри каждого отдельного риска равна 1.

Основные положения факторного метода могут быть представлены следующим образом:

где А — значение фактора (от 1 до 10 в целых числах);

i — вес факторов в результате оценки значимости риска.

В процессе проведения факторного анализа необходимо иметь в виду следующие положения.

1.  Факторы состоят из различных, но соизмеримых и желательно сопоставимых показателей.

2. Для любого анализируемого объекта они могут быть внутренними и внешними.

3. При анализе риска в условиях рыночной экономики особое значение приобретает определенная классификация факторов.

В зависимости от возможностей подбора и анализа конкретных показателей факторы можно разделить на следующие группы:

•  управляемые (регулируемые), которые характеризуются достаточно высокой возможностью их подбора, определения их количественных и качественных значений в статике и динамике;

•  условно нерегулируемые (труднорегулируемые), тенденцию динамики которых невозможно спрогнозировать с достаточно высокой точностью;

•  неуправляемые (нерегулируемые) — это показатели, условия или критерии, динамика которых не поддается прямому анализу, а в процессе осуществления прогнозов моделей получаются неадекватные результаты.

Отнесение показателя (фактора) к той или иной группе зависит от анализируемого уровня управления и/или длительности реализации принятого решения. Чем выше уровень анализа, тем больше факторов можно рассматривать как управляемые, т.к. информационная база расширяется.

Основные шаги, с помощью которых осуществляются методы многомерного факторного анализа:

1)  организуется матрица исходных данных Y= (y i,j), в которой по столбцам располагаются анализируемые зависимые переменные i (i'= l,m) а по строкам — анализируемые объекты (индивидуумы) j(j = l,n);

2) далее анализируется полученная корреляционная матрица R = (r i , k) с целью определения степени корреляционной зависимости между анализируемыми показателями, где i,k = l,m;

3) после решения проблемы общности получаем редуцированную корреляционную матрицу Rh = (rh  i  , k)

4) в результате решения проблемы факторов получаем матрицу отображения A= (aj, I), элементами которой являются факторные нагрузки. По столбцам этой матрицы отображаются переменные i(i =  l,m), а по строкам — факторы I (I= l,m),

5)  в результате осуществленных операций получаем новую ортогональную m-мерную матрицу (систему координат) U =  (u i ,I), выполняющую условие, чтобы максимум полной дисперсии (при которой вес анализируемого показателя имеет максимальное значение) лежал в направлении первой главной оси, а максимум оставшейся дисперсии — в направлении второй главной оси, где i=l,m, I=l,r ;

6)  осуществляем анализ факторной матрицы после поворота; после оценки значений факторов анализируем данные, полученные в матрице значений факторов S = (s i , j), где i = l,m, j=l,n

Одним из основных методов многомерного факторного анализа является метод главных компонент (МГК).

Метод главных компонент позволяет сгруппировать отдельные показатели, характеризующие те или иные стороны деятельности институциональных единиц финансового сектора, и сформировать укрупненные факторы, оказывающие влияние на анализируемый процесс, — главные компоненты, – с целью

дальнейшего анализа. Далее анализ деятельности и уровня конкретных рисков определяется не по отдельным показателям или факторам, а по главным компонентам, которые отражают внутреннее содержание происходящих процессов.

Этот метод заключается в нахождении последовательности ортогональных осей координат, вдоль которых каждый раз в убывающем порядке определяется максимум полной дисперсии.

Иными словами, по исходной корреляционной матрице исследуемых элементов (показателей) определяется новая ортогональная система координат, которая представляется главными компонентами таким образом, чтобы их совокупность определила общую вариацию всех признаков.

Первая главная компонента определяется из условия извлечения соответствующей ей линейной комбинации исходных переменных с возможно большей дисперсией. Вторая главная компонента объясняет максимум оставшейся дисперсии и т.д. Процедуру вычисления можно прекратить в любом месте и, например, выбрать только первые две главные компоненты, которые воспроизведут лишь 80% полной дисперсии.

Множество главных компонент представляет собой удобную систему координат, а соответствующие дисперсии главных компонент характеризуют их статистические свойства.

Из общего числа главных компонент для исследования отбираются только весомые дисперсии, т.е. вносящие максимальный вклад в объяснимую часть. Опыт показал: оптимальный вариант — это когда m = (0,15 — 0,25)n.

При проведении анализа с помощью МГК применяются различные техники исследования:

•  R-техника дает возможность аналитикам определять взаимную близость n-объектов исследования путем изучения степени корреляции между различными признаками и r-общими факторами (главными компонентами), причем т должно быть больше r;

•  с помощью Q-техники определяется степень взаимной близости n-объектов исследования путем изучения корреляции между признаками;

•  если в R-технике выделяются группы близких по экономическому содержанию признаков, то в данном случае анализируются группы близких объектов. Р- и О-техника относятся к одному объекту исследования.

Например, уровень конкретного риска в деятельности одного финансового учреждения может быть оценен по небольшому числу параметров в динамике с помощью R -техники. O-техника дает возможность оценивать уровень того же вида риска не между парами признаков, а между парами временных интервалов.

4.3.4. Кластерный анализ

Задача кластерного анализа состоит в разбиении множества точек (показателей, факторов, различных видов финансовых учреждений, их клиентов, контрагентов) на группы, или кластеры, таким образом, чтобы каждая точка принадлежала одному и только одному подмножеству разбиения. При этом в каждом подмножестве разбиения точки лежат достаточно плотно друг к другу и являются сходными по каким-то определенным признакам, в то время как точки, принадлежащие разным подмножествам, являются разнородными. Точки эти могут быть переменными, объектами, индивидуума ми и другими величинами, которые содержатся в матрице исходных данных. Таким образом, с помощью кластерного анализа осуществляется группировка первичных данных, их разбиение по группам (кластерам) с целью дальнейшей работы с полученной информацией.

Иными словами, задача кластерного анализа сводится к разработке определенного правила, или алгоритма, с помощью которого можно определять критерии значимости для проверки гипотезы: действительно ли точка принадлежит данной группе.

Трудным и мало формализуемым является вопрос, связанный с определением понятия однородности объектов.

Понятие однородности объектов определяется введением правила вычисления расстояния между любой парой анализируемых объектов или с помощью некоторой функции, характеризующей степень близости объектов множества. На практике довольно часто используют коэффициент близости.

Применение коэффициента близости (β-коэффициент) или других метрик (мер близости) при благоприятных условиях приводит к однозначной группировке объектов. (β -коэффициент определяется следующим отношением:

β =  Средний коэффициент корреляции  переменными одной группы / Средний коэффициент корреляции переменными этой трупы с остальными переменными *100%.

Выбор меры близости является основным моментом, от которого зависит окончательный вариант разбиения совокупности

объектов, а следовательно, и степень достоверности, адекватности и реальности полученных результатов. Существует несколько основных методов определения степени близости отдельных элементов совокупности.

П. Аим систематизировал методы классификации однородных элементов. Он различал такие подходы к решению задач классификации, как использование модели факторного анализа, задание функции плотности распределения вероятностей генеральной совокупности, к которой принадлежит данная группировка, и, наконец, приложение метода максимального правдоподобия.

Четкие рекомендации, когда, какой подход и при каких данных проводить анализ, пока не разработаны.

Некоторые авторы при решении задач классификации исходят из модели факторного анализа. Вначале все точки проецируются в р-мерное пространство, которое натянуто на р-собственных векторов.

Внутри этого р-мерного пространства с помощью определенного алгоритма находят группировки, являющиеся пока предварительными оценками классов.

Затем к этим группировкам для решения задачи идентификации и окончательного разбиения объектов на классы применяется дискриминантная функция. Данная процедура повторяется до тех пор, пока группировки точек не будут изменяться по сравнению с предыдущим циклом итерации.

Остается только показать, при каких условиях осуществляется быстрая сходимость данной итеративной процедуры. Речь при этом идет о комбинации метода главных компонент, дискриминантного анализа и алгоритма нахождения группировок.

Интересный подход к решению задач классификации использовал Наус. Он определял вероятность того, что по меньшей мере n точек из имеющихся N попадает в прямоугольник со сторонами n и V. Из такого подхода может быть разработана статистическая концепция при решении задачи формирования группировок объектов.

МакКуайти занимался анализом группировок, исходя из коэффициентов корреляции рангов. Ему и принадлежит идея назвать метод кластерным.

Из всего вышеизложенного следует, что задачами кластерного анализа являются:

• разбиение переменных на группы, наиболее отдаленные друг от друга;

• снижение размерности набора переменных путем выделения скрытых за ними факторов, адекватно отражающих изучаемое явление.

4.3.5. Дискриминантный анализ

Суть этого анализа состоит в классификации факторов при полностью описанных классах, группах и кластерах.

Иными словами, целью этого анализа является выработка статистического правила, позволяющего отнести новый элемент матрицы Z либо к элементам матрицы X, либо к элементам матрицы Y.

На практике дискриминантный анализ можно использовать при определении того, в каком виде риска произойдет изменение, если изменится тот или иной внешний или внутренний (для финансового учреждения), социальный, экономический или политический показатель/фактор.

Источник: http://www.easyschool.ru/books/7/4/21

Многофакторный анализ: виды, примеры, методы проведения анализа, назначение и результаты

3. Многофакторный анализ как один из методов формирования групп

Дисперсионный многофакторный анализ представляет собой совокупность различных статистических методов, которые предназначены для проверки гипотез и связи между исследуемыми факторами и определенными признаками, не имеющими количественного описания. Также подобная методика позволяет определить степень взаимодействия факторов и их влияние на определенные процессы. Все эти определения звучат довольно запутанно, поэтому давайте разберемся в них более подробно в нашей статье.

Критерии и виды дисперсионного анализа

Метод дисперсионного многофакторного анализа чаще всего используется для поиска связи между непрерывной количественной переменной и номинальными качественными признаками. По сути, данная методика представляет собой тестирование различных гипотез о равенстве различных арифметических выборок.

Таким образом, ее можно рассматривать и в качестве критерия для сравнения нескольких выборок. Однако результаты будут идентичными, если для сравнения используется лишь два элемента.

Исследование t-критерия показывает, что подобная методика позволяет изучить проблему гипотез более детально, чем любой другой известный способ.

Также нельзя не отметить тот факт, что некоторые виды дисперсионного анализа базируются на определенном законе: сумма квадратов межгрупповых отклонений и сумма квадратов внутригрупповых отклонений абсолютно равны.

В качестве исследования используется критерий Фишера, использующийся для детального анализа внутригрупповых дисперсий. Хотя для этого необходимы предпосылки нормальности распределения, а также гомоскедастичности выборок – равенство дисперсий.

Что касается видом дисперсионного анализа, то различают следующие:

  • многомерный или многофакторный анализ;
  • однофакторный или одномерный анализ.

Не трудно догадаться, что второй рассматривает зависимость одного признака и исследуемой величины, а первый – базируется на анализе сразу нескольких признаков. Кроме того, многофакторная дисперсия не позволяет выявлять более прочную связь между несколькими элементами, поскольку исследуется зависимость сразу нескольких величин (хотя проводить метод намного проще).

Факторы

Задумались о методах проведения многофакторного корреляционного анализа? Тогда вам следует знать, что для детального изучения следует изучить те факторы, которые контролируют обстоятельства эксперимента и влияют на конечный результат.

Также под факторами могут подразумеваться способы и уровни обработки значений, характеризующие конкретное проявление определенного условия. В этом случае цифры подаются в порядковой или номинальной системе измерений.

Если же возникает проблема, связанная с группировкой данных, приходится прибегать к использованию одинаковых числовых значений, что немного изменяет конечный результат.

Также следует понимать, что количество наблюдений и групп не может быть чрезмерно большим, ведь это приводит к избытку данных и невозможности закончить расчет. В то же время способ группировки зависит не только от объема, но и от характера варьирования определенных значений.

Размеры и количество интервалов в анализе могут определяться по принципу равных частот, а также одинаковых промежутков между ними. В итоге все полученные исследования будут указаны в статистике многофакторного анализа, которая должна базироваться на различных примерах.

К этому мы еще вернемся в следующих разделах.

Итак, иногда могут возникать ситуации, когда необходимо сравнить между собой две или более различных выборок.

В этом случае логичнее всего будет применить многофакторный корреляционно-регрессионный анализ, базирующийся на изучении гипотезы и связи различных факторов в степени регрессии.

Также название методики указывает на тот факт, что в процессе исследования используются различные составляющие дисперсии.

В чем суть исследования? Для начала два или более показателей разбивают на отдельные части, каждая из которых соответствует действию определенного фактора.

После этого проводится ряд исследовательских процедур на поиск взаимосвязи различных выборок и связей между ними.

Чтобы более детально разобраться в столь сложной, но интересной методике, рекомендуем изучить несколько примеров многофакторного корреляционного анализа, приведенных в следующих разделах нашей статьи.

Пример первый

В производственном цеху есть несколько автоматических станков, каждый из которых предназначен для изготовления определенной детали. Размер производимого элемента представляет собой случайную величину, которая зависит не только от настроек самого станка, но и случайных отклонений, которые неминуемо будут возникать в результате производства деталей.

Но как рабочему определить правильность работы станка, если он изначально производит детали с браком? Правильно, необходимо приобрести такую же деталь на рынке и сравнить ее размеры с тем, что получается во время производства. После этого можно регулировать оборудование таким образом, чтобы оно выпускало детали нужных размеров.

И совсем не важно, что имеется производственный брак, ведь он также учитывается при расчетах.

В то же время если на станках будут определенные показатели, позволяющие определить интенсивность регулировки (осей X и Y, глубины и так далее), то показатели на всех станках будут совершенно разными. Если измерения оказались абсолютно одинаковыми, то производственный брак можно не учитывать вовсе.

Однако такое происходит крайне редко, особенно если погрешности измеряются в миллиметрах.

Но если выпущенная деталь обладает теми же размерами, что и стандарт, приобретенный на рынке, значит ни о каком браке не может быть и речи, поскольку при производстве “идеала” также использовался станок, дающий определенные погрешности, которые наверняка также учитывались рабочими.

Пример второй

Для изготовления определенного прибора, работающего на электричестве, необходимо использовать несколько типов различной изоляционной бумаги: электротехническую, конденсаторную и так далее.

Кроме того, аппарат может быть пропитан смолой, лаком, эпоксидным составам и прочими химическими элементами, продлевающими срок эксплуатации. Ну а различные утечки под вакуумным цилиндром при повышенном давлении легко устраняются с помощью метода нагревания или выкачивания воздуха.

Однако если мастер до этого использовал лишь по одному элементу из каждого списка, в процессе производства по новой технологии могут возникнуть различные трудности. Причем, практически наверняка, подобная ситуация будет вызвана из-за одного элемента.

Однако рассчитать, какой именно фактор влияет на плохую работоспособность прибора, будет практически нереально. Именно поэтому рекомендуется использовать не многофакторный метод анализа, а однофакторный, чтобы быстрее разобраться с причиной неисправности.

Конечно же, при использовании различных инструментов и приборов, которые отслеживают влияние того или иного фактора на конечный результат, исследование упрощается в разы, однако обзавестись подобными агрегатами начинающему инженеру будет не по карману.

Именно поэтому рекомендуется применять однофакторный дисперсионный анализ, позволяющий выявить причину неполадок за считаные минуты. Для этого будет достаточно поставить перед собой одну из наиболее вероятных гипотез, после чего начать доказывать ее путем экспериментов и анализа показателей работоспособности прибора.

Довольно скоро мастеру удастся найти причину неполадок и устранить ее, заменив одну из выборок альтернативным вариантом.

Пример третий

Еще один пример многофакторного анализа. Предположим, что троллейбусное депо может обслуживать несколько маршрутов в течение суток. На этих самых маршрутах работают троллейбусы совершенно разных марок, а оплату за проезд собирают 50 разных контролеров.

Однако руководство депо интересуется тем, каким образом можно сравнить между собой несколько различных показателей, влияющих на общую выручку: марка троллейбуса, эффективность маршрута и умение работника.

Чтобы увидеть экономическую целесообразность, необходимо детально проанализировать влияние каждого из этих факторов на конечный результат. К примеру, некоторые контролеры могут плохо справляться со своими обязанностями, поэтому придется нанять более ответственных сотрудников.

Большинство пассажиров не любят ездить на старых троллейбусах, поэтому целесообразнее всего использовать новую марку. Однако если оба этих фактора идут наряду с тем, что большая часть маршрутов являются высоко востребованными, то стоит ли вообще что-то менять?

Задача исследователя заключается в том, чтобы с помощью одного аналитического метода получить как можно больше полезной информации по поводу влияния каждого из факторов на конечный результат. Для этого необходимо выдвигать как минимум 3 различных гипотезы, которые придется доказывать различными способами.

Дисперсионный анализ позволяет решить подобные задачи в максимально короткий срок и получить максимум полезной информации, особенно если используется многофазный метод. Однако не забывайте о том, что однофакторный анализ дает куда больше уверенности по поводу влияния того или иного фактора, поскольку он исследует выборку более детально.

К примеру, если депо направит все силы на анализ работы кондукторов, то можно будет выявить много недобросовестных рабочих на всех маршрутах.

Однофакторный анализ

Однофакторный анализ – это совокупность методов исследования, направленных на анализ определенного фактора на конечный результат в конкретном случае. Также довольно часто подобная методика используется для сравнения наибольшего влияния между двумя факторами.

Если проводить аналогию все с тем же депо, то следует сперва проанализировать по отдельности влияние различных маршрутов и марок троллейбусов на прибыльность, после чего сравнить полученные результаты между собой и определить, в каком направлении будет лучше всего развивать станцию.

Кроме того, не стоит забывать о таком понятии, как нулевая гипотеза – то есть гипотеза, которая не может быть отброшенной и на нее в любом случае влияют все факторы из перечисленных в той или иной степени.

Даже если мы будем сравнивать между собой лишь маршруты и марки троллейбусов, от влияния профессионализма кондукторов все равно никуда не деться. Поэтому даже если данный фактор не поддается анализу, о влиянии нулевой гипотезы забывать не стоит.

К примеру, если вы решили исследовать зависимость прибыли от маршрута, пускайте в рейс одного и того же кондуктора, чтобы показания оказались максимально точными.

Двухфакторный анализ

Чаще всего данную методику также называют методом сравнения и используют для того, чтобы выявить зависимость двух факторов друг от друга. На практике придется использовать различные таблицы с точными показателями, чтобы не запутаться в собственных расчетах и влияниях на них факторов.

К примеру, можно пустить по двум одинаковым маршрутам два совершенно разных троллейбуса в одно и то же время, пренебрегая фактором нулевой гипотезы (выбрать двух ответственных кондукторов).

В этом случае сравнение двух ситуаций будет максимально качественным, поскольку эксперимент проходит в одно и то же время.

Многофакторный анализ с повторными опытами

Данный метод применяется на практике гораздо чаще других, особенно если речь идет о группе начинающих исследователей. Повторный опыт позволяет не только убедиться во влиянии того или иного фактора на конечный результат, но и найти ошибки, которые были допущены в ходе исследования.

К примеру, большинство неопытных аналитиков забывают о наличии одной или сразу нескольких нулевых гипотез, что приводит к получению неточных результатов в ходе исследования. Продолжая пример с депо, можно проанализировать влияние тех или иных факторов в разный сезон года, поскольку количество пассажиров зимой сильно отличается от летнего.

Кроме того, повторный опыт может натолкнуть исследователя на новые идеи и выдвижение новых гипотез.

ролик и заключение

Надеемся, наша статья помогла вам разобраться в том, на чем основан метод многофакторного корреляционного анализа. Если у вас до сих пор остались какие-то вопросы по данной теме, то рекомендуем к просмотру небольшой видеоролик. В нем во всех подробностях рассказывается о методах дисперсионного исследования на определенном примере.

Как видите, многофакторный анализ – это довольно сложный, но очень интересный процесс, который позволяет выявить зависимость определенных факторов на конечный результат.

Данная методика может применяться абсолютно во всех сферах жизни и эффективно использоваться для ведения бизнеса.

Также модель многофакторного анализа можно использовать для достижения прорывных задач с помощью простых методов.

Источник: https://FB.ru/article/457482/mnogofaktornyiy-analiz-vidyi-primeryi-metodyi-provedeniya-analiza-naznachenie-i-rezultatyi

4.4.3. Методы современного факторного анализа: В эту группу входят методы анализа многофакторных зависимостей в

3. Многофакторный анализ как один из методов формирования групп

В эту группу входят методы анализа многофакторных зависимостей в условиях, когда факторы существенно коррелируют между собой. Дело в том, что практическое применение классических регрессионных моделей в эконо­мическом анализе сопряжено с необходимостью преодоления ряда трудно­стей, основная из которых — мультиколлинеарность факторов.

Особенность экономического анализа заключается в тесной взаимосвязи и взаимообус­ловленности показателей, поэтому бездумное и необоснованное включение в регрессионную модель бессистемно отобранных показателей нередко при­водит к искусственности модели, невозможности ее использования на прак­тике.

Если пытаться следовать формальным требованиям регрессионного анализа в полном объеме, то, например, устранение мультиколпинеарности нередко сводится к отбрасыванию существенно коррелирующих факторов.

В этом случае, во-первых, имеет место потеря информации и, во-вторых, ана­лиз чаще всего выхолащивается, в некотором роде теряет смысл, поскольку модель сводится к одно- или двухфакторной.

Предположим для примера, что анализируется влияние различных факторов на изменение производительности труда.

Среди этих факторов — показатели, связанные с техническим обеспечением производственной деятельности, технологическим уровнем производства, уровнем органи­зации производства, уровнем квалификационной и общеобразовательной подготовки работников и т.п.

Все факторы влияют на изменение произ­водительности труда, но вместе с тем они, без сомнения, не являются не­зависимыми друг от друга.

В рамках классического корреляционно-рег­рессионного анализа методом пошаговой регрессии можно отбросить коррелирующие и незначимые факторы, однако не исключено, что мо­дель существенно упростится, причем значимые (по логике) направления (например, факторы, связанные с технологией производства) могут вооб­ще быть не представлены в модели.

Особенность современного факторного анализа заключается в том, что он дает возможность совместной обработки большого числа взаимосвя­занных (коррелирующих) факторов.

Аппарат современного факторного анализа позволяет свести десятки исходных признаков (факторов) к не­скольким обобщенным, которые не наблюдаются непосредственно при исследовании, но, тем не менее, появляются в модели как линейные ком­бинации исходных признаков и поддаются определенной интерпретации.

Важная особенность подобных обобщенных факторов состоит в том, что они не коррелируют между собой и потому их удобно использовать для построения уравнения регрессии.

В зависимости от того, какие исходные признаки входят в обобщен­ные факторы, последние можно интерпретировать как обобщенные ха­рактеристики сложных факторов, каждый из которых, с одной стороны, имманентно присущ изучаемому явлению или процессу, а, с другой сто­роны, с позиции количественной оценки не сводится к какому-то одному экономически понятному показателю. В качестве примера подобных обоб­щенных факторов можно привести размер предприятия, его технический уровень, уровень организации труда и т.п. Очевидно, что каждое из при­веденных понятий чрезвычайно емко в содержательном плане и вряд ли может быть охарактеризовано каким-то конкретным, очевидным показа­телем. Например, можно ли отдать предпочтение какому-то одному по­казателю (величина основных средств, уставный капитал, число работни­ков, объем производимой продукции и т.п.) как характеристике величи­ны предприятия? Ответ вряд ли будет утвердительным.

Методы современного факторного анализа предназначены для реше­ния следующих задач:

отыскание скрытых, но объективно существующих закономерностей между факторами и оценка их влияния на результативные показатели;

описание изучаемого явления значительно меньшим числом обобщенных факторов (например, исходных факторов было 20, а обобщенных — 3—4, но они объемлют информацию всех или почти всех исходных факторов);

выявление стохастической связи между исходными и обобщенными факторами (например, зависимость между обобщенным фактором «тех­нический уровень предприятия» и частными факторами, его образующи­ми: фондовооруженность, фондообеспеченность и др.);

построение уравнения регрессии на обобщенных факторах (в качестве результатного показателя может использоваться, например, некоторый показатель эффективности финансово-хозяйственной деятельности).

Наибольшее распространение среди методов данной группы получи­ли два: метод главных компонент и собственно современный факторный анализ. Различие между ними заключается в следующем:

современный факторный анализ дает возможность свести исходные факторные признаки к меньшему числу обобщенных факторов (было п исходных факторных признаков, а в результате преобразований получа-

5-2917

ется к обобщенных факторов, каждый из которых представляет собой линейную комбинацию исходных признаков, причем к < «);

в методе главных компонент число обобщенных факторов (они и на­зываются главными компонентами) в точности равно числу исходных факторных признаков, но они упорядочены по убыванию вклада каждой компоненты в исходную дисперсию факторов (например, первая компо­нента учитывает 38% общей дисперсии, вторая — 26%, третья — 17%, чет­вертая — 9% и т.д.; для построения уравнения регрессии аналитик может ограничиться первыми тремя обобщенными факторами, которые в сумме покрывают 81% дисперсии, т.е. эти факторы в значительной степени объяс­няют вариацию результативного признака).

Основными недостатками описанных методов являются существенная сложность математического аппарата, необходимость использования для расчетов специализированных пакетов, сложность интерпретации обоб­щенных факторов и др. Поэтому методы применяются лишь в тематичес­ком анализе. Подробную характеристику и опыт приложения данных ме­тодов можно найти в эконометрической литературе и соответствующих узкоспециализированных монографиях.

4.4.4.

Источник: https://all-sci.net/finansovyiy-analiz_729/443-metodyi-sovremennogo-faktornogo-194597.html

3.9. Методы многофакторного анализа

3. Многофакторный анализ как один из методов формирования групп

Однимиз важных моментов при изучении состоянияздоровья населения и деятельностисистемы охраны здоровья является анализдействия многочисленных факторов,которые формируют здоровье людей, влияютна рост заболеваемости, приводят кинвалидности или смерти пациентов.

Темболее при разработке профилактическихспособов улучшения состояния здоровьянаселения, состояния окружающей среды,деятельности медицинских учрежденийрастет значимость оценивания факторов.

Биостатистика владеет большим количествомвозможностей для этого, необходимотолько научиться правильно подбиратьметоды статистического анализа, которыеявляются наиболее адекватными дляданного конкретного исследования.

Благодаряиспользованию методовкорреляционно-регрессивного, факторного,дисперсионного, кластерного анализамедицинская статистика превратится изописательной в аналитическую.

Однимиз распространенных методов анализаявляетсякорреляционный анализ(см.выше).Коэффициент линейной корреляциисуществует 3 типов:

  • парный;

  • парциальный;

  • множественный.

Парныйкоэффициент корреляции дает характеристикуобобщенной, «неочищенной» связи междупараметрами. При этом возможно влияниедругих факторов, которые не учитываются,поэтому самостоятельная ценностьпарного коэффициента не высока.

Поэтомучаще используют парциальные коэффициенты(которые можно рассчитать при наличиипарных коэффициентов корреляции). Ониотражают связь между факторами и уровнемздоровья в чистом виде, исключая влияниедругих факторов.

Множественный коэффициенткорреляции отражает одновременно связьизучаемых факторов с результативнымпризнаком.

Степеньвлияния факторов характеризуется т.н.коэффициентом детерминации-квадратыпарциальных коэффициентов, перемноженныена 100 (в процентах). . Коэффициентдетерминации отображает искомый весвлияния на здоровье данного факторасреди других.

Регрессионныйанализчаще проводится вместе с корреляционным,поэтому его и называюткорреляционно-регрессионным. задача регрессионного анализа -составитьуравнение регрессии, которое описывает«поведение», например, профессиональногозаболевания при изменении интенсивностивлияния включенных в исследованиефакторов (пола, возраста, профессии,стажа работы, условий работы).

Дисперсионный анализ.Основной целью дисперсионного анализаявляется исследование значимостиразличия между средними. Может показатьсястранным, что процедура сравнениясредних называется дисперсионныманализом.

В действительности, это связанос тем, что при исследовании статистическойзначимости различия между среднимидвух (или нескольких) групп, мы на самомделе сравниваем (т.е. анализируем)выборочные дисперсии. Фундаментальнаяконцепция дисперсионного анализапредложена Фишером в 1920 году.

Возможно,более естественным был бы термин анализсуммы квадратов или анализ вариации,но в силу традиции употребляется терминдисперсионный анализ. Чтобы проиллюстрироватьлогику дисперсионного анализа, рассмотримпростой план эксперимента, включающийодну независимую переменную (или фактор А) и, скажем, 3 группы испытуемых.

Цельютакого плана обычно является выяснениетого, изменяется ли зависимая переменная как функция фактора А.. Дисперсионный анализ позволяет нам проверить нулевуюгипотезу об отсутствии действительныхэффектов данного фактора – и тогдаразличия в показателях вызваныисключительно случайной изменчивостью.

Предполагая, что нулевая гипотеза верна, можно получить две разные оценкидисперсии генеральной совокупности.Одна из этих оценок вычисляется наоснове изменчивости групповых средних,а другая – на основе дисперсии показателейвнутри каждой включенной в план группы.

Если нулевая гипотеза и в самом делеверна, то обе оценки являются, по существу,оценками одной и той же генеральнойдисперсии. Как следствие, эти оценкибудут иметь одинаковую величину, заисключением случайной изменчивости, аих отношение будет иметь известноетеоретическое. Если нулевая гипотезене верна, то наши выборочные оценки неявляются оценками дисперсии одной итой же генеральной совокупности, т. к.на первую будут влиять любые реальныеэффекты фактора, а на вторую – нет.

Дискриминантныйанализиспользуется для принятия решения отом, какие переменные различают(дискриминируют) две или более возникающиесовокупности (группы).

Предположим, чтовы измеряете рост в случайной выборкеиз 50 мужчин и 50 женщин. Женщины в среднемне так высоки, как мужчины, и эта разницадолжна найти отражение для каждой группысредних (для переменной Рост).

Поэтомупеременная Рост позволяет вам провестидискриминацию между мужчинами иженщинами.

Терминкластерныйанализ(впервые ввел Tryon, 1939) в действительностивключает в себя набор различных алгоритмовклассификации. Общий вопрос, задаваемыйисследователями во многих областях,состоит в том, как организовать наблюдаемыеданные в наглядные структуры, т.е.развернуть таксономии.

Например, биологиставят цель разбить животных на различныевиды, чтобы содержательно описатьразличия между ними. В соответствии ссовременной системой, принятой вбиологии, человек принадлежит к приматам,млекопитающим, амниотам, позвоночными животным.

Заметьте, что в этойклассификации, чем выше уровень агрегации,тем меньше сходства между членами всоответствующем классе.

Каждый статистический метод основан на собственной математической модели, и результаты его правильны настолько, насколько эта модель отвечает действительности. Необходимо научиться понимать и оценивать правильность применения статистических методов, которые используются для анализа результатов.

Такимобразом, все указанные методымногофакторного анализа расширяютвозможности исследователя относительностатистического анализа полученныхрезультатов, необходимо только научитьсяих правильно подбирать и смелоиспользовать.

Вопросыдля контроля:

  1. В чём принципиальное отличие описательной от аналитической статистики?

  2. Почему возникает необходимость в использовании методов многофакторного анализа?

Источник: https://studfile.net/preview/4022224/page:15/

Medic-studio
Добавить комментарий