Пиши Дома Нужные Работы

Обратная связь

Корреляционно-регрессионный анализ

 

Корреляционная связь - связь, проявляющаяся не в каждом отдельном случае, а в массе случаев в средних величинах в фор­ме тенденции.

Статистическое исследование ставит своей конечной целью получение модели зависимости для ее практического использо­вания. Решение этой задачи осуществляется в следующей после­довательности.

1. Логический анализ сущности изучаемого явления и при­чинно-следственных связей.

В результате устанавливаются резуль­тативный показатель (у), факторы его изменения, характеризуе­мые показателями (x1,x2,x3, ...,xn). Связь двух признаков и х) называетсяпарной корреляцией. Влияние нескольких факторов на результативный признак называетсямножественной корре­ляцией.

По общему направлению связи могут быть прямые и обрат­ные. При прямых связях с увеличением признака х увеличивает­ся и признак у, при обратных - с увеличением признака х при­знак у уменьшается.

2. Сбор первичной информации и проверка ее на однород­ность и нормальность распределения. Для оценки однородности совокупности используется коэффициент вариации по факторным признакам.

3. Исключение из массива первичной информации всех резко выделяющихся (аномальных) единиц по уровню признаков-фак­торов. Исключаются все единицы, у которых уровень признака-фактора не попадает в интервал

и формируется новый массив для последующего анализа.

4. Установление факта наличия и направления корреляци­онной зависимости между результативным (у) и факторным (x) признаками. Основным методом выявления наличия кор­реляционной связи является метод аналитической группировки и определения групповых средних. Он заключается в том, что все единицы совокупности разбиваются на группы по ве­личине признака-фактора и для каждой группы определяется средняя величина результативного признака. На основе дан­ных аналитической группировки строится график эмпиричес­кой линии связи (линии регрессии), вид которой не только позволяет судить о возможном наличии связи, но и дает неко­торое представление о форме корреляционной связи. Если эмпирическая линия связи по своему виду приближается к прямой линии, то можно предположить наличие прямолиней­ной корреляционной связи; если эмпирическая линия приближается к какой-либо кривой, то это связано с наличием криво­линейной связи.



5. После установления факта наличия связи и ее формы из­меряется степень тесноты связи и проводится оценка ее суще­ственности.

Для определения степени тесноты парной линейной зависи­мости служит линейный коэффициент корреляции (r); при лю­бой форме зависимости (линейной и криволинейной) - эмпири­ческое корреляционное отношение ( ). Формулы их расчета для несгруппированных данных следующие:

где --- отклонения вариантов значений признака-фактора от их средней величины;

--- отклонения вариантов значений результативного признака от их средней величины;

n --- число единиц в совокупности;

--- среднее квадратическое отклонение соответственно признака-фак­тора и результативного признака;

--- межгрупповая дисперсия результативного признака, вызванная влиянием признака-фактора.

Линейный коэффициент корреляции может принимать значе­ния в пределах от -1 до +1. Чем ближе он по абсолютной вели­чине к 1, тем теснее связь. Знак при нем указывает направление связи: знак «+» соответствует прямой зависимости, знак «-» - обратной. Корреляционное отношение изменяется от 0 до 1: чем ближе к 1, тем связь теснее; направление связи он не показывает, оно устанавливается по данным групповой таблицы.

6. После установления достаточной степени тесноты связи выполняется построение модели связи (уравнения регрессии). Тип модели выбирается на основе сочетания теоретического анализа и исследования эмпирических данных посредством построения эмпирической линии регрессии. Чаще всего используются сле­дующие типы функций:

а) линейная: ;

б) гиперболическая:

в) параболическая:

г) показательная:

Для определения численных значений параметров уравнения связи (линии регрессии) используется метод наименьших квад­ратов и решается система нормальных уравнений.

Для определения параметров а и b уравнения прямолиней­ной корреляционной связи система нормальных уравнений (для несгруппированных данных) следующая:

Решение указанной системы уравнений дает следующие фор­мулы для расчета параметров а и b:

7. Изучение множественной корреляционной зависимости на­чинается с анализа матрицы парных коэффициентов корреляции, что позволяет произвести отбор факторов, включаемых в модель множественной зависимости. Матрица имеет следующий вид:

Признак  
1  
 
 
       
 

Анализ первой строки матрицы позволяет выявить факторы, у которых степень тесноты связи с результативным показателем значительна, а поэтому они могут быть включены в модель. Од­нако при построении многофакторных моделей должно соблю­даться требование возможно меньшей коррелированности вклю­ченных в модель признаков-факторов (отсутствие мультиколлинеарности). В качестве критерия мультиколлинеарности может быть принято соблюдение следующих неравенств:

Если приведенные неравенства (или хотя бы одно из них) не выполняются, то исключается тот фактор хj, или xk, связь которо­го с результативным признаком у будет менее тесной.

8. Отобранные факторы включаются в модель множествен­ной зависимости. При этом следует учитывать, что число факто­ров, включаемых в модель, должно быть в 5 - 6 раз меньше, чем число единиц, входящих в совокупность.

Линейное уравнение множественной зависимости имеет сле­дующий вид:

9. Для измерения степени тесноты связи между изменениями величины результативного признака (у) и изменениями значений факторных признаков определяется коэффициент множественной (совокупной) корреляции (R).

Для случая зависимости результативного признака от двух факторных признаков формула совокупного коэффициента кор­реляции имеет вид:

Величина R2 называется еще коэффициентом детерминации; она показывает, в какой мере вариация результативного признака обусловлена влиянием признаков-факторов, включенных в урав­нение множественной зависимости.

Величина совокупного коэффициента корреляции изменяет­ся в пределах от 0 до 1 и численно не может быть меньше, чем любой из образующих его парных коэффициентов корреляции. Чем ближе он к единице, тем меньше роль неучтенных в модели факторов и тем более оснований считать, что параметры регрес­сионной модели отражают степень эффективности включенных в нее факторов.

Кроме совокупного коэффициента корреляции познавательное значение имеют частные коэффициенты корреляции, позволяющие установить степень тесноты связи между результативным призна­ком у и каждым из факторных признаков при исключении искажа­ющего влияния других факторных признаков. Следовательно, ко­эффициенты частной корреляции отражают степень «чистого» вли­яния факторного признака на результативный признак. Для их рас­чета могут быть использованы парные коэффициенты корреляции.

Для случая зависимости результативного признака y от двух признаков-факторов (x1 и x2)определяются два коэффициента частной корреляции:

• частный коэффициент корреляции между результативным признаком y и фактором х при элиминировании фактора x1:

частный коэффициент корреляции между результативным признаком у и фактором x2 при элиминировании фактора x1:

Для общего случая частные коэффициенты корреляции опре­деляются по формуле

где --- коэффициент детерминации результативного признака yс комп­лексом факторных признаков x1, x2,…, x k-1, xk;

--- коэффициент детерминации результативного признака с комплек­сом признаков x1, x2,…, x k-1;

--- частный коэффициент корреляции результативного признака y с факторным признаком xk при исключении влияния факторных при­знаков x1, x2,…, x k-1.

Величина частного коэффициента корреляции лежит в пре­делах от 0 до 1, а знак определяется знаком соответствующих параметров регрессии.

Рассчитывая величины частных коэффициентов корреляции, следует иметь в виду, что каждый из них по своей абсолютной величине не может быть больше величины коэффициента мно­жественной (совокупной) корреляции

 






ТОП 5 статей:
Экономическая сущность инвестиций - Экономическая сущность инвестиций – долгосрочные вложения экономических ресурсов сроком более 1 года для получения прибыли путем...
Тема: Федеральный закон от 26.07.2006 N 135-ФЗ - На основании изучения ФЗ № 135, дайте максимально короткое определение следующих понятий с указанием статей и пунктов закона...
Сущность, функции и виды управления в телекоммуникациях - Цели достигаются с помощью различных принципов, функций и методов социально-экономического менеджмента...
Схема построения базисных индексов - Индекс (лат. INDEX – указатель, показатель) - относительная величина, показывающая, во сколько раз уровень изучаемого явления...
Тема 11. Международное космическое право - Правовой режим космического пространства и небесных тел. Принципы деятельности государств по исследованию...



©2015- 2024 pdnr.ru Все права принадлежат авторам размещенных материалов.