Скачать

Прогноз среднего значения цены

Задача 1

Магазин торгует подержанными автомобилями. Статистика их потребительских цен накапливается в базе данных. В магазин пригоняют на продажу очередную партию небольших однотипных автомобилей. Как назначить их цену? Статистический подход позволяет дать прогноз среднего значения цены и доверительных интервалов для него.

Цена автомобиля зависит от множества факторов. К числу объясняющих переменных можно отнести, например, модель автомобиля, фирму-производитель, регион производства (Европа, США, Япония), объем двигателя, фирму-производитель, регион производства (Европа, США, Япония), объем производителя, количество цилиндров, время разгона до 100 км/час, пробег, потребление горючего, год выпуска и т.д. Первые из названных переменных очень важны при ценообразовании, но они – качественные. Традиционный регрессионный анализ, рассматриваемый в этом задании, предназначен для количественных данных. Поэтому, не претендуя на высокую точность, не будем включать их в эконометрическую модель. Сделаем выборку, например, только для автомобилей одной фирмы-производителя. Пусть, например, оказалось, что продано n= 16 таких автомобилей. Для упрощения выберем из базы данных цены yi (i = 1......16) проданных автомобилей и только две объясняющие переменные: возраст хi1 (i = 1, …..16) в годах и мощность двигателя хi2 (i = 1, ….16) в лошадиных силах. Выборка представлена в таблице:

I номер

yi , цена, тыс. у.е.

хi1 возраст,лет

хi2, мощность двигателя

1

115,0155
267,087
39,85,0106
4114,089
512,34,0133
68,76,094
79,35,0124
810,65,0105
911,84,0120
1010,64,0107
115,27,053
128,25,080
136,56,067
145,77,073
157,96,0100
1610,54,0118

1. Построить поля рассеяния между ценой y и возрастом автомобиля х1, между ценой y и мощностью автомобиля x2. На основе их визуального анализа выдвинуть гипотезу о виде статистической зависимости y от х1 и y от х2. Найти точечные оценки независимых параметров

а0а1 модели y = а0 + а1 х1 + ε и

β1β2 модели y = β0 + а1 х1 + δ

2. Проанализировать тесноту линейной связи между ценой и возрастом автомобиля, а также ценой и мощностью двигателя х2. Для этого рассчитать коэффициенты парной корреляции ryx1 и ryx2 и проверить их отличие от нуля при уровне значимости α = 0,1.

3. Проверить качество оценивания моделей на основе коэффициента детерминации, F- и t- критериев при уровне значимости α = 0,05 и α = 0,10.

4. Проверить полученные результаты с помощью средств Microcoft Excel.

5. С помощью уравнений регрессии рассчитать доверительные интервалы для среднего значения цены, соответствующие доверительной вероятности 0,9. Изобразить графически поля рассеяния, линии регрессии и доверительные полосы.

На продажу поступила очередная партия однотипных автомобилей. Их возраст х1 равен 3 года. Мощность двигателя х2 = 165 л.с. Рассчитать точечный и интервальный прогноз среднего значения цены поступивших автомобилей по моделям y = а0 + а1 х1 + ε и y = β0 + а1 х1 + δ с доверительной вероятностью 0,9.

Решение:

На основе поля рассеяния, построенного на основе табл. 1, выдвигаем гипотезу о том, что зависимость цены y от возраста автомобиля x1 описывается линейной моделью вида

y = а0 + а1 х1 + ε

где а0 и а1 – неизвестные постоянные коэффициенты, а ε – случайная переменная (случайное возмущение), отражающая влияние неучтенных факторов и погрешностей измерений.

Рисунок 1 – Поле рассеяния «возраст автомобиля-цена»

Аналогично, на основе анализа поля рассеяния (рис. 2), также построенного на основе таблицы 1, выдвигаем гипотезу о том, что зависимость цены y от мощности автомобиля x2 описывается линейной моделью вида

y = β0 + β1 х1 + δ


где β0 и β1 – неизвестные постоянные коэффициенты, а ε – случайная переменная (случайное возмущение), отражающая влияние неучтенных факторов и погрешностей измерений.

Рисунок 2 – Поле рассеяния «мощность автомобиля-цена»

На основе табл. 1 исходных данных для вычисления оценок параметров моделей составляется вспомогательная табл. 1.1. Воспользуемся формулами и левой частью таблицы 1.1. для нахождения оценок а0 и а1.

Так как n = 16, получаем

= 145/16=9.0625

 = 84.0/16=5.25

 = 27.5625

= 365

 = 460

i

yi

xi1

xi12

xi1 yi

yi2

i

yi

xi2

xi22

xi2 yi

1

115.02555121111155240251705
267.049423626877569522
39,85.0254996,0439,8106112361038,8
4114.01644121411897921979
512,34.01649,2151,29512,3133176891635,9
68,76.03652,275,6968,7948836817,8
79,35.02546,586,4979,3124153761153,2
810,65.02553112,36810,6105110251113
911,84.01647,2139,24911,8120144001416
1010,64.01642,4112,361010,6107114491134,2
115,27.04936,427,04115,2532809275,6
128,25.0254167,24128,2801600656
136,56.0363942,25136,5674489435,5
145,77.04939,932,49145,7735329416,1
157,96.03647,462,41157,910010000790
1610,54.01642110,251610,5118139241239
Сумма145,184.0460726,21393,15145,1161116767715327,1

Следовательно,

а1 =

а0 = 9,0625- (-1,844) * 5.25 = 18,74

Таким образом,

Аналогично находятся оценки коэффициентов второй регрессионной модели y = β0 + β1 х1 + δ. При этом используется правая часть таблицы

 = 1611/16=100,6875

 = 10137.97

= 153271,1

 = 167677

β1 =

β 0 = 9,0625- 0,0099 * 100.6875= 2.0355

Окончательно получаем:

Подставляем соответствующие значения в формулу:

ryx =


ryx1 = = 0,915

ryx2 = = 0.8

В нашей задаче t0.95;14 = 1,761

Для ryx1 получаем

 = = 0,955 <1.761

Условие не выполняется, следовательно, коэффициент парной корреляции не значим, гипотеза отвергается, между переменными отсутствует линейная связь

 = = 4.98>1.761

Условие выполняется, следовательно, коэффициент парной корреляции значимый, гипотеза подтверждается, между переменными существует сильная линейная связь

Коэффициент парной корреляции ryx связан с коэффициентом а1 уравнения регрессии

 следующим образом

ryx = a1 Sx/Sy

где Sx, Sy – выборочные среднеквадратичные отклонения случайных переменных х и y соответственно, рассчитывающиеся по формулам:

Sx1 = √ Sx12

Sx12 = 1/n ∑(xi - )2

Sy = √ Sy2

Sy2 = 1/n ∑(yi - )2


ryx1 = 0,915

ryx2 = 0,8

R2 = ryx12 = 0,8372

Вариация на 83,72 % объясняется вариацией возраста автомобиля

R2 = ryx22 = 0,64

Вариация на 64 % объясняется вариацией мощности двигателя автомобиля

Рассчитаем фактическое значение F- статистики Фишера по формуле:

F=

F== 0,768 для зависимости y от х1

F== 0,285для зависимости y от х2

Fт = 4,6

Поэтому для зависимостей y от х1и y от х2 выполняется неравенство

Fт ф

гипотеза отклоняется и признается статистическая значимость уравнения регрессии.

Для оценки статистической значимости коэффициентов регрессии используется t-критерий Стьюдента.

Для зависимости y от х1:

 = √F = √0,768 = 0,876

Поскольку это значение меньше 1,761, то принимаем нулевую гипотезу равенства нулю а1

Для зависимости y от х2:

 = √F = √0,285 = 0,533

Поскольку это значение меньше 1,761, то принимаем нулевую гипотезу равенства нулю а1

Проверка с помощью Microsoft Excel

Оценка параметра а1-1,87237Оценка параметра а018,89868
Среднеквадратическое отклонение0,200234Среднеквадратическое отклонение а01,073633

Коэффициент детерминации R2

  • Астрономии
  • Банковскому делу
  • ОБЖ
  • Биологии
  • Бухучету и аудиту
  • Военному делу
  • Географии
  • Праву
  • Гражданскому праву
  • Иностранным языкам
  • Истории
  • Коммуникации и связи
  • Информатике
  • Культурологии
  • Литературе
  • Маркетингу
  • Математике
  • Медицине
  • Международным отношениям
  • Менеджменту
  • Педагогике
  • Политологии
  • Психологии
  • Радиоэлектронике
  • Религии и мифологии
  • Сельскому хозяйству
  • Социологии
  • Строительству
  • Технике
  • Транспорту
  • Туризму
  • Физике
  • Физкультуре
  • Философии
  • Химии
  • Экологии
  • Экономике
  • Кулинарии
  • Подобное: