Информационный сайт

 

Реклама
bulletinsite.net -> Книги на сайте -> Бизнесмену -> Чураков Е.П. -> "Математические методы обработки экспериментальных данных в экономике" -> 4

Математические методы обработки экспериментальных данных в экономике - Чураков Е.П.

Чураков Е.П. Математические методы обработки экспериментальных данных в экономике — М.: Финансы и статистика, 2004. — 240 c.
ISBN 5-279-02745-6
Скачать (прямая ссылка): matematicheskiemetodiobrabotki2004.pdf
Предыдущая << 1 .. 2 3 < 4 > 5 6 7 8 9 10 .. 73 >> Следующая

9
(1.1)
и
(1.2)
Уп
,(к)
Здесь и далее символ Rax6 используется для обозначения мно-
жества матриц размерностью а на Ь.
Теперь можем более определенно сформулировать существо проблемы восстановления зависимостей. Располагая экспериментальными данными в объеме (1.1), (1.2), требуется разработать математическую модель, устанавливающую связь между эндогенными Y и экзогенными X переменными и учитывающую присутствие неконтролируемых латентных переменных. Разумеется, это чисто качественная формулировка замысла и она будет уточняться в процессе последующего изучения проблемы. Однако ряд вопросов, порожденных сформулированным намерением, можно выявить уже сейчас. Основные из них следующие.
1. С какой целью строится математическая модель?
2. Имеется ли вообще какая-либо связь между всеми из введенных переменных или только между некоторыми из них? Как оценить степень этой связи?
3. В классе каких математических моделей предполагается искать зависимость эндогенных переменных от экзогенных?
4. Как адаптировать выбранную в некотором классе модель к экспериментальным данным (1.1), (1.2), т. е. как установить конкретный вид модели по экспериментальным данным?
5. Как оценить эффективность построенной модели и в каком смысле эту эффективность следует понимать?
Наиболее просто дать ответ на первый вопрос. Будем полагать, что математическая модель строится для того, чтобы можно было вычислять значения эндогенных переменных при любых
10
значениях экзогенных переменных, не охваченных экспериментальными данными (1.1), (1.2), и при необходимости управлять эндогенными переменными путем выбора надлежащих значений экзогенных переменных. Подобные цели формируют задачи восстановления (по иной терминологии — интерполяции) и прогноза (предсказания, экстраполяции). Ответы на остальные вопросы дают методы регрессионного (и частично корреляционного) анализа.
1.2. Функция регрессии и регрессионная модель эндогенных переменных
Подчеркнем прежде всего, что эндогенные переменные даже при фиксированных (принявших определенные конкретные значения ) экзогенных переменных являются случайными величинами. Это утверждение понимается в следующем смысле. Пусть в некотором эксперименте экзогенные переменные приняли значение х (Х = х ), а эндогенные переменные - у (У= у ). Если теперь провести второй эксперимент, в котором опять же обеспечить равенство X = х , то из-за влияния неучитываемых латентных переменных и неизбежных ошибок в результатах измерений окажется Уфу . Аналогичная ситуация возникнет в третьем и последующих экспериментах. Таким образом, последовательность значений эндогенных переменных, полученных в ряде экспериментов при одном и том же значении экзогенных переменных, следует рассматривать как реализации случайной величины У, имеющей некоторую, как правило, неизвестную плотность вероятностей со(у | х) или короче со(у | х). Если бы условная плот-
ность со(у I х) случайной величины Убыла известна, можно было бы попытаться найти значение эндогенной переменной У, соответствующее значению экзогенной переменной Х — х, поступив следующим образом. Отметим прежде всего, что точное значение эндогенной переменной Уиз-за влияния латентных переменных принципиально найти нельзя. Можно отыскать некоторую величину У, в каком-то смысле близкую к У, но не равную У. Вектор У—У определяет отклонение того, что можно найти, от того, что хотелось бы найти. В таких случаях векторУ называют оценкой вектора У, а разность У — У — ошибкой оценивания. Величину ошибки оценивания как вектора принято характеризовать нормой || У - У ||, понимаемой для определенности в евклидовом
11
смысле. Эта норма в силу указанных причин является случайной величиной. Тогда в качестве меры близости величин У иУ можно выбрать какую-либо неслучайную характеристику случайной величины || У — У|| или, что математически удобнее, величины ЦК—У||2. Наиболее простой такой характеристикой является среднее значение (математическое ожидание), найденное при условии Х=х, т.е. при условии, что экзогенные переменные равны величине л:: M{\\Y—У||21 Х = лс}, где М — символ усреднения. В развернутом виде
Л/{|| Y - У ||21X = X) = J IIУ~ Y ||2 соО-1X = x)dy, (1.3)
—оо
где дифференциал dy понимается как многомерный dy = dy11 'dy<2)... dyW и соответственно интеграл понимается как ^-мерный.
Очевидно, оценка У в среднем наиболее «близка» к У, если она минимизирует величину (1.3), т.е. находится в результате решения оптимизационной задачи
Л/{||У-У ||2| * = ШІП. (1.4)
YeRk
Если в качестве нормы принять евклидову, т.е. ||У — У ||2 = = (У—У)Т(У-У), то необходимое условие минимума в задаче (1.4) сведется к уравнению
VM{||y-y||2l Х = х) = Л/{У(У-У)Т(У-У)|*=*} =
= _2Л/{(У-У)|*=д:} = 0ъ (1,5)
где V — градиент по вектору Y; О* - А:-мерный нулевой вектор.
Так как в (1.5) вектор Y не зависит от F, то из (1.5) непосредственно получаем
Y = M{Y\X = x)=] уы(у\Х = х)йу. (1.6)
—оо
Функцию У=У(дс), определяемую соотношением (1.6) и по существу представляющую собой условное среднее вектора У, принято называть функцией регрессии, или просто регрессией величины Уна Л". Традиционно ее обозначают символом ту(х). Заметим
Предыдущая << 1 .. 2 3 < 4 > 5 6 7 8 9 10 .. 73 >> Следующая
Реклама
Авторские права © 2009 AdsNet. Все права защищены.
Rambler's Top100