logo
лекции 2-й семестр

7.2. Методы исследования операций в управлении инновационными проектами

Рассмотрим особенности применения теории исследования операций на примере трех известных методик прогнозирования изменений неких переменных как функций времени:

Используем следующие основные обозначения:

yt - действительное (или наблюдаемое) значение случайной величиныyв момент времениt,

y*t- расчетное значение (оценка) случайной величины y в момент времениt,

t- случайный компонент (или шум) в момент времениt.

Прогнозирование с использованием скользящего среднего. При использовании этой методики основное предположение состоит в том, что временной ряд является устойчивым в том смысле,что его члены являются реализациями следующего случайного процесса:

yt = b + t,

где b -неизвестный постоянный параметр, который оценивается на основе представленной информации. Предполагается, что случайная ошибкаtимеет нулевое математическое ожидание и постоянную дисперсию. Кроме того, предполагается, что данные для различных периодов времени не коррелированны.

Предполагает, что последние nнаблюдений являются равнозначно важными для оценки параметраb.Другими словами, если в текущий момент времениtпоследниеn наблюдений естьyt-n+1, yt-n+2 , ... , yt,тогда оцениваемое значение для моментаt+1вычисляется по формуле:

y*t+1 = (yt-n+1 + yt-n+2 + ... + yt) / n.

Не существует четкого правила для выбора числа n- базы метода, использующего скользящее среднее. Если есть весомые основания полагать, что наблюдения в течение достаточно длительного времени удовлетворяют моделиyt = b + t, то рекомендуется выбирать большие значенияn.Если же наблюдаемые значения удовлетворяют приведенной модели в течение коротких периодов времени, то может быть приемлемым и малое значениеn. На практике величинаn обычно принимается в пределах от 2 до 10.

Пример 1.

В таблице представлены объемы спроса на некое изделие за прошедшие 24 месяца. Необходимо с помощью метода скользящего среднего дать прогноз объема спроса на следующий месяц (здесь t = 25).

Месяц t

Спрос yt

Месяц t

Спрос yt

1

46

13

54

2

56

14

42

3

54

15

64

4

43

16

60

5

57

17

70

6

56

18

66

7

67

19

57

8

62

20

55

9

50

21

52

10

56

22

62

11

47

23

70

12

56

24

72

Чтобы проверить применимость метода скользящего среднего, проанализируем приведенные данные. На рис. 20 нанесены значения временного ряда yt.График показывает, что наблюдается тенденция к возрастанию значенийytс течением времени. Это, вообще-то, означает, что скользящее среднее не будет хорошим предсказателем для будущего спроса. В частности использование большой базы n для скользящего среднего неприемлемо в этом случае, т.к. это приведет к подавлению наблюдаемой тенденции в изменении данных. Следовательно, если мы используем небольшое значение для базыn,то будем находиться в лучшем положении с точки зрения отображения упомянутой тенденции в изменении данных.

Если мы используем значение n = 3 в качестве базы скользящего среднего, то оценка спроса на следующий месяц (t = 25) будет равна средней величине спроса за 22, 23 и 24 месяцы:

y*25 = (62+70+72)/3 = 68 единиц.

Оценка величины спроса в 68 единиц для 25 месяца будет использоваться также при прогнозе спроса для t = 26:

Рис.20

y*26 = (70+72+68)/3 = 70 единиц.

Когда значение реального спроса в 25 месяце будет известно, его следует использовать для вычисления новой оценки спроса для 26 месяца в виде средней величины спроса 23, 24 и 25 месяцев.

Метод экспоненциального сглаживанияпредполагает, что вероятностный процесс определяется модельюyt = b + t; это предположение использовалось и при рассмотрении метода скользящего среднего. Метод экспоненциального сглаживания разработан для того, чтобы устранить недостаток метода скользящего среднего, который состоит в том, что все данные, используемые при вычислении среднего, имеют одинаковый вес. В частности, метод экспоненциального сглаживания приписывает больший весовой коэффициент самому последнему наблюдению.

Определим величину (0 < < 1) как константу сглаживания, и пусть известны значения временного ряда для прошедшихtмоментов времениy1, y2, ... , yt. Тогда оценкаy*t+1для момента времениt+1вычисляется по формуле:

y*t+1 = yt + (1 - )yt-1 + (1 - )2yt-2 + ... .

Коэффициенты при yt, yt-1, yt-2, ... постепенно уменьшаются, тем самым эта процедура приписывает больший вес последним (по времени) данным.

Формулу для вычисления y*t+1можно привести к следующему (более простому) виду:

y*t+1 = yt + (1 - ){yt-1 + (1 - )yt-2 + (1 - )2yt-3 + ... } = yt + (1 - )y*t.

Т.о., значение y*t+1можно вычислить рекуррентно на основании значенияy*t.Вычисления в соответствии с этим рекуррентным уравнением начинаются с того, что пропускается оценкаy*tдляt= 1 и в качестве оценки дляt= 2 принимается наблюденная величина дляt= 1, т.е.y*2 = y1. В действительности же для начала можно использовать любую разумную процедуру. Например, часто в качестве оценкиy*0берется усредненное значениеyiпо “приемлемому” числу периодов в начале временного ряда.

Выбор константы сглаживания является решающим моментом при вычислении значения прогнозируемой величины. Большее значениеприписывает больший вес последним наблюдениям. На практике значениеберут в пределах от 0.01 до 0.30.

Пример 2.

Применим метод экспоненциального сглаживания к данным из прим. 1 при = 0.1.

В таблице содержатся результаты вычислений. При вычислениях пропускается y*1и принимается, чтоy*2 = y1 = 46единиц.

i

yi

y*i

i

yi

y*i

1

46

-

13

54

0.156+0.951.63 = 52.07

2

56

46

14

42

0.154+0.952.07 = 52.26

3

54

0.156+0.946 = 47

15

64

0.142+0.952.26 = 51.23

4

43

0.154+0.947 = 47.7

16

60

0.164+0.951.23 = 52.50

5

57

0.143+0.947.7 = 47.23

17

70

0.160+0.952.50 = 53.26

6

56

0.157+0.947.23 = 48.21

18

66

0.170+0.953.26 = 54.93

7

67

0.156+0.948.21 = 48.98

19

57

0.166+0.954.93 = 56.04

8

62

0.167+0.948.98 = 50.79

20

55

0.157+0.956.04 = 56.14

9

50

0.162+0.950.79 = 51.91

21

52

0.155+0.956.14 = 56.02

10

56

0.150+0.951.91 = 51.72

22

62

0.152+0.956.02 = 55.62

11

47

0.156+0.951.72 = 52.15

23

70

0.162+0.955.62 = 56.26

12

56

0.147+0.952.15 = 51.63

24

72

0.170+0.956.62 = 57.63

Из приведенных данных следует, что оценка для t = 25 равна

y*25 = y24 + (1 - )y*24= 0.172 + 0.957.63 = 59.07 единиц.

Эта оценка значительно отличается от полученной с помощью метода скользящего среднего (68 единиц). Большее значение для даст оценку, более близкую к оценке метода скользящего среднего.

Регрессионный анализопределяет связь между зависимой переменной (например, спросом на продукцию) и независимой переменной (например, временем). Часто применяемая формула регрессии, описывающая зависимость между переменнойy и независимой переменнойx,имеет вид:

Y = b0 + b1x + b2x2 + ... + bnxn + ,

где b0, b1, ... , bn- неизвестные параметры. Случайная ошибкаимеет нулевое математическое ожидание и постоянную дисперсию (т.е. дисперсия случайной величиныодинакова для всех наблюдаемых значенийу).

Самая простая регрессионная модель предполагает, что зависимая переменная линейна относительно независимой переменной, т.е.

y* = a + bx

Константы aиbопределяются из временного ряда с использованием метода наименьших квадратов, в соответствии с которым находятся значения этих констант, доставляющих минимум сумме квадратов разностей между наблюденными и вычисленными величинами. Пусть(yi, xi)представляет i-ю точку исходных данных временного ряда,i= 1,2,...,n. Определим сумму квадратов отклонений между наблюденными и вычисленными величинами.

n

S = (yia - bxi)2

i=1

Значения коэффициентов aиbопределяются из соответствующих условий минимума функцииS, которые представимы в виде следующих уравнений.

n

S/a = -2 (yi – a - bxi) = 0

i=1

n

S/b = -2  (yi – a - bxi)xi = 0

i=1

После алгебраических преобразований получим следующее решение данных уравнений

n __ n _ _ _

b = ( yixi – nyx) / ( x2i - nx2) ; a = y - bx,

i=1 i=1

где

_ n _ n

x = xi / n, y = yi / n.

i=1 i=1

Приведенные соотношения показывают, что сначала необходимо вычислить b, а затем величину коэффициентаa.

Вычисленные значения aиbимеют силу при любом вероятностном распределении случайных величинyi.Однако еслиyiявляется нормально распределенной случайной величиной с постоянным стандартным отклонением, можно установить доверительный интервал для среднего значения оценки приx = x0 (т.е. дляy0 = a + bx) в виде интервала

_________________________

__ / _ _

(a + b0) ta / 2, n-2 ni = 1(yi - y*i)2 / (n-2) 1/n + (x0 - x)2 / (ni = 1xi2 - nx2)

Выражение (yi - y*i)представляет собой отклонениеi-го наблюдения зависимой переменной от его соответствующей оценки.

Мы заинтересованы в установлении для прогнозируемых значений зависимой переменной y соответствующих им интервалов предсказания (скорее чем доверительного интервала для среднего значения оценки). Как и следовало ожидать, интервал предсказания для значения прогнозируемой величины является более широким, чем доверительный интервал для среднего значения оценки. Действительно, формула для интервала предсказания такая же как и для доверительного интервала, но с той лишь разницей, что член1/nпод вторым квадратным корнем заменен на(n+1)/n.

Чтобы проверить, насколько линейная модель y* = a + bxсоответствует исходным данным, необходимо вычислить коэффициент корреляцииrпо формуле:

____________________

n __ / n _ n _

r = (yixi - nyx) / ( xi2 - nx2)(yi2 - ny2)

i=1 i=1 i=1

где -1 r 1.

Если r = 1, тогда линейная модель идеально подходит для описания зависимости междуyиx. В общем случае, чем ближе| r |к 1, тем лучше подходит линейная модель. Если жеr = 0, величиныyиxмогут быть независимыми. В действительности равенствоr = 0 является лишь необходимым, но не достаточным условием независимости, т.к. возможен случай, когда для двух зависимых величин коэффициент корреляции будет равен 0.

Пример 3.

Применим модель линейной регрессии к данным из примера 1, которые для удобства приведены в таблице

Месяц, xi

Спрос yi

Месяц xi

Спрос yi

1

46

13

54

2

56

14

42

3

54

15

64

4

43

16

60

5

57

17

70

6

56

18

66

7

67

19

57

8

62

20

55

9

50

21

52

10

56

22

62

11

47

23

70

12

56

24

72

Из данных этой таблицы получаем следующее

24 24 24 24 24

 yixi = 17842,  xi = 300,  x2i = 4900,  yi = 1374,  y2i = 80254.

i=1 i=1 i=1 i=1 i=1

Следовательно,

x = 12.5, y = 57.25,

b = (17842 - 2457.2512.5)/(4900 - 24(12.5)2),

a = 57.25 - 0.5812.5 = 50.

Таким образом, оценка спроса представляется формулой

y* = 50 + 0.58x.

Например, при x = 25 получаем y* = 50+0.5825 = 64.5 единицы.

Вычисляем коэффициент корреляции:

_________________________________

r = (17842 - 2457.2512.5) /(4900 - 24(12.5)2)(80.254 - 24(57.25)2) = 0.493

Относительно малое значение коэффициента корреляции r указывает на то, что линейная модельy*= 50 + 0.58x является не совсем подходящей для исходных данных. Считается, как правило, что линейная модель подходит для исходных данных, если 0.75| r | 1.

Предположим, что необходимо вычислить 95% доверительный интервал для полученной линейной оценки. Для этого надо сначала вычислить сумму квадратов отклонений от аппроксимирующей прямой. В таблице приведены результаты этих вычислений.

*

( - *)

1

46

50.58

20.98

2

56

51.16

23.43

3

54

51.74

5.11

4

43

54.32

86.86

5

57

52.90

16.81

6

56

53.48

6.35

7

67

54.06

152.77

8

62

54.64

54.17

9

50

55.22

27.25

10

56

55.80

0.04

11

47

56.38

87.98

12

56

56.96

0.92

13

54

57.54

12.53

14

42

58.12

259.85

15

64

58.70

28.09

16

60

59.28

0.52

17

70

59.86

102.82

18

66

60.44

30.91

19

57

61.02

16.16

20

55

61.60

43.56

21

52

62.18

103.63

22

62

62.76

0.58

23

70

63.34

44.53

24

72

63.92

65.29

24

 (yi - y*i)2 = 1088.70

i=1

Табличное значение критерия Стьюдента t0.025,22= 2.074. Следовательно, искомый доверительный интервал имеет вид:

__________ _________________________________

(50 + 0.58x0)2.0741088.7/(24-2)1/24 + [(x0- 12.5)2/ (4900 - 24(12.5)2)].

Это выражение можно упростить, в результате получим следующее:

______________________

(50 + 0.58x0)14.590.042 + [(x0- 12.5)2/ 1150.

Чтобы продемонстрировать применение этой формулы, вычислим интервал предсказания для оценки спроса на следующий месяц (x0 = 25). В этом случае коэффициент 0.042 должен быть заменен на (1.042)2, и соответствующий интервал предсказания определяется как (64.515.82) или (46.68, 80.32). Следовательно, можно сказать, что с вероятностью 95% спрос для x = 25 будет находиться между 46.68 и 80.32 единицами.

Выше рассмотрены три метода прогнозирования хода инновационного проекта, основанных на теории исследования операций. Применимость каждого из них связана с характеристиками временного ряда, представляющего исходные данные. Ознакомиться с другими методиками прогнозирования можно, например, по […].