怎样应用数学方法进行预测
在现代生活中,作计划、办事情,往往离不开预测。工厂要通过预测产品的市场需求状况和原料供应状况才能安排生产;农民种田要预测天气和病虫害等情况,才能确定种植计划,争取丰收。总之,正确的决策,离不开正确的预测。
预测免不了出现偏差。偏差一般有两种:一种是或然性偏差,它是由种种偶然因素造成的,处理这种偏差通常采用数理统计的方法;另一种是系统性偏差,这种偏差有的是由于预测者的种种局限所造成,有的则是由于未来出现了预测者意料不到的情况。这种系统偏差有的可以避免,有的就难以避免。因此,预测者应该对预测结果作实事求是的估计。
目前,预测的方法多达几百种,常用的也有几十种。这里,我们通过一个例子来介绍其中的一个常用方法——最小二乘法。
设某县在建筑行业方面最近几年的就业人数如下表所示:
![]() |
试问:1989、1990、1991三年该县建筑业就业人数的情况如何?
首先建立坐标系:以横坐标表示年度为简便起见,将1981,…,1988分别用1,…,8来表示);以纵坐标表示就业人数y(单位:千人)。然后,把表上数据在坐标系上用点来标出。
![]() |
如果我们能画出一条曲线(包括直线),使坐标系上已有的点尽可能地在这条曲线上,并且以后年份所标出的点也会落在这条曲线上,那么这条曲线就会起到预报情况的作用。
如何画出这条曲线呢?最好的办法是求出它的方程。在上面的例子中,我们所看到的点列似乎排成了一条直线,所以可以考虑选用直线来作为所要求的曲线。于是问题就在于求出这条直线的方程。
设有n个观察点(t1,Y1),(t2,Y2),…,(tn,Yn),所求的直线方程是y=a+bt,我们希望当t=ti时,yi=a+bti与Yi尽可能接近,即yi与Yi的离差(差的绝对值)ei=|yi-Yi|尽可能地小。这只要使离差的总和$\sum {{e_i}} = {e_1} + {e_2} + \cdots + {e_n}$达到最小即可。但带绝对值的式子在数学上不好处理,因此改为要求离差的平方之和达到最小。就是说,使
$\eqalign{ & Q = e_1^2 + \cdots + e_n^2 \cr & = {\left( {{Y_1} - \left( {a + b{t_1}} \right)} \right)^2} + \cdots + {\left( {{Y_n} - \left( {a + b{t_n}} \right)} \right)^2} \cr} $
达到最小。
根据微积分学知道,要使Q达到最小,a和b应该满足如下两个方程:
![]() |
其中,
$\sum {{t_i}} = {t_1} + \cdots + {t_n}\sum {{Y_i}} = {Y_1} + \cdots + {Y_n}$,
$\sum {t_i^2} = t_1^2 + \cdots + t_n^2\sum {{t_i}{Y_i}} = {t_1}{Y_1} + \cdots + {t_n}{Y_n}$。
在上述例子中,
$n = 8\sum {{t_i}} = {t_1} + \cdots + {t_8} = 1 + 2 + \cdots + 8 = 36$,
$\sum {{Y_i}} = 214 + 223 + \cdots + 276 = 1944$,
$\sum {t_i^2} = {1^2} + {2^2} + \cdots + {8^2} = 204$,
$\sum {{t_i}{Y_i}} = 1 \times 214 + 2 \times 223 + \cdots + 8 \times 276 = 9114$。
代入方程组(1)中,得
![]() |
解此方程组,得
a=203.7865,6=8.7143,
因此,最佳的拟合直线方程是
y=203.8+8.7t。(2)
这里a,b的值按四舍五入法作了近似处理。
用t=9,10,11分别代入方程(2),就得到如下的预测结果:
![]() |
需要注意的是,这里的预测结果仅仅是根据历史资料用最小二乘法得到的,它没有考虑影响就业人数的诸因素在未来的几年中将会有何种变化。因此,只有在影响就业人数的重要因素不发生突变的条件下,这种预测结果才是合理的。