教材总结

第一章 线性规划

1、问题的关键

目标函数以及约束条件均为线性函数

线性规划问题是在一组线性约束条件的限制下,求一线性目标函数最大或最小的问题。 选取适当的决策变量,是建立线性规划模型的关键。

灵敏度分析:当系数有一个或几个发生变化,已求得的线性问题的最优解会有什么变化;或者这些系数在什么范围里变化的时候,线性问题的最优解不变。

2、优点

求出的最优解就是整个可行域上的全局最优解

3、缺点

4、检验

5、可以解决的问题

运输问题(产销平衡);指派问题;对偶原理与灵敏度分析;投资的收益和风险

6、求解的方法

单纯形法(通用)

第二章 整数规划

1、问题的关键

变量限制为整数

2、优点

3、缺点

4、检验

5、求解的方法

分支定界法(可求纯或混合整数线性规划);割平面法(可求纯或混合整数线性规划);隐枚举法(求解0-1整数规划);匈牙利法(解决指派问题0-1规划特殊情形);蒙特卡洛法(随机取样法,可求解各种类型的规划);

6、解决的实际问题

投资场所的确定;有两个相互排斥的约束条件;固定费用,成本最小的问题;生产与销售计划问题

第三章 非线性规划

1、问题的关键

目标函数以及约束条件中包含线性函数

线性规划最优解只能在边界达到,非线性规划最优解可能在可行域的任意一点达到

2、优点

3、缺点

有时求出的某个解虽是一部分可行域上的极值点,但不一定是整个可行域上的全局最优解。

4、检验

5、解决的问题

投资决策问题;无约束问题

6、归结成非线性规划需要注意的问题

确定供选方案;提出追求目标;给出价值标准;寻求限制条件;

7、求解的方法

迭代法;0.618法(对称搜索,逐步缩减考察的区间);一维搜索法(沿某一已知方向求目标函数的极小点);二次插值法(适用于极小化问题);解析法;梯度法(最速下降法,优点:每轮的收搜索方向都是目标函数在当前点下降最快的方向);牛顿法(优点:收敛速度快;缺点:有时不好用需要改进,计算量大);变尺度法(优点:避免了计算二阶导数矩阵及其求逆过程,比梯度法收敛速度快,对高维问题有优越性);直接法(适用于目标函数不可导或导函数的解析式难以表示)

第四章 动态规划

1、问题的关键

求解决策过程最优化的数学方法

把多阶段问题转化为一系列单阶段问题,逐个求解

最短路问题、生产计划问题、库存问题、资源分配、设备更新、排序、装载问题处理更简便 主要用于求解以时间划分阶段的动态过程的优化问题,但与时间无关的静态规划,人为引进时间因素,视为多阶段决策过程,也可以用动态规划的方法求出。

2、优点(相比于静态规划)

能够得到全局最优解;可以得到全过程及所有后部子过程的各个状态的一族最优解;能够利用经验提高求解效率

3、缺点

没有统一的标准模型;用数值方法求解时存在维数灾

4、检验

5、解决的问题

最短路问题、生产计划问题、库存问题、资源分配、设备更新、排序、装载问题、资源分配问题

第五章 图与网络

1、问题的关键

二元关系的离散系统,

网络优化研究的是网络上的各种优化模型与算法。

描述图与网络的常用表示方法:邻接矩阵表示法(网络稀疏会浪费存储空间)、关联矩阵表示法(网络稀疏会浪费存储空间)、弧表表示法(网络比较稀疏时比较方便);邻接表表示法;星形表示法。

① 星形表示法和邻接表表示法在实际算法实现中都是经常采用的。星形表示法 点是占用的存储空间较少,并且对那些不提供指针类型的语言(如 FORTRAN 语 )也容易实现。邻接表表示法对那些提供指针类型的语言(如 C 语言等)是方便 增加或删除一条弧所需的计算工作量很少, 而这一操作在星形表示法中所需的计算 量较大(需要花费 ) (m O 的计算时间) 。有关“计算时间”的观念是网络优化中需 虑的一个关键因素。

② 当网络不是简单图,而是具有平行弧(即多重弧)时,显然此时邻接矩阵表 是不能采用的。其他方法则可以很方便地推广到可以处理平行弧的情形。

2、优点

3、缺点

4、检验

5、解决的问题

最短路问题(两个指定顶点之间的最短路径,每对顶点之间的最短路径 ):求最短路已有成熟的算法:迪克斯特拉(Dijkstra)算法,其基本思想是按距 u0 从

近到远为顺序,依次求得 u0 到G 的各顶点的最短路和距离,直至 v0(或直至G 的所有 顶点) ,算法结束。为避免重复并保留每一步的计算信息,采用了标号算法。 计算赋权图中各对顶点之间最短路径,显然可以调用 Dijkstra 算法。具体方法是: 每次以不同的顶点作为起点,用 Dijkstra 算法求出从该起点到其余顶点的最短路径,反 复执行 1 ? n 次这样的操作,就可得到从每一个顶点到其它顶点的最短路径。这种算法 的时间复杂度为 o(n3) 。第二种解决这一问题的方法是由 Floyd R W 提出的算法,称 之为 Floyd 算法

最大流问题;最小费用问题和匹配问题;公路连接问题;指派问题;

中国邮递员问题(在一个赋权连通图上求一个含所有边的回路,

且使此回路的权最小。

显然,若此连通赋权图是 Euler 图,则可用 Fleury 算法求 Euler 回路,此回路即为 所求。);

旅行商问题(就是在一个赋权完全图中,找出一个有最小权的

Hamilton 圈。称这种圈为最优圈。);

运输问题;Kruskal 算法构造最小生成树 ;

最优分配问题(:在人员分派问题中,工作人员适合做的各项工作当中,效益未必一 致,我们需要制定一个分派方案,使公司总效益最大。

这个问题的数学模型是:在人员分派问题的模型中,图 G 的每边加了权

0 ) ( ≥ j i

y x w ,表示 i

x 干 j

y 工作的效益,求加权图G上的权最大的完美对集。

解决这个问题可以用库恩—曼克莱斯(Kuhn-Munkres)算法。) 完成作业期望和实现事件的概率

第六章 排队论

1、问题的关键

排队论(Queuing Theory)也称随机服务系统理论,就是为解决上述问题而发展 的一门学科。它研究的内容有下列三部分:

(i)性态问题,即研究各种排队系统的概率规律性,主要是研究队长分布、等待 时间分布和忙期分布等,包括了瞬态和稳态两种情形。

(ii)最优化问题,又分静态最优和动态最优,前者指最优设计。后者指现有排队 系统的最优运营。

(iii)排队系统的统计推断,即判断一个给定的排队系统符合于哪种模型,以便 根据排队理论进行分析研究。

2、优点

排队规则指到达排队系统的顾客按怎样的规则排队等待,可分为损失制,等待制和 混合制三种。

3、缺点

4、排队论指标

(i)平均队长:指系统内顾客数(包括正被服务的顾客与排队等待服务的顾客)的 数学期望,记作 s

L 。

(ii)平均排队长:指系统内等待服务的顾客数的数学期望,记作 q L 。

(iii)平均逗留时间:顾客在系统内逗留时间(包括排队等待的时间和接受服务的 时间)的数学期望,记作 s

W 。

(iv)平均等待时间:指一个顾客在排队系统中排队等待时间的数学期望,记作 q W 。

(v)平均忙期:指服务机构连续繁忙时间(顾客到达空闲服务机构起,到服务机 构再次空闲止的时间)长度的数学期望,记为 b T 。

还有由于顾客被拒绝而使企业受到损失的损失率以及以后经常遇到的服务强度等, 这些都是很重要的指标。

输入过程与服务时间的分布

排队系统中的事件流包括顾客到达流和服务时间流。 由于顾客到达的间隔时间和服 务时间不可能是负值,因此,它的分布是非负随机变量的分布。最常用的分布有泊松分 布、确定型分布,指数分布和爱尔朗分布。

排队模型的计算机模拟

10.1 确定随机变量概率分布的常用方法

在模拟一个带有随机因素的实际系统时, 究竟用什么样的概率分布描述问题中的随 机变量,是我们总是要碰到的一个问题,下面简单介绍确定分布的常用方法: 1

o

根据一般知识和经验,可以假定其概率分布的形式,如顾客到达间隔服从指数 分布 ) ( Exp λ ;产品需求量服从正态分布 ) , (

2

σ μ N ;订票后但未能按时前往机场登机

的人数服从二项分布 ) , ( p n B 。然后由实际数据估计分布的参数 σ μ λ , , 等,参数估计

可用极大似然估计、矩估计等方法。

2

o

直接由大量的实际数据作直方图,得到经验分布,再通过假设检验,拟合分布 函数,可用 2

χ 检验等方法。

3

o

既缺少先验知识,又缺少数据时,对区间 ) , ( b a 内变化的随机变量, 可选用 Beta

分布(包括均匀分布) 。先根据经验确定随机变量的均值μ 和频率最高时的数值(即密 -150-

度函数的最大值点)m,则 Beta 分布中的参数 2 1,α α 可由以下关系求出:

第七章 对策论

1、关键问题

解决社会经济发展所带来上的人与人之间或团体之间的竞争和矛盾问题。

对策论主要研究具有竞争性质现象的数学理论和方法。

对策问题的特征是参与者为利益相互冲突的各方, 其结局不取决于其中任意一方的 努力而是各方所采取的策略的综合结果。

第八章 层次分析法

1、主要解决的问题

层次分析法是对一些较为复杂、较为模糊的问题作出决策的简易方法,它特别适用于那些难于完全定量分析的问题。一个由相互关联、相互制约的众多因素构成的复杂而往往缺少定量数据的系统,通常采用层次分析法。

运用层次分析法建模,大体上可按下面四个步骤进行:

(i)建立递阶层次结构模型;

(ii)构造出各层次中的所有判断矩阵;

(iii)层次单排序及一致性检验;

(iv)层次总排序及一致性检验。

在应用层次分析法研究问题时,遇到的主要困难有两个: (i)如何根据实际情况 抽象出较为贴切的层次结构; (ii)如何将某些定性的量作比较接近实际定量化处理。

2、缺点

层次分析法也有其局限性, 主要表现在:

(i)它在很大程度上依赖于人们的经验,主观因素的影响很大,它至多只能排除思维 过程中的严重非一致性,却无法排除决策者个人可能存在的严重片面性。 (ii)比较、 判断过程较为粗糙,不能用于精度要求较高的决策问题。AHP 至多只能算是一种半定 量(或定性与定量结合)的方法。

第九章 插值与拟合

1、主要问题

插值:求过已知有限个数据点的近似函数。

拟合:已知有限个数据点,求近似函数,不要求过已知数据点,只要求在某种意义 下它在这些点上的总偏差最小。

2、插值的方法

拉格朗日多项式插值、牛顿插值(优点:每增加一个节点,插值多项式只增加一项)、分段线性插值、Hermite 插值(对插值函数,不仅要求它在节点处与函数同值,而且要求它与函数有相同的一阶、二阶甚至更高阶的导数值)和三次样条插值(都要求曲线具有较高的光滑程度,不仅要连续,而且要有连续的曲率)。

3、拟合

曲线拟合的最小二乘法,线性最小二乘法;多项式拟合方法

第十章 数据的统计和分析

1、主要问题

数理统计研究的对象是受随机因素影响的数据,以下数理统计就简称统计,统计是 以概率论为基础的一门应用学科。

面对一批数据如何进行描述与分析, 需要掌握参数估计和假设检验这两个数理统计 的最基本方法。

统计量中最重要、最常用的是均值和标准差,由于样本是随机变量,它们作为样本 的函数自然也是随机变量,当用它们去推断总体时,有多大的可靠性就与统计量的概率 分布有关,因此我们需要知道几个重要分布的简单性质。

正态分布(连续性、即在大量相互

独立的、作用差不多大的随机因素影响下形成的随机变量,其极限分布为正态分布)。

2、假设检验

统计推断的另一类重要问题是假设检验问题。 在总体的分布函数完全未知或只知其

形式但不知其参数的情况, 为了推断总体的某些性质, 提出某些关于总体的假设。 例如, 提出总体服从泊松分布的假设,又如对于正态总体提出数学期望等于 μ0 的假设等。假 设检验就是根据样本对所提出的假设做出判断:是接受还是拒绝。这就是所谓的假设检 验问题。

单个总体 N(μ,?) 均值μ 的检验

T检验 2

?2 未知,关于μ 的检验(t检验)

在 Matlab 中t检验法由函数 ttest 来实现,命令为

[h,p,ci]=ttest(x,mu,alpha,tail)

Z检验

?2 已知,关于μ 的检验(Z 检验)

在 Matlab 中Z 检验法由函数 ztest 来实现,命令为

[h,p,ci]=ztest(x,mu,sigma,alpha,tail)

第十一章 方差分析

1、关键的问题

用数理统计分析试验结果、鉴别各因素对结果影响程

度的方法称为方差分析(Analysis Of Variance) ,记作 ANOVA。

人们关心的试验结果称为指标, 试验中需要考察、 可以控制的条件称为因素或因子, 因素所处的状态称为水平。

2、单因素方差分析

只考虑一个因素 A对所关心的指标的影响, A取几个水平,在每个水平上作若干

个试验,试验过程中除 A外其它影响指标的因素都保持不变(只有随机因素存在) ,我 们的任务是从试验结果推断,因素 A对指标有无显著影响,即当 A取不同水平时指标 有无显著差别。

A取某个水平下的指标视为随机变量,判断 A取不同水平时指标有无显著差别, 相当于检验若干总体的均值是否相等。

3、双因素方差分析

如果要考虑两个因素 B A, 对指标的影响, B A, 各划分几个水平,对每一个水平组 合作若干次试验,对所得数据进行方差分析,检验两因素是否分别对指标有显著影响, 或者还要进一步检验两因素是否对指标有显著的交互影响。

第十二章 回归分析

1、主要的问题

从数理统计的观点看,这里涉及的都是随机变量,我们根据一个样本计算出的那些 系数,只是它们的一个(点)估计,应该对它们作区间估计或假设检验,如果置信区间 太大,甚至包含了零点,那么系数的估计值是没有多大意义的。另外也可以用方差分析 方法对模型的误差进行分析,对拟合的优劣给出评价。简单地说,回归分析就是对拟合 问题作的统计分析。

具体地说,回归分析在一组数据的基础上研究这样几个问题:

(i)建立因变量 y与自变量 m x x x , , , 2 1 L 之间的回归模型(经验公式) ; (ii)对回归模型的可信度进行检验;

(iii)判断每个自变量 ) , , 2 , 1 ( m i xi

L = 对 y的影响是否显著;

(iv)诊断回归模型是否适合这组数据;

(v)利用回归模型对 y进行预报或控制。

一元线性回归的模型为

y??0??1x??

显著性检验

回归模型的线性关系检验

在拟合回归方程之前, 我们曾假设数据总体是符合线性正态误差模型的, 也就是说, y与x之间的关系是线性关系,即

yi??0??1xi??i

多元线性回归分析的模型为

y??0??1x1?...??mxm??

4.2.2 多元二项式回归

统计工具箱提供了一个作多元二项式回归的命令rstool, 它也产生一个交互式画面, 并输出有关信息,用法是

rstool(x,y,model,alpha)

第十三章 微分方程

1、主要问题

1. 根据实际要求确定要研究的量(自变量、 未知函数、 必要的参数等)并确定坐标系。

2. 找出这些量所满足的基本规律(物理的、几何的、化学的或生物学的等等)。

3. 运用这些规律列出方程和定解条件。

2、列方程的方法

列方程常见的方法有:

(i)按规律直接列方程

在数学、力学、物理、化学等学科中许多自然现象所满足的规律已为人们所熟悉, 并直接由微分方程所描述。如牛顿第二定律、放射性物质的放射性规律等。我们常利用 这些规律对某些实际问题列出微分方程。

(ii)微元分析法与任意区域上取积分的方法

自然界中也有许多现象所满足的规律是通过变量的微元之间的关系式来表达的。 对 于这类问题,我们不能直接列出自变量和未知函数及其变化率之间的关系式,而是通过 微元分析法, 利用已知的规律建立一些变量 (自变量与未知函数) 的微元之间的关系式, 然后再通过取极限的方法得到微分方程, 或等价地通过任意区域上取积分的方法来建立 微分方程。

(iii)模拟近似法

在生物、经济等学科中,许多现象所满足的规律并不很清楚而且相当复杂,因而需 要根据实际资料或大量的实验数据,提出各种假设。在一定的假设下,给出实际现象所 满足的规律,然后利用适当的数学方法列出微分方程。

2、主要解决的问题

火箭速度问题;人口模型;阻滞增长模型;战争模型

第十四章 稳定状态模型

1、主要的问题

研究稳定状态下的特征,以及时间充分长后动态过程的变化趋势;譬如在什么情况下 描述过程的变量会越来越接近某些确定的数值, 在什么情况下又会越来越远离这些数值 而导致过程不稳定。为了分析这种稳定与不稳定的规律常常不需要求解微分方程,而可 以利用微分方程稳定性理论,直接研究平衡状态的稳定性就行了。

2、解决的问题

再生资源的管理和开发;资源增长模型;资源开发模型;经济效益模型;种群的相互竞争模型 ;Volterra 模型 ;

第十九章 神经网络模型

1、主要的问题

人工神经网络(artificial neural network,以下简称 NN)的基本单元的神经元模型,它有三个基本要素:

(i)一组连接(对应于生物神经元的突触) ,连接强度由各连接上的权值表示,权 值为正表示激活,为负表示抑制。

(ii)一个求和单元,用于求取各输入信号的加权和(线性组合) 。

(iii)一个非线性激活函数,起非线性映射作用并将神经元输出幅度限制在一定范 围内(一般限制在(0,1)或 (-1,1)之间) 。

此外还有一个阈值?k(或偏值bk???k)

以上作用可分别以数学式表达出来:

uk??wkixj,vk?uk??k,yk??(vk)

j?1p

2、解决的问题

蠓虫分类问题与多层前馈网络 ;向后传播算法

第二十章 偏微分方程

1、主要的问题

自然科学与工程技术中种种运动发展过程与平衡现象各自遵守一定的规律。 这些规 律的定量表述一般地呈现为关于含有未知函数及其导数的方程。 我们将只含有未知多元 函数及其偏导数的方程,称之为偏微分方程。

方程中出现的未知函数偏导数的最高阶数称为偏微分方程的阶。 如果方程中对于未 知函数和它的所有偏导数都是线性的,这样的方程称为线性偏微分方程,否则称它为非 线性偏微分方程。

初始条件和边界条件称为定解条件,未附加定解条件的偏微分方程称为泛定方程。 对于一个具体的问题,定解条件与泛定方程总是同时提出。定解条件与泛定方程作为一 个整体,称为定解问题。

§1 偏微分方程的定解问题

其最典型、最简单的形式是泊松(Poisson)方程

§2 偏微分方程的差分解法

差分方法又称为有限差分方法或网格法, 是求偏微分方程定解问题的数值解中应用 最广泛的方法之一。它的基本思想是:先对求解区域作网格剖分,将自变量的连续变化 区域用有限离散点(网格点)集代替;将问题中出现的连续变量的函数用定义在网格点 上离散变量的函数代替;通过用网格点上函数的差商代替导数,将含连续变量的偏微分 方程定解问题化成只含有限个未知数的代数方程组(称为差分格式) 。如果差分格式有 解,且当网格无限变小时其解收敛于原微分方程定解问题的解,则差分格式的解就作为 原问题的近似解(数值解) 。因此,用差分方法求偏微分方程定解问题一般需要解决以 下问题:

(i)选取网格;

(ii)对微分方程及定解条件选择差分近似,列出差分格式;

(iii)求解差分格式;

(iv)讨论差分格式解对于微分方程解的收敛性及误差估计。

边界条件的处理可以有各种方案,下面介绍较简单的两种。

(i) 直接转移

(ii) 线性插值

2、可以解决的问题

触煤反应装置内温度及转换率的分布

MATLAB 中的偏微分方程(PDE)工具箱是用有限元法寻求典型偏微分方程的数

值近似解, 该工具箱求解偏微分方程具体步骤与用有限元方法求解偏微分方程的过程是 一致的,包括几个步骤,即几何描述、边界条件描述、偏微分方程类型选择、有限元划 分计算网格、初始化条件输入,最后给出偏微分方程的数值解(包括画图) 。 求解泊松方程 ;考虑最小表面问题

第二十一章 目标规划

1.线性规划的局限性

只能解决一组线性约束条件下,某一目标只能是一个目标的最大或最小值的问题。

2.实际决策中,衡量方案优劣考虑多个目标

这些目标中,有主要的,也有次要的;有最大值的,也有最小值的;有定量的, 也有定性的;有相互补充的,也有相互对立的,LP则无能为力。

3.求解思路

(1)加权系数法

为每一目标赋一个权系数,把多目标模型转化成单一目标的模型。但困难是要确

定合理的权系数,以反映不同目标之间的重要程度。

(2)优先等级法

将各目标按其重要程度不同的优先等级,转化为单目标模型。

(3)有效解法

寻求能够照顾到各个目标,并使决策者感到满意的解。由决策者来确定选取哪一个 解,即得到一个满意解。但有效解的数目太多而难以将其一一求出。

这样在考虑产品决策时,便为多目标决策问题。目标规划方法是解决这类决策问题 的方法之一。下面引入与建立目标规划数学模型有关的概念。

1. 正、负偏差变量 2. 绝对(刚性)约束和目标约束 3. 优先因子(优先等级)与权系数4. 目标规划的目标函数

目标规划的目标函数(准则函数)是按各目标约束的正、负偏差变量和赋于相应的 优先因子而构造的。当每一目标值确定后,决策者的要求是尽可能缩小偏离目标值。因 此目标规划的目标函数只能是 minz?f(d?d)。其基本形式有三种:

对每一个具体目标规划问题, 可根据决策者的要求和赋于各目标的优先因子来构造目标 函数,以下用例子说明。

5.目标规划的一般数学模型

设 xj(j?1,2,...,n)是目标规划的决策变量,共有m个约束是刚性约束,

可能是等式约束,也可能是不等式约束。设有l个柔性目标约束,其目标规划约束的偏 差为 di?,di?(i?1,2,...,l)。设有q个优先级别,分别为 P1,P2,...,Pq。在同一个优先

??级 k P 中,有不同的权重,分别记为wkj,wkj(j?1,2,...,l) 。因此目标规划模型的一般

ql??

数学表达式为 minz?

n?P(?wdk?kjk?1j?1?j???wkjdj)

{?aijxj?(?,?)bi,i?1,...,m

j?1

建立目标规划的数学模型时,需要确定目标值、优先等级、权系数等,它都具有一 定的主观性和模糊性,可以用专家评定法给以量化。

第二十二章 模糊数学模型

1、关键的问题

模糊数学就是用数学方法研究与处理模糊现象的数学。它作为一门崭新的学科,它 是继经典数学、统计数学之后发展起来的一个新的数学学科。经过短暂的沉默和争议之 后,迅猛的发展起来了,而且应用越来越广泛。如今的模糊数学的应用已经遍及理、工、 农、医及社会科学的各个领域,充分的表现了它强大的生命力和渗透力。

统计数学是将数学的应用范围从确定性的领域扩大到了不确定性的领域, 即从必然 现象到偶然现象,而模糊数学则是把数学的应用范围从确定领域扩大到了模糊领域,即 从精确现象到模糊现象。

实际中,我们处理现实的数学模型可以分成三大类:第一类是确定性数学模型,即

模型的背景具有确定性,对象之间具有必然的关系。第二类是随机性的数学模型,即模

型的背景具有随机性和偶然性。 第三类是模糊性模型, 即模型的背景及关系具有模糊性。 主要概念:

模糊集和隶属函数

隶属函数的确定方法

模糊数学的基本思想是隶属度的思想。 应用模糊数学方法建立数学模型的关键是建 立符合实际的隶属函数。如何确定一个模糊集的隶属函数至今还是尚未解决的问题。这 里仅仅介绍几种常用的确定隶属函数的方法。

(1)模糊统计方法

模糊统计方法是一种客观方法, 主要是基于模糊统计试验的基础上根据隶属度的客 观存在性来确定的。所谓的模糊统计试验包含以下四个要素:

i) 论域 X ;

ii) X 中的一个固定元素 x0 ;

* iii) X 中一个随机变动的几何 A (普通集);

** iv) X 中一个以A 作为弹性边界的模糊集 A,对 A 的变动起着制约作用。其中

x0∈A,或者 x0?A,致使 x0 对 A的关系是不确定的。

假设做n次模糊统计试验,则可计算出 **

x0?A*的次数x0对A的隶属频率? n

实际上,当n不断增大时,隶属频率趋于稳定,其频率的稳定值称为 0 x 对 A的隶属度, 即

?A(x0)?limn??x0?A*的次数 n

(2)指派方法

指派方法是一种主观的方法, 它主要依据人们的实践经验来确定某些模糊集隶属函 数的一种方法。

如果模糊集定义在实数域R上,则模糊集的隶属函数称为模糊分布。所谓指派方 法就是根据问题的性质主观地选用某些形式地模糊分布, 再根据实际测量数据确定其中 所包含地参数,常用的模糊分布如表 1 所示。

实际中,根据问题对研究对象的描述来选择适当的模糊分布:

① 偏小型模糊分布一般适合于描述像“小,少,浅,淡,冷,疏,青年”等偏小

的程度的模糊现象。

② 偏大型模糊分布一般适合于描述像“大,多,深,浓,热,密,老年”等偏大

的程度的模糊现象。

③ 中间型模糊分布一般适合于描述像“中,适中,不太多,不太少,不太深,不

太浓,暖和,中年”等处于中间状态的模糊现象。

(3)其它方法

教材总结

教材总结

1.3 模糊关系、模糊矩阵

2.3 模糊模式识别原则

模糊模式识别大致有两种方法,一是直接方法,按“最大隶属原则”归类,主要应

用于个体的识别;另一是间接方法,按“择近原则”归类,一般应用于群体模型的识别。 §3 模糊聚类分析方法

在工程技术和经济管理中,常常需要对某些指标按照一定的标准(相似的程度或亲 疏关系等)进行分类处理。例如,根据生物的某些性态对其进行分类,根据空气的性质 对空气质量进行分类,以及工业上对产品质量的分类、工程上对工程规模的分类、图像 识别中对图形的分类、地质学中对土壤的分类、水资源中的水质分类等等。这些对客观 事物按一定的标准进行分类的数学方法称为聚类分析,它是多元统计“物以聚类”的一种分类方法。 然而, 在科学技术、 经济管理中有许多事物的类与类之间并无清晰的划分, 边界具有模糊性,它们之间的关系更多的是模糊关系。对于这类事物的分类,一般用模

糊数学方法、我们把应用模糊数学方法进行的聚类分析,称为模糊聚类分析。

3.2 模糊聚类分析法的基本步骤

Step1: 数据标准化

(1) 获取数据

(2) 数据的标准化处理

在实际问题中,不同的数据可能有不同的性质和不同的量纲,为了使原始数据能够

适合模糊聚类的要求,需要将原始数据矩阵 A作标准化处理,即通过适当的数据变换,将其转化为模糊矩阵。常用的方法有以下两种:

① 平移—标准差变换

② 平移—极差变换

Step2: 建立模糊相似矩阵

确定相似系数rij有下列方法。

(1) 数量积法

(2) 夹角余弦法

(3) 相关系数法

(4) 指数相似系数法

(5) 最大最小值法

(6) 算术平均值法

(7) 几何平均值法

(8) 绝对值倒数法

(9) 绝对值指数法

(10) 海明距离法

(11) 欧氏距离法

(12) 切比雪夫距离法

(13) 主观评分法

Step3: 聚类

所谓聚类方法就是依据模糊矩阵将所研究的对象进行分类的方法。 对于不同的置信 水平 ??[0,1] ,可以得到不同的分类结果,从而形成动态聚类图。常用的方法如下:

(1) 传递闭包法

(2) 布尔矩阵法

(3) 直接聚类法 (此方法是直接由模糊相似矩阵求出聚类图的方法)

§3 模糊决策分析方法

模糊数学中有一个研究的热点问题就是“模糊决策”, 它就是研究在模糊环境下或者 模糊系统中进行决策的数学理论和方法。 模糊决策的目标是把决策论域中的对象在模糊 环境下进行排序,或按某些模糊限制条件从决策域中选择出最优对象。

3.1 模糊综合评价法

模糊综合评价方法,是应用模糊关系合成的原理,从多个因素(指标)对被评价事物 隶属等级状况进行综合性评判的一种方法,其具体的步骤为:

(1) 确定被评判对象的因素论域U,U??u1,u2,...,un? ;

(2) 确定评语等级论域V,V?(v1,v2,...,vn);。通常评语有 = V (很高,高,较

高,?,较低,低,很低);

(3) 进行单因素评判,建立模糊关系矩阵R

(4) 确定评判因素权向量A,A?(a1,a2,..,an);A是U 中各因素对被评事物的隶属

关系,它取决于人们进行模糊综合评判时的着眼点,即根据评判时各因素的重要性分配权重;

(5) 选择评价的合成算子,将 A与R合成得到B,B?(b1b2,...,bn) 。

(6) 对模糊综合评价结果B作分析处理。

3.2 多目标模糊综合评价决策法

当被评价的对象有两个以上时, 从多个对象中选择出一个最优的方法称为多目标模 糊综合评价决策法。

评价的步骤:

① 对每个对象按上面多个目标(因素)进行模糊综合评价;

② 将模糊评语量化,计算各对象的优先度。假设模糊评价评语量化集(或评价尺 度)为S ,则各对象的优先度为:

1Nk?BkST?(Bk,Bk2,...,Bkm)?(S1,S2,...,Sm)T

第二十三章 现代优化算法

现代优化算法是 80 年代初兴起的启发式算法。这些算法包括禁忌搜索(tabusearch) ,模拟退火(simulated annealing) ,遗传算法(genetic algorithms) ,人工神经网络(neural networks) 。它们主要用于解决大量的实际应用问题。目前,这些算法在理论和实际应用方面得到了较大的发展。无论这些算法是怎样产生的,它们有一个共同的目标-求 NP-hard 组合优化问题的全局最优解。虽然有这些目标,但 NP-hard 理论限制它们只能以启发式的算法去求解实际问题。 启发式算法包含的算法很多,例如解决复杂优化问题的蚁群算法(Ant ColonyAlgorithms) 。有些启发式算法是根据实际问题而产生的,如解空间分解、解空间的限制等;另一类算法是集成算法,这些算法是诸多启发式算法的合成。现代优化算法解决组合优化问题, 如 TSP (Traveling Salesman Problem) 问题, QAP(Quadratic Assignment Problem)问题,JSP(Job-shop Scheduling Problem)问题等效果很好。

§1 模拟退火算法

模拟退火算法得益于材料的统计力学的研究成果。统计力学表明材料中粒子的不同结构对应于粒子的不同能量水平。在高温条件下,粒子的能量较高,可以自由运动和重新排列。在低温条件下,粒子能量较低。如果从高温开始,非常缓慢地降温(这个过程被称为退火) ,粒子就可以在每个温度下达到热平衡。当系统完全被冷却时,最终形成处于低能状态的晶体。

假定我们要解决的问题是一个寻找最小值的优化问题。将物理学中模拟退火的思想应用于优化问题就可以得到模拟退火寻优方法。

在模拟退火算法中应注意以下问题:

(1)理论上,降温过程要足够缓慢,要使得在每一温度下达到热平衡。但在计算机实现中,如果降温速度过缓,所得到的解的性能会较为令人满意,但是算法会太慢,相对于简单的搜索算法不具有明显优势。如果降温速度过快,很可能最终得不到全局最优解。因此使用时要综合考虑解的性能和算法速度,在两者之间采取一种折衷。

(2)要确定在每一温度下状态转换的结束准则。实际操作可以考虑当连续m次的转换过程没有使状态发生变化时结束该温度下的状态转换。 最终温度的确定可以提前定为一个

较小的值 e T ,或连续几个温度下转换过程没有使状态发生变化算法就结束。

(3)选择初始温度和确定某个可行解的邻域的方法也要恰当。

§2 遗传算法

2.1 遗传算法简介

遗传算法(Genetic Algorithms,简称 GA)是一种基于自然选择原理和自然遗传机制的搜索(寻优)算法,它是模拟自然界中的生命进化机制,在人工系统中实现特定目标的优化。遗传算法的实质是通过群体搜索技术,根据适者生存的原则逐代进化,最终得到最优解或准最优解。它必须做以下操作:初始群体的产生、求每一个体的适应度、根据适者生存的原则选择优良个体、被选出的优良个体两两配对,通过随机交叉其染色体的基因并随机变异某些染色体的基因后生成下一代群体,按此方法使群体逐代进化,直到满足进化终止条件。其实现方法如下:

(1)根据具体问题确定可行解域,确定一种编码方法,能用数值串或字符串表示可行解域的每一解。

(2)对每一解应有一个度量好坏的依据,它用一函数表示,叫做适应度函数,适应度函数应为非负函数。

(3)确定进化参数群体规模M 、交叉概率pc 、变异概率 pm、进化终止条件。

教材总结

3 禁忌搜索算法

3.1 禁忌搜索算法简介

禁忌搜索算法是组合优化算法的一种,是局部搜索算法的扩展。禁忌搜索算法是人工智能在组合优化算法中的一个成功应用。禁忌搜索算法的特点是采用了禁忌技术。所谓禁忌就是禁止重复前面的工作。 禁忌搜索算法用一个禁忌表记录下已经到达过的局部最优点,在下一次搜索中,利用禁忌表中的信息不再或有选择地搜索这些点。

禁忌搜索算法实现的技术问题是算法的关键。禁忌搜索算法涉及侯选集合、禁忌对象、评价函数、特赦规则、记忆频率信息等概念。

(1)邻域

在组合优化中,距离的概念通常不再适用,但是在一点附近搜索另一个下降的点仍然是组合优化数值求解的基本思想。因此,需要重新定义邻域的概念。

(2)侯选集合

侯选集合由邻域中的邻居组成。常规的方法是从邻域中选择若干个目标值或评价值最佳

的邻居入选。

(3)禁忌对象和禁忌长度

禁忌表中的两个主要指标是禁忌对象和禁忌长度。禁忌算法中,由于我们要避免一些操作的重复进行,就要将一些元素放到禁忌表中以禁止对这些元素进行操作,这些元素就是我们指的禁忌对象。禁忌长度是被禁对象不允许选取的迭代次数。一般是给被禁对象 x一个数(禁忌长度)t,要求对象 x 在t步迭代内被禁,在禁忌表中采用tabu(x)=t 记忆,每迭代一步,该项指标做运算 tabu(x)=t—1 ,直到 tabu(x)=0 时解禁。于是,我们可将所有元素分成两类,被禁元素和自由元素。禁忌长度t的选取可以有多种方法,例如 t= 常数,或t?[n]

(4)评价函数

评价函数是侯选集合元素选取的一个评价公式,侯选集合的元素通过评价函数值来选取。以目标函数作为评价函数是比较容易理解的。目标值是一个非常直观的指标,但有时为了方便或易于计算,会采用其他函数来取代目标函数。

(5)特赦规则

在禁忌搜索算法的迭代过程中,会出现侯选集中的全部对象都被禁忌,或有一对象被禁,但若解禁则其目标值将有非常大的下降情况。在这样的情况下,为了达到全局最优, 我们会让一些禁忌对象重新可选。 这种方法称为特赦, 相应的规则称为特赦规则。

(6)记忆频率信息

在计算的过程中,记忆一些信息对解决问题是有利的。如一个最好的目标值出现的频率很高,这使我们有理由推测:现有参数的算法可能无法再得到更好的解。根据解决问题的需要,我们可以记忆解集合、被禁对象组、目标值集合等的出现频率。频率信息有助于进一步加强禁忌搜索的效率。我们可以根据频率信息动态控制禁忌的长度。 一个最佳的目标值出现的频率很高, 有理由终止计算而将此值认为是最优值。,其中n为邻域中邻居的个数;这种规则容易在算法中实现。

§4 蚁群算法

4.1 蚁群算法简介

相对弱小,功能并不强大的个体是如何完成复杂的工作的(如寻找到食物的最佳路径并返回等) 。在此基础上一种很好的优化算法逐步发展起来。蚁群算法的特点是模拟自然界中蚂蚁的群体行为。科学家发现,蚁群总是能够发现从蚁巢到食物源的最短路径。经研究发现,蚂蚁在行走过的路上留下一种挥发性的激素,蚂蚁就是通过这种激素进行信息交流。蚂蚁趋向于走激素积累较多的路径。找到最短路径的蚂蚁总是最早返回巢穴,从而在路上留下了较多的激素。由于最短路径上积累了较多的激素,选择这条路径的蚂蚁就会越来越多,到最后所有的蚂蚁都会趋向于选择这条最短路径。基于蚂蚁这种行为而提出的蚁群算法具有群体合作,正反馈选择,并行计算等三大特点,并且可以根据需要为人工蚁加入前瞻、回溯等自然蚁所没有的特点。在使用蚁群算法求解现实问题时,先生成具有一定数量蚂蚁的蚁群,让每一只蚂蚁建立一个解或解的一部分,每只人工蚁从问题的初始状态出发,根据“激素”浓度来选择下一个要转移到的状态,直到建立起一个解,每只蚂蚁根据所找到的解的好坏程度在所经过的状态上释放与解的质量成正比例的“激素” 。之后,每只蚂蚁又开始新的求解过程,直到寻找到满意解。为避免停滞现象,引入了激素更新机制。

第二十四章 时间序列模型

时间序列是按时间顺序排列的、随时间变化且相互关联的数据序列。分析时间序列的方法构成数据分析的一个重要领域,即时间序列分析。

时间序列根据所研究的依据不同,可有不同的分类。

1.按所研究的对象的多少分,有一元时间序列和多元时间序列。

2.按时间的连续性可将时间序列分为离散时间序列和连续时间序列两种。

3.按序列的统计特性分,有平稳时间序列和非平稳时间序列。如果一个时间序列的概率分布与时间t无关,则称该序列为严格的(狭义的)平稳时间序列。如果序列的一、二阶矩存在,而且对任意时刻t满足:

(1)均值为常数

(2)协方差为时间间隔τ 的函数。

则称该序列为宽平稳时间序列,也叫广义平稳时间序列。我们以后所研究的时间序列主要是宽平稳时间序列。

4.按时间序列的分布规律来分,有高斯型时间序列和非高斯型时间序列。

§1 确定性时间序列分析方法概述

时间序列预测技术就是通过对预测目标自身时间序列的处理,来研究其变化的。一个时间序列往往是以下几类变化形式的叠加或耦合。

(1)长期趋势变动。它是指时间序列朝着一定的方向持续上升或下降,或停某一水平上的倾向,它反映了客观事物的主要变化趋势。

(2)季节变动。

(3)循环变动。通常是指周期为一年以上,由非季节因素引起的涨落起伏波似的波动。

(4)不规则变动。通常它分为突然变动和随机变动。

通常用Tt表示长期趋势项,St表示季节变动趋势项,Ct表示循环变动趋势项,Rt表示随机干扰项。常见的确定性时间序列模型有以下几种类型:

(1)加法模型;(2)乘法模型;(3)混合模型

§2 移动平均法

移动平均法是根据时间序列资料逐渐推移,依次计算包含一定项数的时序平均数,以反映长期趋势的方法。当时间序列的数值由于受周期变动和不规则变动的影响,起伏较大,不易显示出发展趋势时,可用移动平均法,消除这些因素的影响,分析、预测序列的长期趋势。 移动平均法有:

简单移动平均法(当预测目标的基本趋势是在某一水平上下波动时,可用一次简单移动平均方法建立预测模型,简单移动平均法只适合做近期预测,而且是预测目标的发展趋势变化不大的情况。如果目标的发展趋势存在其它的变化, 采用简单移动平均法就会产生较大的预测偏差和滞后);

加权移动平均法(在简单移动平均公式中,每期数据在求平均时的作用是等同的。但是,每期数据所包含的信息量不一样,近期数据包含着更多关于未来情况的信心。因此,把各期数据等同看待是不尽合理的,应考虑各期数据的重要性,对近期数据给予较大的权重,这就是加权移动平均法的基本思想,在加权移动平均法中,wt的选择,同样具有一定的经验性。一般的原则是:近期数据的权数大,远期数据的权数小。至于大到什么程度和小到什么程度,则需要按照预测者对序列的了解和分析来确定);

趋势移动平均法(简单移动平均法和加权移动平均法,在时间序列没有明显的趋势变动时,能够准确反映实际情况。但当时间序列出现直线增加或减少的变动趋势时,用简单移动平均法和加权移动平均法来预测就会出现滞后偏差。因此,需要进行修正,修正的方法是作二次移动平均,利用移动平均滞后偏差的规律来建立直线趋势的预测模型。这就是趋势移动

平均法。用移动平均的滞后偏差建立直线趋势预测模型。趋势移动平均法对于同时存在直线趋势与周期波动的序列, 是一种既能反映趋势变化,又可以有效地分离出来周期变动的方法。)

§3 指数平滑法

指数平滑法根据平滑次数的不同,又分为一次指数平滑法、二次指数平滑法和三次指数平滑法等。

一次指数平滑法虽然克服了移动平均法的缺点。但当时间序列的变动出现直线趋势时,用一次指数平滑法进行预测,仍存在明显的滞后偏差。因此,也必须加以修正。修正的方法与趋势移动平均法相同,即再作二次指数平滑,利用滞后偏差的规律建立直线趋势模型。这就是二次指数平滑法。当时间序列的变动表现为二次曲线趋势时,则需要用三次指数平滑法。三次指数平滑是在二次指数平滑的基础上,再进行一次平滑。指数平滑预测模型是以时刻t为起点,综合历史序列的信息,对未来进行预测的。

(1)如果序列的基本趋势比较稳,预测偏差由随机因素造成,则α值应取小一些,以减少修正幅度,使预测模型能包含更多历史数据的信息。

(2)如果预测目标的基本趋势已发生系统地变化,则α值应取得大一些。这样,可以偏重新数据的信息对原模型进行大幅度修正,以使预测模型适应预测目标的新变化。

§4 差分指数平滑法

在上节我们已经讲过,当时间序列的变动具有直线趋势时,用一次指数平滑法会出现滞后偏差,其原因在于数据不满足模型要求。因此,我们也可以从数据变换的角度来考虑改进措施,即在运用指数平滑法以前先对数据作一些技术上的处理,使之能适合于一次指数平滑模型, 以后再对输出结果作技术上的返回处理, 使之恢复为原变量的形态。差分方法是改变数据变动趋势的简易方法。

指数平滑值实际上是一种加权平均数。因此把序列中逐期增量的加权平均数(指数平滑值)加上当前值的实际数进行预测,比一次指数平滑法只用变量以往取值的加权平均数作为下一期的预测更合理。 从而使预测值始终围绕实际值上下波动,从根本上解决了在有直线增长趋势的情况下,用一次指数平滑法所得出的结果始终落后于实际值的问题。

差分方法和指数平滑法的联合运用,除了能克服一次指数平滑法的滞后偏差之外,对初始值的问题也有显著的改进。因为数据经过差分处理后,所产生的新序列基本上是平稳的。这时,初始值取新序列的第一期数据对于未来预测值不会有多大影响。其次,它拓展了指数平滑法的适用范围, 使一些原来需要运用配合直线趋势模型处理的情况可用这种组合模型来取代。但是,对于指数平滑法存在的加权系数α 的选择问题,以及只能逐期预测问题,差分指数平滑模型也没有改进。

§5 自适应滤波法

自适应滤波法与移动平均法、指数平滑法一样,也是以时间序列的历史观测值进行某种加权平均来预测的,它要寻找一组“最佳”的权数,其办法是先用一组给定的权数来计算一个预测值,然后计算预测误差,再根据预测误差调整权数以减少误差。这样反复进行,直至找出一组“最佳”权数,使误差减少到最低限度。由于这种调整权数的过程与通讯工程中的传输噪声过滤过程极为接近,故称为自适应滤波法。

自适应滤波法有两个明显的优点:一是技术比较简单,可根据预测意图来选择权数的个数和学习常数,以控制预测。也可以由计算机自动选定。二是它使用了全部历史数据来寻求最佳权系数,并随数据轨迹的变化而不断更新权数,从而不断改进预测。由于自适应滤波法的预测模型简单,又可以在计算机上对数据进行处理,所以这种预测方法应用较为广泛。

§6 趋势外推预测方法

趋势外推法是根据事物的历史和现时资料,寻求事物发展规律,从而推测出事物未来状

况的一种比较常用的预测方法。利用趋势外推法进行预测,主要包括六个阶段:(a)选择应预测的参数;(b)收集必要的数据;(c)利用数据拟合曲线;(d)趋势外推;(e)预测说明;(f)研究预测结果在进行决策中应用的可能性。趋势外推法常用的典型数学模型有:指数曲线、修正指数曲线、生长曲线、包络曲线等。

6.1 指数曲线法

一般来说,技术的进步和生产的增长,在其未达饱和之前的新生时期是遵循指数曲线增长规律的,因此可以用指数曲线对发展中的事物进行预测。

6.2 修正指数曲线法

利用指数曲线外推来进行预测时,存在着预测值随着时间的推移会无限增大的情况。这是不符合客观规律的。因为任何事物的发展都是有一定限度的。例如某种畅销产品,在其占有市场的初期是呈指数曲线增长的,但随着产品销售量的增加,产品总量接近于社会饱和量时。这时的预测模型应改用修正指数曲线。

6.3 Logistic曲线(生长曲线)

生物的生长过程经历发生、发展到成熟三个阶段,在三个阶段生物的生长速度是不一样的,例如南瓜的重量增长速度,在第一阶段增长的较慢,在发展时期则突然加快,而到了成熟期又趋减慢,形成一条 S形曲线,这就是有名的 Logistic 曲线(生长曲线),很多事物,如技术和产品发展进程都有类似的发展过程,因此 Logistic曲线在预测中有相当广泛的应用。

6.4 趋势线的选择

趋势线的选择有以下几种方式。1.由散点图选择趋势线。2.由数据本身的取值规律选择趋势线。3.比较预测标准误差大小。

§7 平稳时间序列模型

这里的平稳是指宽平稳,其特性是序列的统计特性不随时间的平移而变化,即均值和协方差不随时间的平移而变化。

§8 时间序列建模的基本步骤

上面我们介绍了时间序列的一些基本概念,下面我们初步给出时间序列建模的基本步骤,有兴趣的读者可以去查阅相关的参考资料。

时间序列建模的基本步骤如下:

1.数据的预处理:数据的剔取及提取趋势项。

2.取 n =1 ,拟合ARMA(2n,2n—1) (即 ARMA(2,1))模型

3.n= n+1 ,拟合ARMA(2n,2n—1)模型

4.用 F准则检验模型的适用性。若F 检验显著,则转入第 2步。若F 检验不显著,转入第 5 步。

5.检查?2n,?2n?1 的值是否很小,其置信区间是否包含零。若不是,则适用的模型就是ARMA(2n,2n—1)。若 ?2n,?2n?1很小,且其置信区间包含零,则拟合ARMA(2n—1,2n—2)。

6.利用 F准则检验模型ARMA(2n,2n—1)和 ARMA(2n—1,2n—2),若 F值不显著,转入第 7 步;若F值显著,转入第 8 步。

7.舍弃小的MA参数,拟合 m<2n—2的模型 ) , ARMA(2n—1,m),并用 F准则进行检验。重复这一过程,直到得出具有最小参数的适用模型为止。

8.舍弃小的MA参数,拟合 m<2n—1的模型 ) , ARMA(2n,m),并用 F准则进行检验。重复这一过程,直到得出具有最小参数的适用模型为止。

第二十五章

相关推荐