连续型进化算法首达时间分析的更新理论模型
周珍胜1,2, 王林2, 冯夫健1,2, 谭棉1,2, 何兴2, 张再军3
1.贵州民族大学 数据科学与信息工程学院 贵阳 550025
2.贵州民族大学 贵州省模式识别与智能系统重点实验室 贵阳 550025
3.黔南民族师范学院 数学与统计学院 都匀 558000
通讯作者:

王 林,博士,教授,主要研究方向为计算机图像处理、模式识别、智能控制.E-mail:wanglin@gzmu.edu.cn.

作者简介:

周珍胜,硕士研究生,主要研究方向为演化计算理论分析.E-mail:1345323920@qq.com.

冯夫健,博士,教授,主要研究方向为智能计算、微计算.E-mail:fujian_feng@gzmu. edu.cn.

谭 棉,硕士,副教授,主要研究方向为进化计算理论分析、智能计算.E-mail:tanmian@gzmu.edu.cn.

何 兴,博士研究生,主要研究方向为智能计算、机器学习.E-mail:gs.hex20@gzu.edu.cn.

张再军,博士,副教授,主要研究方向为算法设计与分析、深度学习.E-mail:zzj@sgmtu.edu.cn.

摘要

连续型进化算法首达时间上界研究中需要较强的前提假设且较少关注其下界.文中引入鞅论和更新过程,结合瓦尔德不等式以及更新定理,提出基于增长率的更新理论模型,用于估计进化策略(Evolution Strategies, ES)平均首达时间的上界和下界.更新理论模型依赖算法的初始种群以及增长率概率密度函数,这为进化策略的首达时间分析提供估计优势.为了验证文中更新理论模型,首先计算带均匀变异(1, λ)ES在二维倾斜平面问题上的平均首达时间,得到(1, λ)ES种群规模与时间上下界之间的关系闭合表达式,并且验证平均首达时间与种群规模之间并非负相关.再计算带均匀变异(1, λ)ES在五维超平面问题上的平均首达时间,得到理论计算的上下界闭合表达式.数值实验表明,理论计算的上界和下界与实际运行平均首达时间一致,这为分析进化策略的首达时间提供一种理论工具.

关键词: 连续型进化算法; 瓦尔德不等式; 更新理论模型; 首达时间; 种群规模
中图分类号:TP18
Renewal Theory Model of First Hitting Time Analysis for Continuous Evolutionary Algorithms
ZHOU Zhensheng1,2, WANG Lin2, FENG Fujian1,2, TAN Mian1,2, HE Xing2, ZHANG Zaijun3
1. School of Data Sciences and Information Engineering, Guizhou Minzu University, Guiyang 550025
2. Key Laboratory of Pattern Recognition and Intelligent Systems of Guizhou Province, Guizhou Minzu University, Guiyang 550025
3. School of Mathematics and Statistics, Qiannan Normal University for Nationalities, Duyun 558000
Corresponding author:WANG Lin, Ph.D., professor. His research interests include image processing, pattern recognition and intelligent control.

About Author:
ZHOU Zhensheng, master student. His research interests include theoretical analysis of evolutionary computation.
FENG Fujian, Ph.D., professor. His research interests include intelligent computing and microcomputation.
TAN Mian, master, associate professor. Her research interests include theoretical ana-lysis of evolutionary computation and intelligent computation.
HE Xing, Ph.D. candidate. His research interests include intelligent computing and ma-chine learning.
ZHANG Zaijun, Ph.D., associate profe-ssor. His research interests include algorithm design and analysis and deep learning.

Abstract

In the research on upper bound of the first hitting time for continuous evolutionary algorithms,strong assumptions are required and less attention is given to its lower bound . In this paper, martingale theory and renewal process are introduced and combined with Wald's inequality and renewal theorem. A renewal theory model based on progress rate is proposed to estimate the upper and lower bounds of the expected first hitting time of evolution strategies. The renewal theory model relies on the initial population and the probability density function of the progress rate, providing an estimation advantage for the analysis of the first hitting time of evolutionary strategies. To verify the validity of the proposed renewal theory model, experiments are conducted to estimate the expected first hitting time. Firstly, the expected first hitting time of (1, λ)evolution strategies with uniform mutation on a two-dimensional inclined plane problem is calculated. The closed-form expression for the relationship between(1, λ)evolution strategies population size and the time upper and lower bounds is obtained. It is proved that the expected first hitting time is not negatively correlated with the population size. Next, the expected first hitting time of evolution strategies with uniform mutation on a five-dimensional hyperplane problem is calculated, and the closed-form expression for theoretical upper and lower bounds is derived. Numerical experiments show that the theoretically calculated upper and lower bounds are consistent with the actual expected first hitting time, which provides a theoretical tool for analyzing the first hitting time of evolution strategies.

Key words: Continuous Evolutionary Algorithm; Wald's Inequality; Renewal Theory Model; First Hitting Time; Population Size

进化算法(Evolutionary Algorithm, EA)是一类模拟生物进化过程的自适应搜索算法, 主要包括遗传算法(Genetic Algorithm, GA)、进化策略(Evolu-tion Strategy, ES)、遗传编程(Genetic Programming, GP)和进化规划(Evolutionary Programming, EP)等[1].EA为解决实际的复杂问题提供一种高效可行的思路, 能在大规模、高维度的问题空间中搜索全局最优解, 可广泛应用于组合优化、机器学习、数据挖掘等领域.EA计算时间分析可以通过首达时间刻画.首达时间是指算法首次找到最优解或满意解时的迭代(运行)次数[2].由于算法随机性的本质, 算法运行一次并不能较好地刻画算法性能, 因此, 可借助平均首达时间评估和分析算法性能[3].

平均首达时间是指算法首次找到最优解或满意解时, 对适应度函数的平均评估次数.平均首达时间的大小对应算法的全局搜索能力和收敛速度, 值越小, 收敛速度越快, 越容易找到全局最优解.目前, 进化算法在离散搜索空间和连续搜索空间优化问题上取得显著性成果, 尤其连续型进化算法的计算时间分析引起学者的广泛关注[4].

在针对离散型进化算法的计算时间分析中, He等[5]将进化算法运行过程中种群状态建模成马尔可夫链, 并引入漂移分析和距离函数, 分析父代个体与子代个体之间的期望变化, 得出平均首达时间上界.在此基础上, He等[6]提出进化算法时间分析的一般框架.Yu等[7]基于非齐次马尔可夫链, 建立首达时间与收敛速度之间的桥梁, 提出进化算法平均首达时间转换分析方法.Lengler等[8]结合漂移分析, 假设父代个体优于子代个体, 分析进化算法在线性函数上有更紧的平均首达时间上界.Yu等[9]提出转换分析方法, 构造一条新的马尔可夫参考链, 对比两条参考链之间每步计算时间的差异性, 从而得出整体算法的计算时间复杂性.Wegener[10]通过种群个体适应值, 将种群个体划分为从低级到高级的集合, 分析种群从低级到高级的迁移概率界, 得到计算时间复杂性适应度分层方法.Huang等[11]结合统计方法和平均增益模型, 采集种群个体增益和曲面拟合技术, 得到增益的概率分布函数, 进一步推出估计进化算法的平均首达时间数学闭合解析式, 并以此分析进化算法在球函数上的计算时间, 有助于估计进化算法首达时间.冯夫健等[12]提出基于等同关系的演化算法的时间对比分析方法, 不需要定义距离函数和满足漂移分析的特定条件, 为算法改进提供理论上的依据.现有的乘法漂移[13, 14, 15]和可变漂移[16, 17, 18]证明平均首达时间下界的证明条件都强于时间上界的证明条件.结合马尔可夫链与漂移分析的模型是一种分析进化算法平均首达时间的有力工具.

综上所述, 现有进化算法首达时间分析主要集中在对离散进化算法的分析, 而连续型进化算法首达时间的分析相对较少, 并且涉及复杂的矩阵计算.在连续型进化算法首达时间分析中, Jiang等[19]结合增益, 分析(1+1)进化策略在超球体内使用均匀变异算子时, 当种群个体到最优解距离减少到一半时, 运行时间的下界为指数级.张宇山等[20]将首达时间视为一个停时, 结合时齐马氏过程性质, 提出(1+λ )进化策略平均首达时间停时理论模型.Agapie等[21]结合增长率, 分析带高斯变异和均匀变异进化策略在球函数的首达时间是Ο (n), 理论分析影响(1+1)进化策略的首达时间并非是变异算子, 而是1/5成功选择的影响.Jä gerskü pper[22]研究进化策略在球函数上运行时间是如何取决于搜索空间维数, 并进一步研究单模函数优化的计算时间, 计算相对冗长.Agapie等[23]把父代个体与子代个体之间每步增长率建模成一个更新过程, 分析带均匀变异算子的进化策略在倾斜平面上的计算时间复杂性, 以此证明计算时间复杂性只与倾斜平面区域有关, 而未关注计算时间复杂性与种群规模相关, 导致得到的平均首达时间下界不紧致.张宇山等[24]基于平均增益, 结合鞅论与勒贝格控制收敛定理, 分析进化策略在球函数和二维倾斜平面的平均首达时间更紧的上界, 而未给出相关理论下界分析, 同时在上界理论分析中勒贝格控制收敛定理需要函数列(T0s)存在控制函数, 这需要较强的假设.

总之, 虽然连续型进化算法的首达时间分析在首达时间上界研究中已有一定成果, 但是学者们较少关注其首达时间下界, 以及相关的理论结果是针对具体案例展开, 导致进化算法首达时间分析没有抽象为一般模型.

本文将进化算法首达时间视为更新过程的停时, 引入鞅论和更新过程, 结合瓦尔德不等式, 推出文献[24]的下界闭合表达式, 提出估计进化算法的平均首达时间分析的一般模型.本文的更新理论模型是建立在非负增长率随机过程上, 不依赖算法的具体实现, 有利于分离具体案例和算法, 使模型更一般化.通过更新理论模型上界和下界, 构建一个闭合区间, 分析进化策略种群规模与平均首达时间的条件关系, 得到平均首达时间与种群规模之间并非负相关.

1 问题描述与数学建模
1.1 问题描述与算法简介

本文重点讨论的是进化算法的随机过程模型, 不失一般性, 研究连续搜索空间的最优化问题, 数学描述如下:

min f(x),

s.t. xSRn,

其中, f(x)表示目标函数, S表示搜索空间, n表示问题的规模.S中每个元素表示问题的一个解, 对应算法中的每个个体, 这些个体组成种群.记进化策略第t代种群

${{\xi }^{t}}=\{\xi _{1}^{t}, \xi _{2}^{t}, \ldots , \xi _{\lambda }^{t}\}\in S, $

其中λ 表示种群规模.一个典型ES求解最优化问题算法流程如算法1[25]所示.

算法1 ES流程[25]

输入 初始化种群

输出 包含目前为止找到满意解

t=0;

随机生成λ 个个体种群ξ 0={ ξ10, ξ20, …, ξλ0};

计算每个个体适应值, 评估当代种群中个体优劣; while not stop do

for i=1∶ λ do

通过交叉和变异产生新的种群;

end for

计算每个个体适应值, 评估当代种群中个体优劣;

λ 个个体中选择ξ 't个体作为下一代的种群;

t=t+1;

end while

输出到目前为止找到的满意解.

算法1包括使用交叉、变异和选择, 未对交叉和变异做任何限制.选择是采取非精英保存, 即每代维持一个父代个体, 通过变异产生λ 个子代个体.再从λ 个子代个体中选择个体作为下一代的种群.然而, 本文给出的主要结果(即定理3)与这样的具体实现无关, 几乎可以用于任何随机算法.

1.2 ES随机过程模型

为了建立非负随机过程, 本文假设在进化策略运行过程中, 第t代种群中至少存在一个个体的适应值优于第t-1代种群个体的适应值.

由于算法很难找到最优解, 当算法找到满意解

${{d}_{min}}(\xi_{opt}^{\text{t}})=min(d(\xi_{opt}^{0}), d(\xi_{opt}^{1}), \ldots )=\varepsilon $

时, 即

$d(\xi_{opt}^{\text{t}})< \varepsilon $

时, 算法终止.

根据随机过程理论, 设(Ω , H, P)为概率空间,

Ht=σ (d(ξ 0), Y1, Y2, …, Yt)⊂H

为σ -代数流, H包含由信息d(ξ 0), Y1, Y2, …, Yt生成的所有事件.鞅这个概念最初起源于公平赌博数学模型, 后引入概率论中.鞅就是在掌握从初始到现在累积信息d(ξ 0), Y1, Y2, …, Yt条件下预测未来与现在相同.

设$\{{{X}_{t}}\}_{\text{t}=0}^{\infty }$和$\{{{H}_{t}}\}_{\text{t}=0}^{\infty }$为随机过程, Xt为$\{{{H}_{t}}\}_{\text{t}=0}^{\infty }$的可测函数, 对∀ t≥ 0, 有

E(Xt+1|Ht)≥ Xt,

称$\{{{X}_{t}}\}_{\text{t}=0}^{\infty }$是关于$\{{{H}_{t}}\}_{\text{t}=0}^{\infty }$的下鞅.若

E(Xt+1|Ht)≤ Xt,

称$\{{{X}_{t}}\}_{\text{t}=0}^{\infty }$是关于$\{{{H}_{t}}\}_{\text{t}=0}^{\infty }$的上鞅.从概率论的角度来看, 下鞅就是在已知d(ξ 0), Y1, Y2, …, Yt的条件下, Xt+1的条件期望优于现在Xt; 上鞅就是在已知d(ξ 0), Y1, Y2, …, Yt的条件下, Xt+1的条件期望劣于现在Xt.为了度量当代个体到最优个体之间距离, 给出如下定义1.

定义1 适应值差函数 设函数d在S→ R满足

$d(\xi_{opt}^{\text{t}})=f(\xi_{opt}^{\text{t}})-{{f}_{opt}}$,

则称d为适应值差函数, 其中, ξoptt表示第t代最优个体, fopt表示目标适应值.当t=0时,

$d(\xi_{opt}^{0})=d({{\xi }_{0}})=f({{\xi }_{0}})$.

令${{d}_{max}}(\xi_{opt}^{\text{t}})$表示ES在第t代之前取得最大适应值差, 即

${{d}_{max}}(\xi_{opt}^{\text{t}})=max(d(\xi_{opt}^{0}), d(\xi_{opt}^{1}), \ldots , d(\xi_{opt}^{\text{t}}))=d(\xi_{opt}^{\text{0}})$.

定义2 增长率[26]ES运行过程中, 增长率表示 t-1代到t代种群之间到最优距离的减少量, 即

${{X}_{t}}=d(\xi_{opt}^{\text{t}-1})-d(\xi_{opt}^{\text{t}}), t=1, 2, \ldots $.

质量增益表示父代与子代之间的适应值减少量[27].

增长率大小反映ES收敛速度的快慢.增长率越大, 与最优解的距离减少量改变越快, 收敛速度越快; 增长率越小, 与最优解的距离减少量改变越慢, 收敛速度相对越慢.由于是最小化问题, $\{{{X}_{t}}\}_{\text{t}=0}^{\infty }$为非负随机过程, 由此得出如下定义3.

定义3 增长率更新过程 设$\{{{X}_{t}}\}_{\text{t}=0}^{\infty }$为非负随机过程, Yt为非负随机变量.若对∀ t=1, 2, …, 有

${{Y}_{t}}=\overset{\text{t}}{\mathop{\underset{\text{n}=1}{\mathop \sum }\, }}\, {{X}_{n}}=d({{\xi }_{0}})-d(\xi_{opt}^{\text{t}})$,

则称Yt为进化策略在第t代增长率更新过程.

在随机算法中, 研究者们通常感兴趣的是算法首次找到满意解时, 算法对适应度函数的迭代次数[4], 即父代与子代之间到最优距离的减少量之和

Yt=d(ξ 0)-ε .

首达时间可使用停时描述, 下面给出停时的定义.

定义4 更新过程停时 设$\{{{X}_{t}}\}_{\text{t}=0}^{\infty }$为非负随机过程, τ 为一个非负随机变量, 若满足

${{T}_{\tau }}=\left\{ \tau |\overset{\tau-1}{\mathop{\underset{\text{k}=1}{\mathop \sum }\, }}\, {{X}_{k}}< d({{\xi }_{0}})-\varepsilon , \overset{\infty }{\mathop{\underset{\text{k}=\tau}{\mathop \sum }\, }}\, {{X}_{k}}\ge d({{\xi }_{0}})-\varepsilon \right\}$,

则称τ 为Xt的一个更新过程停时.

2 更新理论模型建模

与目前进化算法[28, 29]研究不同, 本文将ES从初始位置到满意解的渐进过程视为随机状态建立更新理论模型.在建立模型之前, 需要给出定理1.

定理1 瓦尔德等式 若$\{{{X}_{t}}\}_{\text{t}=0}^{\infty }$为独立同分布X的随机变量, 满足E(X|Ht)< ∞ , 则Tτ 为$\{{{X}_{t}}\}_{\text{t}=0}^{\infty }$的一个停时.若E(Tτ |Ht)< ∞ , 则

$E\left( \overset{{{\text{T}}_{\tau}}}{\mathop{\underset{\text{n}=1}{\mathop \sum }\, }}\, {{X}_{n}}|{{H}_{t}} \right)=E({{T}_{\tau }}|{{H}_{t}})E(X|{{H}_{t}})$.

在定理1中, 得到增长率更新过程期望与平均首达时间之间的等式.增长率更新过程的期望是平均首达时间与期望增长率的乘积.然而, 期望增长率的概率密度函数与初始种群有关, 推论1给出增长率更新过程的期望上界和下界.

推论1 瓦尔德不等式 设$\{{{X}_{t}}\}_{\text{t}=0}^{\infty }$为独立同分布X的随机变量, 假定

E(Tτ |Ht)< ∞ ,

Tτ 为$\{{{X}_{t}}\}_{\text{t}=0}^{\infty }$的停时, 若存在常数μ 2, 使得

μ 1< E(X|Ht)< μ 2,

${{\mu }_{1}}E({{T}_{\tau }}|{{H}_{t}})< E\left( \overset{{{\text{T}}_{\tau}}}{\mathop{\underset{\text{n}=1}{\mathop \sum }\, }}\, {{X}_{n}}|{{H}_{t}} \right)< {{\mu }_{2}}E({{T}_{\tau }}|{{H}_{t}})$.

根据推论1, 可得到平均首达时间的更新定理, 如定理2所示.

定理2 更新定理 设$\{{{X}_{t}}\}_{\text{t}=0}^{\infty }$为独立同分布的非负随机变量, 具有数学期望μ 和方差σ , 且存在常数μ 1和μ 2, 使得

μ 1< E(Xi|Ht)< μ 2, var(Xi|Ht)< σ ,

若当${{\text{d}}_{{{\text{T}}_{\tau}}}}\to \infty $时, 则对E(Tτ |Ht),

E(Tτ|Ht)dTτp1μ

成立.

证明 因为

${{\text{d}}_{{{\text{T}}+1}}}< {{\text{d}}_{{{\text{T}}_{\tau}}}}< d({{\xi }_{0}})$,

于是可得

dTτ+1E(Tτ|Ht)< dTτE(Tτ|Ht)< d(ξ0)E(Tτ|Ht),

而Tτ 时刻时到达距离

${{\text{d}}_{{{\text{T}}_{\tau}}}}=Y_{{t}}^{{{{T}}_{\tau}}}=\overset{{t}}{\mathop{\underset{{n}=1}{\mathop \sum }\, }}\, {{X}_{n}}=d({{\xi }_{0}})-d(\xi_{t}^{{{T}}_{\tau}})$,

在E(Tτ |Ht)之前到达距离 dTτ的均值

dTτE(Tτ|Ht).

由强大数定理可得, 当E(Tτ |Ht)→ ∞ 时,

dTτ+1E(Tτ|Ht)μ.

但是由于 dTτ时,

E(Tτ |Ht)→ ∞ ,

所以 dTτ时,

dTτ+1E(Tτ|Ht)μ.

d(ξ0)E(Tτ|Ht)=d(ξ0)E(Tτ+1|Ht)·E(Tτ+1|Ht)E(Tτ|Ht),

类似可推得, 当E(Tτ |Ht)→ ∞ 时,

d(ξ0)E(Tτ|Ht)μ.

由极限夹逼定理可得, 当E(Tτ |Ht)→ ∞ 时,

dTτE(Tτ|Ht)μ.

证毕.

推论2 设$\{{{X}_{t}}\}_{\text{t}=0}^{\infty }$为独立同分布X的随机变量, 满足

μ 1< E(X|Ht)< μ 2,

Tτ 为$\{{{X}_{t}}\}_{\text{t}=0}^{\infty }$的停时, E(Tτ |Ht)< ∞ , 则

1μ2< E(Tτ|Ht)dTτ< 1μ1.

证明 对于下界证明, 定义4中停时

${{T}_{\tau }}=\left\{ \tau |\overset{\tau-1}{\mathop{\underset{\text{k}=1}{\mathop \sum }\, }}\, {{X}_{k}}< d({{\xi }_{0}})-\varepsilon , \overset{\infty }{\mathop{\underset{\text{k}=\tau}{\mathop \sum }\, }}\, {{X}_{k}}\ge d({{\xi }_{0}})-\varepsilon \right\}$,

等价于

${{T}_{\tau }}=\left\{ \tau |\overset{\tau}{\mathop{\underset{\text{k}=1}{\mathop \sum }\, }}\, {{X}_{k}}> d({{\xi }_{0}})-\varepsilon , \overset{\tau-1}{\mathop{\underset{\text{k}=1}{\mathop \sum }\, }}\, {{X}_{k}}\le d({{\xi }_{0}})-\varepsilon \right\}$,

根据瓦尔德不等式, 有

${{\text{d}}_{{{\text{T}}_{\tau}}}}< E\left( \overset{{{\text{T}}_{\tau}}}{\mathop{\underset{\text{n}=1}{\mathop \sum }\, }}\, {{X}_{n}}|{{H}_{t}} \right)< {{\mu }_{2}}E({{T}_{\tau }}|{{H}_{t}})$,

$\underset{{{\text{d}}_{{{\text{T}}_{\tau}}}}\to \infty }{\mathop{\text{lim}}}\, inf\left( \frac{\text{E}({{\text{T}}_{\tau}}|{{\text{H}}_{\text{t}}})}{{{\text{d}}_{{{\text{T}}_{\tau}}}}} \right)> \frac{1}{{{\mu}_{2}}}$.

而对于上界证明, 记另一更新过程为

Xtr=Xt, Xtaa, Xt> a

${{\mu }_{a}}=\min \left\{ {{\mu }_{1}}, \inf E(\text{X}_{\text{t}}^{\text{r}}) \right\}$,

对于常数a> 0,

$0< \text{X}_{\text{t}}^{\text{r}}< {{X}_{t}}, 0< {{\mu }_{a}}< E(X_{\text{t}}^{\text{r}})< {{\mu }_{2}}$,

从而

$E\left( \overset{{{\text{T}}_{\text{r}}}}{\mathop{\underset{\text{n}=1}{\mathop \sum }\, }}\, {{X}_{n}}|{{H}_{t}} \right)< E\left( \overset{{{\text{T}}_{\text{t}}}}{\mathop{\underset{\text{n}=1}{\mathop \sum }\, }}\, {{X}_{n}}|{{H}_{t}} \right)$,

$E({{T}_{r}}|{{H}_{t}})> E({{T}_{t}}|{{H}_{t}})$.

因此, 由推论2可推出

${{\mu }_{a}}E({{T}_{t}}|{{H}_{t}})< {{\mu }_{a}}E({{T}_{r}}|{{H}_{t}})< E\left( \overset{{{\text{T}}_{\text{r}}}}{\mathop{\underset{\text{n}=1}{\mathop \sum }\, }}\, {{X}_{n}}|{{H}_{t}} \right)< {{\text{d}}_{{{\text{T}}_{\tau}}}}+a$,

$\underset{{{\text{d}}_{{{\text{T}}_{\tau}}}}\to \infty }{\mathop{\text{lim}}}\, \sup \left( \frac{\text{E}({{\text{T}}_{\tau}}|{{\text{H}}_{\text{t}}})}{{{\text{d}}_{{{\text{T}}_{\tau}}}}} \right)< \frac{1}{{{\mu}_{1}}}$,

1μ2< E(Tτ|Ht)dTτ< 1μ1.

证毕.

在进化策略运行中, 当父代个体到最优解的适应值差函数值等于ε 时, 算法终止, 即到达某种特定的停时距离:

${{\text{d}}_{{{\text{T}}_{\tau}}}}={{Y}_{t}}=d({{\xi }_{0}})-\varepsilon $.

则平均首达时间定义如定义5.

定义5 平均首达时间 根据推论2, 在连续型ES中, 若Tτ 为$\{{{X}_{t}}\}_{\text{t}=0}^{\infty }$的停时, 则经过[ε , d(ξ 0)]区间的首达时间Tτ 满足

$\frac{\text{d}\left( {{\xi}_{0}} \right)-\varepsilon}{{{\mu}_{2}}}< E({{T}_{\tau }}|{{H}_{t}})< \frac{\text{d}\left( {{\xi}_{0}} \right)-\varepsilon}{{{\mu}_{1}}}$.

由于进化算法首达时间与初始种群的状态有关, 为了刻画初始种群转移状态与首达时间的关系, E(Tτ |Ht)可简化为E(Tτ |d(ξ 0)).推论3给出E(Tτ |d(ξ 0))的估计式.

推论3 设$\{{{X}_{t}}\}_{\text{t}=0}^{\infty }$为一个非负随机过程, 假定对∀ t> 0, 有

$d(\xi_{opt}^{\text{t}})> 0, E({{T}_{\tau }})< \infty $,

若存在2个关于初始种群的函数ψ 10)、ψ 20), 使得

ψ 10)< E(Xt0)< ψ 20),

则对E(Tτ |d(ξ 0)),

$\frac{\text{d}\left( {{\xi}_{0}} \right)-\varepsilon}{{{\psi}_{2}}\left( {{\xi}_{0}} \right)}< E({{T}_{\tau }}|d({{\xi }_{0}}))< \frac{\text{d}\left( {{\xi}_{0}} \right)-\varepsilon}{{{\psi}_{1}}\left( {{\xi}_{0}} \right)}$

成立.

在推论3中, 平均首达时间可以由Kö tzing[30]的加性漂移定理的证明得到, 这是 He[5]对原有离散空间漂移结果的一种连续空间的自适应.他们在补充假设中对所有t≥ 0, 有$d(\xi_{opt}^{\text{t}})> 0$; 而对

∀ t=1, 2, …,

Yt=d(ξ 0)-ε =d(ξ 0),

即ε =0, 则在连续情形(对于所有t)下, μ 1> 0不存在.并且在连续搜索空间下, 算法很难搜索到局部最优解.因此本文在收敛时间中使用瓦尔德不等式.基于推论3, 可得到平均首达时间E(Tτ )的通用定理, 如定理3所示.

定理3 更新理论模型 设$\{{{X}_{t}}\}_{0}^{\infty }$为非负随机过程, 对∀ t≥ 0, 均有$d(\xi_{opt}^{\text{t}})> 0$, 令

$g, h\, \!:[{{d}_{min}}(\xi_{opt}^{\text{t}}), {{d}_{max}}(\xi_{opt}^{\text{t}})]\to {{R}^{+}}$

为单调递增可积函数, 若满足

$g(d(\xi _{\text{opt}}^{t-1}))\le E(d(\xi _{\text{opt}}^{t-1})-d(\xi _{\text{opt}}^{t})|d({{\xi }_{0}}))\le h(d(\xi _{\text{opt}}^{t-1})$,

则对Tτ ,

$\underset{{{d}_{\text{min}}}\ \ \left( \xi _{\text{opt}}^{t} \ \ \right)}{\overset{d\left( {{\xi }_{0}} \ \right)}{\mathop \int }}\, \frac{1}{h\left( t \right)}dt-\frac{1}{h\left( {{d}_{\text{min}}}\ \left( \xi _{\text{opt}}^{t}\ \ \right) \right)}\le E({{T}_{\tau }}|d({{\xi }_{0}}))\le 1+\underset{{{d}_{\text{min}}}\ \ \left( \xi _{\text{opt}}^{t}\ \ \right)}{\overset{d\left( {{\xi }_{0}}\ \right)}{\mathop \int }}\, \frac{1}{g\left( t \right)}dt$

成立.

证明

$G(x)=\left\{ \begin{array}{* {35}{l}}0, & x< {{d}_{\text{min}}}\left( \xi _{\text{opt}}^{t} \right) \\h\left( {{d}_{\text{min}}}\left( \xi _{\text{opt}}^{t} \right) \right)\underset{{{d}_{\text{min}}}\ \ \left( \xi _{\text{opt}}^{t} \ \ \right)}{\overset{x}{\mathop \int }}\, \frac{1}{h\left( t \right)}dt-1, & x\ge {{d}_{\text{min}}}\left( \xi _{\text{opt}}^{t} \right) \\\end{array} \right.$

${{x}_{t}}> {{d}_{min}}(\xi _{\text{opt}}^{t}), {{x}_{t}}_{+1}\ge {{d}_{min}}(\xi _{\text{opt}}^{t})$

时, 存在一个

$\zeta \in (d(\xi _{\text{opt}}^{t}), d(\xi _{\text{opt}}^{t-1}))$,

使得

$\begin{align} & G(d(\xi _{\text{opt}}^{t-1}))-G(d(\xi _{\text{opt}}^{t}))= \\ & h({{d}_{\min }}(\xi _{\text{opt}}^{t}))\underset{d\left( \xi _{\text{opt}}^{t} \ \ \right)}{\overset{d\ \left( \xi _{\text{opt}}^{t-1} \ \ \right)}{\mathop \int }}\, \frac{1}{h\left( t \ \right)}dt= \\ & \frac{h\left( {{d}_{\text{min}}}\left( \xi _{\text{opt}}^{t} \right) \right)}{h\left( \zeta \right)}(d(\xi _{\text{opt}}^{t-1})-d(\xi _{\text{opt}}^{t}))\le \\ & \frac{h\left( {{d}_{\text{min}}}\left( \xi _{\text{opt}}^{t} \right) \right)}{h\left( d\left( \xi _{\text{opt}}^{t} \right) \right)}(d(\xi _{\text{opt}}^{t-1})-d(\xi _{\text{opt}}^{t})) \\ \end{align}$

$\begin{align} & E(G(d(\xi _{\text{opt}}^{t-1}))-G(d(\xi _{\text{opt}}^{t}))|d({{\xi }_{0}}))\le \\ & E\left( h({{d}_{min}}(\xi _{\text{opt}}^{t}))\left. \frac{d\left( \xi _{\text{opt}}^{t-1} \right)-d\left( \xi _{\text{opt}}^{t} \right)}{h\left( d\left( \xi _{\text{opt}}^{t} \right) \right)} \right|d({{\xi }_{0}}) \right)\text{=} \\ & \frac{h\left( {{d}_{\text{min}}}\left( \xi _{\text{opt}}^{t} \right) \right)}{h\left( d\left( \xi _{\text{opt}}^{t} \right) \right)}E(d(\xi _{\text{opt}}^{t-1})-d(\xi _{\text{opt}}^{t})|d({{\xi }_{0}}))\le \\ & \frac{h\left( {{d}_{\text{min}}}\left( \xi _{\text{opt}}^{t} \right) \right)}{h\left( d\left( \xi _{\text{opt}}^{t} \right) \right)}h(d(\xi _{\text{opt}}^{t}))= \\ & h({{d}_{min}}(\xi _{\text{opt}}^{t})) \\ \end{align}$,

$\begin{align} & {{T}_{\tau }}=\left\{ \tau \left| \overset{\tau }{\mathop{\underset{k=1}{\mathop \sum }\, }}\, {{X}_{k}}< d({{\xi }_{0}})-{{d}_{min}}(\xi _{\text{opt}}^{t}), \overset{\infty }{\mathop{\underset{k=\tau }{\mathop \sum }\, }}\, {{X}_{k}}\ge d({{\xi }_{0}})-{{d}_{min}}(\xi _{\text{opt}}^{t}) \right. \right\}= \\ & \{\tau > 0G(\xi _{\text{opt}}^{{{T}_{\tau }}})={{d}_{min}}(\xi _{\text{opt}}^{t})\} \\ \end{align}$.

假定

$d({{\xi }_{0}})> {{d}_{min}}(\xi _{\text{opt}}^{t})$,

由推论3得

$\begin{align} & E({{T}_{\tau }}|d({{\xi }_{0}}))=E(T~_{{{d}_{\text{min}}}\ \left( \xi _{\text{opt}}^{t} \ \ \right)}^{h}|h(d({{\xi }_{0}})))\ge \\ & \frac{h\left( {{d}_{\text{min}}}\ \left( \xi _{\text{opt}}^{t} \ \right) \right)}{h\left( {{d}_{\text{min}}}\ \left( \xi _{\text{opt}}^{t} \ \ \right) \right)}\left( \underset{d{{~}_{\text{min}}}\ \left( \xi _{\text{opt}}^{t}\ \right)}{\overset{x}{\mathop \int }}\, \frac{1}{h\left( t \right)}\text{d}t-1 \right)= \\ & \underset{{{d}_{\text{min}}}\ \left( \xi _{\text{opt}}^{t} \ \right)}{\overset{d\left( {{\xi }_{0}} \right)}{\mathop \int }}\, \frac{1}{h\left( t \right)}-\frac{1}{h\left( {{d}_{\text{min}}}\ \left( \xi _{\text{opt}}^{t}\ \ \right) \right)} \\ \end{align}$.

证毕.

类似地, 可以证明E(Tτ |d(ξ 0))上界成立.

在定理3中, 期望增长率的上界和下界会随着$h(d(\xi _{\text{opt}}^{t-1}\ ))$和$g(d(\xi _{\text{opt}}^{t-1}\ ))$函数的变化而变化, 使得到的首达时间上下界更紧致.

3 进化策略的平均首达时间分析

本节运用更新理论模型, 分析(1, λ )ES在倾斜平面和超平面问题上的平均首达时间上界和下界.(1, λ )ES带均匀变异算子用于解决最优化问题算法流程如算法2.

算法2 (1, λ )ES流程

输入 初始种群个体ξ 0, 步长Δ 0(σ 0)

输出 满足给定精度dmin( ξoptt)的解

t=0;

随机生成λ 个个体种群ξ 0={ ξ10, ξ20, …, ξλ0};

计算每个个体适应值, 评估当代种群中个体优劣;

while not stop do

for i=1∶ λ do

ξ 't=ξ 't-1+Δ t(σ 0)U;

end for

计算每个个体适应值, 评估当代种群中个体优劣;

λ 个个体中选择一个ξ 't个体作为下一代的种群;

t=t+1;

end while

输出到目前为止找到的满意解.

在(1, λ )ES算法中, 每代以Δ t(σ 0)为步长, 通过

ξ 't=ξ 't-1+Δ t(σ 0)U

生成λ 个独立同分布子代个体, U表示均匀变异算子, 满足均匀分布, 概率密度函数为:

f1(x)=12, -1< x< 10, 其它

选择操作采取非精英保存, 即每代维持一个父代个体.通过计算每个个体的适应值, 评估种群个体适应值, 从λ 个子代个体中选择1个个体作为下一代的种群.如果(1, λ )ES算法收敛, 即1/5变异子代个体适应值比父代个体适应值更小, 则Δ t(σ 0)减小; 否则Δ t(σ 0)增大.然而, 在实际运行中, 算法很难找到最优解, 为了便于理论分析, 假设步长Δ t(σ )为一个定值1.

均匀分布变异是进化算法中常用的变异算子[21, 22], 这里使用均匀分布变异在倾斜平面和超平面上进行首达时间的分析.

3.1 (1, λ )ES在倾斜平面问题上的首达时间分析

本节主要分析(1, λ )ES带均匀变异算子在倾斜平面问题上的平均首达时间分析.倾斜平面问题是一个连续搜索空间的优化问题, 为了降低计算量, 本节主要讨论二维倾斜平面问题:

f(y1, y2)=y2,

(y1, y2)⊂S=[-c, c]× [0, c].

由此可知, y2=b时, 二维倾斜平面取得最大值.由于本文考虑最小值问题, 因此, 讨论的二维倾斜平面问题转化为

f=min f(y1, y2)=-y2,

(y1, y2)⊂S=[-c, c]× [0, c].

可见, y2=-c时二维倾斜平面取得最小值, 即目标适应值f* =-c.由于二维倾斜平面问题只在y2上有分量, 可以归结为一元问题.定义

$d(\xi _{k}^{t-1})=f(\xi _{k}^{t-1})-{{f}^{* }}$

为第t-1次迭代到最优解的适应值差, 第t-1代到第t代的增长率为:

${{\delta }_{t}}={{X}_{t}}=d(\xi _{k}^{t-1})-d(\xi _{k}^{t})=f(\xi _{k}^{t-1})-f(\xi _{k}^{t})$.

(1, λ )ES的平均首达时间关键是推导增长率的概率密度函数, 下面将推导带均匀变异(1, λ )ES的增长率分布函数.

定理4 对于(1, λ )ES, 如果变异算子服从U(-1, 1), 增长率δ t-1的分布函数为:

$F\left( \gamma \right)=P\left( \delta \le \gamma \right)=\left\{ \begin{array}{*{35}{l}} 0, & \gamma <0 \\ \left( \frac{1}{2} \right){^{\lambda }}, & \gamma =0 \\ \left( \frac{1}{2}+\frac{\gamma }{2} \right){^{\lambda }}, & 0<\gamma \le 1 \\ 1, & \gamma >1 \\ \end{array} \right.$

证明 由算法2可知, 父代y2分量个体ξ 't-1通过均匀变异Uk(k=1, 2, …, λ )产生λ 个子代个体

ξ 't, k=(ξ '1, ξ '2, …, ξ 'λ -1, ξ 'λ ), k=1, 2, …, λ ,

其个体之间相互独立, 则

ξt'=minξt, λ', maxξt, λ'< ξt-1'ξt-1', minξt, λ'> ξt-1'

根据增长率定义, 得

δt=maxUk, minUk00, maxUk< 0

进而增长率δ t的分布函数F(γ )表示如下.

1)当γ < 0时,

F(γ )=P(δ t< γ )=0.

2)当γ =0时,

$F(\gamma )=P({{\delta }_{t}}< \gamma )=P({{\delta }_{t}}=0)=P\{\max {{U}_{k}}< 0\}={{\left( \frac{1}{2} \right)}^{\lambda }}$.

3)当0< γ ≤ 1时,

$\begin{align} & F(\gamma )=P({{\delta }_{t}}< \gamma )=P(max{{U}_{k}}< \gamma )= \\ & {{(P({{\delta }_{t}}< 0)+P({{\delta }_{t}}=0)+P(0< \gamma < 1))}^{\lambda }}= \\ & {{\left( 0+\frac{1}{2}+\underset{0}{\overset{\gamma }{\mathop \int }}\, \frac{1}{2}d\gamma \right)}^{\lambda }}={{\left( \frac{1}{2}+\frac{\gamma }{2} \right)}^{\lambda }} \\ \end{align}$.

4)当 γ > 1时,

F(γ )=1.

因此

$F\left( \gamma \right)=\left\{ \begin{array}{* {35}{l}} 0, & \gamma < 0 \\ \left( \frac{1}{2} \right){{~}^{\lambda }}, & \gamma =0 \\ \left( \frac{1}{2}+\frac{\gamma }{2} \right){{~}^{\lambda }}, & 0< \gamma \le 1 \\ 1, & \gamma > 1 \\ \end{array} \right.$

证毕.

定理5 在(1, λ )ES求解倾斜平面问题中, 对于平均首达时间Tτ , 有

$\begin{align} & \frac{\left( \lambda +1 \right)\left( d\left( {{\xi }_{0}} \right)-{{d}_{\text{min}}}\left( \xi _{\text{opt}}^{t} \right) \right)}{\lambda +1+{{\left( 2 \right)}^{-\lambda }}}-\frac{\lambda +1}{\lambda +1+{{\left( 2 \right)}^{-\lambda }}}\le \\ & E({{T}_{\tau }}|d({{\xi }_{0}}))\le 1+\frac{\left( \lambda +1 \right)\left( d\left( {{\xi }_{0}} \right)-{{d}_{\text{min}}}\left( \xi _{\text{opt}}^{t} \right) \right)}{\lambda -1} \\ \end{align}$

成立.

证明 根据定理4, 可得

$\begin{align} & E({{\delta }_{t}}|{{H}_{t}})=\underset{-\infty }{\overset{+\infty }{\mathop \int }}\, \gamma dF(\gamma )=\underset{-\infty }{\overset{0}{\mathop \int }}\, \gamma dF(\gamma )+\underset{0}{\overset{1}{\mathop \int }}\, \gamma dF(\gamma )+\underset{1}{\overset{+\infty }{\mathop \int }}\, \gamma dF(\gamma )= \\ & 0+\underset{0}{\overset{1}{\mathop \int }}\, \gamma dF(\gamma )+0=\frac{\lambda }{2}\underset{0}{\overset{1}{\mathop \int }}\, \gamma {{\left( \frac{1}{2}+\frac{\gamma }{2} \right)}^{\lambda -1}}\text{d}\gamma \text{=}\left[ \gamma {{\left( \frac{1}{2}+\frac{\gamma }{2} \right)}^{\lambda }} \right]_{0}^{1}- \\ & \underset{0}{\overset{1}{\mathop \int }}\, {{\left( \frac{1}{2}+\frac{\gamma }{2} \right)}^{\lambda }}\text{d}\gamma \text{=}1-\frac{2}{\lambda +1}\left[ {{\left( \frac{1}{2}+\frac{\gamma }{2} \right)}^{\lambda +1}} \right]_{0}^{1}\text{=}1-\frac{2}{\lambda +1}\left( 1-{{\left( \frac{1}{2} \right)}^{\lambda +1}} \right) \\ \end{align}$

又因为

$E({{\delta }_{t}}|{{H}_{t}})=1-\frac{2}{\lambda +1}\left( 1-{{\left( \frac{1}{2} \right)}^{\lambda }}^{+1} \right)\ge 1-\frac{2}{\lambda +1}=\frac{\lambda -1}{\lambda +1}$,

$\begin{align} & E({{\delta }_{t}}|{{H}_{t}})=1-\frac{2}{\lambda +1}~(1-{{(2)}^{-\lambda -1}})\le \\ & 1-\frac{1}{\lambda +1}+\frac{1}{\lambda +1}~{{(2)}^{-\lambda -1}}=\frac{\lambda +{{\left( 2 \right)}^{-\lambda -1}}}{\lambda +1} \\ \end{align},$

所以可得出算法平均增长率:

$\frac{\lambda -1}{\lambda +1}\le E({{\delta }_{t}}|{{H}_{t}})\le \frac{\lambda +{{\left( 2 \right)}^{-\lambda }}}{\lambda +1}$.

根据定理3, 对于

${{d}_{\min }}(\xi _{\text{opt}}^{t})> 0$,

可得

$\begin{align} & \underset{{{d}_{\text{min}}}\ \left( \xi _{\text{opt}}^{t} \ \ \right)}{\overset{d\left( {{\xi }_{0}} \right)}{\mathop \int }}\, \frac{\lambda +1}{\lambda +{{\left( 2 \right)}^{-\lambda -1}}}dt-\frac{\lambda +1}{\lambda +{{\left( 2 \right)}^{-\lambda -1}}}\le \\ & E({{T}_{\tau }}|d({{\xi }_{0}}))\le 1+\underset{{{d}_{\text{min}}}\ \ \left( \xi _{\text{opt}}^{t} \right)}{\overset{d\left( {{\xi }_{0}} \right)}{\mathop \int }}\, \frac{\lambda +1}{\lambda -1}dt \\ \end{align}$,

$\begin{align} & E({{T}_{\tau }}|d({{\xi }_{0}}))\ge \underset{{{d}_{\text{min}}}\ \left( \xi _{\text{opt}}^{t}\ \right)}{\overset{d\left( {{\xi }_{0}} \right)}{\mathop \int }}\, \frac{\lambda +1}{\lambda +{{\left( 2 \right)}^{-\lambda -1}}}\text{d}t-\frac{\lambda +1}{\lambda +{{\left( 2 \right)}^{-\lambda -1}}}\text{=} \\ & \frac{\left( \lambda +1 \right)\left( d\left( {{\xi }_{0}} \right)-{{d}_{\text{min}}}\ \left( \xi _{\text{opt}}^{t} \ \ \right) \right)}{\lambda +{{\left( 2 \right)}^{-\lambda -1}}} \\ \end{align}$,

$\begin{align} & E({{T}_{\tau }}|d({{\xi }_{0}}))\le 1+\underset{{{d}_{\text{min}}}\ \ \left( \xi _{\text{opt}}^{t} \ \ \right)}{\overset{d\left( {{\xi }_{0}} \right)}{\mathop \int }}\, \frac{\lambda +1}{\lambda -1}dt= \\ & 1+\frac{\left( \lambda +1 \right)\left( d\left( {{\xi }_{0}} \right)-{{d}_{\text{min}}}\ \ \left( \xi _{\text{opt}}^{t} \ \ \right) \right)}{\lambda -1} \\ \end{align}$.

因此, 估计平均首达时间的上下界:

$\begin{align} & \frac{\left( \lambda +1 \right)\left( d\left( {{\xi }_{0}} \right)-{{d}_{\text{min}}}\ \ \left( \xi _{\text{opt}}^{t} \ \ \right) \right)}{\lambda +1+{{\left( 2 \right)}^{-\lambda }}}-\frac{\lambda +1}{\lambda +1+{{\left( 2 \right)}^{-\lambda }}}\le \\ & E({{T}_{\tau }}|d({{\xi }_{0}}))\le 1+\frac{\left( \lambda +1 \right)\left( d\left( {{\xi }_{0}} \right)-{{d}_{\text{min}}}\ \left( \xi _{\text{opt}}^{t}\ \right) \right)}{\lambda -1} \\ \end{align}$.

证毕.

3.2 (1, λ )ES在超平面问题上的首达时间分析

本节分析(1, λ )ES带均匀算子在超平面上的平均首达时间.

如果球函数的对称性在一个方向上被破坏, 这就是RIDGE问题, 相应的RIDGE函数表达式如下:

${{F}_{RIDGE}}(x)={{x}_{0}}-d{{\left( \overset{n-1}{\mathop{\underset{i=1}{\mathop \sum }\, }}\, x_{i}^{2} \right)}^{{{~}^{\frac{\theta }{2}}}}}, \theta \in R, d\in {{R}^{+}}$.

不失一般性, 本节主要研究超平面问题, 这是RIDGE函数中θ =0时的简化形式[31, 32].相应的函数表达式为

$f(x)={{a}_{0}}+\overset{n}{\mathop{\underset{i=1}{\mathop \sum }\, }}\, {{a}_{i}}{{x}_{i}}$,

${{a}_{0}}\in R, {{a}_{i}}\in {{R}^{+}}, {{x}_{i}}\subset S=[-b, b]$,

其中x=(x1, x2, …, xn), 考虑当x=(0, 0, …, 0), f(x)=a0为理想最小值.

定义

$d(\xi _{k}^{t-1})=f(\xi _{k}^{t-1})-{{f}^{* }}=({{a}_{0}}+{{a}_{1}}{{x}_{1}}+{{a}_{2}}{{x}_{2}}+\ldots +{{a}_{n}}{{x}_{n}})-{{a}_{0}}$

为第t-1次迭代到最优解的适应值差.那么第t-1代到第t代的增长率为:

$\begin{align} & {{\delta }_{t}}={{X}_{t}}=d(\xi _{k}^{t-1})-d(\xi _{k}^{t})=f(\xi _{k}^{t-1})-f(\xi _{k}^{t})= \\ & \left[ {{a}_{1}}(x_{1}^{t-1}-x_{1}^{t})+\cdots +{{a}_{n}}(x_{n}^{t-1}-x_{n}^{t}) \right] \\ \end{align}$.

虽然独立同分布的均匀分布具有可加性, 但是计算量较复杂, 积分不易计算.为了减少冗余的复杂计算, 下面主要考虑n=5的情形, 结合列维-林德伯格中心极限定理进行分析.增长率δ t由变异算子及问题规模决定, 因此增长率δ t是一个随机变量, 分布函数计算如定理6.

定理6n=5时, 对于(1, λ )ES, 如果变异算子U服从U(-1, 1), 那么增长率δ t的分布函数为:

$F(\gamma )=P({{\delta }_{t}}\le \gamma )=\left\{ \begin{array}{* {35}{l}} 0, & \gamma< 0 \\ {{\left( \frac{1}{2} \right)}^{\lambda }}, & \gamma=0 \\ {{\left( \sqrt{\frac{3}{2\pi\left( a_{1}^{2}+a_{2}^{2}+\ldots +a_{5}^{2} \right)}}\underset{-\infty }{\overset{\gamma }{\mathop \int }}\, \text{exp}\left( -\frac{3{{t}^{2}}\left( a_{1}^{2}+a_{2}^{2}+\ldots +a_{5}^{2} \right)}{2} \right)\text{d}t \right)}^{\lambda }}, & \gamma > 0 \\ \end{array} \right.$

证明 随机变量 x1t-1-x1t, x2t-1-x2t, …, x5t-1-x5t的期望和方差如下:

$E(x_{k}^{t-1}-x_{k}^{t})=0$,

$D(x_{k}^{t-1}-x_{k}^{t})=\frac{1}{3}, k=1, 2, \ldots , 5$.

则随机变量

$\overset{5}{\mathop{\underset{k=1}{\mathop \sum }\, }}\, {{a}_{k}}(x_{k}^{t-1}-x_{k}^{t})\tilde{\ }N\left( 0, \frac{1}{3}(a_{1}^{2}+a_{2}^{2}+\ldots +a_{5}^{2}) \right)$.

其中~表示近似等于.

1)当γ < 0时, 即f(ξ 't)> f(ξ 't-1), 则

F(γ )=0.

2)当γ =0时, 即

$f(\xi _{t}^{'})=f(\xi _{t-1}^{'}), \underset{k=1, 2, \ldots , \lambda }{\mathop{\text{max}}}\, (f(\xi _{t, k}^{'})-f(\xi _{t-1}^{'}))=0$,

$F(\gamma )={{\left( \frac{1}{2} \right)}^{\lambda }}$.

3)当γ > 0, 即f(ξ 't)< f(ξ 't-1)等价于

$\underset{k=1, 2, \ldots , \lambda }{\mathop{\text{max}}}\, ~(f(\xi _{t, k}^{'})-f(\xi _{t-1}^{'}))$

时, 则

$\begin{align}& F(\gamma )=\underset{k=1, 2, \ldots , \lambda }{\mathop{\text{max}}}\, ~(f(\xi _{t, k}^{'})-f(\xi _{t-1}^{'}))=\overset{\lambda }{\mathop{\underset{k=1}{\mathop \prod }\, }}\, ~(f(\xi _{t, k}^{'})-f(\xi _{t-1}^{'}))= \\& {{\left( \sqrt{\frac{3}{2\pi\left( a_{1}^{2}+a_{2}^{2}+\ldots +a_{5}^{2} \right)}}\underset{-\infty }{\overset{\gamma }{\mathop \int }}\, \exp \left( \frac{3{{t}^{2}}\left( a_{1}^{2}+a_{2}^{2}+\ldots +a_{5}^{2} \right)}{2} \right)dt \right)}^{\lambda }} \\ \end{align}$.

因此

F(γ)=0, γ< 0(12)λ, γ=0(12+32π(a12+a22++a52)0γexp(-3t2(a12+a22++a52)2)dt)λ, γ> 0

证毕.

不妨假定进化策略在初始化种群时, 初始化种群到满意解的距离为d(ξ 0), 即有如下定理7成立.

定理7 在(1, λ )ES求解超平面问题中, 对于${{d}_{\min }}(\xi _{\text{opt}}^{t})> {{a}_{0}}$, 估计首达时间Tτ , 则有

$\begin{align} & \sqrt{\frac{6\pi}{{{\lambda }^{2}}\left( a_{1}^{2}+a_{2}^{2}+\ldots +a_{5}^{2} \right)}}~(d({{\xi }_{0}})-{{d}_{min}}(\xi _{\text{opt}}^{t})-1)\le E({{T}_{\tau }}|d({{\xi }_{0}}))\le \\ & 1+\sqrt{\frac{24\pi}{{{\lambda }^{2}}\left( a_{1}^{2}+a_{2}^{2}+\ldots +a_{5}^{2} \right)}}(d(\xi 0)-{{d}_{\min }}(\xi _{\text{opt}}^{t})) \\ \end{align}$

成立.

证明 根据定理4, 可得

$\begin{align} & E({{\delta }_{t}}|{{H}_{t}})=\underset{-\infty }{\overset{+\infty }{\mathop \int }}\, \gamma dF(\gamma )=\underset{-\infty }{\overset{0}{\mathop \int }}\, \gamma dF(\gamma )+\underset{0}{\overset{+\infty }{\mathop \int }}\, \gamma dF(\gamma )= \\ & \underset{0}{\overset{+\infty }{\mathop \int }}\, \gamma d{{\left( \frac{1}{2}+\sqrt{\frac{3}{2\pi\left( a_{1}^{2}+a_{2}^{2}+\ldots +a_{5}^{2} \right)}}\underset{0}{\overset{\gamma }{\mathop \int }}\, \exp \left( -\frac{3{{t}^{2}}\left( a_{1}^{2}+a_{2}^{2}+\ldots +a_{5}^{2} \right)}{2} \right)dt \right)}^{\lambda }}= \\ & \underset{0}{\overset{+\infty }{\mathop \int }}\, \gamma \lambda {{\left( \frac{1}{2}+\sqrt{\frac{3}{2\pi\left( a_{1}^{2}+a_{2}^{2}+\ldots +a_{5}^{2} \right)}}\underset{0}{\overset{\gamma }{\mathop \int }}\, \exp \left( -\frac{3{{t}^{2}}\left( a_{1}^{2}+a_{2}^{2}+\ldots +a_{5}^{2} \right)}{2} \right)dt \right)}^{\lambda -1}}\cdot \\ & \sqrt{\frac{3}{2\pi\left( a_{1}^{2}+a_{2}^{2}+\ldots +a_{5}^{2} \right)}}\exp \left( -\frac{3{{\gamma }^{2}}\left( a_{1}^{2}+a_{2}^{2}+\ldots +a_{5}^{2} \right)}{2} \right)dt. \\ \end{align}$.

由于在算法运行过程中, 随机变量$f(\xi _{t, k}^{'})-f(\xi _{t-1}^{'})\ge 0$且服从均匀分布U(-1, 1), 故$\frac{1}{2}\le F(\gamma )\le 1$.而

$\underset{0}{\overset{+\infty }{\mathop \int }}\, \gamma \sqrt{\frac{3}{2\pi\left( a_{1}^{2}+a_{2}^{2}+\ldots +a_{5}^{2} \right)}}\exp \left( -\frac{3{{t}^{2}}\left( a_{1}^{2}+a_{2}^{2}+\ldots +a_{5}^{2} \right)}{2} \right)dt=\sqrt{\frac{a_{1}^{2}+a_{2}^{2}+\ldots +a_{5}^{2}}{6\pi}}$,

因此

$\frac{\lambda }{2}\sqrt{\frac{a_{1}^{2}+a_{2}^{2}+\ldots +a_{5}^{2}}{6\pi}}\le E({{\delta }_{t}}|{{H}_{t}})\le \lambda \sqrt{\frac{a_{1}^{2}+a_{2}^{2}+\ldots +a_{5}^{2}}{6\pi}}$.

假定算法初始化从原点出发, 根据定理4, 推导的首达时间Tτ 下界

$\begin{align} & E({{T}_{\tau }}|d({{\xi }_{0}}))\ge \underset{{{d}_{\text{min}}}\ \ \left( \xi _{\text{opt}}^{t} \ \ \right)}{\overset{d\left( {{\xi }_{0}} \right)}{\mathop \int }}\, \sqrt{\frac{6\pi}{{{\lambda }^{2}}\left( a_{1}^{2}+a_{2}^{2}+\ldots +a_{5}^{2} \right)}}dt-\sqrt{\frac{6\pi}{{{\lambda }^{2}}\left( a_{1}^{2}+a_{2}^{2}+\ldots +a_{5}^{2} \right)}}= \\ & \sqrt{\frac{6\pi}{{{\lambda }^{2}}\left( a_{1}^{2}+a_{2}^{2}+\ldots +a_{5}^{2} \right)}}(d({{\xi }_{0}})-{{d}_{\min }}(\xi _{\text{opt}}^{t}))-\sqrt{\frac{6\pi}{{{\lambda }^{2}}\left( a_{1}^{2}+a_{2}^{2}+\ldots +a_{5}^{2} \right)}}= \\ & \sqrt{\frac{6\pi}{{{\lambda }^{2}}\left( a_{1}^{2}+a_{2}^{2}+\ldots +a_{5}^{2} \right)}}(d({{\xi }_{0}})-{{d}_{\min }}(\xi _{\text{opt}}^{t})-1) \\ \end{align}$,

上界

$\begin{align} & E({{T}_{\tau }}|d({{\xi }_{0}}))\le 1+\underset{{{d}_{\text{min}}}\ \left( \xi _{\text{opt}}^{t} \ \right)}{\overset{d\left( {{\xi }_{0}} \right)}{\mathop \int }}\, \sqrt{\frac{24\pi}{{{\lambda }^{2}}\left( a_{1}^{2}+a_{2}^{2}+\ldots +a_{5}^{2} \right)}}dt= \\ & 1+\sqrt{\frac{24\pi}{{{\lambda }^{2}}\left( a_{1}^{2}+a_{2}^{2}+\ldots +a_{5}^{2} \right)}}(d({{\xi }_{0}})-{{d}_{\min }}(\xi _{\text{opt}}^{t})) \\ \end{align}$.

证毕.

由定理5和定理7可得, (1, λ )ES在满足均匀分布变异算子时, 理论分析可得到倾斜平面和超平面的首达时间的上下界.

4 数值实验及结果分析

本节实验目的是为了验证更新理论模型在分析(1, λ )ES在倾斜平面问题与超平面问题平均首达时间理论上下界的准确性.

4.1 (1, λ )ES求解倾斜平面问题

定理5给出二维倾斜平面的平均首达时间上下界的闭合表达式, 下面通过实验方式验证此理论结果.实验中设置如下实验参数:

${{\xi }_{0}}=(x_{1}^{0}, x_{2}^{0})=(0, 0), c=3, d({{\xi }_{0}})=3$,

固定误差

${{d}_{\min }}(\xi _{\text{opt}}^{t})=0.01$.

对于每个种群大小λ , 将算法2在二维倾斜平面上运行100轮.定义$T_{{{d}_{\min \ \left( \xi _{\text{opt}}^{t} \ \right)}}}^{i}$ 表示算法2中第i轮在${{d}_{\min }}(\xi _{\text{opt}}^{t})$去心邻域的首达时间, 实际运行平均首达时间

$E\left( \bar{T}_{{{d}_{\min \ \left( \xi _{\text{opt}}^{t} \ \right)}}}^{i} \ \ \ \ |d({{\xi }_{0}})~ \right)=\frac{1}{100}\overset{100}{\mathop{\underset{i=1}{\mathop \sum }\, }}\, T_{{{d}_{\min \ \left( \xi _{\text{opt}}^{t} \ \right)}}}^{i}$.

记理论分析下界

$E_{\text{low}}^{1}~({{T}_{\tau }}|d({{\xi }_{0}}))=\frac{\left( \lambda +1 \right)\left( d\left( {{\xi }_{0}} \right)-{{d}_{\text{min}}}\ \left( \xi _{\text{opt}}^{t} \ \right) \right)}{\lambda +{{\left( 2 \right)}^{-\lambda -1}}}$,

理论分析上界

$E_{\text{up}}^{1}~({{T}_{\tau }}|d({{\xi }_{0}}))=1+\frac{\left( \lambda +1 \right)\left( d\left( {{\xi }_{0}} \right)-{{d}_{\text{min}}}\ \left( \xi _{\text{opt}}^{t} \ \right) \right)}{\lambda -1}$.

表1给出(1, λ )ES在二维倾斜平面上实际平均首达时间与理论上的时间上界和下界.从表中可以看出, 在选择种群小于λ =13时, 随着种群规模的不断增大, 平均首达时间不断减小, 与理论分析时间的上下界一致.然而当种群大于λ =13时, 随着种群的不断增大, 平均首达时间和理论分析时间的上下界的结果并未减小, 反而趋于一个稳定值.此结果表明种群规模与平均首达时间之间并非负相关.

表1 二维倾斜平面上理论与实际平均首达时间对比 Table 1 Comparison of theoretical and actual first hitting time on a two-dimensional inclined plane

文献[24]引入鞅论和勒贝格控制收敛定理, 分析平均首达时间的上界, 得到紧致的闭合表达式, 但是勒贝格控制收敛定理要求存在控制函数, 这是一个很强的条件, 而本文模型无需要求存在控制函数, 削弱条件后得到更一般结果的时间上下界.文献[23]只给出一个渐近的表达式结果, 而本文模型考虑种群规模对首达时间的影响, 得出更紧的时间下界.

4.2 (1, λ )ES求解超平面问题

定理7给出超平面的平均首达时间的上下界的闭合表达式, 下面验证此理论结果.实验中设置如下实验参数:

${{\xi }_{0}}=(x_{1}^{0}, x_{2}^{0}, \ldots , x_{5}^{0})=(3, 3, \ldots , 3)$,

$b=3, {{a}_{i}}=\sqrt{2}, i=0, 1, \ldots , 5$,

$d({{\xi }_{0}})\text{=}15\sqrt{2}$,

固定误差

${{d}_{\min }}(\xi _{\text{opt}}^{t})=0.01$.

对于每个种群λ , 将算法2在超平面上运行100轮.定义 Tdmin(ξoptt)i表示算法2中第i轮在dmin( ξoptt)去心邻域的首达时间, 平均首达时间为:

$E\left( \bar{T}~_{{{d}_{\text{min}}}\ \left( \xi _{\text{opt}}^{t} \ \right)}^{i}|d({{\xi }_{0}}) \right)=\frac{1}{100}\overset{100}{\mathop{\underset{i=1}{\mathop \sum }\, }}\, T~_{{{d}_{\text{min}}}\ \left( \xi _{\text{opt}}^{t} \ \right)}^{i}$.

记理论分析下界为:

$E_{\text{low}}^{2}({{T}_{\tau }}|d({{\xi }_{0}}))=\sqrt{\frac{6\pi}{{{\lambda }^{2}}\left( a_{1}^{2}+a_{2}^{2}+\ldots +a_{5}^{2} \right)}}~(d({{\xi }_{0}})-{{d}_{\min }}(\xi _{\text{opt}}^{t})-1)$,

理论分析上界为:

$E_{\text{up}}^{2}~({{T}_{\tau }}|d({{\xi }_{0}}))=1+\sqrt{\frac{24\pi}{{{\lambda }^{2}}\left( a_{1}^{2}+a_{2}^{2}+\ldots +a_{5}^{2} \right)}}~(d({{\xi }_{0}})-{{d}_{\min }}(\xi _{\text{opt}}^{t}))$.

表2给出(1, λ )ES在超平面上实际平均首达时间与理论上的时间上下界.从表中可以看出, 随着种群规模λ 不断增长, 实际运行平均首达时间不断减少, 这与理论分析的结果一致.文献[30]通过加性漂移(Additive Drift)分析(1+1)EA在超平面上的计算时间上界, 得到紧致的闭合表达式, 但未关注首达时间下界.同时本文模型将(1+1)EA推广到(1, λ )ES, 得到更通用的结果.

表2 五维超平面上理论与实际平均首达时间对比 Table 2 Comparison of theoretical and actual first hitting time on a five-dimensional hyperplane
5 结束语

本文针对进化策略平均首达时间上下界估计困难的问题, 提出更新理论模型予以解决.在倾斜平面和超平面问题上, 分析(1, λ )ES带均匀分布变异的平均首达时间, 得到估计进化策略首达时间的上下界闭合解析式, 同时分析种群规模与平均首达时间之间的相关性.更新理论模型在连续搜索空间上呈现逐渐收敛的过程, 并且在种群规模一定范围内, 增加种群规模能减少进化策略的平均首达时间.数值实验表明, 进化策略平均首达时间的理论估计与实际运行的首达时间一致.与此同时, 本文方法可应用到其它进化算法, 如微搜索算法、粒子群算法和差分进化算法等.今后将基于增长率, 使用统计学的方法辅助理论方法估计进化策略的首达时间, 尤其是带重组的计算时间分析.另外, 本文假设进化策略变异步长是定值情况, 因此, 下一步将对可变步长展开分析, 把理论结果推广到进化策略的实际应用中.

本文责任编委 付 俊

Recommended by Associate Editor FU Jun

参考文献
[1] BÄCK T, SCHWEFEL H P. An Overview of Evolutionary Algorithms for Parameter Optimization. Evolutionary Computation, 1993, 1(1). DOI:10.1162/evco.1993.1.1.1. [本文引用:1]
[2] HE J, YAO X. Average Drift Analysis and Population Scalability. IEEE Transactions on Evolutionary Computation, 2017, 21(3): 426-439. [本文引用:1]
[3] YAO X. Unpacking and Understand ing Evolutionary Algorithms // Proc of the IEEE World Congress on Computational Intelligence. Washington, USA: IEEE, 2012: 60-76. [本文引用:1]
[4] OLIVETO P S, HE J, YAO X. Time Complexity of Evolutionary Algorithms for Combinatorial Optimization: A Decade of Results. International Journal of Automation and Computing, 2007, 4(3): 281-293. [本文引用:2]
[5] HE J, YAO X. Drift Analysis and Average Time Complexity of Evolutionary Algorithms. Artificial intelligence, 2001, 127(1): 57-85. [本文引用:2]
[6] HE J, YAO X. Towards an Analytic Framework for Analysing the Computation Time of Evolutionary Algorithms. Artificial Intelligence, 2003, 145(1/2): 59-97. [本文引用:1]
[7] YU Y, ZHOU Z H. A New Approach to Estimating the Expected First Hitting Time of Evolutionary Algorithms. Artificial Intelligence, 2008, 172(15): 1809-1832. [本文引用:1]
[8] LENGLER J, STEGER A. Drift Analysis and Evolutionary Algorithms Revisited. Combinatorics, Probability and Computing, 2018, 27(4): 643-666. [本文引用:1]
[9] YU Y, QIAN C, ZHOU Z H. Switch Analysis for Running Time Analysis of Evolutionary Algorithms. IEEE Transactions on Evolutionary Computation, 2014, 19(6): 777-792. [本文引用:1]
[10] WEGENER I. Methods for the Analysis of Evolutionary Algorithms on Pseudo-Boolean Functions[C/OL]. [2023-2-06]. https://www.researchgate.net/publication/225910965_Methods_for_the_Analysis_of_Evolutionary_Algorithms_on_Pseudo-Boolean_Functions. [本文引用:1]
[11] HUANG H, SU J P, ZHANG Y S, et al. An Experimental Method to Estimate Running Time of Evolutionary Algorithms for Continuous Optimization. IEEE Transactions on Evolutionary Computation, 2020, 24(2): 275-289. [本文引用:1]
[12] 冯夫健, 黄翰, 张宇山, . 基于等同关系模型的演化算法期望首达时间对比分析. 计算机学报, 2019, 42(10): 2297-2308.
(FENG F J, HUANG H, ZHANG Y S, et al. Comparative Analysis for First Hitting Time of Evolutionary Algorithms Based on Equal-in-Time Model. Chinese Journal of Computers, 2019, 42(10): 2297-2308. ) [本文引用:1]
[13] WITT C. Tight Bounds on the Optimization Time of a Rand omized Search Heuristic on Linear Functions. Combinatorics, Probability and Computing, 2013, 22(2): 294-318. [本文引用:1]
[14] DOERR B, DOERR C, KÖTZING T. Static and Self-Adjusting Mutation Strengths for Multi-valued Decision Variables. Algorithmica, 2018, 80(5): 1732-1768. [本文引用:1]
[15] DOERR B, KÖTZING T, LAGODZINSKI J A G, et al. The Impact of Lexicographic Parsimony Pressure for Order/Majority on the Run Time. Theoretical Computer Science, 2020, 816: 144-168. [本文引用:1]
[16] DOERR B, DOERR C, YANG J. Optimal Parameter Choices via Precise Black-Box Analysis. Theoretical Computer Science, 2020, 801. DOI:10.1016/j.tcs.2019.06.014. [本文引用:1]
[17] LEHRE P K, WITT C. Tail Bounds on Hitting Times of Rand o-mized Search Heuristics Using Variable Drift Analysis. Combinatorics, Probability and Computing, 2021, 30(4): 550-569. [本文引用:1]
[18] GIEβEN C, WITT C. Optimal Mutation Rates for the (1+ λ)EA on OneMax through Asymptotically Tight Drift Analysis. Algorithmica, 2018, 80(5): 1710-1731. [本文引用:1]
[19] JIANG W, QIAN C, TANG K. Improved Running Time Analysis of the (1+1)-ES on the Sphere Function // Proc of the 14th International Conference on Intelligent Computing. Berlin, Germany: Springer, 2018: 729-739. [本文引用:1]
[20] 张宇山, 郝志峰, 黄翰, . 进化算法首达时间分析的停时理论模型. 计算机学报, 2015, 38(8): 1582-1591.
(ZHANG Y S, HAO Z F, HUANG H, et al. A Stopping Time Theory Model of First Hitting Time Analysis of Evolutionary Algorithms. Chinese Journal of Computers, 2015, 38(8): 1582-1591. ) [本文引用:1]
[21] AGAPIE A, SOLOMON O, BǍDIN L. Theory of (1+1)ES on SPHERE Revisited. IEEE Transactions on Evolutionary Computation, 2023, 27(4): 938-948. [本文引用:2]
[22] JÄGERSKÜPPER J. Algorithmic Analysis of a Basic Evolutionary Algorithm for Continuous Optimization. Theoretical Computer Science, 2007, 379(3): 329-347. [本文引用:2]
[23] AGAPIE A, AGAPIE M, ZBAGANU G. Evolutionary Algorithms for Continuous-Space Optimisation. International Journal of Systems Science, 2013, 44(3): 502-512. [本文引用:2]
[24] 张宇山, 黄翰, 郝志峰, . 连续型演化算法首达时间分析的平均增益模型. 计算机学报, 2019, 42(3): 624-634.
(ZHANG Y S, HUANG H, HAO Z F, et al. An Average Gain Model to Analyze the First Hitting Time of Continuous Evolutionary Algorithms. Chinese Journal of Computers, 2019, 42(3): 624-634. ) [本文引用:3]
[25] DIOUANE Y, GRATTON S, VICENTE L N. Globally Convergent Evolution Strategies. Mathematical Programming, 2015, 152: 467-490. [本文引用:2]
[26] BEYER H G. The Theory of Evolution Strategies. Berlin, Germany: Springer Science & Business Media, 2001. [本文引用:1]
[27] AKIMOTO Y, AUGER A, HANSEN N. Quality Gain Analysis of the Weighted Recombination Evolution Strategy on General Convex Quadratic Functions. Theoretical Computer Science, 2020, 832: 42-67. [本文引用:1]
[28] NEUMANN F, WITT C. Runtime Analysis of the (1+1)EA on Weighted Sums of Transformed Linear Functions // Proc of the International Conference on Parallel Problem Solving from Nature. Berlin, Germany: Springer, 2022: 542-554. [本文引用:1]
[29] DOERR B, KÖTZING T. Lower Bounds from Fitness Levels Made Easy // Proc of the Genetic and Evolutionary Computation Confe-rence. New York, USA: ACM, 2021: 1142-1150. [本文引用:1]
[30] KÖTZING T. Concentration of First Hitting Times under Additive Drift. Algorithmica, 2016, 75(3): 490-506. [本文引用:2]
[31] SHI F, SCHIRNECK M, FRIEDRICH T, et al. Reoptimization Time Analysis of Evolutionary Algorithms on Linear Functions under Dynamic Uniform Constraints. Algorithmica, 2019, 81(2): 828-857. [本文引用:1]
[32] AGAPIE A, SOLOMON O, GIUCLEA M. Theory of (1+1)ES on the RIDGE. IEEE Transactions on Evolutionary Computation, 2022, 26(3): 501-511. [本文引用:1]