跳到主要内容

交易费用最小的稀疏股权投资组合优化的近似线性化方法

摘要

在本文中,我们提出了一个稀疏股权投资组合优化模型,该模型旨在通过避免小额投资来最小化交易成本,同时促进多元化,以帮助缓解投资组合的波动性。前者通过包括\(\ell_{0}\)-规范化资产权重以促进稀疏性。在期望收益最小的条件下,该模型是一个由间断项和非凸项组成的目标函数。模型的复杂性要求使用近似方法,该方法允许我们通过相应的近似操作符分别处理客观项。我们开发了一种有效的算法来寻找最优投资组合,并证明其全局收敛性。使用实际股票数据证明了该算法的有效性,并且该模型在产生更高的预期收益的同时保持良好的稀疏性,从而最小化交易成本方面,在投资组合选择中很有前景。

1介绍

马科维茨介绍[22]1952年,均值-方差优化(MVO)被广泛用于选择最优投资组合。MVO的成功归功于其二次目标函数的简单性,而二次目标又可以通过广泛使用的二次规划(QP)方法进行优化。然而,MVO本身存在缺陷,其在投资组合优化中的实施受到了学术界和专业人士的强烈批评[25]. 正如米绍德指出的那样,它的缺陷之一[23],是其对输入参数的敏感性,从而最大化与这些输入相关的误差。Best和Grauer从理论和计算上证明了这一点[2]资产预期收益或相关性的微小变化导致投资组合权重的大幅变化。这导致了一系列研究,对风险度量和回报率的不同策略进行了调查[17,18,20,27]. 通过文献,很明显,由于缺乏简单到可以作为QP问题的模型,MVO仍然是最成功的框架之一。

在过去十年左右的时间里,稳健优化技术的成功使研究人员能够考虑投资组合优化的非二次目标函数和正则化。因此,Daubechies等人的工作[11]表明通常的二次正则化惩罚可以用加权来代替\(\ell_{p}\)-定额罚款\(第[1,2]页)。投资组合优化中的两个具体案例,即最小绝对收缩和选择算子(lasso),当\(p=1\)和岭回归\(p=2\)Brodie等人[8]DeMiguel等人[13]分别为。当岭回归正则化使样本方差最小化,从而导致多样化时,套索正则化鼓励稀疏投资组合,从而导致交易成本最小化。Chen等人对此类正则化进行了显著研究[9],摩尔数[12]和Fastrich等人[14].

实际上,金融机构向客户收取股票市场交易费。向客户收费的两种最常见方式是基于固定交易费和/或投资金额的比例,以较高者为准。一般来说,大量交易将导致较高的交易成本,这可能是由产生固定交易费用的小额投资引起的。从这个意义上讲,交易成本将对投资组合优化和投资组合时间再平衡频率产生影响。另一方面,多元化是指分散投资,从而限制任何一种资产的风险敞口。这种做法有助于减轻投资组合中的风险和波动性,有可能增加投资组成部分的数量,从而增加交易数量。因此,需要一个更现实的模型来在多样化和交易成本最小化之间取得平衡,以便进行最优投资组合选择。

由于目标函数和所涉及的正则化的复杂性,文献中的许多现有研究都采用了交替方向乘数法(ADMM),该方法首先由Gabay和Mercier引入[16]1976年。直到最近十年,ADMM才在机器学习问题上得到了很多关注。ADMM的本质是,当只能使用近似运算符近似客观项时,它允许单独处理这些客观项。它在大规模凸优化问题中的吸引人的特性包括易于实现和相对良好的性能(例如,参见Boyd等人[7],Fazel等人[15]佩林和伦卡利[25]). Chen等人在投资组合优化中发现了ADMM-like算法的一些示例[9]、戴和文[10],和Lai等人[19],用于求解\(\ell_{p}\)-在以下情况下正则化问题\(第[1,2]页).虽然\(\ell_{0}\)-范数是稀疏问题的理想解,正则化会导致一个不连续的非凸问题,因此计算求解它会变得很复杂。

在本文中,我们提出了一个新的算法框架,以在促进多样化的同时最大化整个投资组合中的稀疏性,即最小化\(\ell_{0}\)-和\(\ell_{2}\)-资产权重的标准值分别取决于通过MVO获得的最小预期回报。我们首先将约束问题转化为无约束问题,以找到一个非光滑且非凸的目标项。ADMM技术允许我们分别处理这些项,但仍会收敛到其最优解。还提供了使用实际数据的数值结果,以说明与标准MVO相比,所提出的模型的可靠性及其在产生更高预期回报的同时最小化交易成本的效率。

本文的结构如下:在Sect。 2,我们提出了一个交易费用最小的稀疏股票投资组合优化模型,并建立了近似线性化方法\(\ell_{0}\)-范数最小化。随后,在第。 ,我们提出了一种类似ADMM的算法来寻找该模型的最优投资组合,并对其收敛性进行了分析。为了说明我们方法的可靠性和有效性,我们在第。 4最后,本文的结论在第节中给出。 5.

2近似线性化方法\(\ell_{0}\)-范数最小化

我们从一个宇宙开始n个考虑中的资产,具有平均回报向量\(\mu\in\mathbb{R}^{n}\)和协方差矩阵\(V\in\mathbb{R}^{n\times n}\).让\(x\in\mathbb{R}^{n}\)是投资组合中资产权重的向量。我们的目标是最大化投资组合回报\(\mu^{T}x\)最小化投资组合收益的方差\(x^{T}V x \)同时保持一定的多元化水平\(\ | x\|^{2}_{2}\)并将交易成本降至最低\(\|x\|_{0}\)投资组合收益的方差是投资组合固有风险的度量,在本文中我们将其表示为方差风险。如果存在这样的话\(x{i}=1\)并在下列条件下平均加权\(x{i}=\压裂{1}{n}\)为所有人.我们假设资本已全部投入,因此\(e^{T}x=1\)哪里\(e \ in \ mathbb{R}^{n}\)是一个全一向量。标准MVO[22]如下所示:

$$\开始{aligned}\min_{x\in\mathbb{R}^{n}}&\quad\frac{1}{2} x个^{T} Vx-\gamma\mu^{T}x\end{aligned}$$
(1)
$$\开始{aligned}\quad\text{subject to}&\quad x\suceq 0,\end{aligned}$$
(2)
$$\开始{aligned}&\四元e^{T}x=1,结束{aligned}$$
(3)

哪里\(伽马>0)是利用预期收益和不等式的参数(2)是没有卖空限制,有符号表示向量之间的分量不等式。在此,多元化对于降低投资组合风险而不一定降低投资组合回报具有普遍重要性。虽然多元化并不意味着我们在投资中增加了更多的资金,但它确实会降低我们的投资价值,因为每项股权投资都会产生交易成本。我们建议的方法考虑了多元化投资,但同时避免了可能因多元化而导致不必要交易成本的小额投资。为此,我们考虑向量的稀疏性度量\(x\in\mathbb{R}^{n}\)由其提供\(\ell_{0}\)-标准:

$$\Vertx\Vert_{0}:=\text{}x_{i}的非零分量数$$

具有最小交易成本的稀疏股票投资组合优化(SEPO-\(\ell_{0}\))声明如下:

$$开始{aligned}\min_{x\in\mathbb{R}^{n}}&\quad\frac{beta_{1}}{2}x^{T}Vx-\mu^{T{x+frac{beta_{2}}{2}\Vertx\Vert^{2}_{2} +\垂直x\垂直_{0}\end{aligned}$$
(4)
$$\开始{aligned}\quad\text{subject to}&\quad\\mu^{T}x\geqr,\end{aligned}$$
(5)
$$\开始{aligned}&\四x \成功0,\结束{aligned}$$
(6)
$$\开始{aligned}&\四元e^{T}x=1,结束{aligned}$$
(7)

哪里\(β{1}>0\)是利用投资组合差异风险的参数,\(β{2}>0\)是利用投资组合多元化的参数,以及\(第0页)是最小保证回报率\(r\leq\max\{\mu_{i}\}\)虽然标准做法是引入一个参数来利用预期回报\(\mu^{T}x\)在目标函数中,我们考虑了一个更直接的不等式约束(5)其中可以容易地决定最小期望回报,同时通过目标函数使其最大化。请注意,最小化\(\ell_{0}\)-中的规范(4)促进投资组合中的稀疏性,因为\(x{i}\)除大额交易外,其他交易都被强制为零,从而降低了交易成本。

我们的模型(4)–(7)由于非凸性和不连续性,导致计算困难\(\ell_{0}\)-范数,最小保证收益约束(5),没有卖空限制(6). 我们使用ADMM来处理光滑项和非光滑项,而不是从整体上处理问题。这需要简要介绍近端算子和Moreau包络[26]:

定义2.1

\(\psi\colon\mathbb{R}^{n}\rightarrow\mathbb{R}\cup\{+\infty\}\)是一个适当的下半连续函数\(σ>0)是一个参数。的近端运算符ψ定义为

$$\mathrm美元{近似}_{\sigma\psi}(x)=\mathop{\arg\min}_{y\in\mathbb{R}^{n}}\biggl\{\psi(y)+\frac{1}{2\sigma}\Vert y-x\Vert^{2}_{2} \biggr \}$$
(8)

其Moreau包络(或Moreau–Yosida正则化)定义为

$$\mathrm美元{env}(英文)_{σ\psi}(x)=\inf_{y\in\mathbb{R}^{n}}\biggl\{psi(y)+\frac{1}{2\sigma}\Vert-y-x\Vert^{2}_{2} \biggr \}$$
(9)

参数σ可以解释为最小化ψ并且接近x个具体来说,Moreau包络是平滑非光滑函数的一种方法,可以表明\(\mathrm{env}(英文)_{\sigma\psi}(x)\)也是的最佳值\(\mathrm{代理}_{\sigma\psi}(x)\).

假设现在我们遇到了一个问题

$$\min\psi(x)+\phi(x)$$

哪里\(\psi,\phi\colon\mathbb{R}^{n}\rightarrow\mathbb{R}\cup\{+\infty\}\)是封闭的适当函数,其中ψϕ可以不吸烟。在ADMM算法下,每次迭代k个具有与近端运算符交替的性质ψϕ单独评估:

$$\开始{对齐}&x^{k+1}\在\mathrm中{近似}_{\sigma\psi}\bigl(z^{k}-u^{k{\bigr),\\&y^{k+1}\in\mathrm{近似}_{\sigma\phi}\bigl(x^{k+1}+u^{k}\bigr),\\&u^{k+1}:=u^{k}+x^{k+1}-z^{k+1}。\结束{对齐}$$

将上述视为固定点迭代,ADMM方案将导致\(x=z)这样的话

$$\开始{aligned}&x=\mathrm{近似}_{\sigma\psi}(x-u),\\&y=\mathrm{近似}_{\sigma\phi}(x+u)。\结束{对齐}$$

把注意力转回我们的问题上来(4)–(7),我们首先表示集合与中的不等式约束相关(5)由

$$R=\bigl\{x\in\mathbb{R}^{n}\colon\mu^{T}x\geqr\bigr\}$$
(10)

和指示功能通过

$$I_{R}(x)=\textstyle\begin{cases}0,&x\in R,\\infty,&x\notin R$$
(11)

约束的可行集(6)由提供

$$S=\bigl\{x\in\mathbb{R}^{n}\colon x\suceq 0\bigr\}$$
(12)

具有指示功能

$$I_{S}(x)=\textstyle\begin{cases}0,&x\in S,\\infty,&x\notin S$$
(13)

我们现在定义对应于问题的增广拉格朗日(4)–(7)作为

$$\开始{对齐}\mathcal{L}(x,\lambda,\rho)={}&\frac{\beta_{1}}{2}x^{T}Vx-\mu^{T{x+\frac}\beta_2}}{2\Vertx\Vert^{2}_{2} +\Vert x\Vert _{0}+I_{R}(x)+I_{S}(x)\\&{}+\lambda\bigl(e^{T}x-1\bigr)+\frac{\rho}{2}\bigl(e^{T}x-1\bigr)^{2},\end{aligned}$$
(14)

哪里λ是通常的拉格朗日乘数\(\rho>0\)是相等约束的惩罚参数\(e^{T}x=1\)。为了获得收敛性,我们可以设置ρ大于问题阈值的常数[1]. 我们的问题(14),阈值为\(\rho=4\),可以重写为\(\mathcal{L}(x,\lambda)\)哪里x个λ通过更新

$$\开始{对齐}&x^{k+1}=\mathop{\arg\min}_{x}\mathcal{L}\bigl(x,\lambda^{k}\bigr),\\&\lambda^{k+1}=\lambda ^{k{+\rho\bigl-(e^{T}x^{k+1}-1\biger)。\结束{对齐}$$

问题(14)现在可以视为以下最小化问题:

$$\min_{x,\lambda}\quad P(x,\lambda)+Q(x)$$
(15)

哪里\(P(x,λ))由以下给定的平滑项组成

$$P(x,\lambda)=\frac{\beta_{1}}{2}x^{T}Vx-\mu^{T{x+\frac}\beta_2}}{2\Vertx\Vert^{2}_{2} +\lambda\bigl$$
(16)

\(Q(x)\)包括非光滑术语,即

$$Q(x)=\垂直x\垂直{0}+I{R}(x)+I{S}(x)$$
(17)

为了讨论近似方法,我们让λ比方说,是固定值λ̂,我们将其用于以下最小化问题:

$$\min_{x}\四P(x,\hat{\lambda})+Q(x)$$
(18)

我们用于最小化目标函数的近似方法(18)可以被视为P(P)在给定点线性化\(x^{k}\):

$$x^{k+1}\in\mathop{\arg\min}_{x}\biggl\{Q(x)+\bigl$$
(19)

哪里\(t>0)表示导数运算符。调用简单代数并忽略常量项(19)可以写为

$$x^{k+1}\in\mathop{\arg\min}_{x}\biggl\{Q(x)+\frac{1}{2t^{k}}\bigl\Vertx-\bigl(x^{k}-t^{k{}\nabla P\bigle(x*k}\bigr)\biger)\bigr\Vert^{2}\biggr\}$$
(20)

使用定义2.1,迭代方案由在产生的梯度点处的近似步骤组成,这为我们提供了近似梯度方法:

$$x^{k+1}\单位:元{近似}_{\alpha^{k}Q}\bigl(x^{k}-\alpha^{k}\nabla P\bigl(x^{k}\bigr)\bigr)$$
(21)

哪里\(\alpha^{k}>0\)是合适的步长。注意,如果P(P)Lipschitz连续且为常数\(L_{c}\),则已知近似梯度法的收敛速度为\(\mathcal{O}(1/k)\)具有固定步长\((0,1/L_{c}]\中的alpha\)(见Parikh和Boyd[24]). 在这种情况下\(L_{c}\)步长可以通过行搜索方法来选择。在行搜索方法的上下文中,最大可能的步长\(阿尔法=1)更可取。因此,近端梯度方法通常具有固定的步长\(阿尔法=\min\{1,1/L_{c}\}\)在我们的例子中P(P)给予

$$\开始{aligned}\bigl\Vert\nabla P(x)-\nabla P(y)\bigr\Vert_{2}&=\bigl\ Vert\beta_{1} V(V)(x-y)+\beta_{2}(x-y$$
(22)

为所有人\(x,y\in\mathbb{R}^{n}\)哪里表示单位矩阵和\(\Vert\cdot\Vert_{F}\)表示弗罗贝尼乌斯范数。由于Lipschitz常数(22)不易访问,我们可以通过以下方式进行估算:

$$开始{对齐}L_{c}和\leq\beta_{1}\Vert V\Vert_{F}+\beta_2}\VertI\Vert_{F}+\rho\bigl\Verte e^{T}\bigr\Vert_F}\\&=\beta_1}\bigl(\mathrm{tr}\bigle(V^{T{bigr)\biger)^{1/2}+\beta_2}\sqrt{n}+\rho n=:\波浪线{左}_{c} ,\结束{对齐}$$
(23)

其中tr表示矩阵轨迹。\(\波浪号{左}_{c} >1),很明显\(\分钟\{1,1/\颚化符{左}_{c} \}\)将始终返回值\(1/\颚化符{左}_{c} \).今后我们将调整步长\(阿尔法=1/\颚化符{左}_{c} \)。我们根据以下众所周知的下降特性选择步长:

引理2.1

(下降属性[6])

\(\psi:\mathbb{R}^{n}\到\mathbb{R}\) 是具有梯度的连续可微函数 ψ 假定为 \(L_{c}\)-利普希茨连续.然后,对于任何 \(\波浪号{左}_{c} \geq L_{c}\),

$$\psi(x)\le\psi(y)+(x-y)^{T}\nabla\psi(y)+\frac{tilde{左}_{c} }{2}\Vert x-y\Vert^{2},对于所有x,y\in\mathbb{R}^{n}$$
(24)

使用定义中定义的近端运算符2.1,最小化(19)相当于以下步骤:

$$x^{k+1}\单位:元{近似}_{\alpha Q}\bigl(x^{k}-\alpha\nabla P\bigl-(x^}\bigr)\biger)$$
(25)

哪里\(\alpha=\frac{1}{\波浪线{L}_{c} }\).选择\(\波浪号{左}_{c} \)还确保在近似方法下,我们的目标函数有足够的减少:

引理2.2

(足够减少属性[6])

\(\psi:\mathbb{R}^{n}\到\mathbb{R}\) 成为 \(C^{1}\) 函数及其梯度 ψ 具有模量的Lipschitz连续\(L_{c}\). \(\phi:\mathbb{R}^{n}\到(-\infty,+\infty]\) 是一个适当的下半连续函数 \(\inf_{\mathbb{R}^{n}}\phi>-\infty\).假设 \(\波浪号{左}_{c} \) 选择如下 \(\波浪号{左}_{c} >L_{c}\).然后,对于任何 \(x\in\mathrm{dom}\\phi\) 以及任何 \(在\mathbb{R}^{n}中的{x}) 由定义

$$\hat{x}\in\mathrm{近似}_{\alpha\phi}\bigl(x-\alpha\nabla\psi(x)\bigr),quad\alpha=\frac{1}{\tilde{左}_{c} }、$$
(26)

我们有

$$\psi(\hat{x})+\phi(\hat{x})\le\psi(x)+\fi(x)-\frac{1}{2}(\tilde{左}_{c} -左_{c} )\Vert\hat{x}-x\Vert^{2}$$
(27)

请注意\(\mathrm{dom}\\phi\)在引理中2.2定义了真下半连续函数的点集\(\phi:\mathbb{R}^{n}\rightarrow\mathbb{R}\cup\{+\infty\}\)采用有限值:

$$\mathrm{dom}\\phi=\bigl\{x\in\mathbb{R}^{n}\colon\phi(x)<+\infty\bigr\}$$

鉴于引理2.2,我们转向非光滑项\(Q(x)\),我们继续在上调用ADMM算法(25):

$$\textstyle\begin{cases}z^{k+1}\in\mathrm{近似}_{\sigma\|\cdot\|_{0}}(z^{k}-\alpha\nablaP(z^}k})),\\y^{k+1}=\mathrm{近似}_{I_{R}}(z^{k+1}),\\x^{k+1}=\mathrm{近似}_{I_{S}}(y^{k+1})。\结束{个案例}$$
(28)

由于ADMM方法确保目标函数收敛到其最优值,因此我们的迭代收敛得到了保证[7].

在(28),的近端运算符\(\ell_{0}\)-范数可以用它的组件形式表示为

$$\mathrm美元{近似}_{\sigma\|\cdot\|{0}}(x)=\textstyle\begin{cases}\{0},&\text{if}x{i}<\sqrt{2\sigma},\\{0,x{i{},&\text{if}x}i}=\sqrt}2\simma},\ \{x{ineneneep,&\text{if}x{i>\sqrt[2]。\结束{cases}$$
(29)

请注意\(\mathrm{近似}_{\sigma\|\cdot\|_{0}}(x)\)被称为硬阈值算子,因为它强制向量的分量\(x_{i}\)除了大的为零[26]. 换句话说,较大的σ导致更高的稀疏性和更少的搬迁惩罚x个。这样做可以确保我们的投资组合选择避免小额投资。

同时,指示器功能的近端操作员\(I_{R}\)被简化为欧几里得投影:

$$\mathrm美元{近似}_{I_{R}(x)=\textstyle\begin{cases}x,&\text{if}\mu^{T}x\geqr,\\frac{R}{\mu^}x}x,&\text{if}\mu{T}x<R.\end{cases{$$
(30)

指示函数的近端运算符\(I_{S}\)是向量的投影x个到上面\(\mathbb{右}_{+}\):

$$\mathrm美元{近似}_{I_{S}}(x)=x_{+}$$
(31)

哪里\(x{+}\)每一张底片都按分量顺序排列\(x{i}\)被零替换。鉴于(28),我们有

$$x^{k+1}_{i}=\ max\ bigl\{0,y_{i}^{k+1}\ bigr \},\ quad i=1,2,\ dots,n$$

交替逼近算法及其收敛性

在本节中,我们提出了一种ADMM算法来找到所建议SEPO的最优投资组合-\(\ell_{0}\)模型(4)–(7)并建立其全球收敛性。

SEPO公司-\(\boldsymbol{\ell_{0}}\) 算法

步骤0。:

鉴于\(β{1},β{2},σ,r,V,mu,rho,alpha),初始点\((x^{0},\lambda^{0{)\)、和收敛公差ε.设置\(k:=0).

步骤1。:

计算\(z^{k+1}\in\mathrm{近似}_{\sigma\|\cdot\|_{0}}(z^{k}-\alpha\nabla P(z^{k},\lambda^{k{)).

第2步。:

计算\(y^{k+1}=\mathrm{代理}_{I_{R}}(z^{k+1}).

步骤3。:

计算\(x^{k+1}=\mathrm{近似}_{I_{S}}(y^{k+1}).

步骤4。:

计算\(\lambda^{k+1}=\lambda ^{k}+\rho(e^{T}x^{k+1}-1)\).

步骤5。:

如果\(垂直P(x^{k+1},λ^{k+1})垂直\(k>10000),停止。否则,设置\(k:=k+1)并转至步骤1。

我们在门派见过。 2所提出的近似方法如何保证解的下降。继续推进SEPO的融合-\(\ell_{0}\)算法,我们从假设开始对于任何目标函数\(\mathcal{L}\colon\mathbb{R}^{n}\rightarrow\mathbb{R}\cup\{+\infty\}\)哪里\(\mathcal{L}=\psi+\phi\):

假设A

  1. (i)

    \(\psi\colon\mathbb{R}^{n}\rightarrow\mathbb{R}\)是一个连续可微函数,其中其梯度ψ是具有模量的Lipschitz连续\(L_{c}\).

  2. (ii)

    \(\phi\colon\mathbb{R}^{n}\rightarrow\mathbb{R}\cup\{+\infty\}\)是一个适当的下半连续函数。

  3. (iii)

    \(\inf_{\mathbb{R}^{n}}\psi>-\infty\)\(\inf_{\mathbb{R}^{n}}\phi>-\infty\).

SEPO公司-\(\ell_{0}\)该算法还使(14):

引理3.1

(收敛属性[6])

假设 \(\mathcal{L}\colon\mathbb{R}^{n}\rightarrow\mathbb{R}\cup\{+\infty\}\) 是一个目标函数,假设持有. \({x^{k}\}_{k\in\mathbb{N}}\) 是SEPO生成的序列-\(\ell_{0}\) 算法.然后,顺序 \(\{\mathcal{L}(x^{k},\lambda^{k{):k\in\mathbb{N}\}\) 不增加,并且,特别地,

$$\mathcal{L}\bigl(x^{k}\bigr)-\mathcal{L}\figl(x^}k+1}\biger)\geq\frac{1}{2}(\波浪线{左}_{c} -L_{c})\bigl\Vert x^{k+1}-x^{k}\bigr\Vert^{2}$$
(32)

此外,

$$\sum^{\infty}_{k=1}\bigl\Vert x^{k+1}-x^{k}\bigr\Vert^{2}<\infty$$
(33)

因此

$$\lim_{k\rightarrow\infty}\bigl\Vert x^{k+1}-x^{k}\bigr\Vert=0$$
(34)

证明

在不失一般性的情况下,我们让λ成为一个固定的常数并与之合作\(数学{L}(x)=P(x)+Q(x))代替\(\mathcal{L}(x,\lambda)\),其中\(P(x)\)\(Q(x)\)由提供(16)和(17)分别是。请注意\(P(x)\)是可微的,其梯度是Lipschitz连续的,具有模量\(L_{c}\).调用SEPO-\(\ell_{0}\)算法和引理2.2,我们有

$$P\bigl(x^{k+1}\bigr)+Q\bigle{左}_{c} -L_{c})\bigl\Vert x^{k+1}-x^{k}\bigr\Vert^{2}$$
(35)

哪里\(\波浪号{L}_{c} \)由提供(23). 写作\(\mathcal{L}(x^{k})=P英寸(35)重新安排会导致(32),它断言序列\(\{\mathcal{L}(x^{k},\lambda^{k{):k\in\mathbb{N}\}\)没有增加。

请注意P(P)下界(见假设),因此\(\mathcal{L}\)收敛到某些\(\下划线{\mathcal{L}}\).让\(不匹配{无}_{+}\).我们总结(32)来自\(k=0)\(k=N-1)得到

$$\开始{aligned}\sum^{N-1}_{k=0}\bigl\垂直x^{k+1}-x^{k}\bigr\Vert^{2}&\leq\frac{2}{\波浪线{左}_{c} -L_{c}}\总和^{N-1}_{k=0}\bigl(\mathcal{L}\bigl(x^{k}\bigr)-\mathcal{L}\bigl(x^{k+1}\bigr)\bigr)\\&=\frac{2}{左}_{c} -L_{c}}\bigl(\mathcal{L}\bigle(x^{0}\bigr)-\mathcal{L}\ bigl{L}_{c} -L_{c}}\bigl(\mathcal{L}\bigle(x^{0}\bigr)-\下划线{\mathcal{L}}\bigr)。\结束{对齐}$$

由此可见(33)和(34)当我们将极限视为\(N\rightarrow\infty\). □

在我们给出总结序列属性的结果之前\({x^{k}\}_{k\in\mathbb{N}}\)由SEPO生成-\(\ell_{0}\)从初始点开始的算法\(x^{0}\),我们首先给出一些基本的符号。我们表示为\(\mathrm{crit}\\mathcal{L}\)临界点集\(\mathcal{L}\)\(\omega(x^{0})\)所有极限点的集合,其中

$$\omega\bigl(x^{0}\bigr)=\begin{Bmatrix}\overline{x}\in\mathbb{R}^{n}:\exists\text{一个递增的整数序列}\{k_{j}\}_{j\in\mathbb{n}}\ \text{使得}x^{k_{j}}\rightarrow\overline{x}\text{as}j\rightarrow\infty\end{Bmatrix}$$

给定任意集合\(\Omega\subset\mathbb{R}^{n}\)以及任何一点\(x\in\mathbb{R}^{n}\),距离x个toΩ表示并定义为

$$\mathrm{dist}(x,\Omega):=\inf\bigl\{\Vert y-x\Vert\colon y\in\Omega\bigr\}$$

什么时候?\(\Omega=\emptyset\),我们援引通常的惯例\(\inf\emptyset=\infty\)因此\(\mathrm{dist}(x,\Omega)=\infty\)为所有人x个.

引理3.2

(极限点的属性[6])

假设 \(\mathcal{L}\colon\mathbb{R}^{n}\rightarrow\mathbb{R}\cup\{+\infty\}\) 是一个目标函数,假设持有. \(\{x ^{k}\}_{k \ in \mathbb{N}}\) 是SEPO生成的有界序列-\(\ell_{0}\) 算法.然后,以下保持:

  1. (a)

    \(\omega(x^{0})\) 是非空的,契约,和连接集.

  2. (b)

    \(\omega(x^{0})\subset\mathrm{crit}\\mathcal{L}\).

  3. (c)

    \(\lim_{k\rightarrow\infty}\mathrm{dist}(x^{k},\omega(x^}))=0\).

  4. (d)

    目标函数 \(\mathcal{L}\) 在上是有限且恒定的 \(\omega(x^{0})\).

证明

参见Bolt等人[6]. □

剩下的是它的全球趋同,我们将通过Kurdyka–Łojasiewicz(KL)属性来建立这种趋同[6]作为Łojasiewicz梯度不等式的推广[21]对于非光滑函数。我们首先说明目标函数(14)是半代数的,因此是一个KL函数。反过来,这对我们通过SEPO生成的序列的收敛性至关重要-\(\ell_{0}\)算法。我们首先回顾关于次微分的符号和定义(例如,参见[6,26])和KL财产。

定义3.1

\(\phi\colon\mathbb{R}^{n}\rightarrow\mathbb{R}\cup\{+\infty\}\)是一个适当的下半连续函数。的(极限)次微分ϕ\(x\in\mathrm{dom}\phi \)表示和定义为

$$\partial\phi(x)=\begin{Bmatrix}u\in\mathbb{R}^{n}\colon\existingsx^{k}\rightarrowx,\phi\bigl(x^{k}\bigr)\rightarrow\fhi(x \rangle}{\Vert-y-x^{k}\Vert}\geq0\end{Bmatrix}$$
(36)

重点x个称为(极限)临界点ϕ如果\(0\英寸\部分\phi(x)\).

由此可见\(0\英寸\部分\phi(x)\)如果\(x\in\mathbb{R}^{n}\)是局部最小值ϕ.对于连续可微ϕ,\(\partial\phi(x)=\{\nabla\phi\}\),因此我们得到了通常的梯度映射ϕ\(x\in\mathrm{dom}\\phi\)\(\nabla\phi(x)\).如果ψ是凸的,次微分(36)原来是经典的Fréchet次微分[26].

\(在(0,输入]\中)并用表示\(\Phi_{\eta}\)全凹连续函数类\(\varphi\colon[0,\eta)\rightarrow\mathbb{右}_{+}\)在上连续可微的\((0,\t)\)并在0处连续\(\varphi(0)=0\)\(\varphi'>0\)为所有人\(在(0,\t)中为\).

定义3.2

(Kurdyka–Łojasiewicz(KL)地产)

\(\phi\colon\mathbb{R}^{n}\rightarrow\mathbb{R}\cup\{+\infty\}\)是一个适当的下半连续函数。功能ϕ据说,Kurdyka–Łojasiewicz(KL)地产位于\(\bar{u}\in\mathrm{dom}\\partial\phi:=\{u\in\mathbb{R}^{n}\colon\partial\fhi(u)\neq\emptyset\}\)如果存在\(在(0,+\输入]\中),一个街区U型属于ū和一个函数\(\varphi\in\Phi_{\eta}\)这样所有人\(u\在u\cap[\phi(\bar{u})中,以下不等式成立:

$$\varphi'\bigl(\phi(u)-\phi$$
(37)

此外,ϕ如果在每个点满足KL属性,则称为KL函数\(\mathrm{dom}\\phi\).

上述定义使用子级别集:给定\(a,b\in\mathbb{R}\),函数的子级集ϕ表示和定义为

$$[a\leq\phi\leq-b]:=\bigl\{x\in\mathbb{R}^{n}\冒号a\leq \phi(x)\leqb\bigr\}$$

类似的定义适用于\([a<\phi<b]\)。级别集ϕ表示和定义为

$$[\phi=a]:=\bigl\{x\in\mathbb{R}^{n}\colon\phi(x)=a\bigr\}$$

与KL函数密切相关的是半代数函数,它在证明我们提出的方法的收敛性方面至关重要。

定义3.3

(半代数集和函数)

  1. (i)

    一个子集\(\Omega\subset\mathbb{R}^{n}\)如果存在有限个实多项式函数,则称为半代数\(p{ij}\)\(q{ij}\)这样的话

    $$\Omega=\大杯^{p}_{j=1}\大帽子^{q}_{i=1}\bigl\{u\in\mathbb{R}^{n}\colon p_{ij}(u)=0\text{和}q_{ij}(u)<0\bigr\}$$
    (38)
  2. (ii)

    A函数\(\phi\colon\mathbb{R}^{n}\rightarrow\mathbb{R}\cup\{+\infty\}\)称为半代数,如果其图

    $$\bigl\{(u,t)\in\mathbb{R}^{n+1}\colon\phi(u)=t\bigr\}$$
    (39)

    是的半代数子集\(\mathbb{R}^{n+1}\).

因此,半代数函数实际上是KL函数,下面的结果是Łojasiewicz梯度不等式的非光滑版本。

定理3.1

([4,5])

\(\phi\colon\mathbb{R}^{n}\rightarrow\mathbb{R}\cup\{+\infty\}\) 是一个真下半连续函数.如果 ϕ 是半成品-代数的,那么它是一个KL函数.

定理3.1允许我们避免证明KL属性的技术性。相反,人们可以利用广泛的半代数函数和集合[,6]. 半代数函数的一些例子包括实多项式函数和半代数集的指示函数。除此之外,半代数函数的有限和和乘积以及标量乘积都是半代数的。

我们现在准备给出所建议模型的全局收敛结果(4)–(7).

定理3.2

(全球趋同)

假设目标函数 \(\mathcal{L}\colon\mathbb{R}^{n}\rightarrow\mathbb{R}\cup\{+\infty\}\) 是一个KL函数,假设持有.然后是序列 \({x^{k}\}_{k\in\mathbb{N}}\) 由SEPO生成-\(\ell_{0}\) 算法收敛到临界点 \(x^{*}\).

证明

参见Bolt等人[6]. □

凭借定理3.2,我们现在显示(14)是半代数的,因为半代数函数的有限和也是半代数的。很明显,中的函数(14)是平滑函数的和\(P(x)\),\(\ell_{0}\)-规范和指标功能。功能\(P(x)\)由提供(16)是线性函数和二次函数的线性组合,因此\(P(x)\)是一个实多项式函数,它又是半代数函数。

Bolte等人给出了一个具体的例子[6],的\(\ell_{0}\)-范数是向量的稀疏性度量\(x\in\mathbb{R}^{n}\),这确实是半代数的。特别是\(\|\cdot\|_{0}\)由乘积集的有限并集给出:

$$\mathrm{graph}\Vert\cdot\Vert_{0}=\bigcup_{I\subset\{1,\dots,n\}}\Biggl(\prod^{无}_{i=1}J^{我}_{i} \Biggr)\times\bigl\{n-\vert i\vert\bigr\}$$
(40)

对于任何给定的\(I \子集\{1,\点,n \}\),\(|I|\)表示的基数

$$J美元^{我}_{i} =\textstyle\begin{cases}\{0\},&\text{if}i\在i中,\\mathbb{R}\setminus\{0\},&\text{otheric}。\结束{cases}$$

很明显(40)是一个分段线性集,因此声明。最后,指示器功能\(I_{R}(x)\)\(I_{S}(x)\)由定义(11)和(13)分别也是半代数的,因为可行集(10)和(12)是凸的。

4数值实验和结果

在本节中,我们研究了所提出的投资组合优化模型SEPO的效率-\(\ell_{0}\)最大化投资组合回报和最小化交易成本。我们使用2019年1月至2019年6月收集的中国10个不同行业100家公司的股票价格和收益的实际数据测试了我们的算法。这些数据反过来用于生成协方差矩阵,该矩阵为我们提供了目标函数中的投资组合方差(4). 我们从加权投资组合开始,即。,\(x{i}^{0}=\压裂{1}{n}\)为所有人.我们设置\(\varepsilon=10^{-7}\)并在以下情况下停止算法\(垂直P(x^{k+1},λ^{k+1})垂直\(k>10000)。所有计算结果都是通过在Windows 10(Intel Core i7 1065G7 16 GB CPU@1.30)上运行Matlab R2021a获得的1.50GHz)。

出于测试目的,我们设置了惩罚参数\(\rho=5\)和调谐参数\(β{2}=1\)后者意味着我们将投资组合多元化的权重设定为不变。同时\(β_{1}\)选择相对小于\(β{2})为了举例说明,我们给出了最低保证回报率的结果\(r=0.1)\(r=0.2).

在表中1,我们给出了在建议的SEPO下的预期收益、方差风险和稀疏率的计算结果-\(\ell_{0}\)模型和不同值的标准MVO模型\(β{1}),当我们将最小保证比率分别设置为0.1和0.2时。请注意,虽然我们在以下情况下利用了差异风险\(β{1}=1\)SEPO下的投资组合选择-\(\ell_{0}\)\(r=0.1\)\(r=0.2)分别是。同时,当我们设置\(r=0.1)然而,在SEPO下,差异风险更高-\(\ell_{0}\)由于稀疏性,与标准MVO的最大多样化相比。从表中可以看出,当\(r=0.1)在0.52和0.72之间\(r=0.2)这仅仅意味着,在100只股票中,有100只股票的回报率低于最低预期回报率\(r=0.1),只需投资算法返回非零的选定39–70只股票\(x_{i}\)的。尽管投资组合选择稀疏且风险增加,但我们可以看到,就更高的预期回报而言,所提出的模型更有希望。

表1不同投资组合的预期收益、方差风险和稀疏率值\(β{1})最低保证回报率\(r=0.1)\(r=0.2\)根据SEPO-\(\ell_{0}\)和标准MVO

我们还比较了SEPO的预期收益和差异风险-\(\ell_{0}\)和标准MVO\(r=0.1)通过使用图中的散点图1投资组合预期收益和方差风险的下降趋势模拟了标准MVO\(β{1})方法1。请注意\(β{1})反映了我们在最小化差异风险而非最大化预期回报方面的杠杆作用。同时,如表所示,较高的预期回报结果意味着较高的风险1一般来说,标准的MVO模型由于最大化的多样化,给出了较低的风险度量,如表所示1和图1.提议的SEPO-\(\ell_{0}\)另一方面,由于投资组合稀疏,可以导致更高的预期回报和更低的总交易成本。这表明SEPO-\(\ell_{0}\)该模型能够很好地结合稀疏性下的投资组合选择。

图1
图1

SEPO公司-\(\ell_{0}\)与最低保证回报率的标准MVO相比\(r=0.1)

为了说明我们模型的可靠性,我们给出了建议模型的输出\(r=1)使用变量散点图,如图2,使用\(β_{1}\)作为自变量x个-轴,左侧的预期回报率和稀疏率-轴,而风险等级位于-轴。我们可以观察到这三条线的类似趋势,这清楚地反映了我们的模型在获得最佳投资组合选择方面的一致性。

图2
图2

最小保证收益率下的投资组合预期收益、方差风险和稀疏率\(r=0.1)根据SEPO-\(\ell_{0}\)对于不同的值\(β{1})

自变量之间的关系\(β{1})使用确定性简单线性回归模型进一步检验响应变量,如下所示:

$$y_{i}=a{i}+b{i}\beta{1},\quadi=1,2,3$$

哪里\(y{i}\)是响应变量,\(a{i}\)这个-截距,以及\(b{i}\)的系数\((0,1]\中的β{1}\)该模型为自变量赋权\(β{1})以量化其对响应变量的影响。这里的响应变量是预期的返回\(y{1}\),差异风险\(y{2}\)、和稀疏比\(y{3}\)关系如表所示2从表中可以看出\(b{i}\)响应变量\(y{i}\)都是负值,这意味着它们的值随着\(β{1})。自第页-所有响应变量的值都近似为零,很明显这三个变量是显著的。特别地,\(β{1})与预期收益、风险和稀疏率呈显著负相关。

表2自变量之间的关系\((0,1]\中的β{1}\)以及使用SEPO简单线性回归模型的响应变量-\(\ell_{0}\)具有\(r=0.1)

The significance of\(β{1})单变量回归的R平方值支持这三个因变量,预期收益、方差风险和稀疏率分别为0.9076、0.8748和0.5859。由于R-平方是预测变量贡献的总变化的百分比,因此,对于预期回报和风险,高于0.80的R-平方值意味着\(β{1})解释了这两个响应变量的高百分比方差。稀疏比略低,但任何大于0.50的R平方值都可视为中等高。

5结论

经典的Markowitz投资组合方案或均值-方差优化(MVO)由于实现简单,是最成功的框架之一;特别是,它可以通过广泛使用的二次规划来求解。然而,它对输入参数非常敏感,获得可接受的解需要正确的权重约束。在过去十年中,由于一类更一般的函数的优化算法的进步,在考虑非二次投资组合选择模型方面重新受到关注。在这里,我们提出了一个新的算法框架,允许投资组合经理在多样化投资和最小化交易成本之间取得平衡,后者通过最小化\(\ell_{0}\)-标准,同时受到最低保证回报的约束。这简单地意味着模型最大化了投资组合中的稀疏性,因为权重\(x_{i}\)除了大的以外,都被强制为零。实际上\(\ell_{0}\)导致不连续且非凸的问题。作为最小保证收益的结果,不等式约束也带来了类似的问题。

在本研究中,我们采用了近似方法,通过在某个给定点对目标函数的一部分进行线性化,并通过二次近似项进行正则化,从而使函数“平滑”,该二次近似值项用作近似中“局部误差”的度量。将问题写成增广拉格朗日形式,无约束问题可以分为两部分,即光滑项和非光滑项。然后通过ADMM方法通过其近似方法分别处理这些问题。拟议SEPO的全球趋同-\(\ell_{0}\)建立了稀疏股票投资组合的算法。利用100家公司的实际数据,分析了我们的模型在最大化投资组合预期收益的同时,在最小化交易成本和多元化之间取得平衡的效率。从经验上讲,我们模型的实施会带来更高的预期回报和更低的交易成本。这表明,尽管与标准MVO相比风险更高,但SEPO-\(\ell_{0}\)该模型有望为最优投资组合生成良好的组合。

数据和材料的可用性

本研究期间分析的数据集可根据合理要求从相应作者处获得。

工具书类

  1. Bertsekas,D.P.:非线性规划,第三版。雅典娜科技(2016)

    数学 谷歌学者 

  2. Best,M.J.,Grauer,R.R.:关于均值-方差有效投资组合对资产均值变化的敏感性:一些分析和计算结果。最终版本。螺柱。4(2), 315–342 (1991)

    第条 谷歌学者 

  3. Bochnak,J.,Coste,M.,Roy,M.F.:《实代数几何》,第36卷。柏林施普林格出版社(2013)

    数学 谷歌学者 

  4. Bolt,J.,Danilidis,A.,Lewis,A.:非光滑子分析函数的Łojasiewicz不等式及其在次梯度动力系统中的应用。SIAM J.Optim公司。17(4), 1205–1223 (2007)

    第条 数学 谷歌学者 

  5. Bolt,J.,Danilidis,A.,Lewis,A.,Shiota,M.:分层函数的Clarke次梯度。SIAM J.Optim公司。18(2), 556–572 (2007)

    第条 数学科学网 数学 谷歌学者 

  6. Bolt,J.,Sabach,S.,Teboulle,M.:非凸和非光滑问题的近似交替线性化最小化。数学。程序。146(1), 459–494 (2014)

    第条 数学科学网 数学 谷歌学者 

  7. Boyd,S.、Parikh,N.、Chu,E.、Peleato,B.、Eckstein,J.:通过交替方向乘数法进行分布式优化和统计学习。已找到。趋势马赫数。学习。(1), 1–122 (2011)

    第条 数学 谷歌学者 

  8. Brodie,J.,Daubechies,I.,De Mol,C.,Giannone,D.,Loris,I.:马科维茨投资组合稀疏稳定。程序。国家。阿卡德。科学。106(30), 12,267–12,272 (2009)

    第条 数学 谷歌学者 

  9. Chen,J.,Dai,G.,Zhang,N.:稀疏群套索正则化在股票投资组合优化和部门选择中的应用。安·Oper。物件。284(1), 243–262 (2020)

    第条 数学科学网 数学 谷歌学者 

  10. Dai,Z.,Wen,F.:稀疏和稳定投资组合优化问题的一种广义方法。J.印第安纳州管理局。最佳方案。14(4), 1651–1666 (2018)

    第条 数学科学网 谷歌学者 

  11. Daubechies,I.,Defrise,M.,De-Mol,C.:具有稀疏约束的线性反问题的迭代阈值算法。Commun公司。纯应用程序。数学。57(11), 1413–1457 (2004)

    第条 数学科学网 数学 谷歌学者 

  12. De Mol,C.:《金融信号处理和机器学习》,第11–22页,《稀疏马科维茨投资组合》一章。威利在线图书馆(2016)

  13. DeMiguel,V.,Garlappi,L.,Nogales,F.J.,Uppal,R.:投资组合优化的通用方法:通过约束投资组合规范来提高绩效。管理。科学。55(5), 798–812 (2009)

    第条 数学 谷歌学者 

  14. Fastrich,B.,Paterlini,S.,Winker,P.:使用正则化方法构建最优稀疏投资组合。计算。管理。科学。12(3), 417–434 (2015)

    第条 数学科学网 数学 谷歌学者 

  15. Fazel,M.,Pong,T.K.,Sun,D.,Tseng,P.:Hankel矩阵秩最小化及其在系统识别和实现中的应用。SIAM J.矩阵分析。申请。34(3), 946–977 (2013)

    第条 数学科学网 数学 谷歌学者 

  16. Gabay,D.,Mercier,B.:通过有限元近似求解非线性变分问题的对偶算法。计算。数学。申请。2(1), 17–40 (1976)

    第条 数学 谷歌学者 

  17. 黄,X.:投资组合选择与风险的新定义。欧洲药典。物件。186(1), 351–357 (2008)

    第条 数学科学网 数学 谷歌学者 

  18. Konno,H.,Suzuki,K.:均值-方差组合优化模型。《运营杂志》。Res.Soc.Jpn.公司。38(2), 173–187 (1995)

    数学 谷歌学者 

  19. Lai,Z.R.,Yang,P.Y.,Fang,L.,Wu,X.:基于交替方向乘数法的短期稀疏投资组合优化。J.马赫。学习。物件。19, 1–28 (2018)

    数学科学网 数学 谷歌学者 

  20. Li,B.,Li,X.,Teo,K.L.,Zheng,P.:具有下行风险和多样化的复杂系统的一种新的不确定随机投资组合优化模型。混沌孤子分形160, 112,213 (2022)

    第条 数学科学网 数学 谷歌学者 

  21. Łojasiewicz,S.:Une propriété拓扑des sous-ensemples analytiques réels。莱斯埃克。辅助Dériv.Partielles117, 87–89 (1963)

    数学 谷歌学者 

  22. Markowitz,H.:投资组合选择。J.金融7(1), 77–91 (1952)

    谷歌学者 

  23. Michaud,R.O.:Markowitz优化之谜:“优化”是最优的吗?财务。分析。J。45(1), 31–42 (1989)

    第条 谷歌学者 

  24. Parikh,N.,Boyd,S.:近似算法。已找到。趋势优化。1(3), 127–239 (2014)

    第条 谷歌学者 

  25. Perrin,S.,Roncalli,T.:机器学习优化算法与投资组合分配。机器。学习。资产管理:新开发财务。申请。,261–328 (2020)

  26. Rockafellar,R.T.,Wets,R.J.B.:变分分析。施普林格,纽约(1998)

     数学 谷歌学者 

  27. Sun,Y.,Aw,G.,Teo,K.L.,Zhou,G.:使用新的概率风险度量进行投资组合优化。J.印第安纳州管理局。最佳方案。11(4), 1275 (2015)

    第条 数学科学网 数学 谷歌学者 

下载参考资料

致谢

作者感谢编辑和审稿人的宝贵意见和建议,这些意见和建议使本文的早期版本得到了改进。

基金

该项目由马来西亚高等教育部通过基础研究拨款计划(FRGS/1/2022/STG06/UTAR/02/2)提供支持。

作者信息

作者和附属机构

作者

贡献

所有作者都为研究构思和设计、材料准备、数据收集和分析做出了贡献。该手稿的初稿由陈振英(C.Y.Chen)撰写,所有作者都对该手稿以前的版本进行了评论。所有作者都已阅读并批准了最终稿。

通讯作者

与的通信蔡怡晨(Chuei Yee Chen).

道德声明

竞争性利益

作者声明没有相互竞争的利益。

其他信息

出版商备注

Springer Nature在公布的地图和机构关联中的管辖权主张方面保持中立。

权利和权限

开放式访问本文是根据Creative Commons Attribution 4.0国际许可证授权的,该许可证允许以任何媒体或格式使用、共享、改编、分发和复制,只要您对原始作者和来源给予适当的信任,提供指向Creative Commons许可证的链接,并指出是否进行了更改。本文中的图像或其他第三方材料包含在文章的知识共享许可证中,除非材料的信用额度中另有说明。如果文章的知识共享许可证中没有包含材料,并且您的预期用途不被法律法规允许或超出了允许的用途,则您需要直接获得版权所有者的许可。要查看此许可证的副本,请访问http://creativecommons.org/licenses/by/4.0/.

转载和许可

关于本文

检查更新。通过CrossMark验证货币和真实性

引用这篇文章

Sim、H.S.、Ling、W.S.Y.、Leong、W.J。等。交易费用最小的稀疏股权投资组合优化的近似线性化方法。J不平等申请 2023, 152 (2023). https://doi.org/10.1186/s13660-023-03055-4

下载引文

  • 收到:

  • 认可的:

  • 出版:

  • 内政部:https://doi.org/10.1186/s13660-023-03055-4

数学学科分类

关键词