二手法の組合せ

Totsuでは、前述した二手法を組み合わせて、錐線形計画問題を解く。

まずHomogeneous Self-dual Embeddingを施した最適性条件を、少し変数名と形を変えて、以下に再掲する: [0AT0cA0IbcTbT00][x^y^s^τ^][{0}n{0}mR+],x^Rn,y^K,s^K,τ^R+ \left[ \begin{matrix} 0 & A^T & 0 & c \\ -A & 0 & -I & b \\ -c^T & -b^T & 0 & 0 \end{matrix} \right] \left[ \begin{matrix} \hat x \\ \hat y \\ \hat s \\ \hat \tau \end{matrix} \right] \in \left[ \begin{matrix} \lbrace0\rbrace^n \\ \lbrace0\rbrace^m \\ \mathbb{R}_+ \end{matrix} \right] , \qquad \hat x \in \mathbb{R}^n, \quad \hat y \in \mathcal{K}^*, \quad \hat s \in \mathcal{K}, \quad \hat \tau \in \mathbb{R}_+ そして K=[0AT0cA0IbcTbT00],x=[x^y^s^τ^] K=\left[ \begin{matrix} 0 & A^T & 0 & c \\ -A & 0 & -I & b \\ -c^T & -b^T & 0 & 0 \end{matrix} \right], \qquad x=\left[ \begin{matrix} \hat x \\ \hat y \\ \hat s \\ \hat \tau \end{matrix} \right] とおく。

GGx^Rn, y^K, s^K, τ^R+\hat x \in \mathbb{R}^n,\ \hat y \in \mathcal{K}^\ast,\ \hat s \in \mathcal{K},\ \hat \tau \in \mathbb{R}_+ の指示関数とする: G(x)=IRn×K×K×R+(x)={0(if xRn×K×K×R+)+(otherwise) G(x)= I_{\mathbb{R}^n \times \mathcal{K}^\ast \times \mathcal{K} \times \mathbb{R}_+}(x)= \left\lbrace \begin{array}{ll} 0 & (\mathrm{if}\ x \in \mathbb{R}^n \times \mathcal{K}^\ast \times \mathcal{K} \times \mathbb{R}_+) \\ +\infty & (\mathrm{otherwise}) \end{array} \right. 同様に FF も指示関数 F(y)=I{0}n+m×R+(y)={0(if y{0}n+m×R+)+(otherwise) F(y)= I_{\lbrace0\rbrace^{n+m} \times \mathbb{R}_+}(y)= \left\lbrace \begin{array}{ll} 0 & (\mathrm{if}\ y \in \lbrace0\rbrace^{n+m} \times \mathbb{R}_+) \\ +\infty & (\mathrm{otherwise}) \end{array} \right. とすることで、元の式を minimizeG(x)+F(Kx) \begin{array}{ll} \mathrm{minimize} & G(x) + F(Kx) \end{array} と表すことができる。 これにPock/Chambolleの一次法を適用すればよい。

近接作用素と前処理行列

まず proxFσ(y~)=y~proxFσ(y~)=y~argminy(F(y)+12yy~diag(σ)12) \begin{array}{rcl} \mathbf{prox}^\sigma_{F^\ast}(\tilde y) &=& \tilde y - \mathbf{prox}^\sigma_F(\tilde y) \\ &=& \tilde y - \arg\min_y \left( F(y) + \frac12\|y-\tilde y\|_{\mathbf{diag}(\sigma)^{-1}}^2 \right) \end{array} ここで FF は指示関数なので argmin\arg\min はその集合への射影となるが、 一般には diag(σ)1\mathbf{diag}(\sigma)^{-1} によってスケールされた距離にもとづく必要がある。 しかし {0}n+m×R+\lbrace0\rbrace^{n+m} \times \mathbb{R}_+ への射影は各要素で互いに独立に分解してよく、 結局 σ\sigma に依存せずに proxFσ(y~)=y~Π{0}n+m×R+(y~)=y~[{0}n+mmax(y~n+m+1,0)]=[y~1y~n+mmin(y~n+m+1,0)] \begin{array}{rcl} \mathbf{prox}^\sigma_{F^\ast}(\tilde y) &=& \tilde y - \Pi_{\lbrace0\rbrace^{n+m} \times \mathbb{R}_+} (\tilde y) \\ &=& \tilde y - \left[ \begin{matrix} \lbrace0\rbrace^{n+m} \\ \max(\tilde y_{n+m+1}, 0) \end{matrix} \right] \\ &=& \left[ \begin{matrix} \tilde y_1 \\ \vdots \\ \tilde y_{n+m} \\ \min(\tilde y_{n+m+1}, 0) \end{matrix} \right] \end{array} となる。

次に proxGτ(x~)=argminx(G(x)+12xx~diag(τ)12) \begin{array}{l} \mathbf{prox}^\tau_{G}(\tilde x) &=& \arg\min_x \left( G(x) + \frac12\|x-\tilde x\|_{\mathbf{diag}(\tau)^{-1}}^2 \right) \end{array} Rn×K×K×R+\mathbb{R}^n \times \mathcal{K}^\ast \times \mathcal{K} \times \mathbb{R}_+ への射影であり、 Rn\mathbb{R}^n への射影(これは何もしなくてよいということ)、R+\mathbb{R}_+ への射影はやはり τ\tau に依存せず行うことができる。 また、仮に K=K1××Kk\mathcal{K} = \mathcal{K}_1 \times \cdots \times \mathcal{K}_k とした場合、 K=K1××Kk\mathcal{K}^\ast = \mathcal{K}^\ast_1 \times \cdots \times \mathcal{K}^\ast_k となり、 各 Ki, Ki\mathcal{K}_i,\ \mathcal{K}^\ast_i への射影どうしは独立している。 しかし Ki, Ki\mathcal{K}_i,\ \mathcal{K}^\ast_i への射影ひとつひとつは一般には τ\tau によるスケーリングに依存してしまう。

ここで、Ki\mathcal{K}_i に対応する τ\tau の成分グループを τi1,,τit\tau_{i1},\ldots,\tau_{it} と置く。 これらをすべて等しい値 τi=min(τi1,,τit)\tau_i=\min(\tau_{i1},\ldots,\tau_{it}) に置き換えれば、等方スケールとなるので、 proxGτ¯(x~)=ΠRn×K×K×R+(x~) \mathbf{prox}^{\bar \tau}_{G}(\tilde x) = \Pi_{\mathbb{R}^n \times \mathcal{K}^\ast \times \mathcal{K} \times \mathbb{R}_+} (\tilde x) τ¯\bar \tau に依存しない形にすることができる (Ki\mathcal{K}^\ast_i も同様、τ\tau を全体的にグルーピングして置き換えたものを τ¯\bar \tau としている)。

なお、上記のグルーピングと置き換えにより diag(σ)12Kdiag(τ¯)122diag(σ)12Kdiag(τ)1221 \|\mathbf{diag}(\sigma)^{\frac12} K \mathbf{diag}(\bar \tau)^{\frac12}\|^2\le \|\mathbf{diag}(\sigma)^{\frac12} K \mathbf{diag}(\tau)^{\frac12}\|^2\le1 となり、収束条件は変わらず満たされていることを注記しておく。

results matching ""

    No results matching ""