一种改进的块对角化预编码算法

Contents Abstract Full text PDF

引用本文

高明, 孙成越, 林少兴, 等. 一种改进的块对角化预编码算法[J]. 工程科学与技术, 2018, 50(2): 112-117. DOI:10.15961/j.jsuese.201601413

GAO Ming, SUN Chengyue, LIN Shaoxing, et al. An Improved Block Diagonalization Precoding Algorithm[J]. Advanced Engineering Sciences, 2018, 50(2): 112-117. DOI:10.15961/j.jsuese.201601413

一种改进的块对角化预编码算法

高明, 孙成越, 林少兴, 王勇

西安电子科技大学综合业务网理论及关键技术国家重点实验室，陕西西安 710071

收稿日期: 2016-12-27; 网络出版时间: 2018-03-21 10 : 11 : 21

作者简介: 高　明（1979—），男，博士，副教授. 研究方向：无线通信. E-mail：mgao@mail.xidian.edu.cn

基金项目: 国家自然科学基金资助项目（61671346）；国家“111计划”创新引智基地资助项目（B08038）

摘要: 为进一步提高块对角化预编码算法的性能，提出一种多用户多输入多输出下行链路中基于Givens变换的正交三角（QR）分解改进块对角化算法（QR-Givens-BD）。在块对角化预编码算法中，首先需要求出预编码矩阵的前半部分来解决多用户干扰问题，然后求出预编码矩阵的后半部分来降低用户自身天线间的数据干扰。在求解预编码矩阵的前半部分时，使用的核心算法是矩阵的正交化算法，矩阵的正交性的强弱将直接影响块对角化预编码算法的误码率性能的好坏。因此，针对块对角化预编码算法中的矩阵正交化算法，使用基于Givens变换的QR分解正交化算法替换原有正交化算法，求解预编码矩阵的前半部分，从而获得信道干扰矩阵零空间的正交基。通过对矩阵采用本方法进行正交分解，可以获得正交性更好的正交矩阵，从而进一步降低系统误码率。仿真结果表明，本文所提出的算法与传统的块对角化算法相比，在降低了计算复杂度的同时大幅提高了系统的误码率性能；与基于Gram-Schmidt正交化的改进块对角化算法相比，在略微增加复杂度的前提下可以提高3～5 dB的误码率性能。

关键词: 多输入多输出预编码块对角化计算复杂度误码率

An Improved Block Diagonalization Precoding Algorithm

GAO Ming, SUN Chengyue, LIN Shaoxing, WANG Yong

State Key Lab. of Integrated Services Networks,Xidian Univ.,Xi’an 710071,China

Abstract: In order to improve the performance of block diagonalization precoding algorithm,an improved algorithm was proposed for multiuser multiple-input multiple-output (MIMO) downlink systems,which employs QR decomposition based on Givens transformation.In the block diagonalization precoding algorithm,the first half of the precoding matrix is required to solve the problem of multi-user interference,and the latter one to reduce the interference between the antennas of each user.The core algorithm of the first half matrix is orthogonalization algorithm,which will directly affect the bit error rate (BER) performance of the block diagonalization precoding algorithm.Therefore,the original orthogonalization algorithm was replaced by QR decomposition algorithm based on Givens transformation.Using this algorithm to solve the first half of the precoding matrix,the orthogonal basis of the interference matrix’s zero space can be obtained.By using the Givens transformation,the matrix with better orthogonality can be obtained,so as to further reduce the BER of the system.The simulation results showed that compared with the traditional block diagonalization algorithms,the complexity of the system was decreased and the BER performance can be improvedgreatly.Compared with the block diagonalization algorithms based on Gram-Schmidt orthogonalization,the BER performance can be improved by 3~5 dB,with a slight increase in the algorithm complexity.

Key words: multiple-input multiple-output (MIMO) precoding block diagonalization computational complexity bit error rate (BER)

与单用户多输入多输出（single user multi-input multi-output，SU-MIMO）系统不同，在多用户多输入多输出（multiuser multi-input multi-output，MU-MIMO）系统中，不同用户所接收到的信号不仅会经历噪声及天线间的干扰^[1–2]，还会受到多用户间干扰（multiuser interference，MUI）的影响。在下行链路中，由于各独立用户设备间协作困难，所以用户间干扰应当通过预编码技术在发射端消除^[3–4]。

脏纸编码（dirty paper coding，DPC）^[3]可以达到多用户MIMO广播信道的容量上限，但它是一种非线性预编码，因此在现实中很难实现。在可实现的线性预编码算法中，最具代表性的无疑是块对角化（block diagonalization，BD）算法^[4]。通过使用BD算法，可以将MU-MIMO信道转化成等价的多个SU-MIMO信道，完全消除用户间干扰，并能够实现接近脏纸编码的信道容量。然而，传统BD算法由于需要进行多次奇异值分解（singular value decomposition，SVD），其运算复杂度仍然较高，因此不断地有改进BD算法被提出。Ling^[5]、Hashem^[6]等研究了基于格基规约算法的低复杂度预编码算法。Zu等^[7]通过将BD算法与LR相结合，得到的改进算法不但能够减少算法的计算复杂度，同时还能在一定程度上提升系统误码性能。Chou等^[8]利用改进的平方根分解法对等效单用户MIMO信道进行块对角化处理，可以进一步降低BD算法的复杂度。An等^[9]则用LQ分解取代了QR分解，相较于传统BD算法也降低了复杂度。巫健^[10]提出一种在BD算法前半部分采用伪逆与QR分解代替高复杂度奇异值分解的方法，并提出进一步改进方案，仅对联合信道矩阵求一次伪逆，再次降低复杂度。此外，巫健^[10–11]等还分别提出了通过增加一次QR分解或格拉姆施密特正交化来避免进行复杂度较高的伪逆运算的改进方案，由于QR分解可以通过施密特正交化来实现，所以这两种方案本质上是相同的。

综上所述，传统的BD算法由于复杂度很高，限制了其应用。巫健^[10–11]等虽然通过避免复杂的伪逆运算降低了BD算法的复杂度，但是该算法的误码率性能并没有获得提升。为了进一步提高BD算法的性能，作者提出了一种基于Givens变换的QR分解改进BD算法，相较于传统BD算法，该算法不仅降低了复杂度，也改善了误码性能。而与巫健^[10–11]等提出的改进算法对比，在略微增加复杂度的前提下可以提高算法的误码率性能。

1 系统模型

考虑一个如图1所示处于平坦衰落信道下的单小区多用户MIMO系统，基站拥有 ${N_{{T}}}$ 个发射天线及 $K$ 个用户，每个用户接收天线数为 ${N_k}$ ，则总接收天线 ${N_{{R}}} = \displaystyle\sum\limits_{k = 1}^K {{N_k}} $ 。基站和用户间的下行信道矩阵可以用 ${{{H}}_k} \in {\mathbb{C}^{{N_k} \times {N_{{T}}}}}$ 表示，其元素服从 ${{N}}(0,1)$ 的独立同分布复高斯随机变量。假设全局信道矩阵 ${{H}} = {[{{H}}_{{1}}^{{T}},{{H}}_{{2}}^{{T}}, \cdots ,{{H}}_K^{{T}}]^{{T}}}$ 行满秩且基站已知其状态信息。因此，用户 $k$ 的接收信号可以写为：

${{{y}}_k} = {{{H}}_k}{{{W}}_k}{{{x}}_k} + \sum\limits_{i = 1,i \ne k}^K {{{{H}}_i}{{{W}}_i}{{{x}}_i}} + {{{n}}_k}$

(1)

式中， ${{{x}}_k}$ 代表用户 $k$ 的信号数据， ${{{W}}_k}$ 表示用户 $k$ 的 ${N_{{T}}} \times 1$ 维预编码向量， ${{{n}}_k}$ 表示用户 $k$ 服从 ${{N}}(0,{\sigma ^2}{{{I}}_{{N_k}}})$ 分布的循环对称复高斯噪声。此外，用户 $k$ 的功率约束 ${P_k} = {{ E}}[{{x}}{{{x}}^{{H}}}]$ 在基站端进行总功率约束，对应关系为 $\displaystyle\sum\limits_{k = 1}^K {{P_k}} \le P$ 。式（1）右侧第2项代表用户间干扰，即期望在算法中消除的对象。

图1 多用户MIMO预编码系统模型 Fig. 1 Multiuser MIMO precoding system model

2 传统块对角化算法

一般地，对于拥有 $K$ 个用户的系统来说，针对每个用户需要进行两次SVD运算。第1次SVD后，得到一个完全消除用户间干扰的预编码矩阵，第2次SVD后，将每个用户的信道分解成并行的子信道以优化功率分配。因此，BD算法通常可以概括为两步，假设其联合预编码矩阵为 ${{W}}\text{，}\!$ 令 ${{W}} = {{{W}}^{{o}}}{{{W}}^{{g}}}$ ，其中， ${{{W}}^{{o}}} \!=\! [{{W}}_1^{{o}},{{W}}_2^{{o}}, \cdots\!,{{W}}_K^{{o}}]$ 用于消除用户间干扰， $ {{{W}}^{{g}}} \!=\! {{diag}}\{ {{W}}_1^{{g}},$ ${{W}}_2^{{g}}, \cdots ,{{W}}_K^{{g}}\} $ 用于抑制每一个用户数据流之间的干扰。即第1步求取预编码矩阵 ${{{W}}^{{o}}}$ 以消除用户间干扰，第2步求取预编码矩阵 ${{{W}}^{{g}}}$ 以抑制数据流之间的干扰。

2.1 求取传统块对角化算法的预编码矩阵 ${{{W}}^{{o}}}$

为了达到用户间干扰最小化，传统BD算法要求用户 $k$ 的预编码矩阵 ${{{W}}^{{o}}}$ 位于其他用户信道的零空间，即 ${{{H}}_i}{{{W}}^{{o}}} = 0,i \ne k$ 。令 ${{\widetilde{ H}}_k}$ 表示除用户 $k$ 以外所有用户组成的信道矩阵：

${{\widetilde{ H}}_k} = {[{{H}}_{{1}}^{{T}},{{H}}_{{2}}^{{T}}, \cdots \!,\;{{H}}_{k - 1}^{{T}},{{H}}_{k + 1}^{{T}}, \cdots\! ,\;{{H}}_K^{{T}}]^{{T}}}$

(2)

假设所有用户均满足维数条件，令 ${L_k} = {{rank}}({{\widetilde{ H}}_k}) \le $ ${N_{{R}}} - {N_k}$ ，对 ${{\widetilde{ H}}_k}$ 进行SVD得到：

${{\widetilde{ H}}_k} = {{\widetilde{ U}}_k}\left[ {\begin{array}{*{20}{c}} {{{{\widetilde{ \varSigma }}}_k}} & 0 \\ 0 & 0 \end{array}} \right]{\left[ {{\widetilde{ V}}_k^{(1)},{\widetilde{ V}}_k^{(0)}} \right]^{{H}}}$

(3)

式中， ${\widetilde{ V}}_k^{(1)}$ 为前 ${L_k}$ 个右奇异向量, ${\widetilde{ V}}_k^{(0)}$ 包含了 ${{\widetilde{ H}}_k}$ 的后 ${N_{{T}}} - {L_k}$ 个右奇异向量， ${\widetilde{ V}}_k^{(0)}$ 的列构成了 ${{\widetilde{ H}}_k}$ 零空间的一个正交基。所以，用户 $k$ 预编码矩阵的第1部分为：

${{W}}_k^{{o}} = {\widetilde{ V}}_k^{(0)}$

(4)

遍历所有 $K$ 个用户，可以得到联合预编码矩阵的第1部分：

${{W}}_k^{{o}} = [{{W}}_1^{{o}},{{W}}_2^{{o}}, \cdots ,{{W}}_K^{{o}}]$

(5)

2.2 求取传统块对角化算法的预编码矩阵 ${{{W}}^{{g}}}$

定义用户 $k$ 的等效单用户MIMO信道 ${{H}}_k^{{eff}} = {{{H}}_k}{{W}}_k^{{o}}$ ，令 ${\overline L_k}$ 表示乘积 ${{{H}}_k}{{W}}_k^{{o}}$ 的秩，为了获得更高的系统容量，需要对等效信道再次进行SVD。分解如下：

${{H}}_k^{{{eff}}} = {{{H}}_k}{{W}}_k^{{o}} = {{{U}}_k}{{{\varSigma }}_k}{[{{V}}_k^{(1)},{{V}}_k^{(0)}]^{{H}}}$

(6)

式中， ${{V}}_k^{(1)}$ 包含 ${{{H}}_k}{{W}}_k^{{o}}$ 的前 ${\overline L_k}$ 个右奇异向量，即用户 $k$ 的预编码矩阵第2部分：

${{W}}_k^{{g}} = {{V}}_k^{(1)}$

(7)

遍历所有用户，可以得到联合预编码矩阵的第2部分为：

${{{W}}^{{g}}} = {{diag}}\{ {{W}}_1^{{g}},{{W}}_2^{{g}}, \cdots ,{{W}}_K^{{g}}\} $

(8)

综上，BD预编码算法的最终联合预编码矩阵 ${{W}}$ 为：

${{W}} = {{{W}}^{{o}}}{{{W}}^{{g}}}$

(9)

同时，接收矩阵为：

${{{B}}_k} = {{U}}_k^{{H}}$

(10)

3 改进块对角化算法

由矩阵论知识可知，QR分解可以通过Gram-Schmidt正交化、Givens变换与Householder变换这3种方式实现，实现方式的不同会得到不同计算复杂度、不同正交性矩阵的QR分解^[12]。因此，提出一种改进的BD算法——QR-Givens-BD算法，与文献[10–11]不同的是，在做第2次QR分解时，使用基于Givens变换的QR分解算法。

如前所述，QR-Givens-BD算法同样可以分为两步进行，即第1步求取预编码矩阵 ${{{W}}^{{o}}}$ 以消除用户间干扰，第2步求取预编码矩阵 ${{{W}}^{{g}}}$ 以抑制数据流之间的干扰。

3.1 求取改进块对角化算法的预编码矩阵 ${{{W}}^{{o}}}$

首先，对联合信道矩阵的共轭转置 ${{{H}}^{{H}}}$ 做QR分解：

${{{H}}^{{H}}} = {{QR}}$

(11)

式中， ${{R}} \in {\mathbb{C}^{{N_{ R}} \times {N_{ R}}}}$ 是分解得到的上三角矩阵， ${{Q}} \in {\mathbb{C}^{{N_{{T}}} \times {N_R}}}$ 是分解得到的正交矩阵。由式（11）可知， ${{H}}$ 的伪逆可以表示为：

$\begin{aligned}[b] {{{H}}^{\text{†}} } = & {{{H}}^{{H}}}{({{H}}{{{H}}^{{H}}})^{ - 1}} = {{QR}}{({{{R}}^{{H}}}{{{Q}}^{{H}}}{{QR}})^{ - 1}} = \\& {{QR}}{{{R}}^{ - 1}}{({{{R}}^{{H}}})^{ - 1}} = {{Q}}{({{{R}}^{{H}}})^{ - 1}}\end{aligned}$

(12)

令 ${({{{R}}^{{H}}})^{ - 1}} = {{L}} = [{{{L}}_1},{{{L}}_2}, \cdots ,{{{L}}_K}]$ ，其中， ${{{L}}_k} \in {\mathbb{C}^{{N_{ R}} \times {N_k}}}$ 是 ${{L}} \in {\mathbb{C}^{{N_{ R}} \times {N_{ R}}}}$ 中用户 $k$ 所对应的子矩阵。由于 ${{H}}{{{H}}^{\text{†}} } = {{I}}$ ，可以看出对于任意用户 $k$ ，都有 ${{\widetilde{ H}}_k}{{Q}}{{{L}}_k} = 0$ ，这表明矩阵 ${{Q}}{{{L}}_k}$ 位于信道干扰矩阵 ${{\widetilde{ H}}_k}$ 的零空间内。此时，还需保证 ${{Q}}{{{L}}_k}$ 为酉矩阵，以不改变总的发射功率。

对子矩阵 ${{Q}}{{{L}}_k}$ 进行基于Givens变换的QR分解：

${{Q}}{{{L}}_k} = {{\overline{ Q}}_k}{{\overline{ R}}_k}$

(13)

式中， ${{\overline{ R}}_k} \in {\mathbb{C}^{{N_k} \times {N_k}}}$ 是子矩阵分解得到的上三角矩阵， ${{\overline{ Q}}_k} \in {\mathbb{C}^{{N_{{T}}} \times {N_k}}}$ 是子矩阵分解得到的正交矩阵，并且是子矩阵 ${{Q}}{{{L}}_k}$ 的标准正交基。由 ${{\widetilde{ H}}_k}{{Q}}{{{L}}_k} = 0$ 可知：

${{\widetilde{ H}}_k}{{Q}}{{{L}}_k} = {{\widetilde{ H}}_k}{{\overline{ Q}}_k}{{\overline{ R}}_k} = 0$

(14)

由于 ${{\overline{ R}}_k}$ 是可逆矩阵，可以得到 ${{\widetilde{ H}}_k}{{\overline{ Q}}_k} = 0$ 。因此， ${{\overline{ Q}}_k}$ 可作为用户 $k$ 的预编码矩阵第1部分，即：

${{{W}}^{{o}}} = {{\overline{ Q}}_k}$

(15)

遍历所有 $K$ 个用户，可以得到联合预编码矩阵的第1部分：

${{W}}_k^{{o}} = [{{W}}_1^{{o}},{{W}}_{{2}}^{{o}}, \cdots ,{{W}}_{{K}}^{{o}}]$

(16)

经过 ${{{W}}^{{o}}}$ 预处理后，下行多用户MIMO广播信道被分解为 $K$ 条等效单用户MIMO信道：

${{H}}{{{W}}^{{o}}} = {{diag}}\{ {{{H}}_1}{{W}}_{{1}}^{{o}},{{{H}}_1}{{W}}_2^{{o}}, \cdots ,{{{H}}_K}{{W}}_K^{{o}}\} $

(17)

3.2 求取改进块对角化算法的预编码矩阵 ${{{W}}^{{g}}}$

定义用户 $k$ 的等效单用户MIMO信道 ${{H}}_k^{{eff}} = {{{H}}_k}{{W}}_k^{{o}}$ ，令 ${\overline L_k}$ 表示乘积 ${{{H}}_k}{{W}}_k^{{o}}$ 的秩，为了获得更高的系统容量，需要对等效信道进行SVD。分解如下：

${{H}}_k^{{eff}} = {{{H}}_k}{{W}}_k^{{o}} = {{{U}}_k}{{{\varSigma }}_k}{[{{V}}_k^{(1)},{{V}}_k^{(0)}]^{{H}}}$

(18)

式中， ${{V}}_k^{(1)}$ 包含 ${{{H}}_k}{{W}}_k^{{o}}$ 的前 ${\overline L_k}$ 个右奇异向量，即用户 $k$ 的预编码矩阵第2部分：

${{W}}_k^{{g}} = {{V}}_k^{(1)}$

(19)

遍历所有用户，可以得到联合预编码矩阵的第2部分为：

${{{W}}^{{g}}} = { diag}\{ {{W}}_1^{{g}},{{W}}_2^{{g}}, \cdots ,{{W}}_K^{{g}}\} $

(20)

综上，QR-Givens-BD预编码算法的最终联合预编码矩阵 ${{W}}$ 为：

${{W}} = {{{W}}^{{o}}}{{{W}}^{{g}}}$

(21)

同时，接收矩阵为：

${{{B}}_k} = {{U}}_k^{{H}}$

(22)

4 性能分析与仿真 4.1 复杂度分析

对所提的QR-Givens-BD算法的复杂度进行分析，并与传统BD算法及基于Gram-Schmidt正交化的QR-GSO-BD算法^[10–11]的复杂度进行对比。为方便计算，假设每个用户的天线数 ${N_k}$ 相同，总接收天线数 ${N_{{R}}} = K{N_k}$ 。复杂度采用浮点操作数（flop）进行度量，1个flop表示1次实数浮点运算操作，1次复数乘法或除法需要6个flops，1次复数加（减）法需要2个flops。参考文献[9–15]，对于一个 $n \times m$ 维（ $n \le m$ ）复矩阵而言，常用的矩阵运算所需浮点数可以总结如下：

1）与 $m \times p$ 维复矩阵相乘所需浮点运算数为 $8nmp - 2np$ ；

2）矩阵奇异值分解所需浮点运算数为 $24n{m^2} +$ $ 48{n^2}m + 54{n^3}$ ；

3）基于修正Gram-Schmidt正交化的QR分解所需浮点运算数为 $8{n^2}m$ ；

4）基于Givens变换的QR分解所需浮点运算数为 $24{n^2}m - 8{n^3}$ ；

5） $n \times n$ 维实矩阵使用高斯消元法求逆，所需浮点运算数为 $4{n^3}/3$ 。

对于传统BD算法而言：1）对每个用户进行一次奇异值分解，共 $K$ 次，所需浮点运算数为 $K\{ 24(K - 1)$ · ${N_k}N_{{T}}^2 + 48{[(K - 1){N_k}]^2}{N_{{T}}} + 54{[(K - 1){N_k}]^3}\}$ ；2）求取每个用户的等效信道矩阵，共需浮点运算数 $ 8KN_k^2{N_{{T}}} -$ $ 2KN_k^2$ ；3）对每个用户的等效信道矩阵再次进行奇异值分解，共需浮点运算数 $K(24{N_k}N_{{T}}^2 + 48N_k^2{N_{{T}}} + 54N_k^3)$ ；4）将前两步得出的预编码矩阵相乘得出最终预编码矩阵，共需浮点运算数 $8{(K{N_k})^2}{N_{{T}}} - 2K{N_k}{N_{{T}}}$ 。综上所述，传统BD算法所需浮点运算数为：

$\begin{aligned}[b]{\varPsi _{{{BD}}}} = & 24{K^2}{N_k}N_{{T}}^2 + (56{K^2} - 40K + 48)N_k^2{N_{{T}}} - \\& 2K{N_k}{N_{{T}}} + 54({K^3} - 3{K^2} + 4K - 1)N_k^3 - 2KN_k^2{{ = }}\\& O({K^2}{N_k}N_{{T}}^2)\end{aligned}$

(23)

对于QR-GSO-BD算法而言：1）对联合信道矩阵进行QR分解，所需浮点运算数为 $8{(K{N_k})^2}{N_{{T}}}$ ；2）求分解所得上三角矩阵的逆矩阵，所需浮点运算数为 $4{(K{N_k})^3}/3$ ；3）对每个用户的该矩阵再次进行QR分解，共需浮点运算数 $K(8N_k^2K{N_k})$ ；4）结合前3步所得矩阵得到每用户的等效信道矩阵，共需浮点运算数 $8{(K{N_k})^2}{N_{{T}}} - 2K{N_k}{N_{{T}}} + 8KN_k^2{N_{{T}}} - 2KN_k^2$ ；5）对每用户的等效信道矩阵再次进行SVD，共需浮点运算数 $K(24{N_k}N_{{T}}^2 + 48N_k^2{N_{{T}}} + 54N_k^3)$ ；6）将预编码矩阵的两部分相乘得出最终预编码矩阵，共需浮点运算数 $8{(K{N_k})^2}{N_{{T}}} - 2K{N_k}{N_{{T}}}$ 。综上所述，QR-GSO-BD算法所需浮点运算数为：

$\begin{aligned} {\varPsi _{{{QR}} - {{GSO}} - {{BD}}}} = & 24K{N_k}N_{{T}}^2 + (24{K^2} + 56K)N_k^2{N_{{T}}} - 4K{N_k}{N_{{T}}} + \\& (4{K^3}/3 \!+\! 8{K^2} \!+\! 54K)N_k^3 - 2KN_k^2 \!=\! O(K{N_k}N_{{T}}^2)\end{aligned}$

(24)

对于QR-Givens-BD算法而言，与QR-GSO-BD算法相比较，除矩阵相乘步骤的顺序外，仅第3）步所需浮点运算数不同，共需 $K(24N_k^2K{N_k} - 8N_k^3)$ 。综上所述，QR-Givens-BD算法所需浮点运算数为：

$\begin{aligned}[b]{\varPsi _{{{QR}} \!-\! {{Givens}} \!-\! {{BD}}}} \!= & 24K{N_k}N_{{T}}^2 \!+\! (24{K^2} + 56K)N_k^2{N_{{T}}} - 4K{N_k}{N_{{T}}} + \\& (4{K^3}/3 \!+\! 24{K^2} \!+\! 48K)N_k^3 \!-\! 2KN_k^2 \!=\! O(K{N_k}N_{{T}}^2)\end{aligned}$

(25)

由式（23）～（25）可以看出，QR-Givens-BD算法复杂度数量级与QR-GSO-BD算法相当，且二者均为传统BD算法的 $1/K$ 。

固定每用户天线数为2，发射天线数为24，图2与3分别比较了QR-Givens-BD算法与传统BD算法及QR-GSO-BD算法随着用户数变化的计算复杂度。

图2 BD与QR-Givens-BD复杂度比较 Fig. 2 Comparison of complexity between BD and QR-Givens-BD

图3 QR-GSO-BD与QR-Givens-BD复杂度比较 Fig. 3 Comparison of complexity between QR-GSO-BD and QR-Givens-BD

从图2中可以看出，由于算法复杂度数量级的下降，随着用户数的增加，QR-Givens-BD算法的复杂度远远低于传统BD算法。当用户数为12时，前者的计算复杂度仅约为后者的14.7%。从图3中可以看出，尽管基于Givens变换QR分解的复杂度约为基于修正Gram-Schmidt正交化QR分解复杂度的2倍^[12]，但其在整个算法中只占很小一部分，因此QR-Givens-BD和QR-GSO-BD算法在计算复杂度上相差不大。当用户数较低时，两种算法的复杂度基本相同，当用户数较多时，算法复杂度略有增加，例如，当用户数为12时，前者相对于后者只增加了约2.4%的计算复杂度。

4.2 误码性能仿真

通过MATLAB仿真平台，对传统BD、QR-GSO-BD与QR-Givens-BD算法的误码性能进行了仿真。假设信道为准静态平坦瑞利衰落信道，调制方式为QPSK，信道矩阵元素为独立同分布零均值单位方差的复高斯随机变量。

图4为发射天线数为6、用户数为3、每用户天线数为2的情景下3种BD算法的误码率仿真曲线。从图4可以看出，QR-GSO-BD算法虽然计算复杂度相较于传统BD算法有所降低，但其误码率性能仍与传统BD算法持平，因此在图4中两条曲线重合。而在QR-Givens-BD算法中，即使基于Givens变换的QR分解会引入额外复杂度，但其分解所得的正交矩阵正交性却比基于Gram-Schmidt正交化的QR分解更好^[12]，因此由图4可以看出QR-Givens-BD算法的误码性能比QR-GSO-BD算法及传统BD算法好2～4 dB，并且其计算复杂度仅约为传统BD算法的14.7%，相较于QR-GSO-BD算法也仅增加了约2.4%的计算复杂度。

图5为发射天线数为18、用户数为6、每用户天线数为3的情景下3种算法的误码率仿真曲线。由图5误码仿真结果可以看出，QR-GSO-BD算法与传统BD算法的误码率曲线重合，具有相同的误码率性能，而QR-Givens-BD算法的误码性能优于QR-GSO-BD算法及传统BD算法3～5 dB。结合图4与5可以看出，随着天线数目和用户数目的增加，所提出的算法的误码率性能提升越大。

图4 误码率仿真结果（ ${{{N}}_{{T}}}= 6,{{{N}}_{k}} = 2, {{K}}= 3$ ） Fig. 4 Simulation of bit error rate ( ${{{N}}_{{T}}}= 6,{{{N}}_{k}} = 2, {{K}}= 3$ )

图5 误码率仿真结果（ ${{{N}}_{{T}}}= 18,{{{N}}_{k}} = 3,{{K}}= 6$ ） Fig. 5 Simulation of bit error rate ( ${{{N}}_{{T}}}= 18,{{{N}}_{k}} = 3,{{K}}= 6$ )

5 结　论

提出了一种改进块对角化算法，算法通过采用基于Givens变换的QR分解代替传统BD算法中的SVD分解，使得系统最终求得的预编码矩阵具有更好的正交性。所提出的算法实现复杂度低，具有良好的误码率性，因此，所提出的算法是一种可行的下行多用户MIMO预编码方案。下一步的工作中，将继续研究快速Givens变换中的溢出问题，在解决溢出问题的基础上研究基于快速Givens变换的BD算法，进一步降低算法复杂度。

参考文献

[1]	Nguyen D, Nguyenle H, Lengoc T. Block-diagonalization precoding in a multiuser multicell MIMO system competition and coordination[J]. IEEE Transactions on Wireless Communications, 2014, 13(2): 968-981. DOI:10.1109/TWC.2013.010214.130724
[2]	Zarei S, Gerstacker W, Schober R. Low-complexity widely-linear precoding for downlink large-scale MU-MISO systems[J]. IEEE Communications Letters, 2015, 19(4): 665-668. DOI:10.1109/LCOMM.2015.2392751
[3]	Weingarten H, Steinberg Y, Shamai S. The capacity region of the Gussian MIMO broadcast channel[J]. IEEE Transactions on Information Theory, 2006, 52(9): 3936-3964. DOI:10.1109/TIT.2006.880064
[4]	Spencer Q H, Swinlehurst A L, Haardt M. Zero-forcing methods for downlink spatial multiplexing in multi-user MIMO Channels[J]. IEEE Transactions on Signal Processing, 2004, 52(2): 461-471. DOI:10.1109/TSP.2003.821107
[5]	Ling Cong. On the proximity factors of lattice reduction aided decoding[J]. IEEE Transactions on Signal Processing, 2011, 59(6): 2795-2808. DOI:10.1109/TSP.2011.2123889
[6]	Hashem M, Khan A, Chung J. Lattice reduction aided with block diagonalization for multiuser MIMO systems[J]. EURASIP Journal on Wireless Communications, 2015, 2015(1): 1-9.
[7]	Zu K, Lamare R C, Haardt M. Generalized design of low-complexity block diagonalization type precoding algorithms for multiuser MIMO systems[J]. IEEE Transactions on Communications, 2013, 61(2): 4232-4242.
[8]	Chou C C, Wu J M. Low-complexity MIMO precoder design with LDL^H channel decomposition [J]. IEEE Transactions on Vehicular Technology, 2011, 60(5): 2368-2372. DOI:10.1109/TVT.2011.2151889
[9]	An Jie, Liu Yuanan, Liu Fang. A low complexity block diagonalization precoding method for multiuser MIMO downlink[J]. Journal of Computational Information Systems, 2012, 8(12): 5187-5194.
[10]	Wu Jian.Research on lattice reduction based low-complexity precoding technique for multi-user MIMO systems[D].Chengdu:University of Electronic Science and Technology of China,2015. 巫健.多用户MIMO系统中基于格基规约的低复杂度预编码技术研究[D].成都:电子科技大学,2015.
[11]	Wu Jian,Fang Shu,Li Lei,et al.QR decomposition and Gram Schmidt orthogonalization based low complexity multi-user MIMO precoding[C]//Proceedings of 10th International Conference on Wireless Communications,Networking and Mobile Computing.Beijing:IET,2014:61–66.
[12]	Golub G H,van Loan C F.矩阵计算:英文版[M].4版.北京:人民邮电出版社,2014:199–210.
[13]	Ren Yuwei, Song Yang, Su Xin. Low-complexity channel reconstruction methods based on SVD-ZF precoding in massive 3D-MIMO systems[J]. China Communications, 2015, 12(Supplement1): 49-57.
[14]	Fang Shu, Wu Jian, Lu Chengyi. Simplified QR-decomposition based and lattice reduction-assisted multi user multiple input multiple output precoding scheme[J]. IET Communications, 2016, 10(5): 586-593. DOI:10.1049/iet-com.2015.0643
[15]	Ali-Khan M H, Chung J G, Lee M H. Lattice reduction aided with block diagonalization for multiuser MIMO systems[J]. EURASIP Journal on Wireless Communications, 2015, 2015(254): 1186-1195.


工程科学与技术 2018, Vol. 50 Issue (2): 112-117