为什么KISS_FFT的正反基数4的计算不同,第二部分?正反、基数、第二部分、不同

2023-09-03 09:07:36 作者:笑谈曾经

Part 1 - why the code below checks st_inverse in the first place

KISS_FFT代码在循环内有此分支:

do {
    if(st->inverse) {
        Fout[m].r = scratch[5].r - scratch[4].i;
        Fout[m].i = scratch[5].i + scratch[4].r;
        Fout[m3].r = scratch[5].r + scratch[4].i;
        Fout[m3].i = scratch[5].i - scratch[4].r;
    }else{
        Fout[m].r = scratch[5].r + scratch[4].i;
        Fout[m].i = scratch[5].i - scratch[4].r;
        Fout[m3].r = scratch[5].r - scratch[4].i;
        Fout[m3].i = scratch[5].i + scratch[4].r;
    }
    ++Fout;
} while (--k); // Fout[] has k*4 elements.
常用的电流互感器二次电流为5A,在什么情况下选择1A呢

稍微重新排序:

if(st->inverse) {
    Fout[m].r = scratch[5].r - scratch[4].i;
    Fout[m].i = scratch[5].i + scratch[4].r;
    Fout[m3].r = scratch[5].r + scratch[4].i;
    Fout[m3].i = scratch[5].i - scratch[4].r;
}else{
    Fout[m3].r = scratch[5].r - scratch[4].i;
    Fout[m3].i = scratch[5].i + scratch[4].r
    Fout[m].r = scratch[5].r + scratch[4].i;
    Fout[m].i = scratch[5].i - scratch[4].r;;
}
这两个代码块真正的不同之处在于它们对mm3的使用。但mm3在循环内不变。我可以通过交换mm3来简单地消除此内循环分支吗?

if(st->inverse) { swap(&m, &m3); }
do {
    Fout[m].r = scratch[5].r - scratch[4].i;
    Fout[m].i = scratch[5].i + scratch[4].r;
    Fout[m3].r = scratch[5].r + scratch[4].i;
    Fout[m3].i = scratch[5].i - scratch[4].r;
   ++Fout;
} while (--k);

推荐答案

我确实可以使用该优化。然而,对于可以使用AVX的当前一代的编译器来说,这并不是必需的。他们还将使用vpcmpeqd删除该分支 和vblendvps