当前位置: 首页 > 工具软件 > mtt > 使用案例 >

任意模数ntt_MTT:任意模数NTT

郭乐意
2023-12-01

MTT:任意模数NTT

概述

有时我们用FFT处理的数据很大,而模数可以分解为\(a\cdot 2^k+1\)的形式。次数用FFT精度不够,用NTT又找不到足够大的模数,于是MTT就应运而生了。

MTT没有模数的限制,比NTT更加自由,应用广泛,可以用于任意模数或很大的数。

MTT

MTT是基于NTT的,其思想很简单,就是做多次NTT,每次使用不同的素数,然后使用CRT合并解,在合并的过程中模最终模数,或是对于无模数的情况使用高精度。

做NTT的次数取决于最大可能答案的大小,所用的所有素数之积必须大于答案

实现

此处以取三个素数为例

我们可以做三次NTT,相邻次之间改变素数,但这样常数太大,于是我们常常选择封装(适合于模数不太多的情况)。

我们定义一个结构体node,有三个成员a,b,c,分别代表三个模数下的值,同时,我们定义模数的结构体与之一一对应。

struct node{

LL a,b,c;

node(){

a=b=c=0;

}

node(LL x){

a=b=c=x;

}

node(LL x,LL y,LL z){

a=x;

b=y;

c=z;

}

}MOD=node(167772161,469762049,998244353),BASE=node(3),INV=node(116878283,426037461,929031873);

我们还要定义关于此结构体的运算,其中成员之间互不影响,只和操作对象里对应的成员产生运算

inline node operator+(node x,node y){

return node(x.a+y.a,x.b+y.b,x.c+y.c);

}

inline node operator-(node x,node y){

return node(x.a-y.a,x.b-y.b,x.c-y.c);

}

inline node operator*(node x,node y){

return node(x.a*y.a%MOD.a,x.b*y.b%MOD.b,x.c*y.c%MOD.c);

}

inline node operator%(node x,node y){

return node(x.a%y.a,x.b%y.b,x.c%y.c);

}

inline node operator/(node x,node y){

return node(x.a/y.a,x.b/y.b,x.c/y.c);

}

inline node operator-(node x,LL y){

return node(x.a-y,x.b-y,x.c-y);

}

inline node operator*(node x,LL y){

return node(x.a*y,x.b*y,x.c*y);

}

inline node operator/(node x,LL y){

return node(x.a/y,x.b/y,x.c/y);

}

inline node operator%(node x,LL y){

return node(x.a%y,x.b%y,x.c%y);

}

然后套用NTT的板子,最后用CRT合并。

假设这一位的答案是\(x\),三个模数分别为\(A,B,C\),那么:

\[\begin{aligned}x\equiv x_1\pmod{A} \\ x\equiv x_2\pmod{B} \\ x\equiv x_3\pmod{C}\end{aligned}

\]

先把前两个合并:

\[\begin{aligned}x_1+k_1A=x_2+k_2B\\x_1+k_1A\equiv x_2\pmod{B}\\k_1\equiv \frac{x_2-x_1}A\pmod{B}\end{aligned}

\]

于是求出了\(k_1\),也就求出了\(x\equiv x_1+k_1A\pmod{AB}\),记\(x_4=x_1+k_1A\)

\[\begin{aligned}x_4+k_4AB=x_3+k_3C\\x_4+k_4AB\equiv x_3\pmod{C}\\k_4\equiv \dfrac{x_3-x_4}{AB}\pmod{C}\end{aligned}

\]

因为\(x

\[x=x_4+k_4AB

\]

LL CRT(node x){

LL mod1=MOD.a,mod2=MOD.b,mod3=MOD.c,mod_1_2=mod1*mod2;

LL inv_1=inv(mod1,mod2),inv_2=inv(mod1*mod2%mod3,mod3);

LL A=x.a,B=x.b,C=x.c;

LL x4=(B-A+mod2)%mod2*inv_1%mod2*mod1+A;

return ((C-x4%mod3+mod3)%mod3*inv_2%mod3*(mod_1_2%Last_Mod)+Last_Mod+x4)%Last_Mod;

}

于是我们就能写出完整代码了。

// luogu-judger-enable-o2

#include

using namespace std;

typedef long long LL;

const int INF=1e9+7,MAXN=3e6+10/*Min:2^20+10*/;

void exgcd(LL a,LL b,LL &x,LL &y){

if(!b){

x=1;

y=0;

return;

}

exgcd(b,a%b,y,x);

y-=a/b*x;

}

inline LL inv(LL x,LL p){

LL a,b;

exgcd(x,p,a,b);

return (a%p+p)%p;

}

struct node{

LL a,b,c;

node(){

a=b=c=0;

}

node(LL x){

a=b=c=x;

}

node(LL x,LL y,LL z){

a=x;

b=y;

c=z;

}

}MOD=node(167772161,469762049,998244353),BASE=node(3),INV=node(116878283,426037461,929031873);

inline node operator+(node x,node y){

return node(x.a+y.a,x.b+y.b,x.c+y.c);

}

inline node operator-(node x,node y){

return node(x.a-y.a,x.b-y.b,x.c-y.c);

}

inline node operator*(node x,node y){

return node(x.a*y.a%MOD.a,x.b*y.b%MOD.b,x.c*y.c%MOD.c);

}

inline node operator%(node x,node y){

return node(x.a%y.a,x.b%y.b,x.c%y.c);

}

inline node operator/(node x,node y){

return node(x.a/y.a,x.b/y.b,x.c/y.c);

}

inline node operator-(node x,LL y){

return node(x.a-y,x.b-y,x.c-y);

}

inline node operator*(node x,LL y){

return node(x.a*y,x.b*y,x.c*y);

}

inline node operator/(node x,LL y){

return node(x.a/y,x.b/y,x.c/y);

}

inline node operator%(node x,LL y){

return node(x.a%y,x.b%y,x.c%y);

}

LL Last_Mod;

LL CRT(node x){

LL mod1=MOD.a,mod2=MOD.b,mod3=MOD.c,mod_1_2=mod1*mod2;

LL inv_1=inv(mod1,mod2),inv_2=inv(mod1*mod2%mod3,mod3);

LL A=x.a,B=x.b,C=x.c;

LL x4=(B-A+mod2)%mod2*inv_1%mod2*mod1+A;

return ((C-x4%mod3+mod3)%mod3*inv_2%mod3*(mod_1_2%Last_Mod)+Last_Mod+x4)%Last_Mod;

}

inline LL fpm_(LL base,LL p,LL mod){

LL ret=1;

while(p){

if(p&1)

ret=ret*base%mod;

base=base*base%mod;

p>>=1;

}

return ret%mod;

}

inline node fpm(LL base,node p){

return node(fpm_(base,p.a,MOD.a),fpm_(base,p.b,MOD.b),fpm_(base,p.c,MOD.c));

}

int N,M,lim=1,lg,rev[MAXN];

node Wn[MAXN];

inline void NTT(node *a,int type){

for(int i=0;i

if(i

swap(a[i],a[rev[i]]);

for(int mid=1;mid

int len=mid<<1/*n*/;

node Wn=fpm(3,(MOD-1)/(LL)len);

for(int j=0;j

node w=node(1);

for(int k=0;k

node x=a[j+k],y=w*a[j+k+mid]%MOD;

a[j+k]=(x+y)%MOD;

a[j+k+mid]=(x-y+MOD)%MOD;

w=w*Wn%MOD;

}

}

}

if(type==-1){

reverse(a+1,a+lim);

node lim_inv=node(inv(lim,MOD.a),inv(lim,MOD.b),inv(lim,MOD.c));

for(int i=0;i

a[i]=a[i]*lim_inv;

}

}

node a[MAXN],b[MAXN];

int main(){

scanf("%d%d%lld",&N,&M,&Last_Mod);

for(int i=0;i<=N;i++){

LL ii;

scanf("%lld",&ii);

a[i]=node(ii%Last_Mod)%MOD;

}

for(int i=0;i<=M;i++){

LL ii;

scanf("%lld",&ii);

b[i]=node(ii%Last_Mod)%MOD;

}

while(lim<=N+M){

lim<<=1;

lg++;

}

for(int i=0;i

rev[i]=(rev[i>>1]>>1)|((i&1)<

Wn[0]=node(1);

for(int i=1;i

Wn[i]=Wn[i-1]*INV;

NTT(a,1);

NTT(b,1);

for(int i=0;i

a[i]=a[i]*b[i]%MOD;

NTT(a,-1);

for(int i=0;i<=N+M;i++)

printf("%lld ",CRT(a[i]));

return 0;

}

例题

 类似资料: