有 T 组数据,求:
Tleq 10^4,n,mleq 10^7
Solution
显然可以枚举质数,所以原式可以化为:
根据基本套路,可以把 [gcd(i,j)=k] 化为 [gcd(i,j)=1]:
由莫比乌斯函数性质可得:
再根据基本套路,可以变换枚举顺序,可得:
此时时间复杂度为 mathcal{O}(text{质数个数}times sqrt N),显然会 TLE。
此时就有一个常用的技巧可以降低时间复杂度。
设 T=kd,有
显然后面的式子可以直接预处理。
暂且将这种常用的技巧理解为通过变换枚举顺序,使得某一式子可以预处理化吧。
然后时间复杂度就变成了 mathcal{O}(Tsqrt N N)
Code
代码语言:javascript复制#include<bits/stdc .h>
#define Tp template<typename Ty>
#define Ts template<typename Ty,typename... Ar>
#define W while
#define I inline
#define RI register int
#define LL long long
#define Cn const
#define CI Cn int&
#define gc getchar
#define D isdigit(c=gc())
#define pc(c) putchar((c))
#define min(x,y) ((x)<(y)?(x):(y))
#define max(x,y) ((x)>(y)?(x):(y))
using namespace std;
namespace Debug{
Tp I void _debug(Cn char* f,Ty t){cerr<<f<<'='<<t<<endl;}
Ts I void _debug(Cn char* f,Ty x,Ar... y){W(*f!=',') cerr<<*f ;cerr<<'='<<x<<",";_debug(f 1,y...);}
Tp ostream& operator<<(ostream& os,Cn vector<Ty>& V){os<<"[";for(Cn auto& vv:V) os<<vv<<",";os<<"]";return os;}
#define gdb(...) _debug(#__VA_ARGS__,__VA_ARGS__)
}using namespace Debug;
namespace FastIO{
Tp I void read(Ty& x){char c;int f=1;x=0;W(!D) f=c^'-'?1:-1;W(x=(x<<3) (x<<1) (c&15),D);x*=f;}
Ts I void read(Ty& x,Ar&... y){read(x),read(y...);}
Tp I void write(Ty x){x<0&&(pc('-'),x=-x,0),x<10?(pc(x '0'),0):(write(x/10),pc(x '0'),0);}
Tp I void writeln(Cn Ty& x){write(x),pc('n');}
}using namespace FastIO;
Cn int N=1e7 10;
int T,n,m,mu[N],p[N],v[N],tot,F[N];
I void GM(){
RI i,j;for(mu[1]=1,i=2;i<N;i ) for(!v[i]&&(mu[p[ tot]=i]=-1,0),j=1;j<=tot&&i*p[j]<N;j )
if(v[i*p[j]]=1,i%p[j]) mu[i*p[j]]=-mu[i];else break ;
for(i=1;i<=tot;i ) for(j=1;j*p[i]<N;j ) F[j*p[i]] =mu[j];for(i=1;i<N;i ) F[i] =F[i-1];
}
I LL S(CI n,CI m){
RI i,j;LL X=0;for(i=1;i<=min(n,m);i=j 1) j=min(n/(n/i),m/(m/i)),X =1LL*(F[j]-F[i-1])*(n/i)*(m/i);return X;
}
int main(){
GM(),read(T);W(T--) read(n,m),writeln(S(n,m));return 0;
}