20230508 - ゲームにっき（仮）別館（仮）

以下はテスターした問題解いたときの思考回路のメモ書きです．

とりあえず愚直解を書いておきましょう．

ll T, N, M, X, Y;
ll A[1d6], B[];

ll baka1(){
  ll i, j, res = 0;
  rep(i,N) A[i] = (X*i + Y) % M;
  rep(i,N) rep(j,i+1,N) if(A[i] > A[j]) res++;
  return res;
}

丁寧に愚直解と比較しながら進めていきたいです．

さて，項数 $N$ の数列なので何かしら一気に計算できないと駄目ですね．
とりあえず，思いつくところでは，$j$ を固定したとき，$i < j$ かつ $A[i] > A[j]$ なる $i$ の個数を求めようとすると，$(Xi+Y)\ \text{mod}\ M$ がある値以下になる個数が欲しいです．
これは floor_sum でできるってのが maspy さんが何回か言及してた気がしますね（リンク1，リンク2）．

// 他に縦横2分割にして分割統治とか，$O(\sqrt{\max(N,M)})$ みたいなのとかないかなとか考えそうにもなりましたが，あまり考えなかった．

これだけできたところでしょうがないのですが，とりあえずこの方針で進めてみましょう．
$j$ 固定で一気に計算してもしょうがないので，$A[i] > A[j]$ を式で書いてみます．
$A[i] > A[j]$ なら 1，そうでないなら 0 になる式を作りましょう．

maspy さんの教えの通りにやります．
$A[i]$ に $1$ ～ $M - A[j] + 1$ 足したときに $M$ を上回って，$M$ で割ったときに1増えるようにすることを考えると良いです．
$B[i] = Xi+Y$ として（modを取らないもの）以下のコードが書けます．

ll baka2(){
  ll i, j, res = 0;
  rep(i,N) B[i] = X*i + Y;
  rep(i,N) rep(j,i+1,N) res += fDiv(B[i] + M - 1 - (B[j] % M), M) - fDiv(B[i], M);
  return res;
}

一応，ここまで愚直解と一致です．
fDiv(a,b) は floor(a/b) です．今は非負なので / でも問題ないですが，今後のために．

で，とにかく，B[j] % M がやばそうです．
てか，$M$ で割った余りとか商とか考えているので，この辺は分離できますね．

ll baka3(){
  ll i, j, res = 0;
  rep(i,N) B[i] = X*i + Y;
  rep(i,N) rep(j,i+1,N) res += fDiv(B[i] + M - 1 - B[j], M) - fDiv(B[i], M) + fDiv(B[j], M);
  return res;
}

分離しました．
fDiv(B[i], M) は何回出てくるかカウントして一気にできますね．
後，$B[i] - B[j]$ は $X(i-j)$ です．

ll baka4(){
  ll i, j, res = 0;
  rep(i,N) B[i] = X*i + Y;
  rep(i,N) res += fDiv(B[i], M) * (2 * i + 1 - N);
  rep(i,N) rep(j,i+1,N) res += fDiv(X * (i-j) + M - 1, M);
  return res;
}

ということで，こうなります．
$i-j$ のところも何回出てくるかカウントして一気に計算したり，整理したりすると，結局こうなります．

ll baka5(){
  ll i, res = 0;
  rep(i,N) res += fDiv(X * i + Y, M) * (2 * i + 1 - N);
  rep(i,N) res += fDiv(-X * i + M - 1, M) * (N - i);
  return res;
}

このループを一気に計算したいですが，後ろの 2 * i + 1 - N とか N - i とかが定数なら floor_sum ですが i が入っています．
floor_sum は何だったか考えてみると，kyopro_friendsさんの絵（リンク）を思い出すと，格子点の数みたいな感じでしたね．
別に点に重み i を載せても重みの和を計算とかでもできそうな気もしますね．
x軸とy軸を反転させるので，x座標，y座標ともに計算できそうな重みを載せて拡張して modified_floor_sum なるものを作ってみましょう．

最初，格子点 (X,Y) に $w(X,Y) = (x_1 X + x_0)(y_1 Y + y_0)$ とか何故か非線形な重みを載せようとして失敗しましたが，普通に線形で $w(X,Y) = xX + yY + c$ の重みを載せましょう（$x,y,c$ が重みを決めるパラメータ）．

// ordinary_floor_sum(ll n, ll m, ll a, ll b)
// = sum[X=0..n-1] floor( (a*X+b) / m )
// = num of lattice points [0 <= X < n] && [0 < Y <= (Ax+B)/M]

// modified_floor_sum(ll n, ll m, ll a, ll b, ll x, ll y, ll c)
// = sum of lattice points [0 < X <= n] && [0 < Y <= (Ax+B)/M] : weight of (X,Y) = x*X + y*Y + c
// = sum[X=1..n] [let Y=floor((a*X+b)/m)] Y * (Y+1) / 2 * y + Y * (c + x*X)

ll modified_floor_sum(ll n, ll m, ll a, ll b, ll x, ll y, ll c){
  ll res = 0;
  ll h, d, w, aa, bb;

  if(a < 0){
    return modified_floor_sum(n, m, -a, b + (n+1)*a, -x, y, c+x*(n+1));
  }

  h = fDiv(b, m);
  if(h){
    res += (h * n * ( (h+1)*y + (n+1)*x )) / 2 + h * n * c;
    b -= m * h;
    c += y * h;
  }

  d = fDiv(a, m);
  res += n * (n+1) / 2 * d * ( 6*c + y*(2*d*n+d+3) + (4*n+2) * x ) / 6;
  a -= d * m;
  x += d * y;

  if(a == 0) return res;

  w = fDiv(a*n+b, m);
  aa = -m;
  bb = b + a * (n+1);
  res += modified_floor_sum(w, a, aa, bb, y, -x, c+x*(n+1));

  return res;
}

ということで，modified_floor_sum の愚直解と比較しながら，kyopro_friendsさんの絵を見ながらぐだぐだと書きました（後でコードは整理とかしましょう）．
方針は同じです．三角形領域の和を求めるのがちょっとめんどいです．長方形とか三角形を削ったときにパラメータがどう変形するか考えます．

愚直解は

ll baka_modified_floor_sum(ll n, ll m, ll a, ll b, ll x, ll y, ll c){
  ll res = 0, X, Y;
  rep(X,1,n+1){
    Y = fDiv(a*X+b, m);
    res += Y * (Y+1) / 2 * y + Y * (c + x*X);
  }
  return res;
}

です．
長方形削ったら残りは愚直解に投げるのと，最初から愚直解に投げるのとで一致しますよねーとか言いながら書きました．

ちなみに，愚直解に baka とつけてるのは診断人師匠に教わりました．
格好良い名前で作ると，愚直解をサブミットしがちなので．

さて，元の問題に戻って，1-indexed に変えたので（失敗だった気もしてきた），解もそっちに揃えて

ll baka6(){
  ll i, res = 0;
  rep(i,1,N+1) res += fDiv(X * i + Y - X, M) * (2 * i - 1 - N);
  rep(i,1,N+1) res += fDiv(-X * i + M - 1 + X, M) * (N - i + 1);
  return res;
}

となり，modified_floor_sum が使える形になったので

ll baka7(){
  ll i, res = 0;
  res += modified_floor_sum(N, M, X, Y-X, 2, 0, -1-N);
  res += modified_floor_sum(N, M, -X, M-1+X, -1, 0, N+1);
  return res;
}

として，終了です．
ではなく，オーバーフローしそうな気がするので，128ビット整数で計算した場合と比較してみます．

はい，落ちました．ダメです．
64ビットだと $N,M$ が $10^6$ 程度は大丈夫ですが $2 \times 10^6$ でダメです．
途中で 3 乗ぐらいの値が出てくるのかな？
はい，出てきますね（2乗個の点があって重みが1乗ぐらい）．
なので128ビット整数でやりましょう（か中国剰余定理？）．

ところで，これ計算できるの面白いですね．

Current time: 2025年07月02日10時58分22秒
Last modified: 2023年06月23日23時24分25秒 (by laycrs)
Tags: no_tags
トップページに戻る

Logged in as: unknown user (not login)