OpenJijにおける相互作用行列の保持の仕方

OpenJijにおける相互作用行列の保持の仕方#

解きたい問題によって、イジングハミルトニアンの相互作用行列JJやQUBOの相互作用行列QQに含まれる非ゼロの要素数は大きく変化します。 実問題の多くでは、相互作用行列の中の非ゼロの要素数は比較的少なく疎な行列であることが多いです。 そこで、OpenJijでは、デフォルトでは内部で相互作用係数を疎行列として保持するようになっています。 ですが、解きたい問題によっては必ずしも疎行列であるというわけではありません。 この場合には、疎行列形式のデータ保持では計算速度が低下してしまいます。 この点を解決するために、OpenJijは、ユーザーが自分で行列保持の仕方を制御できるパラメータであるsparseが用意されています。 このチュートリアルでは、このsparseの使い方を説明し、疎行列でデータを保持した場合と密行列でデータを保持した場合の速度を比較してみます。

import openjij as oj
import numpy as np
import time

データの内部保持の仕方は、次のように設定することができます。

sampler = oj.SASampler()
response = sampler.sample_ising(h, J, sparse = True)

ここで、sparse = Trueとすると内部の相互作用行列のデータ保持の仕方が疎行列になります。現在のOpenJijでは、デフォルトでsparse = Trueとなっています(2022/10 現在 (v0.6.5))。 このフラグを

response = sampler.sample_ising(h, J, sparse = False)

のようにすると、内部でのデータ保持の仕方を密行列にすることができます。

sparseモードとdenseモードでの実行速度の比較#

次に、データ保持の仕方を変化することで実行速度にどのように違いが出るかを検証してみます。

NUM_READS = 1

BETA_MAX = 14000000
BETA_MIN = 0.0015

num_spins = [100,200,500,1000,2000,5000]
p_list = [0.1,0.3,0.5,0.8]

ここでは、外場のないSherrington-Kirkpatrick模型を変形させた用いてベンチマークを取りたいと思います、 外場のないSherrington-Kirkpatrick(SK)模型は、次のようなハミルトニアンを持つ模型です。

H=1NijJijσiσj, JijN(0,1),Jij=Jji H = \frac{1}{N}\sum_{ij} J_{ij} \sigma_i \sigma_j,\\ \ J_{ij} \sim \mathcal{N}(0,1), J_{ij} = J_{ji}

ここで、N(0,1)\mathcal{N}(0,1)は平均0、分散1のランダムガウスノイズです。 SK模型では全ての要素がランダム分布に従っていますが、ここでは、相互作用行列JJに入っている要素の割合を変化させていき、相互作用を疎にしていくことで、計算時間がどのように変化するかを調べます。

まず、初めにランダムな相互作用を作ります。ここで、パラメータはスピン数nnと相互作用行列JJに入っている要素の割合ppです。

def create_random_interaction(n,p):
    h,J = {},{}
    for i in range(n-1):
        for j in range(i+1, n):
            if np.random.random() <= p:
                # OpenJijでは、上三角行列の形でデータを保持している。
                J[i, j] = np.random.normal(0, 1) / np.sqrt(n)

    return J,h

最初に密行列を用いた場合を計算してみます。 ここでは、スピン数をn=100,200,500,1000,2000,5000n=100,200,500,1000,2000,5000と変化させ、相互作用行列JJに入っている要素の割合ppp=0.1,0.3,0.5,0.8p=0.1,0.3,0.5,0.8と変化させます。

# Benchmark OpenJij Dense
print('OpenJij Dense')
sampler = oj.SASampler()
openjij_dense_time = []
openjij_dense_energy = []

for p in p_list:
    for n in num_spins:
        J,h = create_random_interaction(n,p)
        start = time.perf_counter()
        response = sampler.sample_ising(h, J, num_sweeps=1000, num_reads=NUM_READS, beta_max=BETA_MAX, beta_min=BETA_MIN,sparse = False)
        elapsed_time = time.perf_counter() - start

        openjij_dense_time.append(elapsed_time)
        openjij_dense_energy.append(np.mean(response.energies))

        print(f"p = {p}, n = {n} : \telapsed_time:{elapsed_time}[sec]")
OpenJij Dense
p = 0.1, n = 100 : 	elapsed_time:0.009180344000014884[sec]
p = 0.1, n = 200 : 	elapsed_time:0.028130669000006492[sec]
p = 0.1, n = 500 : 	elapsed_time:0.0964929059999804[sec]
p = 0.1, n = 1000 : 	elapsed_time:0.242810650000024[sec]
p = 0.1, n = 2000 : 	elapsed_time:0.8850449579999804[sec]
p = 0.1, n = 5000 : 	elapsed_time:5.445467456000074[sec]
p = 0.3, n = 100 : 	elapsed_time:0.007435557000007975[sec]
p = 0.3, n = 200 : 	elapsed_time:0.023246706000009[sec]
p = 0.3, n = 500 : 	elapsed_time:0.10206876199993076[sec]
p = 0.3, n = 1000 : 	elapsed_time:0.2950382530000297[sec]
p = 0.3, n = 2000 : 	elapsed_time:1.1155085839999401[sec]
---------------------------------------------------------------------------
KeyboardInterrupt                         Traceback (most recent call last)
Cell In[4], line 9
      7 for p in p_list:
      8     for n in num_spins:
----> 9         J,h = create_random_interaction(n,p)
     10         start = time.perf_counter()
     11         response = sampler.sample_ising(h, J, num_sweeps=1000, num_reads=NUM_READS, beta_max=BETA_MAX, beta_min=BETA_MIN,sparse = False)

Cell In[3], line 7, in create_random_interaction(n, p)
      4     for j in range(i+1, n):
      5         if np.random.random() <= p:
      6             # OpenJijでは、上三角行列の形でデータを保持している。
----> 7             J[i, j] = np.random.normal(0, 1) / np.sqrt(n)
      9 return J,h

KeyboardInterrupt: 

次に、疎行列を用いた場合を検証します。実行条件は密行列の場合と同様です。

# Benchmark OpenJij Sparse
print('OpenJij Sparse')
sampler = oj.SASampler()
openjij_sparse_time = []
openjij_sparse_energy = []
for p in p_list:
    for n in num_spins:
        J,h = create_random_interaction(n,p)
        start = time.perf_counter()
        response = sampler.sample_ising(h, J, num_sweeps=1000, num_reads=NUM_READS, beta_max=BETA_MAX, beta_min=BETA_MIN, sparse=True)
        elapsed_time = time.perf_counter() - start

        openjij_sparse_time.append(elapsed_time)
        openjij_sparse_energy.append(np.mean(response.energies))

        print(f"p = {p}, n = {n} : \telapsed_time:{elapsed_time}[sec]")
OpenJij Sparse
p = 0.1, n = 100 : 	elapsed_time:0.018858227999999144[sec]
p = 0.1, n = 200 : 	elapsed_time:0.011375076999911471[sec]
p = 0.1, n = 500 : 	elapsed_time:0.040720876000023054[sec]
p = 0.1, n = 1000 : 	elapsed_time:0.1434848740000234[sec]
p = 0.1, n = 2000 : 	elapsed_time:0.5859196809999503[sec]
p = 0.1, n = 5000 : 	elapsed_time:4.693539175000069[sec]
p = 0.3, n = 100 : 	elapsed_time:0.008090091999974902[sec]
p = 0.3, n = 200 : 	elapsed_time:0.01928631900000255[sec]
p = 0.3, n = 500 : 	elapsed_time:0.09923592899986033[sec]
p = 0.3, n = 1000 : 	elapsed_time:0.3975637910000387[sec]
p = 0.3, n = 2000 : 	elapsed_time:1.9902634820000458[sec]
p = 0.3, n = 5000 : 	elapsed_time:14.41226490400004[sec]
p = 0.5, n = 100 : 	elapsed_time:0.010653709000052913[sec]
p = 0.5, n = 200 : 	elapsed_time:0.02600566599994636[sec]
p = 0.5, n = 500 : 	elapsed_time:0.16183085200009373[sec]
p = 0.5, n = 1000 : 	elapsed_time:0.6748764890000984[sec]
p = 0.5, n = 2000 : 	elapsed_time:3.276416020999932[sec]
p = 0.5, n = 5000 : 	elapsed_time:21.87782676500001[sec]
p = 0.8, n = 100 : 	elapsed_time:0.014087553000081243[sec]
p = 0.8, n = 200 : 	elapsed_time:0.03917992299989237[sec]
p = 0.8, n = 500 : 	elapsed_time:0.24562845499985997[sec]
p = 0.8, n = 1000 : 	elapsed_time:1.0560938139999507[sec]
p = 0.8, n = 2000 : 	elapsed_time:5.183320384999888[sec]
p = 0.8, n = 5000 : 	elapsed_time:33.83915293400014[sec]

密行列と疎行列の場合で得られた結果を比較するために、プロットしてみます。

import matplotlib.pyplot as plt
fig = plt.figure(figsize=(10,6))
sparse_time = np.array(openjij_sparse_time).reshape(len(p_list),-1)
dense_time = np.array(openjij_dense_time).reshape(len(p_list),-1)
color_list = ["blue", "red", "green", "orange"]
for index,p in enumerate(p_list):
    plt.plot(num_spins,dense_time[index], '-o', label=f'dense $p$ ={p}',color = color_list[index],markersize=8)
    plt.plot(num_spins,sparse_time[index], '-^', label=f'sparse $p$ ={p}',color = color_list[index],markersize=8)
plt.xscale("log")
plt.yscale("log")
plt.xlabel('number of spins',fontsize=18)
plt.ylabel('time [sec]',fontsize=18)
plt.legend(fontsize=12, ncol = 4, bbox_to_anchor=(0.7, 0.7, 0.3, 0.5))
plt.show()
../../_images/4c3cb6ec9badba6cca3445e23990b74a2f14656c42cc32ac91b6645699783a9d.png

相互作用行列の中に詰められている要素の割合がp=0.1p=0.1の場合には、sparse=Trueとした疎行列の場合の方が密行列の場合に比べて数倍早いことがわかります。 しかし、p=0.3p=0.3程度になるとおおよそ両者の速度は同程度になります。 さらに、相互作用行列の中に詰められている要素の割合がp=0.5,0.8p=0.5,0.8では密行列を用いる方が速いことがわかりました。 このように、疎行列、密行列のどちらを用いるかで実行速度が変化することがわかります。 ですので、扱う問題に合わせて適切に切り替えることで、より速く結果を得ることができるようになります。