OpenJij-Reference-Page/chimera__gpu__transverse_8hpp_source.html

//    Copyright 2023 Jij Inc.


//    Licensed under the Apache License, Version 2.0 (the "License");

//    you may not use this file except in compliance with the License.

//    You may obtain a copy of the License at


//        http://www.apache.org/licenses/LICENSE-2.0


//    Unless required by applicable law or agreed to in writing, software

//    distributed under the License is distributed on an "AS IS" BASIS,

//    WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

//    See the License for the specific language governing permissions and

//    limitations under the License.


#ifndef OPENJIJ_SYSTEM_CHIMERA_GPU_TRANSVERSE_HPP__

#define OPENJIJ_SYSTEM_CHIMERA_GPU_TRANSVERSE_HPP__


#ifdef USE_CUDA


#include <cstddef>

#include <vector>


#include "openjij/graph/all.hpp"

#include "openjij/system/gpu/chimera_cuda/index.hpp"

#include "openjij/system/system.hpp"

#include "openjij/system/transverse_ising.hpp"

#include "openjij/utility/gpu/memory.hpp"


namespace openjij {

namespace system {


template <typename FloatType> struct ChimeraInteractions {

  using value_type = FloatType;

  utility::cuda::unique_dev_ptr<FloatType[]> J_out_p; // previous

  utility::cuda::unique_dev_ptr<FloatType[]> J_out_n; // next

  utility::cuda::unique_dev_ptr<FloatType[]> J_in_04;

  utility::cuda::unique_dev_ptr<FloatType[]> J_in_15;

  utility::cuda::unique_dev_ptr<FloatType[]> J_in_26;

  utility::cuda::unique_dev_ptr<FloatType[]> J_in_37;

  utility::cuda::unique_dev_ptr<FloatType[]> h;


  ChimeraInteractions(std::size_t n)

      : J_out_p(utility::cuda::make_dev_unique<FloatType[]>(n)),

        J_out_n(utility::cuda::make_dev_unique<FloatType[]>(n)),

        J_in_04(utility::cuda::make_dev_unique<FloatType[]>(n)),

        J_in_15(utility::cuda::make_dev_unique<FloatType[]>(n)),

        J_in_26(utility::cuda::make_dev_unique<FloatType[]>(n)),

        J_in_37(utility::cuda::make_dev_unique<FloatType[]>(n)),

        h(utility::cuda::make_dev_unique<FloatType[]>(n)) {}

};


template <typename FloatType, std::size_t rows_per_block = 2,

          std::size_t cols_per_block = 2, std::size_t trotters_per_block = 2>

struct ChimeraTransverseGPU {

  using system_type = transverse_field_system;


  ChimeraTransverseGPU(const TrotterSpins &init_trotter_spins,

                       const graph::Chimera<FloatType> &init_interaction,

                       FloatType gamma, int device_num = 0)

      : gamma(gamma),

        info({init_interaction.get_num_row(), init_interaction.get_num_column(),

              init_trotter_spins.size()}),

        interaction(init_interaction.get_num_row() *

                    init_interaction.get_num_column() * info.chimera_unitsize),

        spin(utility::cuda::make_dev_unique<std::int32_t[]>(

            init_interaction.get_num_row() * init_interaction.get_num_column() *

            info.chimera_unitsize * init_trotter_spins.size())),

        grid(dim3(init_interaction.get_num_column() / cols_per_block,

                  init_interaction.get_num_row() / rows_per_block,

                  init_trotter_spins.size() / trotters_per_block)),

        block(dim3(info.chimera_unitsize * cols_per_block, rows_per_block,

                   trotters_per_block)),

        dev_random(utility::cuda::make_dev_unique<FloatType[]>(

            init_interaction.get_num_row() * init_interaction.get_num_column() *

            info.chimera_unitsize * init_trotter_spins.size())) {


    if (!(info.rows % rows_per_block == 0 && info.cols % cols_per_block == 0 &&

          info.trotters % trotters_per_block == 0)) {

      throw std::invalid_argument("invalid number of rows, cols, or trotters");

    }


    // initialize

    initialize_gpu(init_interaction, init_trotter_spins, device_num);

  }


  ChimeraTransverseGPU(const graph::Spins &classical_spins,

                       const graph::Chimera<FloatType> &init_interaction,

                       FloatType gamma, size_t num_trotter_slices,

                       int device_num = 0)

      : gamma(gamma),

        info({init_interaction.get_num_row(), init_interaction.get_num_column(),

              num_trotter_slices}),

        interaction(init_interaction.get_num_row() *

                    init_interaction.get_num_column() * info.chimera_unitsize),

        spin(utility::cuda::make_dev_unique<std::int32_t[]>(

            init_interaction.get_num_row() * init_interaction.get_num_column() *

            info.chimera_unitsize * num_trotter_slices)),

        grid(dim3(init_interaction.get_num_column() / cols_per_block,

                  init_interaction.get_num_row() / rows_per_block,

                  num_trotter_slices / trotters_per_block)),

        block(dim3(info.chimera_unitsize * cols_per_block, rows_per_block,

                   trotters_per_block)),

        dev_random(utility::cuda::make_dev_unique<FloatType[]>(

            init_interaction.get_num_row() * init_interaction.get_num_column() *

            info.chimera_unitsize * num_trotter_slices)) {

    // initialize trotter_spins with classical_spins

    if (!(info.rows % rows_per_block == 0 && info.cols % cols_per_block == 0 &&

          info.trotters % trotters_per_block == 0)) {

      throw std::invalid_argument("invalid number of rows, cols, or trotters");

    }


    TrotterSpins trotter_spins(num_trotter_slices);

    for (auto &spins : trotter_spins) {

      spins = classical_spins;

    }


    // initialize

    initialize_gpu(init_interaction, trotter_spins, device_num);

  }


  void reset_spins(const TrotterSpins &init_trotter_spins) {

    // generate temporary interaction and spin

    const std::size_t localsize = info.rows * info.cols * info.chimera_unitsize;

    auto temp_spin =

        utility::cuda::make_host_unique<int32_t[]>(localsize * info.trotters);


    using namespace chimera_cuda;

    // copy spin info to std::vector variables

    for (size_t t = 0; t < info.trotters; t++) {

      for (size_t r = 0; r < info.rows; r++) {

        for (size_t c = 0; c < info.cols; c++) {

          for (size_t i = 0; i < info.chimera_unitsize; i++) {

            temp_spin[glIdx(info, r, c, i, t)] =

                init_trotter_spins[t][glIdx(info, r, c, i)];

          }

        }

      }

    }

    // copy to gpu

    HANDLE_ERROR_CUDA(cudaMemcpy(spin.get(), temp_spin.get(),

                                 localsize * info.trotters * sizeof(int32_t),

                                 cudaMemcpyHostToDevice));

  }


  void reset_spins(const graph::Spins &classical_spins) {

    TrotterSpins init_trotter_spins(

        info.trotters); // info.trotters -> num_trotter_slices


    for (auto &spins : init_trotter_spins) {

      spins = classical_spins;

    }


    // generate temporary interaction and spin

    const std::size_t localsize = info.rows * info.cols * info.chimera_unitsize;

    auto temp_spin =

        utility::cuda::make_host_unique<int32_t[]>(localsize * info.trotters);


    using namespace chimera_cuda;

    // copy spin info to std::vector variables

    for (size_t t = 0; t < info.trotters; t++) {

      for (size_t r = 0; r < info.rows; r++) {

        for (size_t c = 0; c < info.cols; c++) {

          for (size_t i = 0; i < info.chimera_unitsize; i++) {

            temp_spin[glIdx(info, r, c, i, t)] =

                init_trotter_spins[t][glIdx(info, r, c, i)];

          }

        }

      }

    }

    // copy to gpu

    HANDLE_ERROR_CUDA(cudaMemcpy(spin.get(), temp_spin.get(),

                                 localsize * info.trotters * sizeof(int32_t),

                                 cudaMemcpyHostToDevice));

  }


  FloatType gamma;


  const ChimeraInfo info;


  ChimeraInteractions<FloatType> interaction;


  utility::cuda::unique_dev_ptr<std::int32_t[]> spin;


  const dim3 grid;


  const dim3 block;


  utility::cuda::unique_dev_ptr<FloatType[]> dev_random;


private:

  inline void initialize_gpu(const graph::Chimera<FloatType> &init_interaction,

                             const TrotterSpins &trotter_spins, int gpu_num) {


    // specify gpu number

    HANDLE_ERROR_CUDA(cudaSetDevice(gpu_num));


    // generate temporary interaction and spin

    const std::size_t localsize = info.rows * info.cols * info.chimera_unitsize;


    auto J_out_p = utility::cuda::make_host_unique<FloatType[]>(localsize);

    auto J_out_n = utility::cuda::make_host_unique<FloatType[]>(localsize);

    auto J_in_04 = utility::cuda::make_host_unique<FloatType[]>(localsize);

    auto J_in_15 = utility::cuda::make_host_unique<FloatType[]>(localsize);

    auto J_in_26 = utility::cuda::make_host_unique<FloatType[]>(localsize);

    auto J_in_37 = utility::cuda::make_host_unique<FloatType[]>(localsize);

    auto h = utility::cuda::make_host_unique<FloatType[]>(localsize);

    auto temp_spin =

        utility::cuda::make_host_unique<int32_t[]>(localsize * info.trotters);


    using namespace chimera_cuda;


    // copy interaction info to std::vector variables

    for (size_t r = 0; r < info.rows; r++) {

      for (size_t c = 0; c < info.cols; c++) {

        for (size_t i = 0; i < info.chimera_unitsize; i++) {


          J_out_p[glIdx(info, r, c, i)] = 0;

          J_out_n[glIdx(info, r, c, i)] = 0;

          J_in_04[glIdx(info, r, c, i)] = 0;

          J_in_15[glIdx(info, r, c, i)] = 0;

          J_in_26[glIdx(info, r, c, i)] = 0;

          J_in_37[glIdx(info, r, c, i)] = 0;

          h[glIdx(info, r, c, i)] = 0;


          if (r > 0 && i < 4) {

            // MINUS_R

            J_out_p[glIdx(info, r, c, i)] =

                init_interaction.J(r, c, i, graph::ChimeraDir::MINUS_R);

          }

          if (c > 0 && 4 <= i) {

            // MINUS_C

            J_out_p[glIdx(info, r, c, i)] =

                init_interaction.J(r, c, i, graph::ChimeraDir::MINUS_C);

          }

          if (r < info.rows - 1 && i < 4) {

            // PLUS_R

            J_out_n[glIdx(info, r, c, i)] =

                init_interaction.J(r, c, i, graph::ChimeraDir::PLUS_R);

          }

          if (c < info.cols - 1 && 4 <= i) {

            // PLUS_C

            J_out_n[glIdx(info, r, c, i)] =

                init_interaction.J(r, c, i, graph::ChimeraDir::PLUS_C);

          }


          // inside chimera unit

          J_in_04[glIdx(info, r, c, i)] =

              init_interaction.J(r, c, i, graph::ChimeraDir::IN_0or4);

          J_in_15[glIdx(info, r, c, i)] =

              init_interaction.J(r, c, i, graph::ChimeraDir::IN_1or5);

          J_in_26[glIdx(info, r, c, i)] =

              init_interaction.J(r, c, i, graph::ChimeraDir::IN_2or6);

          J_in_37[glIdx(info, r, c, i)] =

              init_interaction.J(r, c, i, graph::ChimeraDir::IN_3or7);


          // local field

          h[glIdx(info, r, c, i)] = init_interaction.h(r, c, i);

        }

      }

    }


    // copy spin info to std::vector variables

    for (size_t t = 0; t < info.trotters; t++) {

      for (size_t r = 0; r < info.rows; r++) {

        for (size_t c = 0; c < info.cols; c++) {

          for (size_t i = 0; i < info.chimera_unitsize; i++) {

            temp_spin[glIdx(info, r, c, i, t)] =

                trotter_spins[t][init_interaction.to_ind(r, c, i)];

          }

        }

      }

    }


    // cudaMemcpy

    HANDLE_ERROR_CUDA(cudaMemcpy(interaction.J_out_p.get(), J_out_p.get(),

                                 localsize * sizeof(FloatType),

                                 cudaMemcpyHostToDevice));

    HANDLE_ERROR_CUDA(cudaMemcpy(interaction.J_out_n.get(), J_out_n.get(),

                                 localsize * sizeof(FloatType),

                                 cudaMemcpyHostToDevice));

    HANDLE_ERROR_CUDA(cudaMemcpy(interaction.J_in_04.get(), J_in_04.get(),

                                 localsize * sizeof(FloatType),

                                 cudaMemcpyHostToDevice));

    HANDLE_ERROR_CUDA(cudaMemcpy(interaction.J_in_15.get(), J_in_15.get(),

                                 localsize * sizeof(FloatType),

                                 cudaMemcpyHostToDevice));

    HANDLE_ERROR_CUDA(cudaMemcpy(interaction.J_in_26.get(), J_in_26.get(),

                                 localsize * sizeof(FloatType),

                                 cudaMemcpyHostToDevice));

    HANDLE_ERROR_CUDA(cudaMemcpy(interaction.J_in_37.get(), J_in_37.get(),

                                 localsize * sizeof(FloatType),

                                 cudaMemcpyHostToDevice));

    HANDLE_ERROR_CUDA(cudaMemcpy(interaction.h.get(), h.get(),

                                 localsize * sizeof(FloatType),

                                 cudaMemcpyHostToDevice));


    HANDLE_ERROR_CUDA(cudaMemcpy(spin.get(), temp_spin.get(),

                                 localsize * info.trotters * sizeof(int32_t),

                                 cudaMemcpyHostToDevice));

  }

};


template <std::size_t rows_per_block = 2, std::size_t cols_per_block = 2,

          std::size_t trotters_per_block = 2, typename FloatType>

ChimeraTransverseGPU<FloatType, rows_per_block, cols_per_block,

                     trotters_per_block>

make_chimera_transverse_gpu(const TrotterSpins &init_trotter_spins,

                            const graph::Chimera<FloatType> &init_interaction,

                            double gamma, int device_num = 0) {

  return ChimeraTransverseGPU<FloatType, rows_per_block, cols_per_block,

                              trotters_per_block>(

      init_trotter_spins, init_interaction, gamma, device_num);

}


template <std::size_t rows_per_block = 2, std::size_t cols_per_block = 2,

          std::size_t trotters_per_block = 2, typename FloatType>

ChimeraTransverseGPU<FloatType, rows_per_block, cols_per_block,

                     trotters_per_block>

make_chimera_transverse_gpu(const graph::Spins &classical_spins,

                            const graph::Chimera<FloatType> &init_interaction,

                            double gamma, size_t num_trotter_slices,

                            int device_num = 0) {

  return ChimeraTransverseGPU<FloatType, rows_per_block, cols_per_block,

                              trotters_per_block>(

      classical_spins, init_interaction, gamma, num_trotter_slices, device_num);

}


} // namespace system

} // namespace openjij


#endif

#endif

memory.hpp

all.hpp

index.hpp

openjij::graph::json_parse
auto json_parse(const json &obj, bool relabel=true)
parse json object from bqm.to_serializable
Definition parse.hpp:50

openjij::graph::Spins
std::vector< Spin > Spins
Definition graph.hpp:27

openjij::system::TrotterSpins
std::vector< graph::Spins > TrotterSpins
trotterized spin (std::vector<Spins>) trotter_spins[i][j] -> jth spin in ith trotter slice.
Definition transverse_ising.hpp:32

openjij
Definition algorithm.hpp:24

openjij::FloatType
double FloatType
Note:
Definition compile_config.hpp:37

system.hpp

transverse_ising.hpp