SenK/senk__bicgstab_8hpp_source.html

#ifndef SENK_BICGSTAB_HPP

#define SENK_BICGSTAB_HPP


#include "senk_sparse.hpp"

#include "senk_blas1.hpp"


namespace senk {


namespace solver {

template <typename T>

void Bicgstab(

    T *val, int *cind, int *rptr,

    T *b, T *x, T nrm_b,

    int max_iter, int N, T epsilon)

{

    int i;

    int flag = 0;

    T *r    = new T[N];

    T *rstr = new T[N];

    T *p    = new T[N];

    T *Ap   = new T[N];

    T *s    = new T[N];

    T *As   = new T[N];

    T *temp = new T[N];

    T alpha, beta, omega;

    T r_rstr, prev;

    T nrm_r = nrm_b;


    sparse::SpmvCsr<T>(val, cind, rptr, x, r, N);

    blas1::Axpby<T>(1, b, -1, r, N);

    blas1::Copy<T>(r, rstr, N);

    blas1::Copy<T>(r, p, N);

    r_rstr = blas1::Dot<T>(r, rstr, N);

    for(i=0; i<max_iter; i++) {

        sparse::SpmvCsr<T>(val, cind, rptr, p, Ap, N);

        alpha = r_rstr / blas1::Dot<T>(Ap, rstr, N);

        blas1::Axpyz<T>(-alpha, Ap, r, s, N);

        sparse::SpmvCsr<T>(val, cind, rptr, s, As, N);

        omega = blas1::Dot<T>(As, s, N) / blas1::Dot<T>(As, As, N);

        blas1::Axpy<T>(alpha, p, x, N);

        blas1::Axpy<T>(omega, s, x, N);

        blas1::Axpyz<T>(-omega, As, s, r, N);

        nrm_r = blas1::Nrm2<T>(r, N);

        printf("%d %e\n", i+1, nrm_r/nrm_b);

        if(nrm_r < epsilon * nrm_b) {

            printf("# iter %d\n", i+1);

            printf("# res %e\n", nrm_r/nrm_b);

            flag = 1;

            break;

        }

        prev = r_rstr;

        r_rstr = blas1::Dot<T>(r, rstr, N);

        beta = alpha / omega * r_rstr / prev;

        blas1::Axpyz<T>(-omega, Ap, p, temp, N);

        blas1::Axpyz<T>(beta, temp, r, p, N);

    }

    if(!flag) {

        printf("# iter %d (max)\n", i);

        printf("# res %e\n", nrm_r/nrm_b);

    }

    delete[] r;

    delete[] rstr;

    delete[] p;

    delete[] Ap;

    delete[] s;

    delete[] As;

    delete[] temp;

}

template <typename T>

void IluBicgstab(

    T *val, int *cind, int *rptr,

    T *lval, int *lcind, int *lrptr,

    T *uval, int *ucind, int *urptr,

    T *b, T *x, T nrm_b,

    int max_iter, int N, T epsilon)

{

    int i;

    int flag = 0;

    T *r    = new T[N];

    T *rstr = new T[N];

    T *p    = new T[N];

    T *Kp   = new T[N];

    T *AKp  = new T[N];

    T *s    = new T[N];

    T *Ks   = new T[N];

    T *AKs  = new T[N];

    T *temp = new T[N];


    T alpha, beta, omega;

    T r_rstr, prev;

    T nrm_r = nrm_b;


    sparse::SpmvCsr<T>(val, cind, rptr, x, r, N);

    blas1::Axpby<T>(1, b, -1, r, N);

    blas1::Copy<T>(r, rstr, N);

    blas1::Copy<T>(r, p, N);

    r_rstr = blas1::Dot<T>(r, rstr, N);

    for(i=0; i<max_iter; i++) {

        sparse::SptrsvCsr_l<T>(lval, lcind, lrptr, p, Kp, N);

        sparse::SptrsvCsr_u<T>(uval, ucind, urptr, Kp, Kp, N);

        sparse::SpmvCsr<T>(val, cind, rptr, Kp, AKp, N);

        alpha = r_rstr / blas1::Dot<T>(AKp, rstr, N);

        blas1::Axpyz(-alpha, AKp, r, s, N);

        sparse::SptrsvCsr_l<T>(lval, lcind, lrptr, s, Ks, N);

        sparse::SptrsvCsr_u<T>(uval, ucind, urptr, Ks, Ks, N);

        sparse::SpmvCsr<T>(val, cind, rptr, Ks, AKs, N);

        omega = blas1::Dot<T>(AKs, s, N) / blas1::Dot<T>(AKs, AKs, N);

        blas1::Axpy<T>(alpha, Kp, x, N);

        blas1::Axpy<T>(omega, Ks, x, N);

        blas1::Axpyz<T>(-omega, AKs, s, r, N);

        nrm_r = blas1::Nrm2<T>(r, N);

        printf("%d %e\n", i+1, nrm_r/nrm_b);

        if(nrm_r < epsilon * nrm_b) {

            printf("# iter %d\n", i+1);

            printf("# res %e\n", nrm_r/nrm_b);

            flag = 1;

            break;

        }

        prev = r_rstr;

        r_rstr = blas1::Dot<T>(r, rstr, N);

        beta = alpha / omega * r_rstr / prev;

        blas1::Axpyz<T>(-omega, AKp, p, temp, N);

        blas1::Axpyz<T>(beta, temp, r, p, N);

    }

    if(!flag) {

        printf("# iter %d (max)\n", i);

        printf("# res %e\n", nrm_r/nrm_b);

    }

    delete[] r;

    delete[] rstr;

    delete[] p;

    delete[] Kp;

    delete[] AKp;

    delete[] s;

    delete[] Ks;

    delete[] AKs;

    delete[] temp;

}

template <typename T, int bnl, int bnw>

void IlubBicgstab(

    T *val, int *cind, int *rptr,

    T *blval, int *blcind, int *blrptr,

    T *buval, int *bucind, int *burptr,

    T *b, T *x, T nrm_b,

    int max_iter, int N, T epsilon)

{

    int i;

    int flag = 0;

    T *r    = new T[N];

    T *rstr = new T[N];

    T *p    = new T[N];

    T *Kp   = new T[N];

    T *AKp  = new T[N];

    T *s    = new T[N];

    T *Ks   = new T[N];

    T *AKs  = new T[N];

    T *temp = new T[N];


    T alpha, beta, omega;

    T r_rstr, prev;

    T nrm_r = nrm_b;


    sparse::SpmvCsr<T>(val, cind, rptr, x, r, N);

    blas1::Axpby<T>(1, b, -1, r, N);

    blas1::Copy<T>(r, rstr, N);

    blas1::Copy<T>(r, p, N);

    r_rstr = blas1::Dot<T>(r, rstr, N);

    for(i=0; i<max_iter; i++) {

        sparse::SptrsvBcsr_l<T, bnl, bnw>(blval, blcind, blrptr, p, Kp, N);

        sparse::SptrsvBcsr_u<T, bnl, bnw>(buval, bucind, burptr, Kp, Kp, N);

        sparse::SpmvCsr<T>(val, cind, rptr, Kp, AKp, N);

        alpha = r_rstr / blas1::Dot(AKp, rstr, N);

        blas1::Axpyz(-alpha, AKp, r, s, N);

        sparse::SptrsvBcsr_l<T, bnl, bnw>(blval, blcind, blrptr, s, Ks, N);

        sparse::SptrsvBcsr_u<T, bnl, bnw>(buval, bucind, burptr, Ks, Ks, N);

        sparse::SpmvCsr<T>(val, cind, rptr, Ks, AKs, N);

        omega = blas1::Dot<T>(AKs, s, N) / blas1::Dot<T>(AKs, AKs, N);

        blas1::Axpy<T>(alpha, Kp, x, N);

        blas1::Axpy<T>(omega, Ks, x, N);

        blas1::Axpyz<T>(-omega, AKs, s, r, N);

        nrm_r = blas1::Nrm2<T>(r, N);

        printf("%d %e\n", i+1, nrm_r/nrm_b);

        if(nrm_r < epsilon * nrm_b) {

            printf("# iter %d\n", i+1);

            printf("# res %e\n", nrm_r/nrm_b);

            flag = 1;

            break;

        }

        prev = r_rstr;

        r_rstr = blas1::Dot<T>(r, rstr, N);

        beta = alpha / omega * r_rstr / prev;

        blas1::Axpyz<T>(-omega, AKp, p, temp, N);

        blas1::Axpyz<T>(beta, temp, r, p, N);

    }

    if(!flag) {

        printf("# iter %d (max)\n", i);

        printf("# res %e\n", nrm_r/nrm_b);

    }

    delete[] r;

    delete[] rstr;

    delete[] p;

    delete[] Kp;

    delete[] AKp;

    delete[] s;

    delete[] Ks;

    delete[] AKs;

    delete[] temp;

}


//

//void Bicgstab_IR(

//    double *val, int *fval, int *cind, int *rptr,

//    double *b, double *x, double nrm_b,

//    int max_iter, int N, double epsilon);

//void Bicgstab_IR(

//    double *val, short *fval, int *cind, int *rptr,

//    double *b, double *x, double nrm_b,

//    int max_iter, int N, double epsilon);

//

//void IluBicgstab(

//    float *val, int *cind, int *rptr,

//    float *lval, int *lcind, int *lrptr,

//    float *uval, int *ucind, int *urptr,

//    float *b, float *x, double nrm_b,

//    int max_iter, int N, double epsilon);

//void IluBicgstab_IR(

//    double *val, float *fval, int *cind, int *rptr,

//    float *lval, int *lcind, int *lrptr,

//    float *uval, int *ucind, int *urptr,

//    double *b, double *x, double nrm_b,

//    int max_iter, int N, double epsilon);

//void IluBicgstab_IR(

//    double *val, int *fval, int *cind, int *rptr,

//    int *lval, int *lcind, int *lrptr,

//    int *uval, int *ucind, int *urptr,

//    double *b, double *x, double nrm_b,

//    int max_iter, int N, double epsilon);


} // namespace solver


} // namespace senk


#endif

senk::blas1::Dot
T Dot(T *x, T *y, int N)
Compute the dot product of x and y.
Definition: senk_blas1.hpp:93

senk::blas1::Axpyz
void Axpyz(T a, T *x, T *y, T *z, int N)
Compute z = a * x + y.
Definition: senk_blas1.hpp:80

senk::solver::IlubBicgstab
void IlubBicgstab(T *val, int *cind, int *rptr, T *blval, int *blcind, int *blrptr, T *buval, int *bucind, int *burptr, T *b, T *x, T nrm_b, int max_iter, int N, T epsilon)
ILUB preconditioned BiCGStab solver.
Definition: senk_bicgstab.hpp:199

senk::solver::IluBicgstab
void IluBicgstab(T *val, int *cind, int *rptr, T *lval, int *lcind, int *lrptr, T *uval, int *ucind, int *urptr, T *b, T *x, T nrm_b, int max_iter, int N, T epsilon)
ILU preconditioned BiCGStab solver.
Definition: senk_bicgstab.hpp:108

senk::solver::Bicgstab
void Bicgstab(T *val, int *cind, int *rptr, T *b, T *x, T nrm_b, int max_iter, int N, T epsilon)
Non-preconditioned BiCGStab solver.
Definition: senk_bicgstab.hpp:30

senk
The top-level namespace of SenK.

senk_blas1.hpp
Level1 BLAS-style functions are written.

senk_sparse.hpp
Functions related to sparse matrices are written.