n2p2/doxygen/KalmanFilter_8cpp_source.html

// n2p2 - A neural network potential package

// Copyright (C) 2018 Andreas Singraber (University of Vienna)

//

// This program is free software: you can redistribute it and/or modify

// it under the terms of the GNU General Public License as published by

// the Free Software Foundation, either version 3 of the License, or

// (at your option) any later version.

//

// This program is distributed in the hope that it will be useful,

// but WITHOUT ANY WARRANTY; without even the implied warranty of

// MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the

// GNU General Public License for more details.

//

// You should have received a copy of the GNU General Public License

// along with this program.  If not, see <https://www.gnu.org/licenses/>.


#include "KalmanFilter.h"

#include "utility.h"

#include <Eigen/LU>

#include <iostream>

#include <stdexcept>


using namespace Eigen;

using namespace std;

using namespace nnp;


KalmanFilter::KalmanFilter(size_t const sizeState,

                           KalmanType const type) :

    Updater(sizeState),

    sizeObservation(0   ),

    numUpdates     (0   ),

    epsilon        (0.0 ),

    q              (0.0 ),

    q0             (0.0 ),

    qtau           (0.0 ),

    qmin           (0.0 ),

    eta            (0.0 ),

    eta0           (0.0 ),

    etatau         (0.0 ),

    etamax         (0.0 ),

    lambda         (0.0 ),

    nu             (0.0 ),

    gamma          (0.0 ),

    w              (NULL),

    xi             (NULL),

    H              (NULL)

{

    if (!(type == KT_STANDARD ||

          type == KT_FADINGMEMORY))

    {

        throw runtime_error("ERROR: Unknown Kalman filter type.\n");

    }


    if (sizeState < 1)

    {

        throw runtime_error("ERROR: Wrong Kalman filter dimensions.\n");

    }


    this->type            = type;

    sizeObservation = 1;


    w  = new Map<VectorXd      >(0, sizeState);

    xi = new Map<VectorXd const>(0, sizeObservation);

    H  = new Map<MatrixXd const>(0, sizeState, sizeObservation);

    P.resize(sizeState, sizeState);

    P.setIdentity();

    // Prevent problems with unallocated K when log starts.

    K.resize(sizeState, sizeObservation);

    K.setZero();

}


KalmanFilter::~KalmanFilter()

{

}


void KalmanFilter::setSizeObservation(size_t const size)

{

    sizeObservation = size;


    return;

}


void KalmanFilter::setState(double* state)

{

    new (w) Map<VectorXd>(state, sizeState);


    return;

}


void KalmanFilter::setError(double const* const error)

{

    setError(error, sizeObservation);


    return;

}


void KalmanFilter::setError(double const* const error, size_t const size)

{

    new (xi) Map<VectorXd const>(error, size);


    return;

}


void KalmanFilter::setJacobian(double const* const jacobian)

{

    setJacobian(jacobian, sizeObservation);


    return;

}


void KalmanFilter::setJacobian(double const* const jacobian,

                               size_t const columns)

{

    new (H) Map<MatrixXd const>(jacobian, sizeState, columns);


    return;

}


void KalmanFilter::update()

{

    update(sizeObservation);


    return;

}


void KalmanFilter::update(size_t const sizeObservation)

{

    sw[prefix].start(timingReset);


    X.resize(sizeState, sizeObservation);


    // Calculate temporary result.

    // X = P . H

    X = P.selfadjointView<Lower>() * (*H);


    // Calculate scaling matrix.

    // A = H^T . X

    MatrixXd A = H->transpose() * X;


    // Increase learning rate.

    // eta(n) = eta(0) * exp(n * tau)

    if (type == KT_STANDARD && eta < etamax) eta *= exp(etatau);


    // Add measurement noise.

    // A = A + R

    if (type == KT_STANDARD)

    {

        A.diagonal() += VectorXd::Constant(sizeObservation, 1.0 / eta);

    }

    else if (type == KT_FADINGMEMORY)

    {

        A.diagonal() += VectorXd::Constant(sizeObservation, lambda);

    }


    // Calculate Kalman gain matrix.

    // K = X . A^-1

    K.resize(sizeState, sizeObservation);

    K = X * A.inverse();


    // Update error covariance matrix.

    // P = P - K . X^T

    P.noalias() -= K * X.transpose();


    // Apply forgetting factor.

    if (type == KT_FADINGMEMORY)

    {

        P *= 1.0 / lambda;

    }

    // Add process noise.

    // P = P + Q

    P.diagonal() += VectorXd::Constant(sizeState, q);


    //double numAcc = (P - P.transpose()).cwiseAbs().maxCoeff();

    //cout << "Max. deviation of symmetric form of P: " << numAcc << endl;


    // Update state vector.

    // w =  w + K . xi

    (*w) += K * (*xi);


    // Anneal process noise.

    // q(n) = q(0) * exp(-n * tau)

    if (q > qmin) q *= exp(-qtau);


    // Update forgetting factor.

    if (type == KT_FADINGMEMORY)

    {

        lambda = nu * lambda + 1.0 - nu;

        gamma = 1.0 / (1.0 + lambda / gamma);

    }


    numUpdates++;


    if (timingReset) timingReset = false;

    sw[prefix].stop();


    return;

}


void KalmanFilter::setParametersStandard(double const epsilon,

                                         double const q0,

                                         double const qtau,

                                         double const qmin,

                                         double const eta0,

                                         double const etatau,

                                         double const etamax)

{

    this->epsilon = epsilon;

    this->q0      = q0     ;

    this->qtau    = qtau   ;

    this->qmin    = qmin   ;

    this->eta0    = eta0   ;

    this->etatau  = etatau ;

    this->etamax  = etamax ;


    q = q0;

    eta = eta0;

    P /= epsilon;


    return;

}


void KalmanFilter::setParametersFadingMemory(double const epsilon,

                                             double const q0,

                                             double const qtau,

                                             double const qmin,

                                             double const lambda,

                                             double const nu)

{

    this->epsilon = epsilon;

    this->q0      = q0     ;

    this->qtau    = qtau   ;

    this->qmin    = qmin   ;

    this->lambda  = lambda ;

    this->nu      = nu     ;


    q = q0;

    P /= epsilon;

    gamma = 1.0;


    return;

}


string KalmanFilter::status(size_t epoch) const

{


    double Pasym = 0.5 * (P - P.transpose()).array().abs().mean();

    double Pdiag = P.diagonal().array().abs().sum();

    double Poffdiag = (P.array().abs().sum() - Pdiag)

                    / (sizeState * (sizeState - 1));

    Pdiag /= sizeState;

    double Kmean = K.array().abs().mean();


    string s = strpr("%10zu %10zu %16.8E %16.8E %16.8E %16.8E %16.8E",

                     epoch, numUpdates, Pdiag, Poffdiag, Pasym, Kmean, q);

    if (type == KT_STANDARD)

    {

        s += strpr(" %16.8E", eta);

    }

    else if (type == KT_FADINGMEMORY)

    {

        s += strpr(" %16.8E %16.8E", lambda, numUpdates * gamma);

    }

    s += '\n';


    return s;

}


vector<string> KalmanFilter::statusHeader() const

{

    vector<string> header;


    vector<string> title;

    vector<string> colName;

    vector<string> colInfo;

    vector<size_t> colSize;

    title.push_back("Kalman filter status report.");

    colSize.push_back(10);

    colName.push_back("epoch");

    colInfo.push_back("Training epoch.");

    colSize.push_back(10);

    colName.push_back("nupdates");

    colInfo.push_back("Number of updates performed.");

    colSize.push_back(16);

    colName.push_back("Pdiag");

    colInfo.push_back("Mean of absolute diagonal values of error covariance "

                      "matrix P.");

    colSize.push_back(16);

    colName.push_back("Poffdiag");

    colInfo.push_back("Mean of absolute off-diagonal values of error "

                      "covariance matrix P.");

    colSize.push_back(16);

    colName.push_back("Pasym");

    colInfo.push_back("Asymmetry of P, i.e. mean of absolute values of "

                      "asymmetric part 0.5*(P - P^T).");

    colSize.push_back(16);

    colName.push_back("Kmean");

    colInfo.push_back("Mean of abolute compontents of Kalman gain matrix K.");

    colSize.push_back(16);

    colName.push_back("q");

    colInfo.push_back("Magnitude of process noise (= diagonal entries of Q).");

    if (type == KT_STANDARD)

    {

        colSize.push_back(16);

        colName.push_back("eta");

        colInfo.push_back("Learning rate.");

    }

    else if (type == KT_FADINGMEMORY)

    {

        colSize.push_back(16);

        colName.push_back("lambda");

        colInfo.push_back("Forgetting factor for fading memory KF.");

        colSize.push_back(16);

        colName.push_back("kgamma");

        colInfo.push_back("Forgetting gain k * gamma(k).");

    }

    header = createFileHeader(title, colSize, colName, colInfo);


    return header;

}


vector<string> KalmanFilter::info() const

{

    vector<string> v;


    if (type == KT_STANDARD)

    {

        v.push_back(strpr("KalmanType::KT_STANDARD (%d)\n", type));

        v.push_back(strpr("sizeState       = %zu\n", sizeState));

        v.push_back(strpr("sizeObservation = %zu\n", sizeObservation));

        v.push_back(strpr("epsilon         = %12.4E\n", epsilon));

        v.push_back(strpr("q0              = %12.4E\n", q0     ));

        v.push_back(strpr("qtau            = %12.4E\n", qtau   ));

        v.push_back(strpr("qmin            = %12.4E\n", qmin   ));

        v.push_back(strpr("eta0            = %12.4E\n", eta0   ));

        v.push_back(strpr("etatau          = %12.4E\n", etatau ));

        v.push_back(strpr("etamax          = %12.4E\n", etamax ));

    }

    else if (type == KT_FADINGMEMORY)

    {

        v.push_back(strpr("KalmanType::KT_FADINGMEMORY (%d)\n", type));

        v.push_back(strpr("sizeState       = %zu\n", sizeState));

        v.push_back(strpr("sizeObservation = %zu\n", sizeObservation));

        v.push_back(strpr("epsilon         = %12.4E\n", epsilon));

        v.push_back(strpr("q0              = %12.4E\n", q0     ));

        v.push_back(strpr("qtau            = %12.4E\n", qtau   ));

        v.push_back(strpr("qmin            = %12.4E\n", qmin   ));

        v.push_back(strpr("lambda          = %12.4E\n", lambda));

        v.push_back(strpr("nu              = %12.4E\n", nu    ));

    }

    v.push_back(strpr("OpenMP threads used: %d\n", nbThreads()));


    return v;

}

KalmanFilter.h

nnp::KalmanFilter::update
void update()
Update error covariance matrix and state vector.
Definition: KalmanFilter.cpp:119

nnp::KalmanFilter::setParametersStandard
void setParametersStandard(double const epsilon, double const q0, double const qtau, double const qmin, double const eta0, double const etatau, double const etamax)
Set parameters for standard Kalman filter.
Definition: KalmanFilter.cpp:199

nnp::KalmanFilter::eta0
double eta0
Learning rate initial value .
Definition: KalmanFilter.h:214

nnp::KalmanFilter::H
Eigen::Map< Eigen::MatrixXd const  > * H
Derivative matrix.
Definition: KalmanFilter.h:230

nnp::KalmanFilter::nu
double nu
Parameter for fading memory Kalman filter.
Definition: KalmanFilter.h:222

nnp::KalmanFilter::qtau
double qtau
Process noise exponential decay parameter .
Definition: KalmanFilter.h:208

nnp::KalmanFilter::status
std::string status(std::size_t epoch) const
Status report.
Definition: KalmanFilter.cpp:243

nnp::KalmanFilter::sizeObservation
std::size_t sizeObservation
Size of observation (measurement) vector.
Definition: KalmanFilter.h:198

nnp::KalmanFilter::type
KalmanType type
Kalman filter type.
Definition: KalmanFilter.h:196

nnp::KalmanFilter::w
Eigen::Map< Eigen::VectorXd > * w
State vector.
Definition: KalmanFilter.h:226

nnp::KalmanFilter::q0
double q0
Process noise initial value .
Definition: KalmanFilter.h:206

nnp::KalmanFilter::lambda
double lambda
Forgetting factor for fading memory Kalman filter.
Definition: KalmanFilter.h:220

nnp::KalmanFilter::setParametersFadingMemory
void setParametersFadingMemory(double const epsilon, double const q0, double const qtau, double const qmin, double const lambda, double const nu)
Set parameters for fading memory Kalman filter.
Definition: KalmanFilter.cpp:222

nnp::KalmanFilter::X
Eigen::MatrixXd X
Intermediate result X = P . H.
Definition: KalmanFilter.h:236

nnp::KalmanFilter::setState
void setState(double *state)
Set pointer to current state.
Definition: KalmanFilter.cpp:83

nnp::KalmanFilter::statusHeader
std::vector< std::string > statusHeader() const
Header for status report file.
Definition: KalmanFilter.cpp:268

nnp::KalmanFilter::etatau
double etatau
Learning rate exponential increase parameter .
Definition: KalmanFilter.h:216

nnp::KalmanFilter::etamax
double etamax
Learning rate maximum value .
Definition: KalmanFilter.h:218

nnp::KalmanFilter::gamma
double gamma
Forgetting gain factor gamma for fading memory Kalman filter.
Definition: KalmanFilter.h:224

nnp::KalmanFilter::info
std::vector< std::string > info() const
Information about Kalman filter settings.
Definition: KalmanFilter.cpp:321

nnp::KalmanFilter::setError
void setError(double const *const error)
Set pointer to current error vector.
Definition: KalmanFilter.cpp:90

nnp::KalmanFilter::numUpdates
std::size_t numUpdates
Total number of updates performed.
Definition: KalmanFilter.h:200

nnp::KalmanFilter::KalmanType
KalmanType
Enumerate different Kalman filter types.
Definition: KalmanFilter.h:36

nnp::KalmanFilter::KT_STANDARD
@ KT_STANDARD
Regular Kalman filter.
Definition: KalmanFilter.h:38

nnp::KalmanFilter::KT_FADINGMEMORY
@ KT_FADINGMEMORY
Kalman filtering with fading memory modification.
Definition: KalmanFilter.h:40

nnp::KalmanFilter::q
double q
Process noise .
Definition: KalmanFilter.h:204

nnp::KalmanFilter::qmin
double qmin
Process noise minimum value .
Definition: KalmanFilter.h:210

nnp::KalmanFilter::setSizeObservation
void setSizeObservation(std::size_t const sizeObservation)
Set observation vector size.
Definition: KalmanFilter.cpp:76

nnp::KalmanFilter::K
Eigen::MatrixXd K
Kalman gain matrix.
Definition: KalmanFilter.h:234

nnp::KalmanFilter::eta
double eta
Learning rate .
Definition: KalmanFilter.h:212

nnp::KalmanFilter::epsilon
double epsilon
Error covariance initialization parameter .
Definition: KalmanFilter.h:202

nnp::KalmanFilter::xi
Eigen::Map< Eigen::VectorXd const  > * xi
Error vector.
Definition: KalmanFilter.h:228

nnp::KalmanFilter::P
Eigen::MatrixXd P
Error covariance matrix.
Definition: KalmanFilter.h:232

nnp::KalmanFilter::~KalmanFilter
virtual ~KalmanFilter()
Destructor.
Definition: KalmanFilter.cpp:72

nnp::KalmanFilter::setJacobian
void setJacobian(double const *const jacobian)
Set pointer to current Jacobi matrix.
Definition: KalmanFilter.cpp:104

nnp::Updater
Base class for different weight update methods.
Definition: Updater.h:32

nnp::Updater::prefix
std::string prefix
Prefix for timing stopwatches.
Definition: Updater.h:112

nnp::Updater::sizeState
std::size_t sizeState
Number of neural network connections (weights + biases).
Definition: Updater.h:110

nnp::Updater::timingReset
bool timingReset
Internal loop timer reset switch.
Definition: Updater.h:108

nnp::Updater::sw
std::map< std::string, Stopwatch > sw
Stopwatch map for timing.
Definition: Updater.h:114

nnp
Definition: Atom.h:29

nnp::strpr
string strpr(const char *format,...)
String version of printf function.
Definition: utility.cpp:90

nnp::createFileHeader
vector< string > createFileHeader(vector< string > const &title, vector< size_t > const &colSize, vector< string > const &colName, vector< string > const &colInfo, char const &commentChar)
Definition: utility.cpp:111

utility.h