n2p2/doxygen/NeuralNetwork_8cpp_source.html

// n2p2 - A neural network potential package

// Copyright (C) 2018 Andreas Singraber (University of Vienna)

//

// This program is free software: you can redistribute it and/or modify

// it under the terms of the GNU General Public License as published by

// the Free Software Foundation, either version 3 of the License, or

// (at your option) any later version.

//

// This program is distributed in the hope that it will be useful,

// but WITHOUT ANY WARRANTY; without even the implied warranty of

// MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the

// GNU General Public License for more details.

//

// You should have received a copy of the GNU General Public License

// along with this program.  If not, see <https://www.gnu.org/licenses/>.


#include "NeuralNetwork.h"

#include "utility.h"

#include <algorithm> // std::min, std::max

#include <cmath>     // sqrt, pow, tanh

#include <cstdio>    // fprintf, stderr

#include <cstdlib>   // exit, EXIT_FAILURE, rand, srand

#include <limits>    // std::numeric_limits


#define EXP_LIMIT 35.0


using namespace std;

using namespace nnp;


NeuralNetwork::

NeuralNetwork(int                              numLayers,

              int const* const&                numNeuronsPerLayer,

              ActivationFunction const* const& activationFunctionsPerLayer)

{

    // check number of layers

    this->numLayers = numLayers;

    if (numLayers < 3)

    {

        fprintf(stderr,

                "ERROR: Neural network must have at least three layers\n");

        exit(EXIT_FAILURE);

    }

    numHiddenLayers = numLayers - 2;


    // do not normalize neurons by default

    normalizeNeurons = false;


    // allocate layers and populate with neurons

    layers = new Layer[numLayers];

    inputLayer = &layers[0];

    outputLayer = &layers[numLayers-1];

    allocateLayer(*inputLayer,

                  0,

                  numNeuronsPerLayer[0],

                  activationFunctionsPerLayer[0]);

    for (int i = 1; i < numLayers; i++)

    {

        allocateLayer(layers[i],

                      numNeuronsPerLayer[i-1],

                      numNeuronsPerLayer[i],

                      activationFunctionsPerLayer[i]);

    }


    // count connections

    numWeights     = 0;

    numBiases      = 0;

    numConnections = 0;

    for (int i = 1; i < numLayers; i++)

    {

        numBiases  += layers[i].numNeurons;

        numWeights += layers[i].numNeurons * layers[i].numNeuronsPrevLayer;

    }

    numConnections = numWeights + numBiases;


    // calculate weight and bias offsets for each layer

    weightOffset = new int[numLayers-1];

    weightOffset[0] = 0;

    for (int i = 1; i < numLayers-1; i++)

    {

        weightOffset[i] = weightOffset[i-1] +

                          (layers[i-1].numNeurons + 1) * layers[i].numNeurons;

    }

    biasOffset = new int[numLayers-1];

    for (int i = 0; i < numLayers-1; i++)

    {

        biasOffset[i] = weightOffset[i] +

                        layers[i+1].numNeurons * layers[i].numNeurons;

    }

    biasOnlyOffset = new int[numLayers-1];

    biasOnlyOffset[0] = 0;

    for (int i = 1; i < numLayers-1; i++)

    {

        biasOnlyOffset[i] = biasOnlyOffset[i-1] + layers[i].numNeurons;

    }

}


NeuralNetwork::~NeuralNetwork()

{

    for (int i = 0; i < numLayers; i++)

    {

        for (int j = 0; j < layers[i].numNeurons; j++)

        {

            delete[] layers[i].neurons[j].weights;

        }

        delete[] layers[i].neurons;

    }

    delete[] layers;

    delete[] weightOffset;

    delete[] biasOffset;

    delete[] biasOnlyOffset;

}


void NeuralNetwork::setNormalizeNeurons(bool normalizeNeurons)

{

    this->normalizeNeurons = normalizeNeurons;


    return;

}


int NeuralNetwork::getNumNeurons() const

{

    int count = 0;


    for (int i = 0; i < numLayers; i++)

    {

        count += layers[i].numNeurons;

    }


    return count;

}


int NeuralNetwork::getNumConnections() const

{

    return numConnections;

}


int NeuralNetwork::getNumWeights() const

{

    return numWeights;

}


int NeuralNetwork::getNumBiases() const

{

    return numBiases;

}


void NeuralNetwork::setConnections(double const* const& connections)

{

    int count = 0;


    for (int i = 1; i < numLayers; i++)

    {

        for (int j = 0; j < layers[i].numNeuronsPrevLayer; j++)

        {

            for (int k = 0; k < layers[i].numNeurons; k++)

            {

                layers[i].neurons[k].weights[j] = connections[count];

                count++;

            }

        }

        for (int j = 0; j < layers[i].numNeurons; j++)

        {

            layers[i].neurons[j].bias = connections[count];

            count++;

        }

    }


    return;

}


void NeuralNetwork::getConnections(double* connections) const

{

    int count = 0;


    for (int i = 1; i < numLayers; i++)

    {

        for (int j = 0; j < layers[i].numNeuronsPrevLayer; j++)

        {

            for (int k = 0; k < layers[i].numNeurons; k++)

            {

                connections[count] = layers[i].neurons[k].weights[j] ;

                count++;

            }

        }

        for (int j = 0; j < layers[i].numNeurons; j++)

        {

            connections[count] = layers[i].neurons[j].bias;

            count++;

        }

    }


    return;

}


void NeuralNetwork::initializeConnectionsRandomUniform(unsigned int seed)

{

    double* connections = new double[numConnections];


    srand(seed);

    for (int i = 0; i < numConnections; i++)

    {

        connections[i] = -1.0 + 2.0 * (double)rand() / RAND_MAX;

    }


    setConnections(connections);


    delete[] connections;


    return;

}


void NeuralNetwork::modifyConnections(ModificationScheme modificationScheme)

{

    if (modificationScheme == MS_ZEROBIAS)

    {

        for (int i = 0; i < numLayers; i++)

        {

            for (int j = 0; j < layers[i].numNeurons; j++)

            {

                layers[i].neurons[j].bias = 0.0;

            }

        }

    }

    else if (modificationScheme == MS_ZEROOUTPUTWEIGHTS)

    {

        for (int i = 0; i < outputLayer->numNeurons; i++)

        {

            for (int j = 0; j < outputLayer->numNeuronsPrevLayer; j++)

            {

                outputLayer->neurons[i].weights[j] = 0.0;

            }

        }

    }

    else if (modificationScheme == MS_FANIN)

    {

        for (int i = 1; i < numLayers; i++)

        {

            if(layers[i].activationFunction == AF_TANH)

            {

                for (int j = 0; j < layers[i].numNeurons; j++)

                {

                    for (int k = 0; k < layers[i].numNeuronsPrevLayer; k++)

                    {

                        layers[i].neurons[j].weights[k] /=

                                           sqrt(layers[i].numNeuronsPrevLayer);

                    }

                }

            }

        }

    }

    else if (modificationScheme == MS_GLOROTBENGIO)

    {

        for (int i = 1; i < numLayers; i++)

        {

            if(layers[i].activationFunction == AF_TANH)

            {

                for (int j = 0; j < layers[i].numNeurons; j++)

                {

                    for (int k = 0; k < layers[i].numNeuronsPrevLayer; k++)

                    {

                        layers[i].neurons[j].weights[k] *= sqrt(6.0 / (

                                             layers[i].numNeuronsPrevLayer

                                           + layers[i].numNeurons));

                    }

                }

            }

        }

    }

    else if (modificationScheme == MS_NGUYENWIDROW)

    {

        double beta   = 0.0;

        double sum    = 0.0;

        double weight = 0.0;


        for (int i = 1; i < numLayers-1; i++)

        {

            beta = 0.7 * pow(layers[i].numNeurons,

                             1.0 / double(layers[i].numNeuronsPrevLayer));

            for (int j = 0; j < layers[i].numNeurons; j++)

            {

                sum = 0.0;

                for (int k = 0; k < layers[i].numNeuronsPrevLayer; k++)

                {

                    weight = layers[i].neurons[j].weights[k];

                    sum += weight * weight;

                }

                sum = sqrt(sum);

                for (int k = 0; k < layers[i].numNeuronsPrevLayer; k++)

                {

                    layers[i].neurons[j].weights[k] *= beta / sum;

                    if (layers[i].activationFunction == AF_TANH)

                    {

                        layers[i].neurons[j].weights[k] *= 2.0;

                    }

                }

                layers[i].neurons[j].bias *= beta;

                if (layers[i].activationFunction == AF_TANH)

                {

                    layers[i].neurons[j].bias *= 2.0;

                }

            }

        }

        for (int i = 0; i < outputLayer->numNeurons; i++)

        {

            outputLayer->neurons[0].weights[i] *= 0.5;

        }

    }

    else

    {

        fprintf(stderr, "ERROR: Incorrect modifyConnections call.\n");

        exit(EXIT_FAILURE);

    }


    return;

}


void NeuralNetwork::modifyConnections(ModificationScheme modificationScheme,

                                      double parameter1,

                                      double parameter2)

{

    if (modificationScheme == MS_PRECONDITIONOUTPUT)

    {

        double mean  = parameter1;

        double sigma = parameter2;


        for (int i = 0; i < outputLayer->numNeurons; i++)

        {

            for (int j = 0; j < outputLayer->numNeuronsPrevLayer; j++)

            {

                outputLayer->neurons[i].weights[j] *= sigma;

            }

            outputLayer->neurons[i].bias += mean;

        }

    }

    else

    {

        fprintf(stderr, "ERROR: Incorrect modifyConnections call.\n");

        exit(EXIT_FAILURE);

    }


    return;

}


void NeuralNetwork::setInput(size_t const index, double const value) const

{

    Neuron& n = inputLayer->neurons[index];

    n.count++;

    n.value = value;

    n.min  = min(value, n.min);

    n.max  = max(value, n.max);

    n.sum  += value;

    n.sum2 += value * value;


    return;

}


void NeuralNetwork::setInput(double const* const& input) const

{

    for (int i = 0; i < inputLayer->numNeurons; i++)

    {

        // TODO: replace by calling setInput from above

        // also, for 4G we need charges

        double const& value = input[i];

        Neuron& n = inputLayer->neurons[i];

        n.count++;

        n.value = value;

        n.min  = min(value, n.min);

        n.max  = max(value, n.max);

        n.sum  += value;

        n.sum2 += value * value;

    }


    return;

}


void NeuralNetwork::getOutput(double* output) const

{

    for (int i = 0; i < outputLayer->numNeurons; i++)

    {

        output[i] = outputLayer->neurons[i].value;

    }


    return;

}


void NeuralNetwork::propagate()

{

    for (int i = 1; i < numLayers; i++)

    {

        propagateLayer(layers[i], layers[i-1]);

    }


    return;

}


void NeuralNetwork::calculateDEdG(double *dEdG) const

{

    double** inner = new double*[numHiddenLayers];

    double** outer = new double*[numHiddenLayers];


    for (int i = 0; i < numHiddenLayers; i++)

    {

        inner[i] = new double[layers[i+1].numNeurons];

        outer[i] = new double[layers[i+2].numNeurons];

    }


    for (int k = 0; k < layers[0].numNeurons; k++)

    {

        for (int i = 0; i < layers[1].numNeurons; i++)

        {

            inner[0][i] = layers[1].neurons[i].weights[k]

                        * layers[1].neurons[i].dfdx;

            if (normalizeNeurons) inner[0][i] /= layers[0].numNeurons;

        }

        for (int l = 1; l < numHiddenLayers+1; l++)

        {

            for (int i2 = 0; i2 < layers[l+1].numNeurons; i2++)

            {

                outer[l-1][i2] = 0.0;

                for (int i1 = 0; i1 < layers[l].numNeurons; i1++)

                {

                    outer[l-1][i2] += layers[l+1].neurons[i2].weights[i1]

                                    * inner[l-1][i1];

                }

                outer[l-1][i2] *= layers[l+1].neurons[i2].dfdx;

                if (normalizeNeurons) outer[l-1][i2] /= layers[l].numNeurons;

                if (l < numHiddenLayers) inner[l][i2] = outer[l-1][i2];

            }

        }

        dEdG[k] = outer[numHiddenLayers-1][0];

    }


    for (int i = 0; i < numHiddenLayers; i++)

    {

        delete[] inner[i];

        delete[] outer[i];

    }

    delete[] inner;

    delete[] outer;


    return;

}


void NeuralNetwork::calculateDEdc(double* dEdc) const

{

    int count = 0;


    for (int i = 0; i < numConnections; i++)

    {

        dEdc[i] = 0.0;

    }


    for (int i = 0; i < outputLayer->numNeurons; i++)

    {

        dEdc[biasOffset[numLayers-2]+i] = outputLayer->neurons[i].dfdx;

        if (normalizeNeurons)

        {

            dEdc[biasOffset[numLayers-2]+i] /=

                outputLayer->numNeuronsPrevLayer;

        }

    }


    for (int i = numLayers-2; i >= 0; i--)

    {

        count = 0;

        for (int j = 0; j < layers[i].numNeurons; j++)

        {

            for (int k = 0; k < layers[i+1].numNeurons; k++)

            {

                dEdc[weightOffset[i]+count] = dEdc[biasOffset[i]+k]

                                            * layers[i].neurons[j].value;

                count++;

                if (i >= 1)

                {

                    dEdc[biasOffset[i-1]+j] += dEdc[biasOffset[i]+k]

                        * layers[i+1].neurons[k].weights[j]

                        * layers[i].neurons[j].dfdx;

                }

            }

            if (normalizeNeurons && i >= 1)

            {

                dEdc[biasOffset[i-1]+j] /= layers[i].numNeuronsPrevLayer;

            }

        }

    }


    return;

}


void NeuralNetwork::calculateDFdc(double*              dFdc,

                                  double const* const& dGdxyz) const

{

    double* dEdb    = new double[numBiases];

    double* d2EdGdc = new double[numConnections];


    for (int i = 0; i < numBiases; i++)

    {

        dEdb[i] = 0.0;

    }

    for (int i = 0; i < numConnections; i++)

    {

        dFdc[i]    = 0.0;

        d2EdGdc[i] = 0.0;

    }


    calculateDEdb(dEdb);

    for (int i = 0; i < layers[0].numNeurons; i++)

    {

        for (int j = 0; j < numConnections; j++)

        {

            d2EdGdc[j] = 0.0;

        }

        calculateDxdG(i);

        calculateD2EdGdc(i, dEdb, d2EdGdc);

        for (int j = 0; j < numConnections; j++)

        {

            // Note: F = - dE / dx !!

            //           ^

            dFdc[j] -= d2EdGdc[j] * dGdxyz[i];

        }

    }


    delete[] dEdb;

    delete[] d2EdGdc;


    return;

}


void NeuralNetwork::writeConnections(std::ofstream& file) const

{

    // File header.

    vector<string> title;

    vector<string> colName;

    vector<string> colInfo;

    vector<size_t> colSize;

    title.push_back("Neural network connection values (weights and biases).");

    colSize.push_back(24);

    colName.push_back("connection");

    colInfo.push_back("Neural network connection value.");

    colSize.push_back(1);

    colName.push_back("t");

    colInfo.push_back("Connection type (a = weight, b = bias).");

    colSize.push_back(9);

    colName.push_back("index");

    colInfo.push_back("Index enumerating weights.");

    colSize.push_back(5);

    colName.push_back("l_s");

    colInfo.push_back("Starting point layer (end point layer for biases).");

    colSize.push_back(5);

    colName.push_back("n_s");

    colInfo.push_back("Starting point neuron in starting layer (end point "

                      "neuron for biases).");

    colSize.push_back(5);

    colName.push_back("l_e");

    colInfo.push_back("End point layer.");

    colSize.push_back(5);

    colName.push_back("n_e");

    colInfo.push_back("End point neuron in end layer.");

    appendLinesToFile(file,

                      createFileHeader(title, colSize, colName, colInfo));


    int count = 0;

    for (int i = 1; i < numLayers; i++)

    {

        for (int j = 0; j < layers[i].numNeuronsPrevLayer; j++)

        {

            for (int k = 0; k < layers[i].numNeurons; k++)

            {

                count++;

                file << strpr("%24.16E a %9d %5d %5d %5d %5d\n",

                              layers[i].neurons[k].weights[j],

                              count,

                              i - 1,

                              j + 1,

                              i,

                              k + 1);

            }

        }

        for (int j = 0; j < layers[i].numNeurons; j++)

        {

            count++;

            file << strpr("%24.16E b %9d %5d %5d\n",

                          layers[i].neurons[j].bias,

                          count,

                          i,

                          j + 1);

        }

    }


    return;

}


void NeuralNetwork::calculateDEdb(double* dEdb) const

{

    for (int i = 0; i < outputLayer->numNeurons; i++)

    {

        dEdb[biasOnlyOffset[numLayers-2]+i] = outputLayer->neurons[i].dfdx;

        if (normalizeNeurons)

        {

            dEdb[biasOnlyOffset[numLayers-2]+i] /=

                outputLayer->numNeuronsPrevLayer;

        }

    }


    for (int i = numLayers-2; i >= 0; i--)

    {

        for (int j = 0; j < layers[i].numNeurons; j++)

        {

            for (int k = 0; k < layers[i+1].numNeurons; k++)

            {

                if (i >= 1)

                {

                    dEdb[biasOnlyOffset[i-1]+j] += dEdb[biasOnlyOffset[i]+k]

                        * layers[i+1].neurons[k].weights[j]

                        * layers[i].neurons[j].dfdx;

                }

            }

            if (normalizeNeurons && i >= 1)

            {

                dEdb[biasOnlyOffset[i-1]+j] /= layers[i].numNeuronsPrevLayer;

            }

        }

    }


    return;

}


void NeuralNetwork::calculateDxdG(int index) const

{

    for (int i = 0; i < layers[1].numNeurons; i++)

    {

        layers[1].neurons[i].dxdG = layers[1].neurons[i].weights[index];

        if (normalizeNeurons)

        {

            layers[1].neurons[i].dxdG /= layers[1].numNeuronsPrevLayer;

        }

    }

    for (int i = 2; i < numLayers; i++)

    {

        for (int j = 0; j < layers[i].numNeurons; j++)

        {

            layers[i].neurons[j].dxdG = 0.0;

            for (int k = 0; k < layers[i-1].numNeurons; k++)

            {

                layers[i].neurons[j].dxdG += layers[i].neurons[j].weights[k]

                                           * layers[i-1].neurons[k].dfdx

                                           * layers[i-1].neurons[k].dxdG;

            }

            if (normalizeNeurons)

            {

                layers[i].neurons[j].dxdG /= layers[i].numNeuronsPrevLayer;

            }

        }

    }


    return;

}


void NeuralNetwork::calculateD2EdGdc(int                  index,

                                     double const* const& dEdb,

                                     double*              d2EdGdc) const

{

    int count = 0;


    for (int i = 0; i < outputLayer->numNeurons; i++)

    {

        d2EdGdc[biasOffset[numLayers-2]+i] = outputLayer->neurons[i].d2fdx2

                                           * outputLayer->neurons[i].dxdG;

        if (normalizeNeurons)

        {

            d2EdGdc[biasOffset[numLayers-2]+i] /=

                outputLayer->numNeuronsPrevLayer;

        }

    }


    for (int i = numLayers-2; i >= 0; i--)

    {

        count = 0;

        for (int j = 0; j < layers[i].numNeurons; j++)

        {

            for (int k = 0; k < layers[i+1].numNeurons; k++)

            {

                if (i == 0)

                {

                    d2EdGdc[weightOffset[i]+count] =

                        d2EdGdc[biasOffset[i]+k] * layers[i].neurons[j].value;

                    if (j == index)

                    {

                        d2EdGdc[weightOffset[i]+count] +=

                            dEdb[biasOnlyOffset[i]+k];

                    }

                }

                else

                {

                    d2EdGdc[weightOffset[i]+count] =

                        d2EdGdc[biasOffset[i]+k] * layers[i].neurons[j].value

                      + dEdb[biasOnlyOffset[i]+k] * layers[i].neurons[j].dfdx

                      * layers[i].neurons[j].dxdG;

                }

                count++;

                if (i >= 1)

                {

                    d2EdGdc[biasOffset[i-1]+j] +=

                        layers[i+1].neurons[k].weights[j]

                      * (d2EdGdc[biasOffset[i]+k] * layers[i].neurons[j].dfdx

                      + dEdb[biasOnlyOffset[i]+k]

                      * layers[i].neurons[j].d2fdx2

                      * layers[i].neurons[j].dxdG);

                }

            }

            if (normalizeNeurons && i >= 1)

            {

                d2EdGdc[biasOffset[i-1]+j] /= layers[i].numNeuronsPrevLayer;

            }

        }

    }


    return;

}


void NeuralNetwork::allocateLayer(Layer&             layer,

                                  int                numNeuronsPrevLayer,

                                  int                numNeurons,

                                  ActivationFunction activationFunction)

{

    layer.numNeurons          = numNeurons;

    layer.numNeuronsPrevLayer = numNeuronsPrevLayer;

    layer.activationFunction  = activationFunction;


    layer.neurons = new Neuron[layer.numNeurons];

    for (int i = 0; i < layer.numNeurons; i++)

    {

        layer.neurons[i].x      = 0.0;

        layer.neurons[i].value  = 0.0;

        layer.neurons[i].dfdx   = 0.0;

        layer.neurons[i].d2fdx2 = 0.0;

        layer.neurons[i].bias   = 0.0;

        layer.neurons[i].dxdG   = 0.0;

        layer.neurons[i].count  = 0;

        layer.neurons[i].min    =  numeric_limits<double>::max();

        layer.neurons[i].max    = -numeric_limits<double>::max();

        layer.neurons[i].sum    = 0.0;

        layer.neurons[i].sum2   = 0.0;

        if (layer.numNeuronsPrevLayer > 0)

        {

            layer.neurons[i].weights = new double[layer.numNeuronsPrevLayer];

            for (int j = 0; j < layer.numNeuronsPrevLayer; j++)

            {

                layer.neurons[i].weights[j] = 0.0;

            }

        }

        else

        {

            layer.neurons[i].weights = 0;

        }

    }


    return;

}


void NeuralNetwork::propagateLayer(Layer& layer, Layer& layerPrev)

{

    double dtmp = 0.0;


    for (int i = 0; i < layer.numNeurons; i++)

    {

        dtmp = 0.0;

        for (int j = 0; j < layer.numNeuronsPrevLayer; j++)

        {

            dtmp += layer.neurons[i].weights[j] * layerPrev.neurons[j].value;

        }

        dtmp += layer.neurons[i].bias;

        if (normalizeNeurons)

        {

            dtmp /= layer.numNeuronsPrevLayer;

        }


        layer.neurons[i].x = dtmp;

        if (layer.activationFunction == AF_IDENTITY)

        {

            layer.neurons[i].value  = dtmp;

            layer.neurons[i].dfdx   = 1.0;

            layer.neurons[i].d2fdx2 = 0.0;

        }

        else if (layer.activationFunction == AF_TANH)

        {

            dtmp = tanh(dtmp);

            layer.neurons[i].value  = dtmp;

            layer.neurons[i].dfdx   = 1.0 - dtmp * dtmp;

            layer.neurons[i].d2fdx2 = -2.0 * dtmp * (1.0 - dtmp * dtmp);

        }

        else if (layer.activationFunction == AF_LOGISTIC)

        {

            if (dtmp > EXP_LIMIT)

            {

                layer.neurons[i].value  = 1.0;

                layer.neurons[i].dfdx   = 0.0;

                layer.neurons[i].d2fdx2 = 0.0;

            }

            else if (dtmp < -EXP_LIMIT)

            {

                layer.neurons[i].value  = 0.0;

                layer.neurons[i].dfdx   = 0.0;

                layer.neurons[i].d2fdx2 = 0.0;

            }

            else

            {

                dtmp = 1.0 / (1.0 + exp(-dtmp));

                layer.neurons[i].value  = dtmp;

                layer.neurons[i].dfdx   = dtmp * (1.0 - dtmp);

                layer.neurons[i].d2fdx2 = dtmp * (1.0 - dtmp)

                                        * (1.0 - 2.0 * dtmp);

            }

        }

        else if (layer.activationFunction == AF_SOFTPLUS)

        {

            if (dtmp > EXP_LIMIT)

            {

                layer.neurons[i].value  = dtmp;

                layer.neurons[i].dfdx   = 1.0;

                layer.neurons[i].d2fdx2 = 0.0;

            }

            else if (dtmp < -EXP_LIMIT)

            {

                layer.neurons[i].value  = 0.0;

                layer.neurons[i].dfdx   = 0.0;

                layer.neurons[i].d2fdx2 = 0.0;

            }

            else

            {

                dtmp = exp(dtmp);

                layer.neurons[i].value  = log(1.0 + dtmp);

                dtmp = 1.0 / (1.0 + 1.0 / dtmp);

                layer.neurons[i].dfdx   = dtmp;

                layer.neurons[i].d2fdx2 = dtmp * (1.0 - dtmp);

            }

        }

        else if (layer.activationFunction == AF_RELU)

        {

            if (dtmp > 0.0)

            {

                layer.neurons[i].value  = dtmp;

                layer.neurons[i].dfdx   = 1.0;

                layer.neurons[i].d2fdx2 = 0.0;

            }

            else

            {

                layer.neurons[i].value  = 0.0;

                layer.neurons[i].dfdx   = 0.0;

                layer.neurons[i].d2fdx2 = 0.0;

            }

        }

        else if (layer.activationFunction == AF_GAUSSIAN)

        {

            double const tmpexp = exp(-0.5 * dtmp * dtmp);

            layer.neurons[i].value  = tmpexp;

            layer.neurons[i].dfdx   = -dtmp * tmpexp;

            layer.neurons[i].d2fdx2 = (dtmp * dtmp - 1.0) * tmpexp;

        }

        else if (layer.activationFunction == AF_COS)

        {

            double const tmpcos = cos(dtmp);

            layer.neurons[i].value  = tmpcos;

            layer.neurons[i].dfdx   = -sin(dtmp);

            layer.neurons[i].d2fdx2 = -tmpcos;

        }

        else if (layer.activationFunction == AF_REVLOGISTIC)

        {

            dtmp = 1.0 / (1.0 + exp(-dtmp));

            layer.neurons[i].value  = 1.0 - dtmp;

            layer.neurons[i].dfdx   = dtmp * (dtmp - 1.0);

            layer.neurons[i].d2fdx2 = dtmp * (dtmp - 1.0) * (1.0 - 2.0 * dtmp);

        }

        else if (layer.activationFunction == AF_EXP)

        {

            dtmp = exp(-dtmp);

            layer.neurons[i].value  = dtmp;

            layer.neurons[i].dfdx   = -dtmp;

            layer.neurons[i].d2fdx2 = dtmp;

        }

        else if (layer.activationFunction == AF_HARMONIC)

        {

            layer.neurons[i].value  = dtmp * dtmp;

            layer.neurons[i].dfdx   = 2.0 * dtmp;

            layer.neurons[i].d2fdx2 = 2.0;

        }

        layer.neurons[i].count++;

        dtmp = layer.neurons[i].x;

        layer.neurons[i].min  = min(dtmp, layer.neurons[i].min);

        layer.neurons[i].max  = max(dtmp, layer.neurons[i].max);

        layer.neurons[i].sum  += dtmp;

        layer.neurons[i].sum2 += dtmp * dtmp;

    }


    return;

}


void NeuralNetwork::resetNeuronStatistics()

{

    for (int i = 0; i < numLayers; i++)

    {

        for (int j = 0; j < layers[i].numNeurons; j++)

        {

            layers[i].neurons[j].count = 0;

            layers[i].neurons[j].min   =  numeric_limits<double>::max();

            layers[i].neurons[j].max   = -numeric_limits<double>::max();

            layers[i].neurons[j].sum   = 0.0;

            layers[i].neurons[j].sum2  = 0.0;

        }

    }


    return;

}


void NeuralNetwork::getNeuronStatistics(long*   count,

                                        double* min,

                                        double* max,

                                        double* sum,

                                        double* sum2) const

{

    int iNeuron = 0;


    for (int i = 0; i < numLayers; i++)

    {

        for (int j = 0; j < layers[i].numNeurons; j++)

        {

            count[iNeuron] = layers[i].neurons[j].count;

            min  [iNeuron] = layers[i].neurons[j].min;

            max  [iNeuron] = layers[i].neurons[j].max;

            sum  [iNeuron] = layers[i].neurons[j].sum;

            sum2 [iNeuron] = layers[i].neurons[j].sum2;

            iNeuron++;

        }

    }


    return;

}


/*

void NeuralNetwork::writeStatus(int element, int epoch)

{

    char  fName[LSTR] = "";

    FILE* fpn         = NULL;

    FILE* fpw         = NULL;


    for (int i = 0; i < numLayers; i++)

    {

        sprintf(fName, "nn.neurons.%03d.%1d.%06d", element, i, epoch);

        fpn = fopen(fName, "a");

        if (fpn == NULL)

        {

            fprintf(stderr, "ERROR: Could not open file: %s.\n", fName);

            exit(EXIT_FAILURE);

        }

        sprintf(fName, "nn.weights.%03d.%1d.%06d", element, i, epoch);

        fpw = fopen(fName, "a");

        if (fpw == NULL)

        {

            fprintf(stderr, "ERROR: Could not open file: %s.\n", fName);

            exit(EXIT_FAILURE);

        }

        for (int j = 0; j < layers[i].numNeurons; j++)

        {

            fprintf(fpn, "%4d %.8f %.8f %.8f %.8f %.8f %.8f\n", j, layers[i].neurons[j].x,

                    layers[i].neurons[j].value, layers[i].neurons[j].dfdx, layers[i].neurons[j].d2fdx2,

                    layers[i].neurons[j].bias, layers[i].neurons[j].dxdG);

            for (int k = 0; k < layers[i].numNeuronsPrevLayer; k++)

            {

                fprintf(fpw, "%4d %4d %.8f\n", j, k, layers[i].neurons[j].weights[k]);

            }

        }

        fclose(fpn);

        fclose(fpw);

    }


    return;


}

*/


long NeuralNetwork::getMemoryUsage()

{

    long mem        = sizeof(*this);

    int  numNeurons = getNumNeurons();


    mem += (numLayers - 1) * sizeof(int); // weightOffset

    mem += (numLayers - 1) * sizeof(int); // biasOffset

    mem += (numLayers - 1) * sizeof(int); // biasOnlyOffset

    mem += numLayers  * sizeof(Layer);    // layers

    mem += numNeurons * sizeof(Neuron);   // neurons

    mem += numWeights * sizeof(double);   // weights


    return mem;

}


vector<string> NeuralNetwork::info() const

{

    vector<string> v;

    int maxNeurons = 0;


    v.push_back(strpr("Number of weights    : %6zu\n", numWeights));

    v.push_back(strpr("Number of biases     : %6zu\n", numBiases));

    v.push_back(strpr("Number of connections: %6zu\n", numConnections));

    v.push_back(strpr("Architecture    "));

    for (int i = 0; i < numLayers; ++i)

    {

        maxNeurons = max(layers[i].numNeurons, maxNeurons);

        v.push_back(strpr(" %4d", layers[i].numNeurons));

    }

    v.push_back("\n");

    v.push_back("-----------------------------------------"

                "--------------------------------------\n");


    for (int i = 0; i < maxNeurons; ++i)

    {

        v.push_back(strpr("%4d", i + 1));

        string s = "";

        for (int j = 0; j < numLayers; ++j)

        {

            if (i < layers[j].numNeurons)

            {

                if (j == 0)

                {

                    s += strpr(" %3s", "G");

                }

                else if (layers[j].activationFunction == AF_IDENTITY)

                {

                    s += strpr(" %3s", "l");

                }

                else if (layers[j].activationFunction == AF_TANH)

                {

                    s += strpr(" %3s", "t");

                }

                else if (layers[j].activationFunction == AF_LOGISTIC)

                {

                    s += strpr(" %3s", "s");

                }

                else if (layers[j].activationFunction == AF_SOFTPLUS)

                {

                    s += strpr(" %3s", "p");

                }

                else if (layers[j].activationFunction == AF_RELU)

                {

                    s += strpr(" %3s", "r");

                }

                else if (layers[j].activationFunction == AF_GAUSSIAN)

                {

                    s += strpr(" %3s", "g");

                }

                else if (layers[j].activationFunction == AF_COS)

                {

                    s += strpr(" %3s", "c");

                }

                else if (layers[j].activationFunction == AF_REVLOGISTIC)

                {

                    s += strpr(" %3s", "S");

                }

                else if (layers[j].activationFunction == AF_EXP)

                {

                    s += strpr(" %3s", "e");

                }

                else if (layers[j].activationFunction == AF_HARMONIC)

                {

                    s += strpr(" %3s", "h");

                }

            }

            else

            {

                s += "    ";

            }

        }

        v.push_back(s += "\n");

    }


    return v;

}


NeuralNetwork::ActivationFunction nnp::activationFromString(string c)

{

    NeuralNetwork::ActivationFunction a;


    if      (c == "l") a = NeuralNetwork::AF_IDENTITY;

    else if (c == "t") a = NeuralNetwork::AF_TANH;

    else if (c == "s") a = NeuralNetwork::AF_LOGISTIC;

    else if (c == "p") a = NeuralNetwork::AF_SOFTPLUS;

    else if (c == "r") a = NeuralNetwork::AF_RELU;

    else if (c == "g") a = NeuralNetwork::AF_GAUSSIAN;

    else if (c == "c") a = NeuralNetwork::AF_COS;

    else if (c == "S") a = NeuralNetwork::AF_REVLOGISTIC;

    else if (c == "e") a = NeuralNetwork::AF_EXP;

    else if (c == "h") a = NeuralNetwork::AF_HARMONIC;

    else

    {

        throw runtime_error("ERROR: Unknown activation function.\n");

    }


    return a;

}


EXP_LIMIT
#define EXP_LIMIT
Definition NeuralNetwork.cpp:25

NeuralNetwork.h

nnp::NeuralNetwork::ActivationFunction
ActivationFunction
List of available activation function types.
Definition NeuralNetwork.h:33

nnp::NeuralNetwork::AF_TANH
@ AF_TANH
Definition NeuralNetwork.h:39

nnp::NeuralNetwork::AF_COS
@ AF_COS
Definition NeuralNetwork.h:49

nnp::NeuralNetwork::AF_LOGISTIC
@ AF_LOGISTIC
Definition NeuralNetwork.h:41

nnp::NeuralNetwork::AF_IDENTITY
@ AF_IDENTITY
Definition NeuralNetwork.h:37

nnp::NeuralNetwork::AF_GAUSSIAN
@ AF_GAUSSIAN
Definition NeuralNetwork.h:47

nnp::NeuralNetwork::AF_SOFTPLUS
@ AF_SOFTPLUS
Definition NeuralNetwork.h:43

nnp::NeuralNetwork::AF_EXP
@ AF_EXP
Definition NeuralNetwork.h:53

nnp::NeuralNetwork::AF_REVLOGISTIC
@ AF_REVLOGISTIC
Definition NeuralNetwork.h:51

nnp::NeuralNetwork::AF_HARMONIC
@ AF_HARMONIC
Definition NeuralNetwork.h:55

nnp::NeuralNetwork::AF_RELU
@ AF_RELU
(NOT recommended for HDNNPs!)
Definition NeuralNetwork.h:45

nnp::NeuralNetwork::getNumConnections
int getNumConnections() const
Return total number of connections.
Definition NeuralNetwork.cpp:132

nnp::NeuralNetwork::inputLayer
Layer * inputLayer
Pointer to input layer.
Definition NeuralNetwork.h:425

nnp::NeuralNetwork::setInput
void setInput(double const *const &input) const
Set neural network input layer node values.
Definition NeuralNetwork.cpp:357

nnp::NeuralNetwork::getNumNeurons
int getNumNeurons() const
Return total number of neurons.
Definition NeuralNetwork.cpp:120

nnp::NeuralNetwork::biasOnlyOffset
int * biasOnlyOffset
Offset adress of biases per layer in bias only array.
Definition NeuralNetwork.h:423

nnp::NeuralNetwork::modifyConnections
void modifyConnections(ModificationScheme modificationScheme)
Change connections according to a given modification scheme.
Definition NeuralNetwork.cpp:212

nnp::NeuralNetwork::numLayers
int numLayers
Total number of layers (includes input and output layers).
Definition NeuralNetwork.h:415

nnp::NeuralNetwork::calculateDEdb
void calculateDEdb(double *dEdb) const
Calculate derivative of output neuron with respect to biases.
Definition NeuralNetwork.cpp:593

nnp::NeuralNetwork::getNumWeights
int getNumWeights() const
Return number of weights.
Definition NeuralNetwork.cpp:137

nnp::NeuralNetwork::setConnections
void setConnections(double const *const &connections)
Set neural network weights and biases.
Definition NeuralNetwork.cpp:147

nnp::NeuralNetwork::writeConnections
void writeConnections(std::ofstream &file) const
Write connections to file.
Definition NeuralNetwork.cpp:529

nnp::NeuralNetwork::normalizeNeurons
bool normalizeNeurons
If neurons are normalized.
Definition NeuralNetwork.h:407

nnp::NeuralNetwork::calculateDFdc
void calculateDFdc(double *dFdc, double const *const &dGdxyz) const
Calculate "second" derivative of output with respect to connections.
Definition NeuralNetwork.cpp:490

nnp::NeuralNetwork::propagateLayer
void propagateLayer(Layer &layer, Layer &layerPrev)
Propagate information from one layer to the next.
Definition NeuralNetwork.cpp:761

nnp::NeuralNetwork::allocateLayer
void allocateLayer(Layer &layer, int numNeuronsPrevLayer, int numNeurons, ActivationFunction activationFunction)
Allocate a single layer.
Definition NeuralNetwork.cpp:721

nnp::NeuralNetwork::weightOffset
int * weightOffset
Offset adress of weights per layer in combined weights+bias array.
Definition NeuralNetwork.h:419

nnp::NeuralNetwork::initializeConnectionsRandomUniform
void initializeConnectionsRandomUniform(unsigned int seed)
Initialize connections with random numbers.
Definition NeuralNetwork.cpp:195

nnp::NeuralNetwork::getMemoryUsage
long getMemoryUsage()
Definition NeuralNetwork.cpp:981

nnp::NeuralNetwork::~NeuralNetwork
~NeuralNetwork()
Definition NeuralNetwork.cpp:97

nnp::NeuralNetwork::biasOffset
int * biasOffset
Offset adress of biases per layer in combined weights+bias array.
Definition NeuralNetwork.h:421

nnp::NeuralNetwork::calculateD2EdGdc
void calculateD2EdGdc(int index, double const *const &dEdb, double *d2EdGdc) const
Calculate second derivative of output neuron with respect to input neuron and connections.
Definition NeuralNetwork.cpp:659

nnp::NeuralNetwork::getNeuronStatistics
void getNeuronStatistics(long *count, double *min, double *max, double *sum, double *sum2) const
Return gathered neuron statistics.
Definition NeuralNetwork.cpp:915

nnp::NeuralNetwork::numBiases
int numBiases
Number of NN biases only.
Definition NeuralNetwork.h:411

nnp::NeuralNetwork::resetNeuronStatistics
void resetNeuronStatistics()
Reset neuron statistics.
Definition NeuralNetwork.cpp:898

nnp::NeuralNetwork::ModificationScheme
ModificationScheme
List of available connection modification schemes.
Definition NeuralNetwork.h:60

nnp::NeuralNetwork::MS_ZEROOUTPUTWEIGHTS
@ MS_ZEROOUTPUTWEIGHTS
Set all weights connecting to the output layer to zero.
Definition NeuralNetwork.h:64

nnp::NeuralNetwork::MS_ZEROBIAS
@ MS_ZEROBIAS
Set all bias values to zero.
Definition NeuralNetwork.h:62

nnp::NeuralNetwork::MS_PRECONDITIONOUTPUT
@ MS_PRECONDITIONOUTPUT
Apply preconditioning to output layer connections.
Definition NeuralNetwork.h:112

nnp::NeuralNetwork::MS_FANIN
@ MS_FANIN
Normalize weights via number of neuron inputs (fan-in).
Definition NeuralNetwork.h:74

nnp::NeuralNetwork::MS_GLOROTBENGIO
@ MS_GLOROTBENGIO
Normalize connections according to Glorot and Bengio.
Definition NeuralNetwork.h:90

nnp::NeuralNetwork::MS_NGUYENWIDROW
@ MS_NGUYENWIDROW
Initialize connections according to Nguyen-Widrow scheme.
Definition NeuralNetwork.h:102

nnp::NeuralNetwork::getConnections
void getConnections(double *connections) const
Get neural network weights and biases.
Definition NeuralNetwork.cpp:171

nnp::NeuralNetwork::numConnections
int numConnections
Number of NN connections (weights + biases).
Definition NeuralNetwork.h:413

nnp::NeuralNetwork::propagate
void propagate()
Propagate input information through all layers.
Definition NeuralNetwork.cpp:386

nnp::NeuralNetwork::calculateDEdc
void calculateDEdc(double *dEdc) const
Calculate derivative of output neuron with respect to connections.
Definition NeuralNetwork.cpp:444

nnp::NeuralNetwork::setNormalizeNeurons
void setNormalizeNeurons(bool normalizeNeurons)
Turn on/off neuron normalization.
Definition NeuralNetwork.cpp:113

nnp::NeuralNetwork::getNumBiases
int getNumBiases() const
Return number of biases.
Definition NeuralNetwork.cpp:142

nnp::NeuralNetwork::calculateDEdG
void calculateDEdG(double *dEdG) const
Calculate derivative of output neuron with respect to input neurons.
Definition NeuralNetwork.cpp:396

nnp::NeuralNetwork::calculateDxdG
void calculateDxdG(int index) const
Calculate derivative of neuron values before activation function with respect to input neuron.
Definition NeuralNetwork.cpp:628

nnp::NeuralNetwork::layers
Layer * layers
Neural network layers.
Definition NeuralNetwork.h:429

nnp::NeuralNetwork::numWeights
int numWeights
Number of NN weights only.
Definition NeuralNetwork.h:409

nnp::NeuralNetwork::getOutput
void getOutput(double *output) const
Get neural network output layer node values.
Definition NeuralNetwork.cpp:376

nnp::NeuralNetwork::outputLayer
Layer * outputLayer
Pointer to output layer.
Definition NeuralNetwork.h:427

nnp::NeuralNetwork::NeuralNetwork
NeuralNetwork(int numLayers, int const *const &numNeuronsPerLayer, ActivationFunction const *const &activationFunctionsPerLayer)
Neural network class constructor.
Definition NeuralNetwork.cpp:31

nnp::NeuralNetwork::numHiddenLayers
int numHiddenLayers
Number of hidden layers.
Definition NeuralNetwork.h:417

nnp::NeuralNetwork::info
std::vector< std::string > info() const
Print neural network architecture.
Definition NeuralNetwork.cpp:996

nnp
Definition Atom.h:29

nnp::strpr
string strpr(const char *format,...)
String version of printf function.
Definition utility.cpp:90

nnp::createFileHeader
vector< string > createFileHeader(vector< string > const &title, vector< size_t > const &colSize, vector< string > const &colName, vector< string > const &colInfo, char const &commentChar)
Definition utility.cpp:111

nnp::activationFromString
NeuralNetwork::ActivationFunction activationFromString(std::string c)
Convert string to activation function.
Definition NeuralNetwork.cpp:1078

nnp::appendLinesToFile
void appendLinesToFile(ofstream &file, vector< string > const lines)
Append multiple lines of strings to open file stream.
Definition utility.cpp:225

nnp::NeuralNetwork::Layer
One neural network layer.
Definition NeuralNetwork.h:395

nnp::NeuralNetwork::Layer::numNeurons
int numNeurons
Number of neurons in this layer .
Definition NeuralNetwork.h:397

nnp::NeuralNetwork::Layer::neurons
Neuron * neurons
Array of neurons in this layer.
Definition NeuralNetwork.h:403

nnp::NeuralNetwork::Layer::activationFunction
ActivationFunction activationFunction
Common activation function for all neurons in this layer.
Definition NeuralNetwork.h:401

nnp::NeuralNetwork::Layer::numNeuronsPrevLayer
int numNeuronsPrevLayer
Number of neurons in previous layer .
Definition NeuralNetwork.h:399

nnp::NeuralNetwork::Neuron
A single neuron.
Definition NeuralNetwork.h:358

nnp::NeuralNetwork::Neuron::weights
double * weights
NN weights assigned to neuron.
Definition NeuralNetwork.h:390

nnp::NeuralNetwork::Neuron::bias
double bias
Bias value assigned to this neuron (if this is neuron  this bias value is ).
Definition NeuralNetwork.h:373

nnp::NeuralNetwork::Neuron::max
double max
Maximum neuron value over data set (neuron statistics).
Definition NeuralNetwork.h:381

nnp::NeuralNetwork::Neuron::sum
double sum
Sum of neuron values over data set (neuron statistics).
Definition NeuralNetwork.h:383

nnp::NeuralNetwork::Neuron::dxdG
double dxdG
Derivative of neuron value before application of activation function with respect to input layer neur...
Definition NeuralNetwork.h:377

nnp::NeuralNetwork::Neuron::value
double value
Neuron value.
Definition NeuralNetwork.h:364

nnp::NeuralNetwork::Neuron::count
long count
How often the value of this neuron has been evaluated.
Definition NeuralNetwork.h:360

nnp::NeuralNetwork::Neuron::d2fdx2
double d2fdx2
Second derivative of activation function with respect to its argument .
Definition NeuralNetwork.h:370

nnp::NeuralNetwork::Neuron::dfdx
double dfdx
Derivative of activation function with respect to its argument .
Definition NeuralNetwork.h:367

nnp::NeuralNetwork::Neuron::min
double min
Minimum neuron value over data set (neuron statistics).
Definition NeuralNetwork.h:379

nnp::NeuralNetwork::Neuron::x
double x
Neuron value before application of activation function.
Definition NeuralNetwork.h:362

nnp::NeuralNetwork::Neuron::sum2
double sum2
Sum of squared neuron values over data set (neuron statistics).
Definition NeuralNetwork.h:385

utility.h