From 5a0ff8364efc884ddbb91b5a174f797140c8effe Mon Sep 17 00:00:00 2001
From: Jaron Krogel <krogeljt@ornl.gov>
Date: Fri, 3 Jan 2020 15:40:42 -0500
Subject: [PATCH 01/12] add anisotropic ewald code

---
 src/QMCHamiltonians/EwaldRef.h   |   2 +-
 src/QMCHamiltonians/EwaldTools.h | 384 +++++++++++++++++++++++++++++++
 2 files changed, 385 insertions(+), 1 deletion(-)
 create mode 100644 src/QMCHamiltonians/EwaldTools.h
diff --git a/src/QMCHamiltonians/EwaldRef.h b/src/QMCHamiltonians/EwaldRef.h
index 393717f086..e94c8411ef 100644
--- a/src/QMCHamiltonians/EwaldRef.h
+++ b/src/QMCHamiltonians/EwaldRef.h
@@ -416,7 +416,7 @@ real_t ewaldEnergy(const RealMat& a, const PosArray& R, const ChargeArray& Q, re
 
 #pragma omp parallel for reduction(+ : ve)
     for(size_t n=0; n<Npairs; ++n)
-      ve += qq[n]*ewaldSum(rr[n],a,tol/qq[n]);
+      ve += qq[n]*ewaldSum(rr[n],a,tol/qq[n]/Npairs);
   }
 
   return ve;
diff --git a/src/QMCHamiltonians/EwaldTools.h b/src/QMCHamiltonians/EwaldTools.h
new file mode 100644
index 0000000000..c2f39ec50c
--- /dev/null
+++ b/src/QMCHamiltonians/EwaldTools.h
@@ -0,0 +1,384 @@
+//////////////////////////////////////////////////////////////////////////////////////
+// This file is distributed under the University of Illinois/NCSA Open Source License.
+// See LICENSE file in top directory for details.
+//
+// Copyright (c) 2019 QMCPACK developers.
+//
+// File developed by: Jaron T. Krogel, krogeljt@ornl.gov, Oak Ridge National Laboratory
+//
+// File created by: Jaron T. Krogel, krogeljt@ornl.gov, Oak Ridge National Laboratory
+//////////////////////////////////////////////////////////////////////////////////////
+
+
+#ifndef EWALD_TOOLS_H
+#define EWALD_TOOLS_H
+
+#include "QMCHamiltonians/EwaldRef.h"
+
+namespace qmcplusplus
+{
+
+  using namespace ewaldref;
+
+
+
+template<typename T>
+real_t anisotropicGridSum(T& function, IntVec& nmax, bool zero = true, real_t tol = 1e-11)
+{
+  real_t dv  = std::numeric_limits<real_t>::max();
+  real_t dva = std::numeric_limits<real_t>::max();
+  real_t v   = 0.0;
+  int_t im   = 0;
+  int_t jm   = 0;
+  int_t km   = 0;
+  IntVec iv;
+  // Add the value at the origin, if requested.
+  if (zero)
+  {
+    iv = 0;
+    v += function(iv);
+  }
+  // Sum over cubic surface shells until the tolerance is reached.
+  tol /= 3; // Tolerance is to be applied to each pair of surface planes separately
+  int_t nx = 0;
+  int_t ny = 0;
+  int_t nz = 0;
+  bool last_surface = false;
+  while(!last_surface)
+  {
+    // Add surface planes until none contribute.
+    // Directions are turned off selectively once they no longer contribute.
+    bool x_active = true;
+    bool y_active = true;
+    bool z_active = true;
+    int_t nx_added = 0;
+    int_t ny_added = 0;
+    int_t nz_added = 0;
+    while (x_active || y_active || z_active)
+    {
+      dv = 0.0;
+      // Sum over new surface planes perpendicular to the x direction.
+      if(x_active)
+      {
+        dva = 0.0;
+        im += 1;
+        for (int_t i : {-im, im})
+          for (int_t j = -jm; j < jm + 1; ++j)
+            for (int_t k = -km; k < km + 1; ++k)
+            {
+              iv[0]    = i;
+              iv[1]    = j;
+              iv[2]    = k;
+              real_t f = function(iv);
+              dv += f;
+              dva += std::abs(f);
+            }
+        nx_added++;
+        x_active = dva > tol; // Stop sum in x-direction when not contributing.
+      }
+      // Sum over new surface planes perpendicular to the y direction.
+      if(y_active)
+      {
+        dva = 0.0;
+        jm += 1;
+        for (int_t j : {-jm, jm})
+          for (int_t k = -km; k < km + 1; ++k)
+            for (int_t i = -im; i < im + 1; ++i)
+            {
+              iv[0]    = i;
+              iv[1]    = j;
+              iv[2]    = k;
+              real_t f = function(iv);
+              dv += f;
+              dva += std::abs(f);
+            }
+        ny_added++;
+        y_active = dva > tol; // Stop sum in y-direction when not contributing.
+      }
+      // Sum over new surface planes perpendicular to the z direction.
+      if(z_active)
+      {
+        dva = 0.0;
+        km += 1;
+        for (int_t k : {-km, km})
+          for (int_t i = -im; i < im + 1; ++i)
+            for (int_t j = -jm; j < jm + 1; ++j)
+            {
+              iv[0]    = i;
+              iv[1]    = j;
+              iv[2]    = k;
+              real_t f = function(iv);
+              dv += f;
+              dva += std::abs(f);
+            }
+        nz_added++;
+        z_active = dva > tol; // Stop sum in z-direction when not contributing.
+      }
+      v += dv;
+    }
+    nx += nx_added;
+    ny += ny_added;
+    nz += nz_added;
+    last_surface = nx_added==1 && ny_added==1 && nz_added==1;
+  }
+
+  nmax[0] = im;
+  nmax[1] = jm;
+  nmax[2] = km;
+
+  //real_t vref = gridSum(function,zero,tol);
+  //std::cout<<v<<" "<<vref<<" "<<v-vref<<std::endl;
+
+  return v;
+}
+
+
+template<typename T>
+real_t fixedGridSum(T& function, IntVec nmax, bool zero=true)
+{
+  real_t v = 0.0;
+  IntVec iv;
+  if(zero)
+  {
+    // Directly sum over the full space
+    for(int_t i = -nmax[0]; i < nmax[0] + 1; ++i)
+      for(int_t j = -nmax[1]; j < nmax[1] + 1; ++j)
+        for(int_t k = -nmax[2]; k < nmax[2] + 1; ++k)
+        {
+          iv[0] = i;
+          iv[1] = j;
+          iv[2] = k;
+          v += function(iv);
+        }
+  }
+  else
+  {
+    // Sum half spaces around zero in z
+    for(int_t k = 1; k < nmax[2] + 1; ++k)
+      for(int_t i = -nmax[0]; i < nmax[0] + 1; ++i)
+        for(int_t j = -nmax[1]; j < nmax[1] + 1; ++j)
+        {
+          iv[0] = i;
+          iv[1] = j;
+          iv[2] = k;
+          v += function(iv);
+          iv[2] = -k;
+          v += function(iv);
+        }
+    // Sum half planes around zero in y
+    iv[2] = 0;
+    for(int_t j = 1; j < nmax[1] + 1; ++j)
+      for(int_t i = -nmax[0]; i < nmax[0] + 1; ++i)
+        {
+          iv[0] = i;
+          iv[1] = j;
+          v += function(iv);
+          iv[1] = -j;
+          v += function(iv);
+        }
+    // Sum half lines around zero in x
+    iv[1] = 0;
+    for(int_t i = 1; i < nmax[0] + 1; ++i)
+    {
+      iv[0] = i;
+      v += function(iv);
+      iv[0] = -i;
+      v += function(iv);
+    }
+  }
+  return v;
+}
+
+
+
+class AnisotropicEwald
+{
+private:
+
+  RealMat A;
+  RealMat B;
+  ChargeArray Q;
+  real_t tol;
+
+  size_t N;
+  real_t volume;
+  real_t QQmax;
+
+  real_t kappa_madelung;
+  real_t rconst_madelung;
+  real_t kconst_madelung;
+  real_t kfactor_madelung;
+
+  real_t kappa_ewald;
+  real_t rconst_ewald;
+  real_t kconst_ewald;
+  real_t kfactor_ewald;
+
+  real_t madelung_constant;
+  real_t madelung_energy;
+
+  IntVec nmax_anisotropic;
+
+public:
+
+  AnisotropicEwald(const RealMat& A_in, const ChargeArray& Q_in, real_t tol_in = 1e-10,real_t kappa_in=-1.0)
+    : A(A_in), Q(Q_in), tol(tol_in), nmax_anisotropic(0)
+  {
+
+    // Reciprocal lattice vectors
+    B = 2 * M_PI * transpose(inverse(A));
+
+    // Set Ewald sum constants
+    volume = std::abs(det(A));
+    // Madelung constants
+    if(kappa_in<0.0)
+      kappa_madelung = getKappaMadelung(volume);
+    else
+      kappa_madelung = kappa_in;
+    rconst_madelung  = kappa_madelung;
+    kconst_madelung  = -1. / (4 * std::pow(kappa_madelung, 2));
+    kfactor_madelung = 4 * M_PI / volume;
+    // Ewald constants
+    if(kappa_in<0.0)
+      kappa_ewald = getKappaEwald(volume);
+    else
+      kappa_ewald = kappa_in;
+    rconst_ewald  = 1. / (std::sqrt(2.) * kappa_ewald);
+    kconst_ewald  = -std::pow(kappa_ewald, 2) / 2;
+    kfactor_ewald = 4 * M_PI / volume;
+
+    // Number of particles
+    N = Q.size();
+
+    // Find maximum self-interaction charge product
+    QQmax = 0.0;
+    for (size_t i = 0; i < N; ++i)
+      QQmax = std::max(std::abs(Q[i] * Q[i]), QQmax);
+
+    // Calculate and store Madelung energy
+    madelung_energy = madelungEnergy();
+  }
+
+
+  real_t madelungConstant()
+  {
+    // Set Madelung tolerance
+    real_t tol_madelung = tol * 2. / QQmax;
+
+    // Create real-/k-space fuctors for terms within the Madelung sums
+    RspaceMadelungTerm rfunc(A, rconst_madelung);
+    KspaceMadelungTerm kfunc(B, kconst_madelung, kfactor_madelung);
+    IntVec nmax;
+
+    // Compute the constant term
+    real_t cval = -M_PI / (std::pow(kappa_madelung, 2) * volume) - 2 * kappa_madelung / std::sqrt(M_PI);
+    // Compute the real-space sum (excludes zero)
+    real_t rval = anisotropicGridSum(rfunc, nmax, false, tol_madelung);
+    // Compute the k-space sum (excludes zero)
+    real_t kval = anisotropicGridSum(kfunc, nmax, false, tol_madelung);
+
+    // Sum all contributions to get the Madelung constant
+    real_t vm = cval + rval + kval;
+
+    return vm;
+  }
+
+
+  real_t madelungEnergy()
+  {
+    // Madelung energy for a single particle with charge 1
+    madelung_constant = madelungConstant();
+    
+    // Sum the Madelung self interaction for each particle
+    real_t me = 0.0;
+    for (size_t i = 0; i < N; ++i)
+      me += Q[i] * Q[i] * madelung_constant / 2;
+
+    return me;
+  }
+
+
+  void updateNmax(const IntVec& nmax)
+  {
+    for(size_t d: {0,1,2})
+      nmax_anisotropic[d] = std::max(nmax[d],nmax_anisotropic[d]);
+  }
+
+
+  IntVec getNmax()
+  {
+    return nmax_anisotropic;
+  }
+
+
+  real_t ewaldPairPotential(const RealVec& r, real_t tol_ewald)
+  {
+    // Create real-/k-space fuctors for terms within the Ewald pair potential sums
+    RspaceEwaldTerm rfunc(r, A, rconst_ewald);
+    KspaceEwaldTerm kfunc(r, B, kconst_ewald, kfactor_ewald);
+    IntVec nmax;
+
+    // Compute the constant term
+    real_t cval = -2 * M_PI * std::pow(kappa_ewald, 2) / volume;
+    // Compute the real-space sum (includes zero)
+    real_t rval = anisotropicGridSum(rfunc, nmax, true, tol_ewald);
+    updateNmax(nmax);
+    // Compute the k-space sum (excludes zero)
+    real_t kval = anisotropicGridSum(kfunc, nmax, false, tol_ewald);
+    updateNmax(nmax);
+
+    // Sum all contributions to get the Ewald pair interaction
+    real_t epp = cval + rval + kval;
+
+    return epp;
+  }
+
+
+  real_t ewaldEnergy(const PosArray& R)
+  {
+    real_t ee = madelung_energy;
+    size_t Npairs = (N*(N-1))/2;
+    for (size_t i = 0; i < N; ++i)
+      for (size_t j = 0; j < i; ++j)
+        ee += Q[i]*Q[j]*ewaldPairPotential(R[i]-R[j],tol/(Q[i]*Q[j])/Npairs);
+    return ee;
+  }
+
+
+  real_t fixedGridEwaldEnergy(const PosArray& R, const IntVec& nmax)
+  {
+    real_t ee = madelung_energy;
+    for (size_t i = 0; i < N; ++i)
+      for (size_t j = 0; j < i; ++j)
+      {
+        RealVec r = R[i]-R[j];
+
+        // Create real-/k-space fuctors for terms within the Ewald pair potential sums
+        RspaceEwaldTerm rfunc(r, A, rconst_ewald);
+        KspaceEwaldTerm kfunc(r, B, kconst_ewald, kfactor_ewald);
+    
+        // Compute the constant term
+        real_t cval = -2 * M_PI * std::pow(kappa_ewald, 2) / volume;
+        // Compute the real-space sum (includes zero)
+        real_t rval = fixedGridSum(rfunc, nmax, true);
+        // Compute the k-space sum (excludes zero)
+        real_t kval = fixedGridSum(kfunc, nmax, false);
+
+        // Sum all contributions to get the Ewald pair interaction
+        real_t epp = cval + rval + kval;
+
+        ee += Q[i]*Q[j]*epp;
+      }
+    return ee;
+  }
+
+
+  real_t fixedGridEwaldEnergy(const PosArray& R)
+  {
+    return fixedGridEwaldEnergy(R, nmax_anisotropic);
+  }
+};
+
+
+} // namespace qmcplusplus
+#endif

From 541583153fc7780cc0d4cee199c69fbc023624f8 Mon Sep 17 00:00:00 2001
From: Jaron Krogel <krogeljt@ornl.gov>
Date: Fri, 3 Jan 2020 15:56:33 -0500
Subject: [PATCH 02/12] remove commented code

---
 src/QMCHamiltonians/EwaldTools.h | 4 +---
 1 file changed, 1 insertion(+), 3 deletions(-)

diff --git a/src/QMCHamiltonians/EwaldTools.h b/src/QMCHamiltonians/EwaldTools.h
index c2f39ec50c..129dd8250d 100644
--- a/src/QMCHamiltonians/EwaldTools.h
+++ b/src/QMCHamiltonians/EwaldTools.h
@@ -122,13 +122,11 @@ real_t anisotropicGridSum(T& function, IntVec& nmax, bool zero = true, real_t to
     last_surface = nx_added==1 && ny_added==1 && nz_added==1;
   }
 
+  // Return dimensions of the converged anisotropic grid
   nmax[0] = im;
   nmax[1] = jm;
   nmax[2] = km;
 
-  //real_t vref = gridSum(function,zero,tol);
-  //std::cout<<v<<" "<<vref<<" "<<v-vref<<std::endl;
-
   return v;
 }
 

From 1c927f031f913f54abdddf6131c3950ad4b63301 Mon Sep 17 00:00:00 2001
From: Jaron Krogel <krogeljt@ornl.gov>
Date: Fri, 3 Jan 2020 16:00:24 -0500
Subject: [PATCH 03/12] fix typos in comments

---
 src/QMCHamiltonians/EwaldRef.h   | 4 ++--
 src/QMCHamiltonians/EwaldTools.h | 4 ++--
 2 files changed, 4 insertions(+), 4 deletions(-)

diff --git a/src/QMCHamiltonians/EwaldRef.h b/src/QMCHamiltonians/EwaldRef.h
index e94c8411ef..81bdf5194a 100644
--- a/src/QMCHamiltonians/EwaldRef.h
+++ b/src/QMCHamiltonians/EwaldRef.h
@@ -280,7 +280,7 @@ real_t madelungSum(const RealMat& a, real_t tol = 1e-10)
   real_t kconst  = -1. / (4 * std::pow(kconv, 2));
   real_t kfactor = 4 * M_PI / volume;
 
-  // Create real-/k-space fuctors for terms within the sums in formula 7
+  // Create real-/k-space functors for terms within the sums in formula 7
   RspaceMadelungTerm rfunc(a, rconst);
   KspaceMadelungTerm kfunc(b, kconst, kfactor);
 
@@ -340,7 +340,7 @@ real_t ewaldSum(const RealVec& r, const RealMat& a, real_t tol = 1e-10)
   real_t kconst  = -std::pow(kconv, 2) / 2;
   real_t kfactor = 4 * M_PI / volume;
 
-  // Create real-/k-space fuctors for terms within the sums in formula 6
+  // Create real-/k-space functors for terms within the sums in formula 6
   RspaceEwaldTerm rfunc(r, a, rconst);
   KspaceEwaldTerm kfunc(r, b, kconst, kfactor);
 
diff --git a/src/QMCHamiltonians/EwaldTools.h b/src/QMCHamiltonians/EwaldTools.h
index 129dd8250d..76c84f0950 100644
--- a/src/QMCHamiltonians/EwaldTools.h
+++ b/src/QMCHamiltonians/EwaldTools.h
@@ -263,7 +263,7 @@ class AnisotropicEwald
     // Set Madelung tolerance
     real_t tol_madelung = tol * 2. / QQmax;
 
-    // Create real-/k-space fuctors for terms within the Madelung sums
+    // Create real-/k-space functors for terms within the Madelung sums
     RspaceMadelungTerm rfunc(A, rconst_madelung);
     KspaceMadelungTerm kfunc(B, kconst_madelung, kfactor_madelung);
     IntVec nmax;
@@ -311,7 +311,7 @@ class AnisotropicEwald
 
   real_t ewaldPairPotential(const RealVec& r, real_t tol_ewald)
   {
-    // Create real-/k-space fuctors for terms within the Ewald pair potential sums
+    // Create real-/k-space functors for terms within the Ewald pair potential sums
     RspaceEwaldTerm rfunc(r, A, rconst_ewald);
     KspaceEwaldTerm kfunc(r, B, kconst_ewald, kfactor_ewald);
     IntVec nmax;

From fd926a2dfbeb51d7f0fc0e2d2a4158bc8cb217c1 Mon Sep 17 00:00:00 2001
From: Jaron Krogel <krogeljt@ornl.gov>
Date: Mon, 6 Jan 2020 10:51:42 -0500
Subject: [PATCH 04/12] add namespace, const, and light function docs

---
 src/QMCHamiltonians/EwaldTools.h | 23 ++++++++++++++++++++---
 1 file changed, 20 insertions(+), 3 deletions(-)

diff --git a/src/QMCHamiltonians/EwaldTools.h b/src/QMCHamiltonians/EwaldTools.h
index 76c84f0950..5691ba7782 100644
--- a/src/QMCHamiltonians/EwaldTools.h
+++ b/src/QMCHamiltonians/EwaldTools.h
@@ -17,11 +17,12 @@
 
 namespace qmcplusplus
 {
-
+namespace ewaldtools
+{
   using namespace ewaldref;
 
 
-
+/// Similar to ewaldref::gridSum but for adaptive anisotropic grids
 template<typename T>
 real_t anisotropicGridSum(T& function, IntVec& nmax, bool zero = true, real_t tol = 1e-11)
 {
@@ -131,6 +132,7 @@ real_t anisotropicGridSum(T& function, IntVec& nmax, bool zero = true, real_t to
 }
 
 
+/// Similar to ewaldref::gridSum, but for non-adaptive, fixed size grids
 template<typename T>
 real_t fixedGridSum(T& function, IntVec nmax, bool zero=true)
 {
@@ -189,6 +191,7 @@ real_t fixedGridSum(T& function, IntVec nmax, bool zero=true)
 
 
 
+/// General class to perform Ewald sums
 class AnisotropicEwald
 {
 private:
@@ -202,23 +205,28 @@ class AnisotropicEwald
   real_t volume;
   real_t QQmax;
 
+  // constants used in Madelung sums
   real_t kappa_madelung;
   real_t rconst_madelung;
   real_t kconst_madelung;
   real_t kfactor_madelung;
 
+  // constants used in Ewald sums
   real_t kappa_ewald;
   real_t rconst_ewald;
   real_t kconst_ewald;
   real_t kfactor_ewald;
 
+  // internally stored values
   real_t madelung_constant;
   real_t madelung_energy;
 
+  // maximum anisotropic grid found across all evaluations
   IntVec nmax_anisotropic;
 
 public:
 
+  /// Setup constant data, including Madelung sums
   AnisotropicEwald(const RealMat& A_in, const ChargeArray& Q_in, real_t tol_in = 1e-10,real_t kappa_in=-1.0)
     : A(A_in), Q(Q_in), tol(tol_in), nmax_anisotropic(0)
   {
@@ -258,7 +266,8 @@ class AnisotropicEwald
   }
 
 
-  real_t madelungConstant()
+  /// Calculate the Madelung constant
+  real_t madelungConstant() const
   {
     // Set Madelung tolerance
     real_t tol_madelung = tol * 2. / QQmax;
@@ -282,6 +291,7 @@ class AnisotropicEwald
   }
 
 
+  /// Calculate and store the Madelung energy
   real_t madelungEnergy()
   {
     // Madelung energy for a single particle with charge 1
@@ -296,6 +306,7 @@ class AnisotropicEwald
   }
 
 
+  /// Update the current maximum anisotropic grid dimensions
   void updateNmax(const IntVec& nmax)
   {
     for(size_t d: {0,1,2})
@@ -303,12 +314,14 @@ class AnisotropicEwald
   }
 
 
+  /// Return the current maximum anisotropic grid dimensions
   IntVec getNmax()
   {
     return nmax_anisotropic;
   }
 
 
+  /// Pair interaction
   real_t ewaldPairPotential(const RealVec& r, real_t tol_ewald)
   {
     // Create real-/k-space functors for terms within the Ewald pair potential sums
@@ -332,6 +345,7 @@ class AnisotropicEwald
   }
 
 
+  /// Total energy for all pairs using adaptive anisotropic grids
   real_t ewaldEnergy(const PosArray& R)
   {
     real_t ee = madelung_energy;
@@ -343,6 +357,7 @@ class AnisotropicEwald
   }
 
 
+  /// Total energy for all pairs using fixed anisotropic grid
   real_t fixedGridEwaldEnergy(const PosArray& R, const IntVec& nmax)
   {
     real_t ee = madelung_energy;
@@ -371,6 +386,7 @@ class AnisotropicEwald
   }
 
 
+  /// Total energy for all pairs using fixed maximum anisotropic grid
   real_t fixedGridEwaldEnergy(const PosArray& R)
   {
     return fixedGridEwaldEnergy(R, nmax_anisotropic);
@@ -378,5 +394,6 @@ class AnisotropicEwald
 };
 
 
+} // namespace ewaldtools
 } // namespace qmcplusplus
 #endif

From f9db5f409b5b7124a551b58f7cbafac551659a29 Mon Sep 17 00:00:00 2001
From: Jaron Krogel <krogeljt@ornl.gov>
Date: Mon, 6 Jan 2020 12:54:48 -0500
Subject: [PATCH 05/12] split off cpp file for EwaldRef

---
 src/QMCHamiltonians/CMakeLists.txt   |   1 +
 src/QMCHamiltonians/CoulombPBCAA.cpp |  37 ++++---
 src/QMCHamiltonians/CoulombPBCAA.h   |   3 +
 src/QMCHamiltonians/EwaldRef.cpp     | 153 +++++++++++++++++++++++++++
 src/QMCHamiltonians/EwaldRef.h       | 125 +---------------------
 src/QMCHamiltonians/EwaldTools.h     |  30 +++++-
 6 files changed, 214 insertions(+), 135 deletions(-)
 create mode 100644 src/QMCHamiltonians/EwaldRef.cpp

diff --git a/src/QMCHamiltonians/CMakeLists.txt b/src/QMCHamiltonians/CMakeLists.txt
index 40351678d6..845d7fb15e 100644
--- a/src/QMCHamiltonians/CMakeLists.txt
+++ b/src/QMCHamiltonians/CMakeLists.txt
@@ -66,6 +66,7 @@ IF(OHMMS_DIM MATCHES 3)
     ECPComponentBuilder.1.cpp
     ECPComponentBuilder.2.cpp
     ECPComponentBuilder_L2.cpp
+    EwaldRef.cpp
     )
 
 
diff --git a/src/QMCHamiltonians/CoulombPBCAA.cpp b/src/QMCHamiltonians/CoulombPBCAA.cpp
index ca584e8af2..a8ec5df845 100644
--- a/src/QMCHamiltonians/CoulombPBCAA.cpp
+++ b/src/QMCHamiltonians/CoulombPBCAA.cpp
@@ -14,7 +14,6 @@
 //////////////////////////////////////////////////////////////////////////////////////
 
 
-#include "EwaldRef.h"
 #include "QMCHamiltonians/CoulombPBCAA.h"
 #include "Particle/DistanceTableData.h"
 #include "Utilities/ProgressReportEngine.h"
@@ -22,6 +21,8 @@
 
 namespace qmcplusplus
 {
+
+
 CoulombPBCAA::CoulombPBCAA(ParticleSet& ref, bool active, bool computeForces)
     : ForceBase(ref, ref),
       AA(0),
@@ -48,23 +49,31 @@ CoulombPBCAA::CoulombPBCAA(ParticleSet& ref, bool active, bool computeForces)
     ref.turnOnPerParticleSK();
     update_source(ref);
   }
-  if (!is_active)
+
+
+  // Setup anistropic ewald
+  ewaldref::RealMat A;
+  ewaldref::PosArray R;
+  ewaldref::ChargeArray Q;
+
+  A = Ps.Lattice.R;
+
+  R.resize(NumCenters);
+  Q.resize(NumCenters);
+  for(int i=0;i<NumCenters;++i)
   {
-    update_source(ref);
+    R[i] = Ps.R[i];
+    Q[i] = Zat[i];
+  }
 
-    ewaldref::RealMat A;
-    ewaldref::PosArray R;
-    ewaldref::ChargeArray Q;
+  //ewaldtools::AnisotropicEwald ewald;
+  //ewald.initialize(A,Q);
 
-    A = Ps.Lattice.R;
 
-    R.resize(NumCenters);
-    Q.resize(NumCenters);
-    for(int i=0;i<NumCenters;++i)
-    {
-      R[i] = Ps.R[i];
-      Q[i] = Zat[i];
-    }
+  if (!is_active)
+  {
+    update_source(ref);
+
 
     RealType Vii_ref = ewaldref::ewaldEnergy(A,R,Q);
     RealType Vdiff_per_atom = std::abs(Value-Vii_ref)/NumCenters;
diff --git a/src/QMCHamiltonians/CoulombPBCAA.h b/src/QMCHamiltonians/CoulombPBCAA.h
index 966b404b31..d4c0545604 100644
--- a/src/QMCHamiltonians/CoulombPBCAA.h
+++ b/src/QMCHamiltonians/CoulombPBCAA.h
@@ -20,6 +20,7 @@
 #include "QMCHamiltonians/ForceBase.h"
 #include "LongRange/LRCoulombSingleton.h"
 #include "Particle/DistanceTableData.h"
+#include "QMCHamiltonians/EwaldRef.h"
 
 namespace qmcplusplus
 {
@@ -38,6 +39,8 @@ struct CoulombPBCAA : public OperatorBase, public ForceBase
 
   typedef DistanceTableData::RowContainer RowContainerType;
 
+  //ewaldtools::AnisotropicEwald ewald;
+
   // energy-optimized
   LRHandlerType* AA;
   GridType* myGrid;
diff --git a/src/QMCHamiltonians/EwaldRef.cpp b/src/QMCHamiltonians/EwaldRef.cpp
new file mode 100644
index 0000000000..8d529d2052
--- /dev/null
+++ b/src/QMCHamiltonians/EwaldRef.cpp
@@ -0,0 +1,153 @@
+//////////////////////////////////////////////////////////////////////////////////////
+// This file is distributed under the University of Illinois/NCSA Open Source License.
+// See LICENSE file in top directory for details.
+//
+// Copyright (c) 2019 QMCPACK developers.
+//
+// File developed by: Jaron T. Krogel, krogeljt@ornl.gov, Oak Ridge National Laboratory
+//
+// File created by: Jaron T. Krogel, krogeljt@ornl.gov, Oak Ridge National Laboratory
+//////////////////////////////////////////////////////////////////////////////////////
+
+
+#include "QMCHamiltonians/EwaldRef.h"
+
+
+namespace qmcplusplus
+{
+namespace ewaldref
+{
+
+
+real_t getKappaMadelung(real_t volume)
+{
+  real_t radius = std::pow(3. * volume / (4 * M_PI), 1. / 3);
+  return std::sqrt(M_PI) / radius;
+}
+
+
+real_t madelungSum(const RealMat& a, real_t tol)
+{
+  // Real-space cell volume
+  real_t volume = std::abs(det(a));
+  // k-space cell axes
+  RealMat b = 2 * M_PI * transpose(inverse(a));
+  // k-space cutoff (kappa)
+  real_t kconv = getKappaMadelung(volume);
+
+  // Set constants for real-/k-space Madelung functors
+  real_t rconst  = kconv;
+  real_t kconst  = -1. / (4 * std::pow(kconv, 2));
+  real_t kfactor = 4 * M_PI / volume;
+
+  // Create real-/k-space functors for terms within the sums in formula 7
+  RspaceMadelungTerm rfunc(a, rconst);
+  KspaceMadelungTerm kfunc(b, kconst, kfactor);
+
+  // Compute the constant term
+  real_t cval = -M_PI / (std::pow(kconv, 2) * volume) - 2 * kconv / std::sqrt(M_PI);
+  // Compute the real-space sum (excludes zero)
+  real_t rval = gridSum(rfunc, false, tol);
+  // Compute the k-space sum (excludes zero)
+  real_t kval = gridSum(kfunc, false, tol);
+
+  // Sum all contributions to get the Madelung constant
+  real_t ms = cval + rval + kval;
+
+  return ms;
+}
+
+
+real_t getKappaEwald(real_t volume)
+{
+  real_t radius = std::pow(3. * volume / (4 * M_PI), 1. / 3);
+  return radius / std::sqrt(2 * M_PI);
+}
+
+
+real_t ewaldSum(const RealVec& r, const RealMat& a, real_t tol)
+{
+  // Real-space cell volume
+  real_t volume = std::abs(det(a));
+  // k-space cell axes
+  RealMat b = 2 * M_PI * transpose(inverse(a));
+  // k-space cutoff (kappa)
+  real_t kconv = getKappaEwald(volume);
+
+  // Set constants for real-/k-space Ewald pair functors
+  real_t rconst  = 1. / (std::sqrt(2.) * kconv);
+  real_t kconst  = -std::pow(kconv, 2) / 2;
+  real_t kfactor = 4 * M_PI / volume;
+
+  // Create real-/k-space functors for terms within the sums in formula 6
+  RspaceEwaldTerm rfunc(r, a, rconst);
+  KspaceEwaldTerm kfunc(r, b, kconst, kfactor);
+
+  // Compute the constant term
+  real_t cval = -2 * M_PI * std::pow(kconv, 2) / volume;
+  // Compute the real-space sum (includes zero)
+  real_t rval = gridSum(rfunc, true, tol);
+  // Compute the k-space sum (excludes zero)
+  real_t kval = gridSum(kfunc, false, tol);
+
+  // Sum all contributions to get the Ewald pair interaction
+  real_t es = cval + rval + kval;
+
+  return es;
+}
+
+
+real_t ewaldEnergy(const RealMat& a, const PosArray& R, const ChargeArray& Q, real_t tol)
+{
+  // Timer for EwaldRef
+  ScopedTimer totalEwaldTimer(TimerManager.createTimer("EwaldRef"));
+
+  // Number of particles
+  const size_t N = R.size();
+
+  // Total Ewald potential energy
+  real_t ve = 0.0;
+
+  {
+    // Sum Madelung contributions
+    ScopedTimer totalMadelungTimer(TimerManager.createTimer("MadelungSum"));
+    // Maximum self-interaction charge product
+    real_t qqmax = 0.0;
+    for (size_t i = 0; i < N; ++i)
+      qqmax = std::max(std::abs(Q[i] * Q[i]), qqmax);
+
+    // Compute the Madelung term (Drummond 2008 formula 7)
+    real_t vm = madelungSum(a, tol * 2. / qqmax);
+
+    // Sum the Madelung self interaction for each particle
+    for (size_t i = 0; i < N; ++i)
+      ve += Q[i] * Q[i] * vm / 2;
+  }
+
+  {
+    // Sum the interaction terms for all particle pairs
+    ScopedTimer EwaldSumTimer(TimerManager.createTimer("EwaldSum"));
+
+    int_t Npairs = (N*(N-1))/2;
+
+    std::vector<real_t>  qq(Npairs);
+    for(size_t i=0,n=0; i<N; ++i)
+      for(size_t j=0; j<i; ++j,++n)
+        qq[n] = Q[i]*Q[j];
+
+    std::vector<RealVec> rr(Npairs);
+    for(size_t i=0,n=0; i<N; ++i)
+      for(size_t j=0; j<i; ++j,++n)
+        rr[n] = R[i]-R[j];
+
+#pragma omp parallel for reduction(+ : ve)
+    for(size_t n=0; n<Npairs; ++n)
+      ve += qq[n]*ewaldSum(rr[n],a,tol/qq[n]/Npairs);
+  }
+
+  return ve;
+}
+
+
+}
+}
diff --git a/src/QMCHamiltonians/EwaldRef.h b/src/QMCHamiltonians/EwaldRef.h
index 81bdf5194a..07a743e8d2 100644
--- a/src/QMCHamiltonians/EwaldRef.h
+++ b/src/QMCHamiltonians/EwaldRef.h
@@ -251,11 +251,7 @@ real_t gridSum(T& function, bool zero = true, real_t tol = 1e-11)
  *
  *  @param volume: Volume of the real space cell.
  */ 
-real_t getKappaMadelung(real_t volume)
-{
-  real_t radius = std::pow(3. * volume / (4 * M_PI), 1. / 3);
-  return std::sqrt(M_PI) / radius;
-}
+real_t getKappaMadelung(real_t volume);
 
 
 /** Compute the Madelung constant to a given tolerance
@@ -266,36 +262,7 @@ real_t getKappaMadelung(real_t volume)
  *
  *  @param tol: Tolerance for the Madelung constant in Ha.
  */
-real_t madelungSum(const RealMat& a, real_t tol = 1e-10)
-{
-  // Real-space cell volume
-  real_t volume = std::abs(det(a));
-  // k-space cell axes
-  RealMat b = 2 * M_PI * transpose(inverse(a));
-  // k-space cutoff (kappa)
-  real_t kconv = getKappaMadelung(volume);
-
-  // Set constants for real-/k-space Madelung functors
-  real_t rconst  = kconv;
-  real_t kconst  = -1. / (4 * std::pow(kconv, 2));
-  real_t kfactor = 4 * M_PI / volume;
-
-  // Create real-/k-space functors for terms within the sums in formula 7
-  RspaceMadelungTerm rfunc(a, rconst);
-  KspaceMadelungTerm kfunc(b, kconst, kfactor);
-
-  // Compute the constant term
-  real_t cval = -M_PI / (std::pow(kconv, 2) * volume) - 2 * kconv / std::sqrt(M_PI);
-  // Compute the real-space sum (excludes zero)
-  real_t rval = gridSum(rfunc, false, tol);
-  // Compute the k-space sum (excludes zero)
-  real_t kval = gridSum(kfunc, false, tol);
-
-  // Sum all contributions to get the Madelung constant
-  real_t ms = cval + rval + kval;
-
-  return ms;
-}
+real_t madelungSum(const RealMat& a, real_t tol = 1e-10);
 
 
 /** Find the optimal kappa for Ewald pair sums
@@ -309,11 +276,7 @@ real_t madelungSum(const RealMat& a, real_t tol = 1e-10)
  *
  *  @param volume: Volume of the real space cell.
  */ 
-real_t getKappaEwald(real_t volume)
-{
-  real_t radius = std::pow(3. * volume / (4 * M_PI), 1. / 3);
-  return radius / std::sqrt(2 * M_PI);
-}
+real_t getKappaEwald(real_t volume);
 
 
 /** Compute the Ewald interaction of a particle pair to a given tolerance
@@ -326,36 +289,7 @@ real_t getKappaEwald(real_t volume)
  *
  *  @param tol: Tolerance for the Ewald pair interaction in Ha.
  */
-real_t ewaldSum(const RealVec& r, const RealMat& a, real_t tol = 1e-10)
-{
-  // Real-space cell volume
-  real_t volume = std::abs(det(a));
-  // k-space cell axes
-  RealMat b = 2 * M_PI * transpose(inverse(a));
-  // k-space cutoff (kappa)
-  real_t kconv = getKappaEwald(volume);
-
-  // Set constants for real-/k-space Ewald pair functors
-  real_t rconst  = 1. / (std::sqrt(2.) * kconv);
-  real_t kconst  = -std::pow(kconv, 2) / 2;
-  real_t kfactor = 4 * M_PI / volume;
-
-  // Create real-/k-space functors for terms within the sums in formula 6
-  RspaceEwaldTerm rfunc(r, a, rconst);
-  KspaceEwaldTerm kfunc(r, b, kconst, kfactor);
-
-  // Compute the constant term
-  real_t cval = -2 * M_PI * std::pow(kconv, 2) / volume;
-  // Compute the real-space sum (includes zero)
-  real_t rval = gridSum(rfunc, true, tol);
-  // Compute the k-space sum (excludes zero)
-  real_t kval = gridSum(kfunc, false, tol);
-
-  // Sum all contributions to get the Ewald pair interaction
-  real_t es = cval + rval + kval;
-
-  return es;
-}
+real_t ewaldSum(const RealVec& r, const RealMat& a, real_t tol = 1e-10);
 
 
 /** Compute the total Ewald potential energy for a collection of charges
@@ -371,56 +305,7 @@ real_t ewaldSum(const RealVec& r, const RealMat& a, real_t tol = 1e-10)
  *
  *  @param tol: Tolerance for the total potential energy in Ha.
  */
-real_t ewaldEnergy(const RealMat& a, const PosArray& R, const ChargeArray& Q, real_t tol = 1e-10)
-{
-  // Timer for EwaldRef
-  ScopedTimer totalEwaldTimer(TimerManager.createTimer("EwaldRef"));
-
-  // Number of particles
-  const size_t N = R.size();
-
-  // Total Ewald potential energy
-  real_t ve = 0.0;
-
-  {
-    // Sum Madelung contributions
-    ScopedTimer totalMadelungTimer(TimerManager.createTimer("MadelungSum"));
-    // Maximum self-interaction charge product
-    real_t qqmax = 0.0;
-    for (size_t i = 0; i < N; ++i)
-      qqmax = std::max(std::abs(Q[i] * Q[i]), qqmax);
-
-    // Compute the Madelung term (Drummond 2008 formula 7)
-    real_t vm = madelungSum(a, tol * 2. / qqmax);
-
-    // Sum the Madelung self interaction for each particle
-    for (size_t i = 0; i < N; ++i)
-      ve += Q[i] * Q[i] * vm / 2;
-  }
-
-  {
-    // Sum the interaction terms for all particle pairs
-    ScopedTimer EwaldSumTimer(TimerManager.createTimer("EwaldSum"));
-
-    int_t Npairs = (N*(N-1))/2;
-
-    std::vector<real_t>  qq(Npairs);
-    for(size_t i=0,n=0; i<N; ++i)
-      for(size_t j=0; j<i; ++j,++n)
-        qq[n] = Q[i]*Q[j];
-
-    std::vector<RealVec> rr(Npairs);
-    for(size_t i=0,n=0; i<N; ++i)
-      for(size_t j=0; j<i; ++j,++n)
-        rr[n] = R[i]-R[j];
-
-#pragma omp parallel for reduction(+ : ve)
-    for(size_t n=0; n<Npairs; ++n)
-      ve += qq[n]*ewaldSum(rr[n],a,tol/qq[n]/Npairs);
-  }
-
-  return ve;
-}
+real_t ewaldEnergy(const RealMat& a, const PosArray& R, const ChargeArray& Q, real_t tol = 1e-10);
 
 } // namespace ewaldref
 } // namespace qmcplusplus
diff --git a/src/QMCHamiltonians/EwaldTools.h b/src/QMCHamiltonians/EwaldTools.h
index 5691ba7782..57ee1ac62c 100644
--- a/src/QMCHamiltonians/EwaldTools.h
+++ b/src/QMCHamiltonians/EwaldTools.h
@@ -19,7 +19,22 @@ namespace qmcplusplus
 {
 namespace ewaldtools
 {
-  using namespace ewaldref;
+
+  using ewaldref::int_t;
+  using ewaldref::real_t;
+  using ewaldref::IntVec;
+  using ewaldref::RealVec;
+  using ewaldref::RealMat;
+  using ewaldref::ChargeArray;
+  using ewaldref::PosArray;
+
+  using ewaldref::getKappaMadelung;
+  using ewaldref::getKappaEwald;
+
+  using ewaldref::RspaceMadelungTerm;
+  using ewaldref::KspaceMadelungTerm;
+  using ewaldref::RspaceEwaldTerm;
+  using ewaldref::KspaceEwaldTerm;
 
 
 /// Similar to ewaldref::gridSum but for adaptive anisotropic grids
@@ -226,11 +241,24 @@ class AnisotropicEwald
 
 public:
 
+  AnisotropicEwald() : nmax_anisotropic(0) { }
+
   /// Setup constant data, including Madelung sums
   AnisotropicEwald(const RealMat& A_in, const ChargeArray& Q_in, real_t tol_in = 1e-10,real_t kappa_in=-1.0)
     : A(A_in), Q(Q_in), tol(tol_in), nmax_anisotropic(0)
   {
 
+    initialize(A_in,Q_in,tol_in,kappa_in);
+  }
+
+
+  void initialize(const RealMat& A_in, const ChargeArray& Q_in, real_t tol_in = 1e-10,real_t kappa_in=-1.0)
+  {
+  
+    A = A_in;
+    Q = Q_in;
+    tol = tol_in;
+
     // Reciprocal lattice vectors
     B = 2 * M_PI * transpose(inverse(A));
 

From 8b06e0a40f4abcd4997535c4fdbb3556c597b068 Mon Sep 17 00:00:00 2001
From: Jaron Krogel <krogeljt@ornl.gov>
Date: Mon, 6 Jan 2020 16:46:31 -0500
Subject: [PATCH 06/12] comparing aniso and qmcpack ewald

---
 src/LongRange/LRCoulombSingleton.cpp |   8 +-
 src/QMCHamiltonians/CoulombPBCAA.cpp |  83 +++++++++-
 src/QMCHamiltonians/CoulombPBCAA.h   |   5 +-
 src/QMCHamiltonians/EwaldTools.h     | 232 ++++++++++++++++++++++++++-
 4 files changed, 309 insertions(+), 19 deletions(-)

diff --git a/src/LongRange/LRCoulombSingleton.cpp b/src/LongRange/LRCoulombSingleton.cpp
index f9adbea398..002c635efc 100644
--- a/src/LongRange/LRCoulombSingleton.cpp
+++ b/src/LongRange/LRCoulombSingleton.cpp
@@ -119,10 +119,10 @@ LRCoulombSingleton::LRHandlerType* LRCoulombSingleton::getHandler(ParticleSet& r
     }
     else //if(ref.LRBox.SuperCellEnum == SUPERCELL_BULK)
     {
-      app_log() << "\n  Creating CoulombHandler with the optimal breakup. " << std::endl;
-      CoulombHandler = new LRHandlerTemp<CoulombFunctor<mRealType>, LPQHIBasis>(ref);
-      //  app_log() << "\n  Creating CoulombHandler with the Ewald3D breakup. " << std::endl;
-      //  CoulombHandler= new EwaldHandler3D(ref);
+      //app_log() << "\n  Creating CoulombHandler with the optimal breakup. " << std::endl;
+      //CoulombHandler = new LRHandlerTemp<CoulombFunctor<mRealType>, LPQHIBasis>(ref);
+        app_log() << "\n  Creating CoulombHandler with the Ewald3D breakup. " << std::endl;
+        CoulombHandler= new EwaldHandler3D(ref);
       //  CoulombHandler = new LRHandlerSRCoulomb<CoulombFunctor<mRealType>, LPQHISRCoulombBasis>(ref);
     }
 //        else if(ref.LRBox.SuperCellEnum == SUPERCELL_SLAB)
diff --git a/src/QMCHamiltonians/CoulombPBCAA.cpp b/src/QMCHamiltonians/CoulombPBCAA.cpp
index a8ec5df845..7006e7befd 100644
--- a/src/QMCHamiltonians/CoulombPBCAA.cpp
+++ b/src/QMCHamiltonians/CoulombPBCAA.cpp
@@ -53,27 +53,76 @@ CoulombPBCAA::CoulombPBCAA(ParticleSet& ref, bool active, bool computeForces)
 
   // Setup anistropic ewald
   ewaldref::RealMat A;
-  ewaldref::PosArray R;
   ewaldref::ChargeArray Q;
 
   A = Ps.Lattice.R;
 
-  R.resize(NumCenters);
   Q.resize(NumCenters);
   for(int i=0;i<NumCenters;++i)
-  {
-    R[i] = Ps.R[i];
     Q[i] = Zat[i];
-  }
 
-  //ewaldtools::AnisotropicEwald ewald;
-  //ewald.initialize(A,Q);
 
+  ewald.initialize(A,Q);
+
+  //RealType qmcpack_kappa = AA->LR_kc;
+  RealType qmcpack_sigma = 0.4914267483;
+  RealType qmcpack_kappa = 1./(std::sqrt(2.0)*qmcpack_sigma);
+  ewaldtools::AnisotropicEwald ewald_qp(A,Q,1e-10,qmcpack_kappa);
+
+  //ewaldref::IntVec nmax = 0;
+  //ewald.setNmax(nmax);
 
   if (!is_active)
   {
     update_source(ref);
 
+    ewaldref::PosArray R;
+    R.resize(NumCenters);
+    for(int i=0;i<NumCenters;++i)
+      R[i] = Ps.R[i];
+    
+    RealType eE   = ewald.ewaldEnergy(R);
+    RealType eEf  = ewald.fixedGridEwaldEnergy(R);
+    RealType eEt  = ewald.ewaldEnergy(Ps.R);
+    RealType eEft = ewald.fixedGridEwaldEnergy(Ps.R);
+
+    RealType c  = ewald.ewaldEnergyConst();
+    RealType sr = ewald.ewaldEnergySR(Ps.R);
+    RealType lr = ewald.ewaldEnergyLR(Ps.R);
+
+    const DistanceTableData& dt(Ps.getDistTable(d_aa_ID));
+    RealType srdt = ewald.ewaldEnergySRDT(dt);
+    RealType lrdt = ewald.ewaldEnergyLRDT(dt);
+
+
+    //ewald_qp.madelungEnergy0();
+    RealType c_qp   = ewald_qp.ewaldEnergyConst();
+    RealType sr_qp  = ewald_qp.ewaldEnergySRDT(dt);
+    RealType lr_qp  = ewald_qp.ewaldEnergyLRDT(dt);
+    RealType sr0_qp = ewald_qp.ewaldEnergySR0DT(dt);
+
+    app_log()<<std::setprecision(14);
+    app_log()<<std::endl;
+    app_log()<<"   adaptive aniso ewald energy: "<<eE<<std::endl;
+    app_log()<<"   fixed aniso ewald energy   : "<<eEf<<std::endl;
+    app_log()<<"   adaptive aniso ewald energy: "<<eEt<<std::endl;
+    app_log()<<"   fixed aniso ewald energy   : "<<eEft<<std::endl;
+    app_log()<<"   ewald energy c+sr+lr       : "<<c+sr+lr<<std::endl;
+    app_log()<<"   ewald energy c+sr+lr dt    : "<<c+srdt+lrdt<<std::endl;
+    app_log()<<"   aniso ewald nmax           : "<<ewald.getNmax()<<std::endl;
+    app_log()<<std::setprecision(14);
+    app_log()<<std::endl;
+    app_log()<<"   qmcpack constant : "<<myConst<<std::endl;
+    app_log()<<"   ewald   constant : "<<c_qp<<std::endl;
+    app_log()<<"   qmcpack SR  : "<<evalSR(Ps)<<std::endl;
+    app_log()<<"   ewald   SR  : "<<sr_qp<<std::endl;
+    app_log()<<"   ewald   SR0 : "<<sr0_qp<<std::endl;
+    app_log()<<"   qmcpack LR  : "<<evalLR(Ps)<<std::endl;
+    app_log()<<"   ewald   LR  : "<<lr_qp<<std::endl;
+    app_log()<<"   qmcpack tot : "<<myConst+evalSR(Ps)+evalLR(Ps)<<std::endl;
+    app_log()<<"   ewald   tot : "<< c_qp+sr_qp+lr_qp <<std::endl;
+    app_log()<<"   ewald   tot0: "<< c_qp+sr0_qp+lr_qp <<std::endl;
+    app_log()<<std::endl;
 
     RealType Vii_ref = ewaldref::ewaldEnergy(A,R,Q);
     RealType Vdiff_per_atom = std::abs(Value-Vii_ref)/NumCenters;
@@ -103,6 +152,9 @@ CoulombPBCAA::CoulombPBCAA(ParticleSet& ref, bool active, bool computeForces)
     {
       app_log()<<"  Check passed."<<std::endl;
     }
+
+    APP_ABORT("explore")
+
   }
   prefix = "F_AA";
   app_log() << "  Maximum K shell " << AA->MaxKshell << std::endl;
@@ -171,14 +223,31 @@ void CoulombPBCAA::delete_particle_quantities()
 
 CoulombPBCAA::Return_t CoulombPBCAA::evaluate(ParticleSet& P)
 {
+  ScopedTimer evaltimer(TimerManager.createTimer("CoulombPBCAA_eval_total"));
+
   if (is_active)
   {
+    {
+    ScopedTimer evaltimer(TimerManager.createTimer("QMCPACK eval"));
+
 #if !defined(REMOVE_TRACEMANAGER)
     if (streaming_particles)
       Value = evaluate_sp(P);
     else
 #endif
       Value = evalLR(P) + evalSR(P) + myConst;
+    }
+
+    RealType eval;
+    {
+      ScopedTimer evaltimer(TimerManager.createTimer("Aniso eval"));
+      eval = ewald.fixedGridEwaldEnergy(P.R);
+    }
+
+    app_log()<<std::endl;
+    app_log()<<"  QMCPACK value: "<<Value<<std::endl;
+    app_log()<<"  Aniso   value: "<<eval<<std::endl;
+    app_log()<<std::endl;
   }
   return Value;
 }
diff --git a/src/QMCHamiltonians/CoulombPBCAA.h b/src/QMCHamiltonians/CoulombPBCAA.h
index d4c0545604..0c3cb4457a 100644
--- a/src/QMCHamiltonians/CoulombPBCAA.h
+++ b/src/QMCHamiltonians/CoulombPBCAA.h
@@ -20,7 +20,8 @@
 #include "QMCHamiltonians/ForceBase.h"
 #include "LongRange/LRCoulombSingleton.h"
 #include "Particle/DistanceTableData.h"
-#include "QMCHamiltonians/EwaldRef.h"
+//#include "QMCHamiltonians/EwaldRef.h"
+#include "QMCHamiltonians/EwaldTools.h"
 
 namespace qmcplusplus
 {
@@ -39,7 +40,7 @@ struct CoulombPBCAA : public OperatorBase, public ForceBase
 
   typedef DistanceTableData::RowContainer RowContainerType;
 
-  //ewaldtools::AnisotropicEwald ewald;
+  ewaldtools::AnisotropicEwald ewald;
 
   // energy-optimized
   LRHandlerType* AA;
diff --git a/src/QMCHamiltonians/EwaldTools.h b/src/QMCHamiltonians/EwaldTools.h
index 57ee1ac62c..a1b9c84da6 100644
--- a/src/QMCHamiltonians/EwaldTools.h
+++ b/src/QMCHamiltonians/EwaldTools.h
@@ -19,7 +19,6 @@ namespace qmcplusplus
 {
 namespace ewaldtools
 {
-
   using ewaldref::int_t;
   using ewaldref::real_t;
   using ewaldref::IntVec;
@@ -27,10 +26,8 @@ namespace ewaldtools
   using ewaldref::RealMat;
   using ewaldref::ChargeArray;
   using ewaldref::PosArray;
-
   using ewaldref::getKappaMadelung;
   using ewaldref::getKappaEwald;
-
   using ewaldref::RspaceMadelungTerm;
   using ewaldref::KspaceMadelungTerm;
   using ewaldref::RspaceEwaldTerm;
@@ -349,6 +346,13 @@ class AnisotropicEwald
   }
 
 
+  /// Set the maximum anisotropic grid dimensions
+  void setNmax(const IntVec& nmax)
+  {
+    nmax_anisotropic = nmax;
+  }
+
+
   /// Pair interaction
   real_t ewaldPairPotential(const RealVec& r, real_t tol_ewald)
   {
@@ -374,7 +378,8 @@ class AnisotropicEwald
 
 
   /// Total energy for all pairs using adaptive anisotropic grids
-  real_t ewaldEnergy(const PosArray& R)
+  template<typename PA>
+  real_t ewaldEnergy(const PA& R)
   {
     real_t ee = madelung_energy;
     size_t Npairs = (N*(N-1))/2;
@@ -386,7 +391,8 @@ class AnisotropicEwald
 
 
   /// Total energy for all pairs using fixed anisotropic grid
-  real_t fixedGridEwaldEnergy(const PosArray& R, const IntVec& nmax)
+  template<typename PA>
+  real_t fixedGridEwaldEnergy(const PA& R, const IntVec& nmax)
   {
     real_t ee = madelung_energy;
     for (size_t i = 0; i < N; ++i)
@@ -414,11 +420,225 @@ class AnisotropicEwald
   }
 
 
+  /// Total energy for all pairs using fixed anisotropic grid
+  template<typename PA>
+  real_t fixedGridEwaldEnergyOpt(const PA& R, const IntVec& nmax)
+  {
+    real_t ee = madelung_energy;
+    for (size_t i = 0; i < N; ++i)
+      for (size_t j = 0; j < i; ++j)
+      {
+        RealVec r = R[i]-R[j];
+
+        // Create real-/k-space fuctors for terms within the Ewald pair potential sums
+        RspaceEwaldTerm rfunc(r, A, rconst_ewald);
+        KspaceEwaldTerm kfunc(r, B, kconst_ewald, kfactor_ewald);
+    
+        // Compute the constant term
+        real_t cval = -2 * M_PI * std::pow(kappa_ewald, 2) / volume;
+        // Compute the real-space sum (includes zero)
+
+
+        //real_t R  = std::sqrt(dot(r, r));
+        //real_t rm = std::erfc(rconst_ewald * R) / R;
+        //real_t rm = std::exp(rconst_ewald * R) / R;
+        //real_t rval = rm;
+
+        //real_t rval = fixedGridSum(rfunc, nmax, true);
+
+        // Compute the k-space sum (excludes zero)
+        real_t kval = fixedGridSum(kfunc, nmax, false);
+
+        // Sum all contributions to get the Ewald pair interaction
+        //real_t epp = cval + rval + kval;
+        real_t epp = cval+kval;
+
+        ee += Q[i]*Q[j]*epp;
+      }
+    return ee;
+  }
+
+
   /// Total energy for all pairs using fixed maximum anisotropic grid
-  real_t fixedGridEwaldEnergy(const PosArray& R)
+  template<typename PA>
+  real_t fixedGridEwaldEnergy(const PA& R)
   {
     return fixedGridEwaldEnergy(R, nmax_anisotropic);
   }
+
+
+  real_t ewaldEnergyConst()
+  {
+    real_t ee = madelung_energy;
+    real_t cval = -2 * M_PI * std::pow(kappa_ewald, 2) / volume;
+    for (size_t i = 0; i < N; ++i)
+      for (size_t j = 0; j < i; ++j)
+        ee += Q[i]*Q[j]*cval;
+
+    std::cout<<"\nconstant breakdown:"<<std::endl;
+    std::cout<<"  madelung energy: "<<madelung_energy<<std::endl;
+    std::cout<<"  other constants: "<<ee-madelung_energy<<std::endl;
+    std::cout<<std::endl;
+
+    return ee;
+  }
+
+
+  template<typename PA>
+  real_t ewaldEnergySR(const PA& R)
+  {
+    real_t ee = 0.0;
+    size_t Npairs = (N*(N-1))/2;
+    IntVec nmax;
+    for (size_t i = 0; i < N; ++i)
+      for (size_t j = 0; j < i; ++j)
+      {
+        real_t tol_ewald = tol/(Q[i]*Q[j])/Npairs;
+        RspaceEwaldTerm rfunc(R[i]-R[j], A, rconst_ewald);
+        real_t rval = anisotropicGridSum(rfunc, nmax, true, tol_ewald);
+        ee += Q[i]*Q[j]*rval;
+      }
+    return ee;
+  }
+
+
+  template<typename PA>
+  real_t ewaldEnergyLR(const PA& R)
+  {
+    real_t ee = 0.0;
+    size_t Npairs = (N*(N-1))/2;
+    IntVec nmax;
+    for (size_t i = 0; i < N; ++i)
+      for (size_t j = 0; j < i; ++j)
+      {
+        real_t tol_ewald = tol/(Q[i]*Q[j])/Npairs;
+        KspaceEwaldTerm kfunc(R[i]-R[j], B, kconst_ewald, kfactor_ewald);
+        real_t kval = anisotropicGridSum(kfunc, nmax, false, tol_ewald);
+        ee += Q[i]*Q[j]*kval;
+      }
+    return ee;
+  }
+
+
+  template<typename PA>
+  real_t ewaldEnergySR0(const PA& R)
+  {
+    real_t ee = 0.0;
+    size_t Npairs = (N*(N-1))/2;
+    IntVec nmax;
+    for (size_t i = 0; i < N; ++i)
+      for (size_t j = 0; j < i; ++j)
+      {
+        real_t tol_ewald = tol/(Q[i]*Q[j])/Npairs;
+        RspaceEwaldTerm rfunc(R[i]-R[j], A, rconst_ewald);
+        IntVec iv = 0;
+        real_t rval = rfunc(iv);
+        ee += Q[i]*Q[j]*rval;
+      }
+    return ee;
+  }
+
+
+  template<typename DT>
+  real_t ewaldEnergySRDT(const DT& dt)
+  {
+    real_t ee = 0.0;
+    size_t Npairs = (N*(N-1))/2;
+    IntVec nmax;
+    for (size_t i = 0; i < N; ++i)
+      for (size_t j = 0; j < i; ++j)
+      {
+        real_t tol_ewald = tol/(Q[i]*Q[j])/Npairs;
+        RspaceEwaldTerm rfunc(dt.Displacements[i][j], A, rconst_ewald);
+        real_t rval = anisotropicGridSum(rfunc, nmax, true, tol_ewald);
+        ee += Q[i]*Q[j]*rval;
+      }
+    return ee;
+  }
+
+
+
+  template<typename DT>
+  real_t ewaldEnergyLRDT(const DT& dt)
+  {
+    real_t ee = 0.0;
+    size_t Npairs = (N*(N-1))/2;
+    IntVec nmax;
+    for (size_t i = 0; i < N; ++i)
+      for (size_t j = 0; j < i; ++j)
+      {
+        real_t tol_ewald = tol/(Q[i]*Q[j])/Npairs;
+        KspaceEwaldTerm kfunc(dt.Displacements[i][j], B, kconst_ewald, kfactor_ewald);
+        real_t kval = anisotropicGridSum(kfunc, nmax, false, tol_ewald);
+        ee += Q[i]*Q[j]*kval;
+      }
+    return ee;
+  }
+
+
+
+  template<typename DT>
+  real_t ewaldEnergySR0DT(const DT& dt)
+  {
+    real_t ee = 0.0;
+    size_t Npairs = (N*(N-1))/2;
+    IntVec nmax;
+    for (size_t i = 0; i < N; ++i)
+      for (size_t j = 0; j < i; ++j)
+      {
+        real_t tol_ewald = tol/(Q[i]*Q[j])/Npairs;
+        RspaceEwaldTerm rfunc(dt.Displacements[i][j], A, rconst_ewald);
+        IntVec iv = 0;
+        real_t rval = rfunc(iv);
+        ee += Q[i]*Q[j]*rval;
+      }
+    return ee;
+  }
+
+
+
+
+  /// Calculate the Madelung constant
+  real_t madelungConstant0() const
+  {
+    // Set Madelung tolerance
+    real_t tol_madelung = tol * 2. / QQmax;
+
+    // Create real-/k-space functors for terms within the Madelung sums
+    RspaceMadelungTerm rfunc(A, rconst_madelung);
+    KspaceMadelungTerm kfunc(B, kconst_madelung, kfactor_madelung);
+    IntVec nmax;
+
+    // Compute the constant term
+    real_t cval = -M_PI / (std::pow(kappa_madelung, 2) * volume) - 2 * kappa_madelung / std::sqrt(M_PI);
+    // Compute the real-space sum (excludes zero)
+    real_t rval = 0.0;
+    // Compute the k-space sum (excludes zero)
+    real_t kval = anisotropicGridSum(kfunc, nmax, false, tol_madelung);
+
+    // Sum all contributions to get the Madelung constant
+    real_t vm = cval + rval + kval;
+
+    return vm;
+  }
+
+
+  /// Calculate and store the Madelung energy
+  real_t madelungEnergy0()
+  {
+    // Madelung energy for a single particle with charge 1
+    madelung_constant = madelungConstant0();
+    
+    // Sum the Madelung self interaction for each particle
+    real_t me = 0.0;
+    for (size_t i = 0; i < N; ++i)
+      me += Q[i] * Q[i] * madelung_constant / 2;
+
+    return me;
+  }
+
+
+
 };
 
 

From 51a77f73553582f24df767776076e5704228cb5d Mon Sep 17 00:00:00 2001
From: Jaron Krogel <krogeljt@ornl.gov>
Date: Wed, 8 Jan 2020 11:58:16 -0500
Subject: [PATCH 07/12] start optimized ewald

---
 src/QMCHamiltonians/CoulombPBCAA.cpp | 51 +++++++++++++----
 src/QMCHamiltonians/EwaldTools.h     | 86 +++++++++++++++++-----------
 2 files changed, 91 insertions(+), 46 deletions(-)

diff --git a/src/QMCHamiltonians/CoulombPBCAA.cpp b/src/QMCHamiltonians/CoulombPBCAA.cpp
index 4b309a2c94..d6c606d9f1 100644
--- a/src/QMCHamiltonians/CoulombPBCAA.cpp
+++ b/src/QMCHamiltonians/CoulombPBCAA.cpp
@@ -62,15 +62,18 @@ CoulombPBCAA::CoulombPBCAA(ParticleSet& ref, bool active, bool computeForces)
     Q[i] = Zat[i];
 
 
-  ewald.initialize(A,Q);
 
   //RealType qmcpack_kappa = AA->LR_kc;
   RealType qmcpack_sigma = std::sqrt(AA->LR_kc / (2.0 * AA->LR_rc));
   RealType qmcpack_kappa = 1./(std::sqrt(2.0)*qmcpack_sigma);
   ewaldtools::AnisotropicEwald ewald_qp(A,Q,1e-10,qmcpack_kappa);
 
-  //ewaldref::IntVec nmax = 0;
-  //ewald.setNmax(nmax);
+  //ewald.initialize(A,Q);
+  ewald.initialize(A,Q,1e-10,qmcpack_kappa);
+
+
+  ewaldref::IntVec nmax = 20;
+  ewald.setNmax(nmax);
 
   if (!is_active)
   {
@@ -102,9 +105,11 @@ CoulombPBCAA::CoulombPBCAA(ParticleSet& ref, bool active, bool computeForces)
     //RealType lr_qp  = ewald_qp.ewaldEnergyLRDT(dt);
     //RealType sr0_qp = ewald_qp.ewaldEnergySR0DT(dt);
 
-    //RealType c_qmc = myConst;
-    //RealType sr_qmc = evalSR(Ps);
-    //RealType lr_qmc = evalLR(Ps);
+    RealType c_qmc = myConst;
+    RealType sr_qmc = evalSR(Ps);
+    RealType lr_qmc = evalLR(Ps);
+    RealType E_qmc  = c_qmc + sr_qmc + lr_qmc;
+
 
     app_log()<<std::setprecision(14);
     app_log()<<std::endl;
@@ -135,12 +140,29 @@ CoulombPBCAA::CoulombPBCAA(ParticleSet& ref, bool active, bool computeForces)
     app_log()<<"   aniso ewald nmax           : "<<ewald_qp.getNmax()<<std::endl;
     app_log()<<std::setprecision(14);
 
+    
     //ewaldtools::IntVec nmax = 20;
     //ewald.setupOpt(nmax);
-    ewald.setupOpt();
-    RealType lr_opt = ewald.ewaldEnergyLROpt(Ps.R);
-    app_log()<<"   ewald     LR  : "<<lr<<std::endl;
+
+    //auto& ewald_opt = ewald_qp;
+    auto& ewald_opt = ewald;
+
+    RealType c_ref  = ewald_opt.ewaldEnergyConst();
+    RealType sr_ref = ewald_opt.ewaldEnergySR(Ps.R);
+    RealType lr_ref = ewald_opt.ewaldEnergyLR(Ps.R);
+    //ewald_opt.setupOpt();
+    ewald_opt.setupOpt(nmax);
+    RealType c_opt  = ewald_opt.ewaldEnergyConst();
+    RealType sr_opt = ewald_opt.ewaldEnergySROpt(dt);
+    RealType lr_opt = ewald_opt.ewaldEnergyLROpt(Ps.R);
+    app_log()<<"   ewald opt energy           : "<<c_opt+sr_opt+lr_opt<<std::endl;
+    app_log()<<"   ewald opt energy2          : "<<ewald.ewaldEnergyOpt(Ps.R,dt)<<std::endl;
+    app_log()<<"   qmcpack   energy           : "<<E_qmc<<std::endl;
+    app_log()<<"   ewald     LR  : "<<lr_ref<<std::endl;
     app_log()<<"   ewald opt LR  : "<<lr_opt<<std::endl;
+    app_log()<<"   ewald     SR  : "<<sr_ref<<std::endl;
+    app_log()<<"   ewald opt SR  : "<<sr_opt<<std::endl;
+    app_log()<<"   qmcpack   SR  : "<<sr_qmc<<std::endl;
 
     app_log()<<std::endl;
     app_log()<<std::endl;
@@ -175,7 +197,7 @@ CoulombPBCAA::CoulombPBCAA(ParticleSet& ref, bool active, bool computeForces)
       app_log() << "  Check passed." << std::endl;
     }
 
-    APP_ABORT("explore")
+    //APP_ABORT("explore")
 
   }
   prefix = "F_AA";
@@ -247,6 +269,8 @@ CoulombPBCAA::Return_t CoulombPBCAA::evaluate(ParticleSet& P)
 {
   ScopedTimer evaltimer(TimerManager.createTimer("CoulombPBCAA_eval_total"));
 
+  const DistanceTableData& dt(P.getDistTable(d_aa_ID));
+
   if (is_active)
   {
     {
@@ -263,12 +287,17 @@ CoulombPBCAA::Return_t CoulombPBCAA::evaluate(ParticleSet& P)
     RealType eval;
     {
       ScopedTimer evaltimer(TimerManager.createTimer("Aniso eval"));
-      eval = ewald.fixedGridEwaldEnergy(P.R);
+      //eval = ewald.fixedGridEwaldEnergy(P.R);
+      eval = ewald.ewaldEnergyOpt(P.R,dt);
     }
 
     app_log()<<std::endl;
     app_log()<<"  QMCPACK value: "<<Value<<std::endl;
     app_log()<<"  Aniso   value: "<<eval<<std::endl;
+    app_log()<<"  QMCPACK    SR: "<<evalSR(P)<<std::endl;
+    app_log()<<"  Aniso      SR: "<<ewald.ewaldEnergySROpt(dt)<<std::endl;
+    app_log()<<"  QMCPACK    LR: "<<evalLR(P)+myConst<<std::endl;
+    app_log()<<"  Aniso      LR: "<<ewald.ewaldEnergyLROpt(P.R)<<std::endl;
     app_log()<<std::endl;
   }
   return Value;
diff --git a/src/QMCHamiltonians/EwaldTools.h b/src/QMCHamiltonians/EwaldTools.h
index ac2d09efad..92b4706278 100644
--- a/src/QMCHamiltonians/EwaldTools.h
+++ b/src/QMCHamiltonians/EwaldTools.h
@@ -203,6 +203,24 @@ real_t fixedGridSum(T& function, IntVec nmax, bool zero=true)
 
 
 
+/// Functor for short range part of e-e pair potential
+class RspaceEwaldPairPotential
+{
+private:
+  /// The constant 1/(\sqrt{2}\kappa) in Drummond 2008 formula 6
+  const real_t rexponent;
+
+public:
+  RspaceEwaldPairPotential(real_t rexponent_in) : rexponent(rexponent_in) {}
+
+  real_t operator()(const RealVec& r) const
+  {
+    real_t R  = std::sqrt(dot(r, r));
+    return std::erfc(rexponent * R) / R;
+  }
+};
+
+
 /// Functor for Fourier transform of long range part of e-e pair potential
 class KspaceEwaldPairPotential
 {
@@ -553,8 +571,31 @@ class AnisotropicEwald
     setupOpt(nmax_anisotropic);
   }
 
+
+  template<typename PA, typename DT>
+  real_t ewaldEnergyOpt(const PA& R, const DT& dt)
+  {
+    real_t Vc  = ewaldEnergyConst();
+    real_t Vsr = ewaldEnergySROpt(dt);
+    real_t Vlr = ewaldEnergyLROpt(R);
+    return Vc + Vsr + Vlr;
+  }
+
+
+  template<typename DT>
+  real_t ewaldEnergySROpt(const DT& dt)
+  {
+    const auto& dr = dt.getDisplacements();
+    real_t ee = 0.0;
+    RspaceEwaldPairPotential vsr(rexponent_ewald);
+    for (size_t i = 0; i < N; ++i)
+      for (size_t j = 0; j < i; ++j)
+        ee += Q[i]*Q[j]*vsr(dr[i][j]);
+    return ee;
+  }
+
   
- /// LR (k-space) part of total energy computed optimally
+  /// LR (k-space) part of total energy computed optimally
   template<typename PA>
   real_t ewaldEnergyLROpt(const PA& R)
   {
@@ -606,27 +647,23 @@ class AnisotropicEwald
 
 
 
-
-
-  template<typename PA>
-  real_t ewaldEnergySR0(const PA& R)
+  template<typename DT>
+  real_t ewaldEnergySR0(const DT& dt)
   {
+    const auto& dr = dt.getDisplacements();
     real_t ee = 0.0;
-    size_t Npairs = (N*(N-1))/2;
-    IntVec nmax;
+    RspaceEwaldPairPotential vsr(rexponent_ewald);
     for (size_t i = 0; i < N; ++i)
       for (size_t j = 0; j < i; ++j)
-      {
-        real_t tol_ewald = tol/(Q[i]*Q[j])/Npairs;
-        RspaceEwaldTerm rfunc(R[i]-R[j], A, rexponent_ewald);
-        IntVec iv = 0;
-        real_t rval = rfunc(iv);
-        ee += Q[i]*Q[j]*rval;
-      }
+        ee += Q[i]*Q[j]*vsr(dr[i][j]);
     return ee;
   }
 
 
+
+
+
+
   template<typename DT>
   real_t ewaldEnergySRDT(const DT& dt)
   {
@@ -667,27 +704,6 @@ class AnisotropicEwald
 
 
 
-  template<typename DT>
-  real_t ewaldEnergySR0DT(const DT& dt)
-  {
-    auto& dr = dt.getDisplacements();
-    real_t ee = 0.0;
-    size_t Npairs = (N*(N-1))/2;
-    IntVec nmax;
-    for (size_t i = 0; i < N; ++i)
-      for (size_t j = 0; j < i; ++j)
-      {
-        real_t tol_ewald = tol/(Q[i]*Q[j])/Npairs;
-        RspaceEwaldTerm rfunc(dr[i][j], A, rexponent_ewald);
-        IntVec iv = 0;
-        real_t rval = rfunc(iv);
-        ee += Q[i]*Q[j]*rval;
-      }
-    return ee;
-  }
-
-
-
 
 
 };

From 634e8c76f8b458579d9388680a6f0a4ef73649e2 Mon Sep 17 00:00:00 2001
From: Jaron Krogel <krogeljt@ornl.gov>
Date: Thu, 9 Jan 2020 09:42:01 -0500
Subject: [PATCH 08/12] cleanup state machine

---
 src/LongRange/StructFact.cpp         |   2 +
 src/QMCHamiltonians/CoulombPBCAA.cpp | 257 ++++++++++++++++----------
 src/QMCHamiltonians/EwaldTools.h     | 265 +++++++++++++++++++++------
 3 files changed, 366 insertions(+), 158 deletions(-)

diff --git a/src/LongRange/StructFact.cpp b/src/LongRange/StructFact.cpp
index b9a14854e7..9332845768 100644
--- a/src/LongRange/StructFact.cpp
+++ b/src/LongRange/StructFact.cpp
@@ -76,6 +76,8 @@ void StructFact::UpdateAllPart(ParticleSet& P) { FillRhok(P); }
  */
 void StructFact::FillRhok(ParticleSet& P)
 {
+  ScopedTimer rhoktimer(TimerManager.createTimer("StructFact::FillRhok"));
+
   int npart = P.getTotalNum();
 #if defined(USE_REAL_STRUCT_FACTOR)
   rhok_r = 0.0;
diff --git a/src/QMCHamiltonians/CoulombPBCAA.cpp b/src/QMCHamiltonians/CoulombPBCAA.cpp
index d6c606d9f1..43c96d5278 100644
--- a/src/QMCHamiltonians/CoulombPBCAA.cpp
+++ b/src/QMCHamiltonians/CoulombPBCAA.cpp
@@ -72,8 +72,9 @@ CoulombPBCAA::CoulombPBCAA(ParticleSet& ref, bool active, bool computeForces)
   ewald.initialize(A,Q,1e-10,qmcpack_kappa);
 
 
-  ewaldref::IntVec nmax = 20;
-  ewald.setNmax(nmax);
+  ewaldref::IntVec nmax = 7;
+  //ewald.setNmax(nmax);
+  ewald.setupOpt(nmax);
 
   if (!is_active)
   {
@@ -84,88 +85,88 @@ CoulombPBCAA::CoulombPBCAA(ParticleSet& ref, bool active, bool computeForces)
     for(int i=0;i<NumCenters;++i)
       R[i] = Ps.R[i];
     
-    RealType eE   = ewald.ewaldEnergy(R);
-    RealType eEf  = ewald.fixedGridEwaldEnergy(R);
-    //RealType eEt  = ewald.ewaldEnergy(Ps.R);
-    //RealType eEft = ewald.fixedGridEwaldEnergy(Ps.R);
-
-    RealType c  = ewald.ewaldEnergyConst();
-    RealType sr = ewald.ewaldEnergySR(Ps.R);
-    RealType lr = ewald.ewaldEnergyLR(Ps.R);
-
-    const DistanceTableData& dt(Ps.getDistTable(d_aa_ID));
-    //RealType srdt = ewald.ewaldEnergySRDT(dt);
-    //RealType lrdt = ewald.ewaldEnergyLRDT(dt);
-
-
-    //ewald_qp.madelungEnergy0();
-    RealType eE_qp = ewald_qp.ewaldEnergy(Ps.R);
-    //RealType c_qp   = ewald_qp.ewaldEnergyConst();
-    //RealType sr_qp  = ewald_qp.ewaldEnergySRDT(dt);
-    //RealType lr_qp  = ewald_qp.ewaldEnergyLRDT(dt);
-    //RealType sr0_qp = ewald_qp.ewaldEnergySR0DT(dt);
-
-    RealType c_qmc = myConst;
-    RealType sr_qmc = evalSR(Ps);
-    RealType lr_qmc = evalLR(Ps);
-    RealType E_qmc  = c_qmc + sr_qmc + lr_qmc;
-
-
-    app_log()<<std::setprecision(14);
-    app_log()<<std::endl;
-    app_log()<<"   adaptive aniso ewald energy: "<<eE<<std::endl;
-    app_log()<<"   fixed aniso ewald energy   : "<<eEf<<std::endl;
-
-    //app_log()<<"   adaptive aniso ewald energy: "<<eEt<<std::endl;
-    //app_log()<<"   fixed aniso ewald energy   : "<<eEft<<std::endl;
-    app_log()<<"   ewald energy c+sr+lr       : "<<c+sr+lr<<std::endl;
-    //app_log()<<"   ewald energy c+sr+lr dt    : "<<c+srdt+lrdt<<std::endl;
-    app_log()<<"   aniso ewald nmax           : "<<ewald.getNmax()<<std::endl;
-    app_log()<<std::setprecision(14);
-    //app_log()<<"   qmcpack constant : "<<c_qmc<<std::endl;
-    //app_log()<<"   ewald   constant : "<<c_qp<<std::endl;
-    //app_log()<<"   qmcpack SR  : "<<sr_qmc<<std::endl;
-    //app_log()<<"   ewald   SR  : "<<sr_qp<<std::endl;
-    //app_log()<<"   ewald   SR0 : "<<sr0_qp<<std::endl;
-    //app_log()<<"   qmcpack LR  : "<<lr_qmc<<std::endl;
-    //app_log()<<"   ewald   LR  : "<<lr_qp<<std::endl;
-    //app_log()<<"   qmcpack tot : "<<c_qmc+sr_qmc+lr_qmc<<std::endl;
-    //app_log()<<"   ewald   tot : "<< c_qp+sr_qp+lr_qp <<std::endl;
-    //app_log()<<"   ewald   tot0: "<< c_qp+sr0_qp+lr_qp <<std::endl;
+    //RealType eE   = ewald.ewaldEnergy(R);
+    //RealType eEf  = ewald.fixedGridEwaldEnergy(R);
+    ////RealType eEt  = ewald.ewaldEnergy(Ps.R);
+    ////RealType eEft = ewald.fixedGridEwaldEnergy(Ps.R);
+    //
+    //RealType c  = ewald.ewaldEnergyConst();
+    //RealType sr = ewald.ewaldEnergySR(Ps.R);
+    //RealType lr = ewald.ewaldEnergyLR(Ps.R);
+    //
+    //const DistanceTableData& dt(Ps.getDistTable(d_aa_ID));
+    ////RealType srdt = ewald.ewaldEnergySRDT(dt);
+    ////RealType lrdt = ewald.ewaldEnergyLRDT(dt);
+    //
+    //
+    ////ewald_qp.madelungEnergy0();
+    //RealType eE_qp = ewald_qp.ewaldEnergy(Ps.R);
+    ////RealType c_qp   = ewald_qp.ewaldEnergyConst();
+    ////RealType sr_qp  = ewald_qp.ewaldEnergySRDT(dt);
+    ////RealType lr_qp  = ewald_qp.ewaldEnergyLRDT(dt);
+    ////RealType sr0_qp = ewald_qp.ewaldEnergySR0DT(dt);
+    //
+    //RealType c_qmc = myConst;
+    //RealType sr_qmc = evalSR(Ps);
+    //RealType lr_qmc = evalLR(Ps);
+    //RealType E_qmc  = c_qmc + sr_qmc + lr_qmc;
+    //
+    //
+    //app_log()<<std::setprecision(14);
+    //app_log()<<std::endl;
+    //app_log()<<"   adaptive aniso ewald energy: "<<eE<<std::endl;
+    //app_log()<<"   fixed aniso ewald energy   : "<<eEf<<std::endl;
+    //
+    ////app_log()<<"   adaptive aniso ewald energy: "<<eEt<<std::endl;
+    ////app_log()<<"   fixed aniso ewald energy   : "<<eEft<<std::endl;
+    //app_log()<<"   ewald energy c+sr+lr       : "<<c+sr+lr<<std::endl;
+    ////app_log()<<"   ewald energy c+sr+lr dt    : "<<c+srdt+lrdt<<std::endl;
+    //app_log()<<"   aniso ewald nmax           : "<<ewald.getNmax()<<std::endl;
+    //app_log()<<std::setprecision(14);
+    ////app_log()<<"   qmcpack constant : "<<c_qmc<<std::endl;
+    ////app_log()<<"   ewald   constant : "<<c_qp<<std::endl;
+    ////app_log()<<"   qmcpack SR  : "<<sr_qmc<<std::endl;
+    ////app_log()<<"   ewald   SR  : "<<sr_qp<<std::endl;
+    ////app_log()<<"   ewald   SR0 : "<<sr0_qp<<std::endl;
+    ////app_log()<<"   qmcpack LR  : "<<lr_qmc<<std::endl;
+    ////app_log()<<"   ewald   LR  : "<<lr_qp<<std::endl;
+    ////app_log()<<"   qmcpack tot : "<<c_qmc+sr_qmc+lr_qmc<<std::endl;
+    ////app_log()<<"   ewald   tot : "<< c_qp+sr_qp+lr_qp <<std::endl;
+    ////app_log()<<"   ewald   tot0: "<< c_qp+sr0_qp+lr_qp <<std::endl;
+    ////app_log()<<std::endl;
+    ////app_log()<<"   SR error    : "<<sr_qmc-sr_qp<<std::endl;
+    ////app_log()<<"   tot error   : "<<c_qmc+sr_qmc+lr_qmc-c_qp-sr_qp-lr_qp<<std::endl;
+    ////app_log()<<std::endl;
+    //app_log()<<"   ewald_qp aniso energy      : "<<eE<<std::endl;
+    //app_log()<<"   aniso ewald nmax           : "<<ewald_qp.getNmax()<<std::endl;
+    //app_log()<<std::setprecision(14);
+    //
+    //
+    ////ewaldtools::IntVec nmax = 20;
+    ////ewald.setupOpt(nmax);
+    //
+    ////auto& ewald_opt = ewald_qp;
+    //auto& ewald_opt = ewald;
+    //
+    //RealType c_ref  = ewald_opt.ewaldEnergyConst();
+    //RealType sr_ref = ewald_opt.ewaldEnergySR(Ps.R);
+    //RealType lr_ref = ewald_opt.ewaldEnergyLR(Ps.R);
+    ////ewald_opt.setupOpt();
+    //ewald_opt.setupOpt(nmax);
+    //RealType c_opt  = ewald_opt.ewaldEnergyConst();
+    //RealType sr_opt = ewald_opt.ewaldEnergySROpt(dt);
+    //RealType lr_opt = ewald_opt.ewaldEnergyLROpt(Ps.R);
+    //app_log()<<"   ewald opt energy           : "<<c_opt+sr_opt+lr_opt<<std::endl;
+    //app_log()<<"   ewald opt energy2          : "<<ewald.ewaldEnergyOpt(Ps.R,dt)<<std::endl;
+    //app_log()<<"   qmcpack   energy           : "<<E_qmc<<std::endl;
+    //app_log()<<"   ewald     LR  : "<<lr_ref<<std::endl;
+    //app_log()<<"   ewald opt LR  : "<<lr_opt<<std::endl;
+    //app_log()<<"   ewald     SR  : "<<sr_ref<<std::endl;
+    //app_log()<<"   ewald opt SR  : "<<sr_opt<<std::endl;
+    //app_log()<<"   qmcpack   SR  : "<<sr_qmc<<std::endl;
+    //
     //app_log()<<std::endl;
-    //app_log()<<"   SR error    : "<<sr_qmc-sr_qp<<std::endl;
-    //app_log()<<"   tot error   : "<<c_qmc+sr_qmc+lr_qmc-c_qp-sr_qp-lr_qp<<std::endl;
     //app_log()<<std::endl;
-    app_log()<<"   ewald_qp aniso energy      : "<<eE<<std::endl;
-    app_log()<<"   aniso ewald nmax           : "<<ewald_qp.getNmax()<<std::endl;
-    app_log()<<std::setprecision(14);
-
-    
-    //ewaldtools::IntVec nmax = 20;
-    //ewald.setupOpt(nmax);
-
-    //auto& ewald_opt = ewald_qp;
-    auto& ewald_opt = ewald;
-
-    RealType c_ref  = ewald_opt.ewaldEnergyConst();
-    RealType sr_ref = ewald_opt.ewaldEnergySR(Ps.R);
-    RealType lr_ref = ewald_opt.ewaldEnergyLR(Ps.R);
-    //ewald_opt.setupOpt();
-    ewald_opt.setupOpt(nmax);
-    RealType c_opt  = ewald_opt.ewaldEnergyConst();
-    RealType sr_opt = ewald_opt.ewaldEnergySROpt(dt);
-    RealType lr_opt = ewald_opt.ewaldEnergyLROpt(Ps.R);
-    app_log()<<"   ewald opt energy           : "<<c_opt+sr_opt+lr_opt<<std::endl;
-    app_log()<<"   ewald opt energy2          : "<<ewald.ewaldEnergyOpt(Ps.R,dt)<<std::endl;
-    app_log()<<"   qmcpack   energy           : "<<E_qmc<<std::endl;
-    app_log()<<"   ewald     LR  : "<<lr_ref<<std::endl;
-    app_log()<<"   ewald opt LR  : "<<lr_opt<<std::endl;
-    app_log()<<"   ewald     SR  : "<<sr_ref<<std::endl;
-    app_log()<<"   ewald opt SR  : "<<sr_opt<<std::endl;
-    app_log()<<"   qmcpack   SR  : "<<sr_qmc<<std::endl;
-
-    app_log()<<std::endl;
-    app_log()<<std::endl;
 
     RealType Vii_ref        = ewaldref::ewaldEnergy(A, R, Q);
     RealType Vdiff_per_atom = std::abs(Value - Vii_ref) / NumCenters;
@@ -273,32 +274,90 @@ CoulombPBCAA::Return_t CoulombPBCAA::evaluate(ParticleSet& P)
 
   if (is_active)
   {
-    {
-    ScopedTimer evaltimer(TimerManager.createTimer("QMCPACK eval"));
+//    {
+//    ScopedTimer evaltimer(TimerManager.createTimer("QMCPACK eval"));
+//
+//#if !defined(REMOVE_TRACEMANAGER)
+//    if (streaming_particles)
+//      Value = evaluate_sp(P);
+//    else
+//#endif
+//      Value = evalLR(P) + evalSR(P) + myConst;
+//    }
+//
+//    RealType eval;
+//    {
+//      ScopedTimer evaltimer(TimerManager.createTimer("Aniso eval"));
+//      //eval = ewald.fixedGridEwaldEnergy(P.R);
+//      eval = ewald.ewaldEnergyOpt(P.R,dt);
+//    }
 
-#if !defined(REMOVE_TRACEMANAGER)
-    if (streaming_particles)
-      Value = evaluate_sp(P);
-    else
-#endif
-      Value = evalLR(P) + evalSR(P) + myConst;
+
+    {
+      ScopedTimer evaltimer(TimerManager.createTimer("QMCPACK eval"));
+      RealType sr_qmc;
+      RealType lr_qmc;
+      {
+        ScopedTimer evaltimer(TimerManager.createTimer("SR qmc"));
+        sr_qmc = evalSR(P);
+      }
+      {
+        ScopedTimer evaltimer(TimerManager.createTimer("LR qmc"));
+        lr_qmc = evalLR(P);
+      }
+      Value = lr_qmc + sr_qmc + myConst;
     }
 
-    RealType eval;
+    RealType E_opt;
+    RealType c_opt;
+    RealType sr_opt;
+    RealType lr_opt;
     {
       ScopedTimer evaltimer(TimerManager.createTimer("Aniso eval"));
-      //eval = ewald.fixedGridEwaldEnergy(P.R);
-      eval = ewald.ewaldEnergyOpt(P.R,dt);
+      c_opt = ewald.ewaldEnergyConst();
+      {
+        ScopedTimer evaltimer(TimerManager.createTimer("SR opt"));
+        sr_opt = ewald.ewaldEnergySROpt(dt);
+      }
+      {
+        ScopedTimer evaltimer(TimerManager.createTimer("LR opt"));
+        lr_opt = ewald.ewaldEnergyLROpt(P.R);
+      }
     }
+    E_opt = lr_opt + sr_opt + c_opt;
+
+
+    RealType sr_opt_orig = ewald.ewaldEnergySROpt_orig(dt);
+    RealType lr_opt_orig = ewald.ewaldEnergyLROpt_orig(P.R);
+    RealType lr_opt_qmc  = ewald.ewaldEnergyLROpt_qmcpack(P.R);
+
+    RealType E_opt2 = c_opt + sr_opt_orig + lr_opt_orig;
+    RealType E_opt3 = c_opt + sr_opt_orig + lr_opt_qmc;
+
+    //RealType E_ref  = ewald.ewaldEnergy(P.R);
+
+    //RealType c_ref  = ewald.ewaldEnergyConst();
+    //RealType sr_ref = ewald.ewaldEnergySR(P.R);
+    //RealType lr_ref = ewald.ewaldEnergyLR(P.R);
+    //
+    //RealType sr_opt = ewald.ewaldEnergySROpt(dt);
+    //RealType lr_opt = ewald.ewaldEnergyLROpt(P.R);
 
     app_log()<<std::endl;
-    app_log()<<"  QMCPACK value: "<<Value<<std::endl;
-    app_log()<<"  Aniso   value: "<<eval<<std::endl;
-    app_log()<<"  QMCPACK    SR: "<<evalSR(P)<<std::endl;
-    app_log()<<"  Aniso      SR: "<<ewald.ewaldEnergySROpt(dt)<<std::endl;
-    app_log()<<"  QMCPACK    LR: "<<evalLR(P)+myConst<<std::endl;
-    app_log()<<"  Aniso      LR: "<<ewald.ewaldEnergyLROpt(P.R)<<std::endl;
+    app_log()<<"  QMCPACK    value: "<<Value<<std::endl;
+    //app_log()<<"  Aniso ref  value: "<<E_ref<<std::endl;
+    //app_log()<<"  Aniso ref  value: "<<c_ref+sr_ref+lr_ref<<std::endl;
+    app_log()<<"  Aniso opt  value: "<<E_opt<<std::endl;
+    app_log()<<"  Aniso opt2 value: "<<E_opt2<<std::endl;
+    app_log()<<"  Aniso opt3 value: "<<E_opt3<<std::endl;
+    //app_log()<<"  QMCPACK       SR: "<<evalSR(P)<<std::endl;
+    //app_log()<<"  Aniso     ref SR: "<<sr_ref<<std::endl;
+    //app_log()<<"  Aniso     opt SR: "<<sr_opt<<std::endl;
+    //app_log()<<"  QMCPACK       LR: "<<evalLR(P)+myConst<<std::endl;
+    //app_log()<<"  Aniso     ref LR: "<<lr_ref+c_ref<<std::endl;
+    //app_log()<<"  Aniso     opt LR: "<<lr_opt+c_ref<<std::endl;
     app_log()<<std::endl;
+
   }
   return Value;
 }
diff --git a/src/QMCHamiltonians/EwaldTools.h b/src/QMCHamiltonians/EwaldTools.h
index 92b4706278..20816b5ccd 100644
--- a/src/QMCHamiltonians/EwaldTools.h
+++ b/src/QMCHamiltonians/EwaldTools.h
@@ -244,12 +244,56 @@ class KspaceEwaldPairPotential
 
 
 
+template<typename M>
+RealVec wignerPoint(const M& A, size_t nc=5)
+{
+  RealVec rwig = 0.0;
+  real_t rmin = 1e90;
+  for(int_t k=-nc; k<nc+1; k++)
+    for(int_t j=-nc; j<nc+1; j++)
+      for(int_t i=-nc; i<nc+1; i++)
+        if(i!=0 || j!=0 || k!=0)
+        {
+          IntVec n(i,j,k);
+          RealVec rv = dot(n,A);
+          real_t rm = 0.5*std::sqrt(dot(rv,rv));
+          if(rm<rmin)
+          {
+            rwig = rv;
+            rmin = rm;
+          }
+        }
+  return rwig;
+}
+
+
+template<typename M>
+real_t wignerRadius(const M& A, size_t nc=5)
+{
+  const auto& rwig = wignerPoint(A,nc);
+  return std::sqrt(dot(rwig,rwig));
+}
+
+
+template<typename V>
+V ivmax(const V& v1, const V& v2)
+{
+  V vm;
+  for(size_t d: {0,1,2})
+    vm[d] = std::max(v1[d],v2[d]);
+  return vm;
+}
+
+
 
 /// General class to perform Ewald sums
 class AnisotropicEwald
 {
-private:
+public:
+  IntVec nrmax; // Max aniso r-space grid dims found across all adaptive evals
+  IntVec nkmax; // Max aniso k-space grid dims found across all adaptive evals
 
+private:
   RealMat A;      // Real-space cell axes
   RealMat B;      // K-space cell axes
   ChargeArray Q;  // List of charges for all particles
@@ -257,7 +301,6 @@ class AnisotropicEwald
 
   size_t N;       // Number of particles
   real_t volume;  // Volume of real-space cell, \Omega in Drummond 2008
-  real_t QQmax;   // Maximum charge product (used for setting tolerances)
 
   // Constants used in Madelung sums (see Drummond 2008 formula 7)
   real_t kappa_madelung;      // kappa for Madelung sums
@@ -284,75 +327,82 @@ class AnisotropicEwald
   std::vector<RealVec> kpoints;    // Converged k-point grid
   std::vector<real_t> vk;          // Fourier transform of Ewald pair potential
   real_t vk_sum;                   // Constant sum term in rho_k breakup
-  //std::rhok2                       // Charge structure factor
+  std::vector<real_t> rhok_r;      // Charge structure factor
+  std::vector<real_t> rhok_i;      // Charge structure factor
 
 public:
 
   /// Empty constructor
-  AnisotropicEwald() : nmax_anisotropic(0) { }
+  AnisotropicEwald() { }
 
   /// State-initializing constructor
   AnisotropicEwald(const RealMat& A_in, const ChargeArray& Q_in, real_t tol_in = 1e-10,real_t kappa_in=-1.0)
-    : A(A_in), Q(Q_in), tol(tol_in), nmax_anisotropic(0)
   {
-
     initialize(A_in,Q_in,tol_in,kappa_in);
   }
 
   /// Initialize constant data, including Madelung sums
   void initialize(const RealMat& A_in, const ChargeArray& Q_in, real_t tol_in = 1e-10,real_t kappa_in=-1.0)
   {
-  
-    A = A_in;
-    Q = Q_in;
+    // Zero out observed grid dimensions
+    nrmax = 0;
+    nkmax = 0;
+
+    // Store input data
+    A   = A_in;
+    Q   = Q_in;
     tol = tol_in;
 
-    // Reciprocal lattice vectors
-    B = 2 * M_PI * transpose(inverse(A));
+    // Setup cell data
+    N      = Q.size();                         // Number of particles
+    volume = std::abs(det(A));                 // Volume
+    B      = 2 * M_PI * transpose(inverse(A)); // Reciprocal lattice vectors
 
     // Set Ewald sum constants
-    volume = std::abs(det(A));
     // Madelung constants
-    if(kappa_in<0.0)
-      kappa_madelung = getKappaMadelung(volume);
-    else
-      kappa_madelung = kappa_in;
+    kappa_madelung      = getKappaMadelung(volume);
     rexponent_madelung  = kappa_madelung;
     kexponent_madelung  = -1. / (4 * std::pow(kappa_madelung, 2));
     kprefactor_madelung = 4 * M_PI / volume;
     // Ewald constants
-    if(kappa_in<0.0)
+    setKappaEwald(kappa_in);
+
+    // Calculate and store Madelung energy
+    madelung_energy = madelungEnergy();
+  }
+
+
+  void setKappaEwald(real_t kappa=-1.0)
+  {
+    if(kappa<0.0)
       kappa_ewald = getKappaEwald(volume);
     else
-      kappa_ewald = kappa_in;
+      kappa_ewald = kappa;
     rexponent_ewald  = 1. / (std::sqrt(2.) * kappa_ewald);
     kexponent_ewald  = -std::pow(kappa_ewald, 2) / 2;
     kprefactor_ewald = 4 * M_PI / volume;
     kconstant_ewald  = -2 * M_PI * std::pow(kappa_ewald, 2) / volume;
 
-    // Number of particles
-    N = Q.size();
-
-    // Find maximum self-interaction charge product
-    QQmax = 0.0;
-    for (size_t i = 0; i < N; ++i)
-      QQmax = std::max(std::abs(Q[i] * Q[i]), QQmax);
-
-    // Calculate and store Madelung energy
-    madelung_energy = madelungEnergy();
-
     // Calculate and store constant energy term for LR interaction
-    real_t lrc = 0.0;
-    for (size_t i = 0; i < N; ++i)
-      for (size_t j = 0; j < i; ++j)
-        lrc += Q[i]*Q[j]*kconstant_ewald;
-    ewald_constant_lr_energy = lrc;
+    real_t qsum  = 0.0;
+    real_t qsum2 = 0.0;
+    for(auto q: Q)
+    {
+      qsum  += q;
+      qsum2 += q*q;
+    }
+    ewald_constant_lr_energy = 0.5*(qsum*qsum - qsum2)*kconstant_ewald;
   }
 
 
   /// Calculate the Madelung constant
   real_t madelungConstant() const
   {
+    // Find maximum self-interaction charge product
+    real_t QQmax = 0.0;
+    for (auto q: Q)
+      QQmax = std::max(q*q, QQmax);
+
     // Set Madelung tolerance
     real_t tol_madelung = tol * 2. / QQmax;
 
@@ -390,27 +440,6 @@ class AnisotropicEwald
   }
 
 
-  /// Update the current maximum anisotropic grid dimensions
-  void updateNmax(const IntVec& nmax)
-  {
-    for(size_t d: {0,1,2})
-      nmax_anisotropic[d] = std::max(nmax[d],nmax_anisotropic[d]);
-  }
-
-
-  /// Return the current maximum anisotropic grid dimensions
-  IntVec getNmax()
-  {
-    return nmax_anisotropic;
-  }
-
-
-  /// Set the maximum anisotropic grid dimensions
-  void setNmax(const IntVec& nmax)
-  {
-    nmax_anisotropic = nmax;
-  }
-
 
   /// Pair interaction computed via sum over adaptive anisotropic grid
   real_t ewaldPairPotential(const RealVec& r, real_t tol_ewald)
@@ -424,10 +453,10 @@ class AnisotropicEwald
     real_t cval = kconstant_ewald;
     // Compute the real-space sum (includes zero)
     real_t rval = anisotropicGridSum(rfunc, nmax, true, tol_ewald);
-    updateNmax(nmax);
+    nrmax = ivmax(nmax,nrmax);
     // Compute the k-space sum (excludes zero)
     real_t kval = anisotropicGridSum(kfunc, nmax, false, tol_ewald);
-    updateNmax(nmax);
+    nkmax = ivmax(nmax,nkmax);
 
     // Sum all contributions to get the Ewald pair interaction
     real_t epp = cval + rval + kval;
@@ -440,6 +469,8 @@ class AnisotropicEwald
   template<typename PA>
   real_t ewaldEnergy(const PA& R)
   {
+    nrmax = 0;
+    nkmax = 0;
     real_t ee = madelung_energy;
     size_t Npairs = (N*(N-1))/2;
     for (size_t i = 0; i < N; ++i)
@@ -498,6 +529,7 @@ class AnisotropicEwald
   template<typename PA>
   real_t ewaldEnergySR(const PA& R)
   {
+    nrmax = 0;
     real_t ee = 0.0;
     size_t Npairs = (N*(N-1))/2;
     IntVec nmax;
@@ -507,6 +539,7 @@ class AnisotropicEwald
         real_t tol_ewald = tol/(Q[i]*Q[j])/Npairs;
         RspaceEwaldTerm rfunc(R[i]-R[j], A, rexponent_ewald);
         real_t rval = anisotropicGridSum(rfunc, nmax, true, tol_ewald);
+        nrmax = ivmax(nmax,nrmax);
         ee += Q[i]*Q[j]*rval;
       }
     return ee;
@@ -517,6 +550,7 @@ class AnisotropicEwald
   template<typename PA>
   real_t ewaldEnergyLR(const PA& R)
   {
+    nkmax = 0;
     real_t ee = ewald_constant_lr_energy;
     size_t Npairs = (N*(N-1))/2;
     IntVec nmax;
@@ -526,6 +560,7 @@ class AnisotropicEwald
         real_t tol_ewald = tol/(Q[i]*Q[j])/Npairs;
         KspaceEwaldTerm kfunc(R[i]-R[j], B, kexponent_ewald, kprefactor_ewald);
         real_t kval = anisotropicGridSum(kfunc, nmax, false, tol_ewald);
+        nkmax = ivmax(nmax,nkmax);
         ee += Q[i]*Q[j]*kval;
       }
     return ee;
@@ -563,12 +598,45 @@ class AnisotropicEwald
           vk_sum    += 0.5*QQsum*vk_val;
           n++;
         }
+
+    rhok_r.resize(nkpoints);
+    rhok_i.resize(nkpoints);
+  }
+
+
+  // Computes error bound for excluding all images of SR sum for single e-e interaction
+  real_t SROptErrorBound(RealVec wigner_point,real_t kappa,real_t errtol=1e-10)
+  {
+    real_t rexponent = 1./(std::sqrt(2.)*kappa);
+    RspaceEwaldTerm vsr(wigner_point,A,rexponent);
+    IntVec nmax;
+    real_t error_bound =0.0;//= ansitropicGridSum(vsr,nmax,false,errtol);
+    return error_bound;
   }
 
 
-  void setupOpt()
+  // Find kappa to use in optmized computation based on error tolerance of SR part
+  real_t findOptKappa(real_t errtol)
   {
-    setupOpt(nmax_anisotropic);
+    real_t qsum  = 0.0;
+    real_t qsum2 = 0.0;
+    for(auto q: Q)
+    {
+      qsum  += std::abs(q);
+      qsum2 += q*q;
+    }
+    real_t QQbound = 0.5*(qsum*qsum - qsum2);
+    RealVec wigner_point = wignerPoint(A);
+    real_t wigner_radius = std::sqrt(dot(wigner_point,wigner_point));
+    real_t err_bound_tol = errtol/QQbound/1e2;
+    real_t error = 1e90;
+    real_t kappa = wigner_radius;
+    int_t n = 0;
+    while(error>errtol && kappa>0)
+    {
+      kappa = (1.0-0.1*n)*wigner_radius;
+      error = QQbound*SROptErrorBound(wigner_point,kappa);
+    }
   }
 
 
@@ -582,6 +650,7 @@ class AnisotropicEwald
   }
 
 
+  /// SR (r-space) part of total energy computed optimally
   template<typename DT>
   real_t ewaldEnergySROpt(const DT& dt)
   {
@@ -601,6 +670,84 @@ class AnisotropicEwald
   {
     real_t ee = ewald_constant_lr_energy;
 
+    real_t ve = 0.0;
+//#pragma omp parallel for reduction(+ : ve)
+    for(size_t n=0; n<kpoints.size(); n++)
+    {
+      const auto& k = kpoints[n];
+      real_t coskr = 0.0;
+      real_t sinkr = 0.0;
+//#pragma omp simd
+      for(size_t i=0; i<N; i++)
+      {
+        real_t c,s;
+        real_t q = Q[i];
+        sincos(dot(k,R[i]),&s,&c);
+        coskr += q*c;
+        sinkr += q*s;
+      }
+      ve += (coskr*coskr + sinkr*sinkr)*vk[n];
+    }
+
+    ee += 0.5*ve - vk_sum;
+
+    return ee;
+  }
+
+  
+  /// LR (k-space) part of total energy computed optimally
+  template<typename PA>
+  real_t ewaldEnergyLROpt_qmcpack(const PA& R)
+  {
+    real_t ee = ewald_constant_lr_energy;
+
+    std::fill(rhok_r.begin(),rhok_r.end(),0.0);
+    std::fill(rhok_i.begin(),rhok_i.end(),0.0);
+    for(size_t i=0; i<N; i++)
+    {
+      real_t q = Q[i];
+      const auto& r = R[i];
+      for(size_t n=0; n<kpoints.size(); n++)
+      {
+        real_t c,s;
+        sincos(dot(kpoints[n],r),&s,&c);
+        rhok_r[n] += q*c;
+        rhok_i[n] += q*s;
+      }
+    }
+
+    real_t ve = 0.0;
+    for(size_t n=0; n<kpoints.size(); n++)
+    {
+      ve += (rhok_r[n]*rhok_r[n]+rhok_i[n]*rhok_i[n])*vk[n];
+    }
+
+    ee += 0.5*ve - vk_sum;
+
+    return ee;
+  }
+
+
+  /// SR (r-space) part of total energy computed optimally
+  template<typename DT>
+  real_t ewaldEnergySROpt_orig(const DT& dt)
+  {
+    const auto& dr = dt.getDisplacements();
+    real_t ee = 0.0;
+    RspaceEwaldPairPotential vsr(rexponent_ewald);
+    for (size_t i = 0; i < N; ++i)
+      for (size_t j = 0; j < i; ++j)
+        ee += Q[i]*Q[j]*vsr(dr[i][j]);
+    return ee;
+  }
+
+  
+  /// LR (k-space) part of total energy computed optimally
+  template<typename PA>
+  real_t ewaldEnergyLROpt_orig(const PA& R)
+  {
+    real_t ee = ewald_constant_lr_energy;
+
     real_t ve = 0.0;
     size_t n=0;
     for(const auto& k: kpoints)

From 1aa80588a75aaa7a124beec3de6886f6bf73ee40 Mon Sep 17 00:00:00 2001
From: Jaron Krogel <krogeljt@ornl.gov>
Date: Thu, 9 Jan 2020 10:13:23 -0500
Subject: [PATCH 09/12] rename functions

---
 src/QMCHamiltonians/CoulombPBCAA.cpp |  5 ++---
 src/QMCHamiltonians/EwaldTools.h     | 20 ++++++++++----------
 2 files changed, 12 insertions(+), 13 deletions(-)

diff --git a/src/QMCHamiltonians/CoulombPBCAA.cpp b/src/QMCHamiltonians/CoulombPBCAA.cpp
index 43c96d5278..b6294d5f4d 100644
--- a/src/QMCHamiltonians/CoulombPBCAA.cpp
+++ b/src/QMCHamiltonians/CoulombPBCAA.cpp
@@ -73,7 +73,6 @@ CoulombPBCAA::CoulombPBCAA(ParticleSet& ref, bool active, bool computeForces)
 
 
   ewaldref::IntVec nmax = 7;
-  //ewald.setNmax(nmax);
   ewald.setupOpt(nmax);
 
   if (!is_active)
@@ -327,8 +326,8 @@ CoulombPBCAA::Return_t CoulombPBCAA::evaluate(ParticleSet& P)
     E_opt = lr_opt + sr_opt + c_opt;
 
 
-    RealType sr_opt_orig = ewald.ewaldEnergySROpt_orig(dt);
-    RealType lr_opt_orig = ewald.ewaldEnergyLROpt_orig(P.R);
+    RealType sr_opt_orig = ewald.ewaldEnergySROpt_ref(dt);
+    RealType lr_opt_orig = ewald.ewaldEnergyLROpt_ref(P.R);
     RealType lr_opt_qmc  = ewald.ewaldEnergyLROpt_qmcpack(P.R);
 
     RealType E_opt2 = c_opt + sr_opt_orig + lr_opt_orig;
diff --git a/src/QMCHamiltonians/EwaldTools.h b/src/QMCHamiltonians/EwaldTools.h
index 20816b5ccd..c4cccc0749 100644
--- a/src/QMCHamiltonians/EwaldTools.h
+++ b/src/QMCHamiltonians/EwaldTools.h
@@ -591,11 +591,11 @@ class AnisotropicEwald
           if(i==0 && j==0 && k==0)
             continue;
           IntVec iv(i,j,k);
-          RealVec kp = dot(iv,B);
-          kpoints[n] = kp;
+          RealVec kp    = dot(iv,B);
+          kpoints[n]    = kp;
           real_t vk_val = vkf(kp);
-          vk[n]      = vk_val;
-          vk_sum    += 0.5*QQsum*vk_val;
+          vk[n]         = vk_val;
+          vk_sum       += 0.5*QQsum*vk_val;
           n++;
         }
 
@@ -610,7 +610,7 @@ class AnisotropicEwald
     real_t rexponent = 1./(std::sqrt(2.)*kappa);
     RspaceEwaldTerm vsr(wigner_point,A,rexponent);
     IntVec nmax;
-    real_t error_bound =0.0;//= ansitropicGridSum(vsr,nmax,false,errtol);
+    real_t error_bound = anisotropicGridSum(vsr,nmax,false,errtol);
     return error_bound;
   }
 
@@ -695,7 +695,7 @@ class AnisotropicEwald
   }
 
   
-  /// LR (k-space) part of total energy computed optimally
+  /// LR (k-space) part of total energy computed like qmcpack
   template<typename PA>
   real_t ewaldEnergyLROpt_qmcpack(const PA& R)
   {
@@ -728,9 +728,9 @@ class AnisotropicEwald
   }
 
 
-  /// SR (r-space) part of total energy computed optimally
+  /// Reference function for ewaldEnergySROpt
   template<typename DT>
-  real_t ewaldEnergySROpt_orig(const DT& dt)
+  real_t ewaldEnergySROpt_ref(const DT& dt)
   {
     const auto& dr = dt.getDisplacements();
     real_t ee = 0.0;
@@ -742,9 +742,9 @@ class AnisotropicEwald
   }
 
   
-  /// LR (k-space) part of total energy computed optimally
+  /// Reference function for ewaldEnergyLROpt
   template<typename PA>
-  real_t ewaldEnergyLROpt_orig(const PA& R)
+  real_t ewaldEnergyLROpt_ref(const PA& R)
   {
     real_t ee = ewald_constant_lr_energy;
 

From 9162af368204e531eede4fb6d9578095e3a9a92b Mon Sep 17 00:00:00 2001
From: Jaron Krogel <krogeljt@ornl.gov>
Date: Mon, 13 Jan 2020 11:54:16 -0500
Subject: [PATCH 10/12] add SR and LR error bounds

---
 src/QMCHamiltonians/CoulombPBCAA.cpp |  59 +++++++-
 src/QMCHamiltonians/EwaldTools.h     | 194 ++++++++++++++++++++++++---
 2 files changed, 225 insertions(+), 28 deletions(-)

diff --git a/src/QMCHamiltonians/CoulombPBCAA.cpp b/src/QMCHamiltonians/CoulombPBCAA.cpp
index b6294d5f4d..553ce0a583 100644
--- a/src/QMCHamiltonians/CoulombPBCAA.cpp
+++ b/src/QMCHamiltonians/CoulombPBCAA.cpp
@@ -72,18 +72,65 @@ CoulombPBCAA::CoulombPBCAA(ParticleSet& ref, bool active, bool computeForces)
   ewald.initialize(A,Q,1e-10,qmcpack_kappa);
 
 
-  ewaldref::IntVec nmax = 7;
-  ewald.setupOpt(nmax);
+  //ewaldref::IntVec nmax = 7;
+  //ewald.setupOpt(nmax);
 
   if (!is_active)
   {
     update_source(ref);
+    
 
     ewaldref::PosArray R;
     R.resize(NumCenters);
     for(int i=0;i<NumCenters;++i)
       R[i] = Ps.R[i];
+
+    RealType Vii_ref        = ewaldref::ewaldEnergy(A, R, Q);
+    RealType Vdiff_per_atom = std::abs(Value - Vii_ref) / NumCenters;
+
+
+
+
+    //app_log()<<std::setprecision(14);
+    app_log()<<std::setprecision(12);
+    app_log()<<std::endl;
+    app_log()<<std::endl;
+    app_log()<<"   ewald ref i-i   energy: "<<Vii_ref<<std::endl;
+    app_log()<<"   qmcpack   i-i   energy: "<<Value<<std::endl;
+    app_log()<<std::endl;
+    app_log()<<std::endl;
+
+    const DistanceTableData& dt(Ps.getDistTable(d_aa_ID));
+
+    //RealType E_ref = ewald.ewaldEnergy(R);
+    //RealType E_fix = ewald.fixedGridEwaldEnergy(R);
+    RealType c     = ewald.ewaldEnergyConst();
+    RealType sr    = ewald.ewaldEnergySR(Ps.R);
+    RealType lr    = ewald.ewaldEnergyLR(Ps.R);
+
+
+    //app_log()<<"   ewald adaptive  energy: "<<E_ref<<std::endl;
+    //app_log()<<"   ewald fixed     energy: "<<E_fix<<std::endl;
+    app_log()<<"   ewald component energy: "<<sr+lr+c<<std::endl;
+
+    app_log()<<std::endl;
+    app_log()<<std::endl;
+
+    app_log()<<"   sr ref : "<< sr <<std::endl;
+    app_log()<<"   sr opt : "<< ewald.ewaldEnergySROpt(dt) <<"  "<<ewald.getKappa() <<std::endl;
+
+    app_log()<<std::endl;
+    app_log()<<std::endl;
+
+    // make print out of SR accuracy vs kappa
+    //ewald.findOptKappa(R,dt);
     
+    // LR accuracy vs cutoff
+    app_log()<<"   lr ref : "<< lr <<std::endl;
+
+    ewald.findOptKGrid(R);
+
+
     //RealType eE   = ewald.ewaldEnergy(R);
     //RealType eEf  = ewald.fixedGridEwaldEnergy(R);
     ////RealType eEt  = ewald.ewaldEnergy(Ps.R);
@@ -167,8 +214,10 @@ CoulombPBCAA::CoulombPBCAA(ParticleSet& ref, bool active, bool computeForces)
     //app_log()<<std::endl;
     //app_log()<<std::endl;
 
-    RealType Vii_ref        = ewaldref::ewaldEnergy(A, R, Q);
-    RealType Vdiff_per_atom = std::abs(Value - Vii_ref) / NumCenters;
+
+    APP_ABORT("explore")
+
+
     app_log() << "Checking ion-ion Ewald energy against reference..." << std::endl;
     if (Vdiff_per_atom > Ps.Lattice.LR_tol)
     {
@@ -197,8 +246,6 @@ CoulombPBCAA::CoulombPBCAA(ParticleSet& ref, bool active, bool computeForces)
       app_log() << "  Check passed." << std::endl;
     }
 
-    //APP_ABORT("explore")
-
   }
   prefix = "F_AA";
   app_log() << "  Maximum K shell " << AA->MaxKshell << std::endl;
diff --git a/src/QMCHamiltonians/EwaldTools.h b/src/QMCHamiltonians/EwaldTools.h
index c4cccc0749..85fb6685e3 100644
--- a/src/QMCHamiltonians/EwaldTools.h
+++ b/src/QMCHamiltonians/EwaldTools.h
@@ -245,10 +245,10 @@ class KspaceEwaldPairPotential
 
 
 template<typename M>
-RealVec wignerPoint(const M& A, size_t nc=5)
+RealVec wignerPoint(const M& A, int_t nc=5)
 {
   RealVec rwig = 0.0;
-  real_t rmin = 1e90;
+  real_t rmin = std::numeric_limits<real_t>::max();
   for(int_t k=-nc; k<nc+1; k++)
     for(int_t j=-nc; j<nc+1; j++)
       for(int_t i=-nc; i<nc+1; i++)
@@ -259,7 +259,7 @@ RealVec wignerPoint(const M& A, size_t nc=5)
           real_t rm = 0.5*std::sqrt(dot(rv,rv));
           if(rm<rmin)
           {
-            rwig = rv;
+            rwig = rv/2;
             rmin = rm;
           }
         }
@@ -365,14 +365,14 @@ class AnisotropicEwald
     kexponent_madelung  = -1. / (4 * std::pow(kappa_madelung, 2));
     kprefactor_madelung = 4 * M_PI / volume;
     // Ewald constants
-    setKappaEwald(kappa_in);
+    setKappa(kappa_in);
 
     // Calculate and store Madelung energy
     madelung_energy = madelungEnergy();
   }
 
 
-  void setKappaEwald(real_t kappa=-1.0)
+  void setKappa(real_t kappa=-1.0)
   {
     if(kappa<0.0)
       kappa_ewald = getKappaEwald(volume);
@@ -395,6 +395,12 @@ class AnisotropicEwald
   }
 
 
+  real_t getKappa()
+  {
+    return kappa_ewald;
+  }
+
+
   /// Calculate the Madelung constant
   real_t madelungConstant() const
   {
@@ -467,22 +473,24 @@ class AnisotropicEwald
 
   /// Total energy for all pairs using adaptive anisotropic grids
   template<typename PA>
-  real_t ewaldEnergy(const PA& R)
+  real_t ewaldEnergy(const PA& R,real_t errtol=-1.0)
   {
+    if(errtol<0.0)
+      errtol = tol;
     nrmax = 0;
     nkmax = 0;
     real_t ee = madelung_energy;
     size_t Npairs = (N*(N-1))/2;
     for (size_t i = 0; i < N; ++i)
       for (size_t j = 0; j < i; ++j)
-        ee += Q[i]*Q[j]*ewaldPairPotential(R[i]-R[j],tol/(Q[i]*Q[j])/Npairs);
+        ee += Q[i]*Q[j]*ewaldPairPotential(R[i]-R[j],errtol/(Q[i]*Q[j])/Npairs);
     return ee;
   }
 
 
   /// Total energy for all pairs using fixed anisotropic grid
   template<typename PA>
-  real_t fixedGridEwaldEnergy(const PA& R, const IntVec& nmax)
+  real_t fixedGridEwaldEnergy(const PA& R, const IntVec& nrmax, const IntVec& nkmax)
   {
     real_t ee = madelung_energy;
     for (size_t i = 0; i < N; ++i)
@@ -497,9 +505,9 @@ class AnisotropicEwald
         // Compute the constant term
         real_t cval = kconstant_ewald;
         // Compute the real-space sum (includes zero)
-        real_t rval = fixedGridSum(rfunc, nmax, true);
+        real_t rval = fixedGridSum(rfunc, nrmax, true);
         // Compute the k-space sum (excludes zero)
-        real_t kval = fixedGridSum(kfunc, nmax, false);
+        real_t kval = fixedGridSum(kfunc, nkmax, false);
 
         // Sum all contributions to get the Ewald pair interaction
         real_t epp = cval + rval + kval;
@@ -514,7 +522,7 @@ class AnisotropicEwald
   template<typename PA>
   real_t fixedGridEwaldEnergy(const PA& R)
   {
-    return fixedGridEwaldEnergy(R, nmax_anisotropic);
+    return fixedGridEwaldEnergy(R, nrmax, nkmax);
   }
 
 
@@ -527,8 +535,10 @@ class AnisotropicEwald
 
   /// SR (real-space) part of total energy computed adaptively 
   template<typename PA>
-  real_t ewaldEnergySR(const PA& R)
+  real_t ewaldEnergySR(const PA& R, real_t errtol=-1.0)
   {
+    if(errtol<0.0)
+      errtol = tol;
     nrmax = 0;
     real_t ee = 0.0;
     size_t Npairs = (N*(N-1))/2;
@@ -536,7 +546,7 @@ class AnisotropicEwald
     for (size_t i = 0; i < N; ++i)
       for (size_t j = 0; j < i; ++j)
       {
-        real_t tol_ewald = tol/(Q[i]*Q[j])/Npairs;
+        real_t tol_ewald = errtol/(Q[i]*Q[j])/Npairs;
         RspaceEwaldTerm rfunc(R[i]-R[j], A, rexponent_ewald);
         real_t rval = anisotropicGridSum(rfunc, nmax, true, tol_ewald);
         nrmax = ivmax(nmax,nrmax);
@@ -548,8 +558,10 @@ class AnisotropicEwald
 
   /// LR (k-space) part of total energy computed adaptively 
   template<typename PA>
-  real_t ewaldEnergyLR(const PA& R)
+  real_t ewaldEnergyLR(const PA& R, real_t errtol=-1.0)
   {
+    if(errtol<0.0)
+      errtol = tol;
     nkmax = 0;
     real_t ee = ewald_constant_lr_energy;
     size_t Npairs = (N*(N-1))/2;
@@ -557,7 +569,7 @@ class AnisotropicEwald
     for (size_t i = 0; i < N; ++i)
       for (size_t j = 0; j < i; ++j)
       {
-        real_t tol_ewald = tol/(Q[i]*Q[j])/Npairs;
+        real_t tol_ewald = errtol/(Q[i]*Q[j])/Npairs;
         KspaceEwaldTerm kfunc(R[i]-R[j], B, kexponent_ewald, kprefactor_ewald);
         real_t kval = anisotropicGridSum(kfunc, nmax, false, tol_ewald);
         nkmax = ivmax(nmax,nkmax);
@@ -605,7 +617,7 @@ class AnisotropicEwald
 
 
   // Computes error bound for excluding all images of SR sum for single e-e interaction
-  real_t SROptErrorBound(RealVec wigner_point,real_t kappa,real_t errtol=1e-10)
+  real_t SROptErrorBound(RealVec wigner_point,real_t kappa,real_t errtol=1e-20)
   {
     real_t rexponent = 1./(std::sqrt(2.)*kappa);
     RspaceEwaldTerm vsr(wigner_point,A,rexponent);
@@ -616,7 +628,8 @@ class AnisotropicEwald
 
 
   // Find kappa to use in optmized computation based on error tolerance of SR part
-  real_t findOptKappa(real_t errtol)
+  template<typename PA, typename DT>
+  real_t findOptKappa(const PA& R, const DT& dt)
   {
     real_t qsum  = 0.0;
     real_t qsum2 = 0.0;
@@ -628,18 +641,155 @@ class AnisotropicEwald
     real_t QQbound = 0.5*(qsum*qsum - qsum2);
     RealVec wigner_point = wignerPoint(A);
     real_t wigner_radius = std::sqrt(dot(wigner_point,wigner_point));
-    real_t err_bound_tol = errtol/QQbound/1e2;
-    real_t error = 1e90;
+    //real_t err_bound_tol = errtol/QQbound/1e2;
+    real_t error_bound = 1e90;
     real_t kappa = wigner_radius;
     int_t n = 0;
-    while(error>errtol && kappa>0)
+
+    std::cout << "\nwigner radius: "<<wigner_radius<<std::endl;
+
+    std::cout << std::scientific;
+
+    //while(error>errtol && kappa>0)
+    while(kappa>0)
     {
-      kappa = (1.0-0.1*n)*wigner_radius;
-      error = QQbound*SROptErrorBound(wigner_point,kappa);
+      kappa = (1.0-0.01*n)*wigner_radius;
+      if(kappa<0.0)
+        break;
+
+      error_bound = QQbound*SROptErrorBound(wigner_point,kappa);
+
+      setKappa(kappa);
+
+      tol = 1e-16;
+
+      real_t sr_opt = ewaldEnergySROpt(dt);
+      real_t sr_ref = ewaldEnergySR(R);
+
+      real_t error_diff = sr_opt-sr_ref;
+      real_t error_sum  = ewaldEnergySROptError(dt);
+
+      std::cout<<kappa/wigner_radius<<" "<<sr_opt<<" "<<sr_ref<<" "<<error_diff<<" "<<error_sum<<" "<<error_bound<<std::endl;
+
+      n++;
     }
   }
 
 
+  /// SR (real-space) part of total energy computed adaptively 
+  template<typename DT>
+  real_t ewaldEnergySROptError(const DT& dt,real_t errtol=1e-30)
+  {
+    const auto& dr = dt.getDisplacements();
+    real_t QQmax = 0.0;
+    for (auto q: Q)
+      QQmax = std::max(q*q, QQmax);
+    real_t ee = 0.0;
+    size_t Npairs = (N*(N-1))/2;
+    IntVec nmax;
+    for (size_t i = 0; i < N; ++i)
+      for (size_t j = 0; j < i; ++j)
+      {
+        real_t tol_ewald = errtol/(Q[i]*Q[j])/Npairs;
+        RspaceEwaldTerm rfunc(dr[i][j], A, rexponent_ewald);
+        real_t rval = anisotropicGridSum(rfunc, nmax, false, tol_ewald);
+        ee += Q[i]*Q[j]*rval;
+      }
+    return ee;
+  }
+
+
+
+  /// LR energy computed on a fixed grid + population
+  template<typename PA>
+  void findOptKGrid(const PA& R, real_t errtol_full=1e-20)
+  {
+    using std::get;
+    using std::sort;
+    using std::greater;
+    using std::vector;
+    using std::tuple;
+    using std::make_tuple;
+    using row_t = tuple<real_t, real_t, real_t, real_t, real_t>;
+
+    // Find minimal anisotropic grid
+    real_t vlr_full = ewaldEnergyLR(R,errtol_full);
+    IntVec nmax = nkmax;
+
+    app_log()<<"   lr opt : "<< vlr_full <<std::endl;
+
+    // Calculate charge product sum
+    real_t qsum  = 0.0;
+    real_t qsum2 = 0.0;
+    for(auto q: Q)
+    {
+      qsum  += std::abs(q);
+      qsum2 += q*q;
+    }
+    real_t QQbound = 0.5*(qsum*qsum - qsum2);
+
+    // Setup kpoints and vk
+    IntVec grid = 2*nmax+1;
+    size_t nkpoints_full = grid[0]*grid[1]*grid[2]-1;
+    vector<row_t> vk_data;
+    KspaceEwaldPairPotential vkf(kexponent_ewald,kprefactor_ewald);
+    size_t n=0;
+    for(int_t i = -nmax[0]; i < nmax[0] + 1; ++i)
+      for(int_t j = -nmax[1]; j < nmax[1] + 1; ++j)
+        for(int_t k = -nmax[2]; k < nmax[2] + 1; ++k)
+        {
+          if(i==0 && j==0 && k==0)
+            continue;
+          IntVec iv(i,j,k);
+          RealVec kp    = dot(iv,B);
+          real_t  kmag  = std::sqrt(dot(kp,kp));
+          real_t  vkval = vkf(kp);
+          vk_data.push_back(make_tuple(kmag,kp[0],kp[1],kp[2],vkval));
+          n++;
+        }
+
+    // Sort data from smallest to largest k-point magnitude
+    sort(vk_data.begin(),vk_data.end(),greater<row_t>());
+
+    std::ofstream file("vlr_sum.dat");
+    real_t vlr_sum = 0.0;
+    real_t vlr_bound = 0.0;
+    for(const auto& vd: vk_data)
+    {
+      real_t kmag   = get<0>(vd);
+      RealVec k(get<1>(vd),get<2>(vd),get<3>(vd));
+      real_t vk_val = get<4>(vd);
+
+      real_t coskr = 0.0;
+      real_t sinkr = 0.0;
+      for(size_t i=0; i<N; i++)
+      {
+        real_t c,s;
+        real_t q = Q[i];
+        sincos(dot(k,R[i]),&s,&c);
+        coskr += q*c;
+        sinkr += q*s;
+      }
+      real_t vk_term = 0.5*(coskr*coskr + sinkr*sinkr - qsum2)*vk_val;
+      vlr_sum += vk_term;
+
+      vlr_bound += QQbound*vk_val;
+
+      file << kmag <<" "<< vk_val << " " << vk_term <<" "<<vlr_sum << " " << vlr_bound <<  std::endl;
+    }
+    vlr_sum += ewald_constant_lr_energy;
+
+    app_log()<<"   lr sum : "<< vlr_sum <<std::endl;
+
+    std::cout<<std::endl;
+    std::cout<<nkpoints_full<<" "<<n<<std::endl;
+
+  }
+
+
+
+
+
   template<typename PA, typename DT>
   real_t ewaldEnergyOpt(const PA& R, const DT& dt)
   {

From 3ef40f00c101684b0d160f5fadc95e97adb19edc Mon Sep 17 00:00:00 2001
From: Jaron Krogel <krogeljt@ornl.gov>
Date: Mon, 13 Jan 2020 15:26:55 -0500
Subject: [PATCH 11/12] add search to enforce bounds

---
 src/QMCHamiltonians/CoulombPBCAA.cpp |  24 ++-
 src/QMCHamiltonians/EwaldTools.h     | 256 +++++++++++++++++++++++++--
 2 files changed, 263 insertions(+), 17 deletions(-)

diff --git a/src/QMCHamiltonians/CoulombPBCAA.cpp b/src/QMCHamiltonians/CoulombPBCAA.cpp
index 553ce0a583..bc5c980563 100644
--- a/src/QMCHamiltonians/CoulombPBCAA.cpp
+++ b/src/QMCHamiltonians/CoulombPBCAA.cpp
@@ -92,7 +92,7 @@ CoulombPBCAA::CoulombPBCAA(ParticleSet& ref, bool active, bool computeForces)
 
 
     //app_log()<<std::setprecision(14);
-    app_log()<<std::setprecision(12);
+    app_log()<<std::setprecision(16);
     app_log()<<std::endl;
     app_log()<<std::endl;
     app_log()<<"   ewald ref i-i   energy: "<<Vii_ref<<std::endl;
@@ -123,12 +123,28 @@ CoulombPBCAA::CoulombPBCAA(ParticleSet& ref, bool active, bool computeForces)
     app_log()<<std::endl;
 
     // make print out of SR accuracy vs kappa
-    //ewald.findOptKappa(R,dt);
+    //ewald.printSRErrorTable(R,dt);
     
     // LR accuracy vs cutoff
-    app_log()<<"   lr ref : "<< lr <<std::endl;
+    //app_log()<<"   lr ref : "<< lr <<std::endl;
+
+    //ewald.findOptKGrid(R);
+
+
+    ewald.setupOpt(R,dt);
+
+    app_log()<<"   sr ref : "<< ewald.ewaldEnergySR(R) <<std::endl;
+    app_log()<<"   sr opt : "<< ewald.ewaldEnergySROpt(dt) <<"  "<<ewald.getKappa() <<std::endl;
+
+
+    app_log()<<std::endl;
+    app_log()<<std::endl;
+
+    RealType lr_ref =  ewald.ewaldEnergyLR(R);
+    auto g = 2*ewald.nkmax+1;
+    app_log()<<"   lr ref : "<< lr_ref<<" "<< g[0]*g[1]*g[2] <<std::endl;
+    app_log()<<"   lr opt : "<< ewald.ewaldEnergyLROpt(R) <<"  "<< ewald.getNkpoints() <<std::endl;
 
-    ewald.findOptKGrid(R);
 
 
     //RealType eE   = ewald.ewaldEnergy(R);
diff --git a/src/QMCHamiltonians/EwaldTools.h b/src/QMCHamiltonians/EwaldTools.h
index 85fb6685e3..5ad7a99d61 100644
--- a/src/QMCHamiltonians/EwaldTools.h
+++ b/src/QMCHamiltonians/EwaldTools.h
@@ -243,6 +243,31 @@ class KspaceEwaldPairPotential
 };
 
 
+/// Functor for bound on term within the k-space sum in Drummond 2008 formula 6
+class KspaceEwaldBoundTerm
+{
+private:
+  /// The k-space cell axes
+  const RealMat B;
+  /// The constant -\kappa^2/2 in Drummond 2008 formula 6
+  const real_t kexponent;
+  /// The constant 4\pi/\Omega in Drummond 2008 formula 6
+  const real_t kprefactor;
+
+public:
+  KspaceEwaldBoundTerm(const RealMat& B_in, real_t kexponent_in, real_t kprefactor_in)
+      : B(B_in), kexponent(kexponent_in), kprefactor(kprefactor_in)
+  {}
+
+  real_t operator()(const IntVec& i) const
+  {
+    RealVec Kv = dot(i, B);
+    real_t K2  = dot(Kv, Kv);
+    real_t km  = kprefactor * std::exp(kexponent * K2) / K2;
+    return km;
+  }
+};
+
 
 template<typename M>
 RealVec wignerPoint(const M& A, int_t nc=5)
@@ -323,6 +348,7 @@ class AnisotropicEwald
   IntVec nmax_anisotropic;
 
   // Internally stored values for optimized computation
+  real_t k_cutoff;
   real_t ewald_constant_lr_energy; // Constant portion of LR (k-space) total energy
   std::vector<RealVec> kpoints;    // Converged k-point grid
   std::vector<real_t> vk;          // Fourier transform of Ewald pair potential
@@ -401,6 +427,12 @@ class AnisotropicEwald
   }
 
 
+  size_t getNkpoints()
+  {
+    return kpoints.size();
+  }
+
+
   /// Calculate the Madelung constant
   real_t madelungConstant() const
   {
@@ -579,9 +611,29 @@ class AnisotropicEwald
   }
 
 
+  /// Setup data structure for optimized computation based on error tolerances
+  template<typename PA, typename DT>
+  void setupOpt(const PA& R, const DT& dt,real_t errtol=-1.0)
+  {
+    if(errtol<0.0)
+      errtol = tol;
+
+    real_t sr_tol = errtol/2;
+    real_t lr_tol = errtol/2;
+
+    // Find kappa consistent w/ error bound on SR sum
+    real_t kappa_sr = findKappaViaSRErrorBound(R,dt,sr_tol);
+
+    // Set kappa
+    setKappa(kappa_sr);
+
+    // Find k-space cutoff consistent w/ error bound on LR sum
+    setupLRKpointsViaErrorBound(lr_tol);
+  }
+
   
   /// Setup data structures for optimized computation on a fixed anisotropic k-grid
-  void setupOpt(IntVec nmax)
+  void setupLRKpoints(IntVec nmax)
   {
     // Calculate charge product sum
     real_t QQsum = 0.0;
@@ -627,10 +679,12 @@ class AnisotropicEwald
   }
 
 
-  // Find kappa to use in optmized computation based on error tolerance of SR part
+  // Find kappa to use in optimized computation based on error tolerance of SR part
   template<typename PA, typename DT>
-  real_t findOptKappa(const PA& R, const DT& dt)
+  real_t findKappaViaSRErrorBound(const PA& R, const DT& dt,real_t errtol=-1.0,real_t reltol=1e-2,int_t itermax=100,real_t nwig_left=1e-2,real_t nwig_right=1.0)
   {
+    if(errtol<0.0)
+      errtol = tol;
     real_t qsum  = 0.0;
     real_t qsum2 = 0.0;
     for(auto q: Q)
@@ -641,23 +695,104 @@ class AnisotropicEwald
     real_t QQbound = 0.5*(qsum*qsum - qsum2);
     RealVec wigner_point = wignerPoint(A);
     real_t wigner_radius = std::sqrt(dot(wigner_point,wigner_point));
-    //real_t err_bound_tol = errtol/QQbound/1e2;
-    real_t error_bound = 1e90;
-    real_t kappa = wigner_radius;
-    int_t n = 0;
 
-    std::cout << "\nwigner radius: "<<wigner_radius<<std::endl;
+    real_t err_bound_tol = errtol/QQbound;
+
+    // Bisection search to hit target error bound
+    int_t n;
+    real_t kappa_left  = nwig_left*wigner_radius;
+    real_t kappa_right = nwig_right*wigner_radius;
+    real_t error_left  = SROptErrorBound(wigner_point,kappa_left);
+    real_t error_right = SROptErrorBound(wigner_point,kappa_right);
+    real_t f_left  = error_left-err_bound_tol;
+    real_t f_right = error_right-err_bound_tol;
+    if(f_left*f_right>0.0)
+    {
+      APP_ABORT("Bisection search for Ewald kappa based on SR energy tolerance failed.  Poor search interval.")
+    }
+    real_t kappa;
+    real_t error;
+    if(error_left<error_right)
+    {
+      kappa = kappa_left;
+      error = error_left;
+    }
+    else
+    {
+      kappa = kappa_right;
+      error = error_right;
+    }
+    for(n=0;n<itermax;++n)
+    {
+      real_t kappa_mid = (kappa_left+kappa_right)/2;
+      real_t error_mid = SROptErrorBound(wigner_point,kappa_mid);
+      real_t f_mid = error_mid-err_bound_tol;
+      if(f_left*f_mid < 0.0)
+      {
+        kappa_right = kappa_mid;
+        error_right = error_mid;
+        f_right     = f_mid;
+      }
+      else if(f_right*f_mid < 0.0)
+      {
+        kappa_left = kappa_mid;
+        error_left = error_mid;
+        f_left     = f_mid;
+      }
 
-    std::cout << std::scientific;
+      real_t kappa_prev = kappa;
+      real_t error_prev = error;
+      if(error_left<error_right)
+      {
+        kappa = kappa_left;
+        error = error_left;
+      }
+      else
+      {
+        kappa = kappa_right;
+        error = error_right;
+      }
+
+      //std::cout<<"  "<<n<<" "<<kappa<<" "<<QQbound*error<<" "<<errtol<<std::endl;
+
+      bool error_converged = std::abs(error)<err_bound_tol;
+      bool kappa_same      = std::abs((kappa-kappa_prev)/kappa_prev)<reltol;
+      bool error_near_target = std::abs((error-err_bound_tol)/err_bound_tol)<reltol;
+      if(error_converged && kappa_same && error_near_target)
+        break;
+    }
+    if(n>=itermax)
+      APP_ABORT("Bisection search for Ewald kappa based on SR energy tolerance failed.  Maximum iterations reached.");
 
-    //while(error>errtol && kappa>0)
+    return kappa;
+  }
+
+
+  template<typename PA, typename DT>
+  void printSRErrorTable(const PA& R, const DT& dt)
+  {    
+    real_t qsum  = 0.0;
+    real_t qsum2 = 0.0;
+    for(auto q: Q)
+    {
+      qsum  += std::abs(q);
+      qsum2 += q*q;
+    }
+    real_t QQbound = 0.5*(qsum*qsum - qsum2);
+    RealVec wigner_point = wignerPoint(A);
+    real_t wigner_radius = std::sqrt(dot(wigner_point,wigner_point));
+
+    std::cout << "\nwigner radius: "<<wigner_radius<<std::endl;
+    std::cout << std::scientific;
+    real_t kappa = wigner_radius;
+    int_t n=0;
     while(kappa>0)
     {
       kappa = (1.0-0.01*n)*wigner_radius;
       if(kappa<0.0)
         break;
 
-      error_bound = QQbound*SROptErrorBound(wigner_point,kappa);
+      real_t error_bound = QQbound*SROptErrorBound(wigner_point,kappa);
 
       setKappa(kappa);
 
@@ -676,6 +811,7 @@ class AnisotropicEwald
   }
 
 
+
   /// SR (real-space) part of total energy computed adaptively 
   template<typename DT>
   real_t ewaldEnergySROptError(const DT& dt,real_t errtol=1e-30)
@@ -700,9 +836,103 @@ class AnisotropicEwald
 
 
 
-  /// LR energy computed on a fixed grid + population
+  void setupLRKpointsViaErrorBound(real_t errtol=-1.0,real_t reftol=1e-20)
+  {
+    using std::get;
+    using std::sort;
+    using std::greater;
+    using std::vector;
+    using std::tuple;
+    using std::make_tuple;
+    using row_t = tuple<real_t, real_t, real_t, real_t, real_t>;
+
+    if(errtol<0.0)
+       errtol = tol;
+    real_t qsum  = 0.0;
+    real_t qsum2 = 0.0;
+    for(auto q: Q)
+    {
+      qsum  += std::abs(q);
+      qsum2 += q*q;
+    }
+    real_t QQbound = 0.5*(qsum*qsum - qsum2);
+    real_t err_bound_tol = errtol/QQbound;
+    
+    reftol = std::min(reftol,err_bound_tol*1e-8);
+
+    // Find minimal anisotropic grid
+    KspaceEwaldBoundTerm vlr_bterm(B,kexponent_ewald,kprefactor_ewald);
+    IntVec nmax;
+    real_t vlr_full = anisotropicGridSum(vlr_bterm,nmax,false,reftol);
+
+    // Setup kpoints and vk
+    IntVec grid = 2*nmax+1;
+    size_t nkpoints_full = grid[0]*grid[1]*grid[2]-1;
+    vector<row_t> vk_data;
+    KspaceEwaldPairPotential vkf(kexponent_ewald,kprefactor_ewald);
+    size_t n=0;
+    real_t kmag_max = std::numeric_limits<real_t>::min();
+    for(int_t i = -nmax[0]; i < nmax[0] + 1; ++i)
+      for(int_t j = -nmax[1]; j < nmax[1] + 1; ++j)
+        for(int_t k = -nmax[2]; k < nmax[2] + 1; ++k)
+        {
+          if(i==0 && j==0 && k==0)
+            continue;
+          IntVec iv(i,j,k);
+          RealVec kp    = dot(iv,B);
+          real_t  kmag  = std::sqrt(dot(kp,kp));
+          real_t  vkval = vkf(kp);
+          vk_data.push_back(make_tuple(kmag,kp[0],kp[1],kp[2],vkval));
+          kmag_max = std::max(kmag,kmag_max);
+          n++;
+        }
+
+    // Sort data from smallest to largest k-point magnitude
+    sort(vk_data.begin(),vk_data.end(),greater<row_t>());
+
+    // Sum the error bound from largest to smallest k-point.
+    // The k-space cutoff is marked by the point when the error 
+    //  bound has crossed the target error.
+    real_t kmag_prev = kmag_max;
+    real_t vlr_bound = 0.0;
+    for(const auto& vd: vk_data)
+    {
+      real_t kmag   = get<0>(vd);
+      real_t vk_val = get<4>(vd);
+      vlr_bound += vk_val;
+      if(std::abs(vlr_bound) > err_bound_tol)
+      {
+        k_cutoff = kmag_prev;
+        break;
+      }
+      kmag_prev = kmag;
+    }
+
+    // Store k-points and long range potential values falling 
+    // within the k-space cutoff.  These will be used later 
+    // in computationally optimized sums.
+    kpoints.resize(0);
+    vk.resize(0);
+    vk_sum = 0.0;
+    for(const auto& vd: vk_data)
+    {
+      real_t kmag = get<0>(vd);
+      if(kmag < k_cutoff)
+      {
+        RealVec k(get<1>(vd),get<2>(vd),get<3>(vd));
+        real_t vk_val = get<4>(vd);
+        kpoints.push_back(k);
+        vk.push_back(vk_val);
+        vk_sum += 0.5*qsum2*vk_val;
+      }
+    }
+
+  }
+
+
+
   template<typename PA>
-  void findOptKGrid(const PA& R, real_t errtol_full=1e-20)
+  void printLRErrorTable(const PA& R, real_t errtol_full=1e-20)
   {
     using std::get;
     using std::sort;

From d55eebacd58fbba0b6c7531f90f951a383e4eef5 Mon Sep 17 00:00:00 2001
From: Jaron Krogel <krogeljt@ornl.gov>
Date: Mon, 13 Jan 2020 16:24:13 -0500
Subject: [PATCH 12/12] enable accuracy vs time comparisons

---
 src/QMCHamiltonians/CoulombPBCAA.cpp | 26 +++++++++++++++++++-------
 src/QMCHamiltonians/EwaldTools.h     | 23 +++++++++++++++++++++++
 2 files changed, 42 insertions(+), 7 deletions(-)

diff --git a/src/QMCHamiltonians/CoulombPBCAA.cpp b/src/QMCHamiltonians/CoulombPBCAA.cpp
index bc5c980563..85f69b43cc 100644
--- a/src/QMCHamiltonians/CoulombPBCAA.cpp
+++ b/src/QMCHamiltonians/CoulombPBCAA.cpp
@@ -131,19 +131,31 @@ CoulombPBCAA::CoulombPBCAA(ParticleSet& ref, bool active, bool computeForces)
     //ewald.findOptKGrid(R);
 
 
-    ewald.setupOpt(R,dt);
 
-    app_log()<<"   sr ref : "<< ewald.ewaldEnergySR(R) <<std::endl;
-    app_log()<<"   sr opt : "<< ewald.ewaldEnergySROpt(dt) <<"  "<<ewald.getKappa() <<std::endl;
+
+    //auto g = 2*ewald.nkmax+1;
+    //size_t nkpoints_ref = g[0]*g[1]*g[2];
+
+    //ewald.setupOpt(R,dt);
+    //
+    //app_log()<<"   sr ref : "<< sr_ref <<std::endl;
+    //app_log()<<"   sr opt : "<< ewald.ewaldEnergySROpt(dt) <<"  "<<ewald.getKappa() <<std::endl;
+    //
+    //
+    //app_log()<<std::endl;
+    //app_log()<<std::endl;
+    //
+    //app_log()<<"   lr ref : "<< lr_ref<<" "<< nkpoints_ref <<std::endl;
+    //app_log()<<"   lr opt : "<< ewald.ewaldEnergyLROpt(R) <<"  "<< ewald.getNkpoints() <<std::endl;
+    //
+    //app_log()<<"   ewald optimized energy: "<<ewald.ewaldEnergyOpt(R,dt)<<std::endl;
+
 
 
     app_log()<<std::endl;
     app_log()<<std::endl;
 
-    RealType lr_ref =  ewald.ewaldEnergyLR(R);
-    auto g = 2*ewald.nkmax+1;
-    app_log()<<"   lr ref : "<< lr_ref<<" "<< g[0]*g[1]*g[2] <<std::endl;
-    app_log()<<"   lr opt : "<< ewald.ewaldEnergyLROpt(R) <<"  "<< ewald.getNkpoints() <<std::endl;
+    ewald.printErrorAndTimeVSTolerance(R,dt);
 
 
 
diff --git a/src/QMCHamiltonians/EwaldTools.h b/src/QMCHamiltonians/EwaldTools.h
index 5ad7a99d61..1727c665a3 100644
--- a/src/QMCHamiltonians/EwaldTools.h
+++ b/src/QMCHamiltonians/EwaldTools.h
@@ -14,6 +14,8 @@
 #define EWALD_TOOLS_H
 
 #include "QMCHamiltonians/EwaldRef.h"
+#include "Utilities/Clock.h"
+
 
 namespace qmcplusplus
 {
@@ -810,6 +812,27 @@ class AnisotropicEwald
     }
   }
 
+  template<typename PA, typename DT>
+  void printErrorAndTimeVSTolerance(const PA& R, const DT& dt)
+  {
+    std::cout << std::scientific;
+    real_t ref_errtol = 1e-20;
+    real_t t1,t2,t3;
+    for(int n=0;n<16;n++)
+    {
+      real_t errtol = 1.0*std::pow(10.0,-n);
+      setupOpt(R,dt,errtol);
+      real_t sr_ref = ewaldEnergySR(R,ref_errtol);
+      real_t lr_ref = ewaldEnergyLR(R,ref_errtol);
+      t1 = cpu_clock();
+      real_t sr     = ewaldEnergySROpt(dt);
+      t2 = cpu_clock();      
+      real_t lr     = ewaldEnergyLROpt(R);
+      t3 = cpu_clock();
+      std::cout<<n<<" "<<errtol<<" "<<sr-sr_ref<<" "<<lr-lr_ref<<" "<<t2-t1<<" "<<t3-t2<<" "<<getNkpoints()<<std::endl;
+    }
+
+  }
 
 
   /// SR (real-space) part of total energy computed adaptively