Boost를 사용하여 샘플을 포함하는 벡터에 대한 평균 및 표준 편차를 계산하는 방법이 있습니까?
아니면 누산기를 만들고 벡터를 그 안에 공급해야합니까?
답변
축전지를 사용하는 것은 입니다 수단과 표준 편차를 계산하는 방법 부스트 .
accumulator_set<double, stats<tag::variance> > acc;
for_each(a_vec.begin(), a_vec.end(), bind<void>(ref(acc), _1));
cout << mean(acc) << endl;
cout << sqrt(variance(acc)) << endl;
답변
Boost에 더 구체적인 기능이 있는지는 모르겠지만 표준 라이브러리로 할 수 있습니다.
을 감안할 때 std::vector<double> v
, 이것은 순진한 방법입니다 :
#include <numeric>
double sum = std::accumulate(v.begin(), v.end(), 0.0);
double mean = sum / v.size();
double sq_sum = std::inner_product(v.begin(), v.end(), v.begin(), 0.0);
double stdev = std::sqrt(sq_sum / v.size() - mean * mean);
이것은 크거나 작은 값에 대해 오버플로 또는 언더 플로에 취약합니다. 표준 편차를 계산하는 약간 더 좋은 방법은 다음과 같습니다.
double sum = std::accumulate(v.begin(), v.end(), 0.0);
double mean = sum / v.size();
std::vector<double> diff(v.size());
std::transform(v.begin(), v.end(), diff.begin(),
std::bind2nd(std::minus<double>(), mean));
double sq_sum = std::inner_product(diff.begin(), diff.end(), diff.begin(), 0.0);
double stdev = std::sqrt(sq_sum / v.size());
C ++ 11 업데이트 :
and std::transform
대신 람다 함수를 사용하여에 대한 호출을 작성할 수 있습니다 (현재 사용되지 않음).std::minus
std::bind2nd
std::transform(v.begin(), v.end(), diff.begin(), [mean](double x) { return x - mean; });
답변
성능이 중요하고 컴파일러가 람다를 지원하는 경우 stdev 계산을 더 빠르고 간단하게 만들 수 있습니다 .VS 2012를 사용한 테스트에서 다음 코드가 선택한 답변에 제공된 Boost 코드보다 10 배 이상 빠르다는 것을 발견했습니다. ; musiphil에서 제공하는 표준 라이브러리를 사용하는보다 안전한 버전의 답변보다 5 배 빠릅니다.
참고 저는 샘플 표준 편차를 사용하고 있으므로 아래 코드는 약간 다른 결과를 제공합니다 ( 표준 편차에 마이너스 1이있는 이유 ).
double sum = std::accumulate(std::begin(v), std::end(v), 0.0);
double m = sum / v.size();
double accum = 0.0;
std::for_each (std::begin(v), std::end(v), [&](const double d) {
accum += (d - m) * (d - m);
});
double stdev = sqrt(accum / (v.size()-1));
답변
musiphil의 답변을 개선 하면 C ++ 11 람다 기능이 diff
있는 단일 inner_product
호출을 사용하여 임시 벡터없이 표준 편차 함수를 작성할 수 있습니다 .
double stddev(std::vector<double> const & func)
{
double mean = std::accumulate(func.begin(), func.end(), 0.0) / func.size();
double sq_sum = std::inner_product(func.begin(), func.end(), func.begin(), 0.0,
[](double const & x, double const & y) { return x + y; },
[mean](double const & x, double const & y) { return (x - mean)*(y - mean); });
return std::sqrt(sq_sum / ( func.size() - 1 ));
}
뺄셈을 여러 번 수행하는 것이 추가 중간 저장소를 사용하는 것보다 저렴하다고 생각하고 더 읽기 쉽다고 생각하지만 아직 성능을 테스트하지 않았습니다.
답변
오랫동안 사용되어 왔지만 다음과 같은 우아한 재귀 솔루션은 언급되지 않은 것 같습니다. Knuth의 컴퓨터 프로그래밍 기술을 언급하면,
mean_1 = x_1, variance_1 = 0; //initial conditions; edge case;
//for k >= 2,
mean_k = mean_k-1 + (x_k - mean_k-1) / k;
variance_k = variance_k-1 + (x_k - mean_k-1) * (x_k - mean_k);
n>=2
값 목록 의 경우 표준 편차 추정치는 다음과 같습니다.
stddev = std::sqrt(variance_n / (n-1)).
도움이 되었기를 바랍니다!
답변
내 대답은 Josh Greifer와 비슷하지만 표본 공분산으로 일반화되었습니다. 표본 분산은 표본 공분산이지만 두 입력이 동일합니다. 여기에는 Bessel의 상관 관계가 포함됩니다.
template <class Iter> typename Iter::value_type cov(const Iter &x, const Iter &y)
{
double sum_x = std::accumulate(std::begin(x), std::end(x), 0.0);
double sum_y = std::accumulate(std::begin(y), std::end(y), 0.0);
double mx = sum_x / x.size();
double my = sum_y / y.size();
double accum = 0.0;
for (auto i = 0; i < x.size(); i++)
{
accum += (x.at(i) - mx) * (y.at(i) - my);
}
return accum / (x.size() - 1);
}
답변
앞서 언급 한 버전보다 2 배 더 빠릅니다. 대부분 transform () 및 inner_product () 루프가 결합되어 있기 때문입니다. 내 바로 가기 / typedefs / 매크로에 대해 죄송합니다 : Flo = float. CR const ref. VFlo-벡터. VS2010에서 테스트 됨
#define fe(EL, CONTAINER) for each (auto EL in CONTAINER) //VS2010
Flo stdDev(VFlo CR crVec) {
SZ n = crVec.size(); if (n < 2) return 0.0f;
Flo fSqSum = 0.0f, fSum = 0.0f;
fe(f, crVec) fSqSum += f * f; // EDIT: was Cit(VFlo, crVec) {
fe(f, crVec) fSum += f;
Flo fSumSq = fSum * fSum;
Flo fSumSqDivN = fSumSq / n;
Flo fSubSqSum = fSqSum - fSumSqDivN;
Flo fPreSqrt = fSubSqSum / (n - 1);
return sqrt(fPreSqrt);
}