0

0

c++中如何计算标准差与方差_c++数学计算统计函数

裘德小鎮的故事

裘德小鎮的故事

发布时间:2026-01-04 17:55:50

|

663人浏览过

|

来源于php中文网

原创

最稳妥方式是用std::accumulate两遍遍历:先求均值,再算平方偏差均值;样本方差除以n-1,总体方差除以n;需预检查nan/inf、空容器及分母为零。

c++中如何计算标准差与方差_c++数学计算统计函数

std::accumulate 手动计算方差和标准差最稳妥

标准库没有内置的方差或标准差函数,std::valarray 虽有 sum() 但不支持直接求均值平方差;依赖第三方库(如 Boost.Math)会增加构建复杂度。实际项目中,用 std::accumulate 两遍遍历是最可控的方式:第一遍算均值,第二遍算平方偏差均值。

  • 必须先求平均值 mean,再遍历计算 (x - mean) * (x - mean),不能合并成单次 accumulate —— 否则会因浮点精度丢失导致方差为负(尤其数据量大、数值集中时)
  • 样本方差用 n-1 作分母(贝塞尔校正),总体方差用 n;C++ 里需显式判断并传入 ddof = 01
  • 输入容器应为 std::vector<double></double> 或类似可迭代浮点序列,避免整数除法截断
#include <vector>
#include <numeric>
#include <cmath>
<p>double variance(const std::vector<double>& data, int ddof = 0) {
if (data.empty()) return 0.0;
double mean = std::accumulate(data.begin(), data.end(), 0.0) / data.size();
double sum_sq_diff = std::accumulate(data.begin(), data.end(), 0.0,
[mean](double acc, double x) { return acc + (x - mean) * (x - mean); });
return sum_sq_diff / (data.size() - ddof);
}</p><p>double stddev(const std::vector<double>& data, int ddof = 0) {
return std::sqrt(variance(data, ddof));
}</p>

std::valarray 快速原型但慎用于生产

std::valarray 支持向量化运算,写起来简洁,但存在隐式拷贝开销、不支持迭代器、且部分老编译器(如 MSVC 2015 前)实现不全。仅建议在小规模数据、快速验证公式时使用。

  • valarraysum() 返回 double,但中间运算可能触发 promotion 规则,若原始类型是 float,结果仍可能是 float,导致精度不足
  • 无法直接对 valarray<t></t> 做“减去标量均值”操作而不生成临时对象,内存效率不如手写循环
  • 以下写法看似短,但每次 - mean 都构造新 valarray,不适用于大数据
#include <valarray>
#include <cmath>
<p>double variance_valarray(const std::valarray<double>& v) {
if (v.size() == 0) return 0.0;
double mean = v.sum() / v.size();
std::valarray<double> diff = v - mean;
return (diff * diff).sum() / v.size();
}</p>

遇到 nan 或负方差?检查输入和溢出路径

调用后得到 nanvariance 返回负值,几乎一定是以下原因:

  • 输入含 NaNinf:用 std::isnan(x)std::isinf(x) 预过滤,否则 (x - mean) 可能传播 nan
  • 数据范围过大导致 (x - mean) * (x - mean) 溢出 double(如 x ≈ 1e155),此时应改用 Welford 在线算法避免大数相减
  • 容器大小为 1 且 ddof = 1 → 分母为 0 → 返回 inf;需在函数开头加 if (data.size()

性能敏感场景用 Welford 算法单趟完成

当数据来自流式输入(如传感器、文件逐行读取)、不能存全量或内存受限时,Welford 方法可在一次遍历中累积计算方差,且数值稳定性优于两遍法。

紫东太初
紫东太初

中科院和武汉AI研究院推出的新一代大模型

下载

立即学习C++免费学习笔记(深入)”;

  • 核心是维护 Mk(当前均值)和 Sk(平方和修正项),递推更新,无须存储全部数据
  • 最终方差为 S / (n - ddof),其中 S 是递推得到的 Sk
  • 注意:初始 M = 0.0, S = 0.0, n = 0,每来一个 x 更新一次,n 从 1 开始计数
struct Welford {
    double M = 0.0, S = 0.0;
    size_t n = 0;
<pre class='brush:php;toolbar:false;'>void add(double x) {
    n++;
    double delta = x - M;
    M += delta / n;
    S += delta * (x - M);
}

double variance(int ddof = 0) const {
    return n <= static_cast<size_t>(ddof) ? 0.0 : S / (n - ddof);
}

double stddev(int ddof = 0) const {
    return std::sqrt(variance(ddof));
}

};

Welford 算法的数值稳定性常被低估——它真正难处理的是极端情况:比如所有数都接近 1e308,此时 delta 计算仍可能失真。这种时候,要么换更高精度类型(long double),要么做预平移(减去估计均值再算)。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
css中float用法
css中float用法

css中float属性允许元素脱离文档流并沿其父元素边缘排列,用于创建并排列、对齐文本图像、浮动菜单边栏和重叠元素。想了解更多float的相关内容,可以阅读本专题下面的文章。

595

2024.04.28

C++中int、float和double的区别
C++中int、float和double的区别

本专题整合了c++中int和double的区别,阅读专题下面的文章了解更多详细内容。

106

2025.10.23

if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

846

2023.08.22

c++怎么把double转成int
c++怎么把double转成int

本专题整合了 c++ double相关教程,阅读专题下面的文章了解更多详细内容。

334

2025.08.29

C++中int、float和double的区别
C++中int、float和double的区别

本专题整合了c++中int和double的区别,阅读专题下面的文章了解更多详细内容。

106

2025.10.23

页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

494

2023.08.14

传感器故障解决方法
传感器故障解决方法

传感器故障排除指南:识别故障症状(如误读或错误代码)。检查电源和连接(确保连接牢固,无损坏)。校准传感器(遵循制造商说明)。诊断内部故障(目视检查、信号测试、环境影响评估)。更换传感器(选择相同规格,遵循安装说明)。验证修复(检查信号准确性,监测异常行为)。

498

2024.06.04

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

9

2026.03.11

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

22

2026.03.10

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
CSS3 教程
CSS3 教程

共18课时 | 7万人学习

PostgreSQL 教程
PostgreSQL 教程

共48课时 | 10.5万人学习

Django 教程
Django 教程

共28课时 | 4.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号