新闻中心

EEPW首页 > 模拟技术 > 设计应用 > 基于盒式图的数据过滤与回归分析算法

基于盒式图的数据过滤与回归分析算法

作者:时间:2010-07-30来源:网络收藏

接下来要对筛选出来的进行,从而得到一个模型。
void regress(double* m,double* q,int n) //对数组
//m和q的数据用线性回归法进行拟合
//并用一条直线表示出它们之间的对应关系
{ double average_m,average_q,total_m,total_q,L_mq,L_mm;
   double a,b; //拟合直线y=a+bx的2个待定系数
   for(int i=0;in;i++) .
   {
   //计算两组数据的和total_m和total_q
   }
   average_m=total_m/n; //求的第一组数据的平均值
   average_q=total_q/n; //求的第二组数据的平均值
for(int j=0;jn;j++)
   {
利用公式(1)计算两组数据m,q它们所有数据偏离程度的对应相乘之和L_mq
   }
for(int k=0;kn;k++)
{
计算第一组数据m,它的所有数据偏离
程度的平方和L_mm
}
b=L_mq/L_mm; //计算出拟合直线的待定系数
//b的拟合值
a=average_q-b*average_m; //利用公式(2)算出参
//数a
}
从而得到一条线性直线,结束。
3 在实验数据上的实现
从SSMBSS(上海软件度量基准体系)中选取了一组数据(见表1),首先将其用散点图列出来(见图1),然后用盒形图进行数据清洗(见图2),最后用得出拟合直线(见图3)。

本文引用地址:http://www.eepw.com.cn/article/187868.htm

综上所述,对于软件度量过程中出现的数据冗余和失真的情况,可以通过数据过滤和进行处理,除去那些离群的数据,并得出相应的拟合直线,这样就可以分析出数据的规律,保证软件的质量,提高效率。
参考文献
[1] FENTONenton N E, PFLEEGER S L. Softwaremetrics: a rigorouspractical apporach[M](第2版). 北京: 清华大学出版社, 2003.
[2] 郭志懋,周傲英.数据质量和数据清洗研究综述.软件学报[J],2002(11).
[3] 王石,李玉忱,刘乃丽,等.在属性级别上处理噪声数据的数据清洗.计算机工程[J],2005(5).
[4] 徐建华.现代地理学中的数学方法.北京:高等教育出版社,2002.


上一页 1 2 下一页

关键词: 数据 回归分析 算法

评论


相关推荐

技术专区

关闭