你所在的位置: 首页 > 正文

分享丨实验数据标准化处理方法

2019-12-01 点击:1945

农业测试2019.11.1我想分享用什么方法处理

能力验证报告数据(n数据)后的判断?这些问题都涉及数据标准化。

在数据分析之前,通常需要标准化数据,并使用标准化数据进行数据分析。 数据标准化也是统计数据的指数化

为什么数据应该标准化?

因为不同的变量通常有不同的单位和不同的变化程度 不同的单位常常使系数的实际解释变得困难。

例如,如果第一个变量的单位是千克,第二个变量的单位是厘米,则在计算绝对距离时,第一个变量的观测值(以千克为单位)和第二个变量的观测值(以厘米为单位)之间的差值的绝对值将被相加。 如何将5公斤的差异加到3厘米的差异上?当不同变量变化较大时,不同变量在计算的关系系数中的比例会有所不同。

例如,如果第一个变量(两个水稻品种的稻米脂肪含量)的值在2%和4%之间,而第二个变量(两个水稻品种的亩产量)的值在1000和5000之间 为了消除尺寸影响以及变量本身的变化和数值的影响,数据被标准化。

数据标准化主要包括数据趋化性和无量纲处理

数据趋化性主要解决数据属性不同的问题。不同性质指标的直接求和不能正确反映不同力的综合结果。有必要首先考虑改变逆指标的数据属性,使所有指标对评价方案的作用力具有趋化性,然后通过求和得到正确的结果。 数据无量纲处理主要解决数据的可比性。 数据标准化有多种方法,如“最小-最大标准化”、“Z值标准化”和“十进制标准化”等 经过上述标准化处理后,原始数据转化为无量纲指标评价值,即所有指标值都在同一数量级,可以进行综合评价分析

1。最小最大标准化

最小最大标准化方法是对原始数据进行线性变换 让minA和maxA分别为属性A的最小值和最大值,并通过最小-最大标准化将A的原始值X映射到间隔[0,1]中的值X。公式为:

新数据=(原始数据-最小值)/(最大值-最小值)

二,z分数标准化

该方法根据原始数据的平均值和标准偏差对数据进行标准化 使用z分数将a的原始值x标准化为x’

z-score标准化方法适用于属性a的最大值和最小值未知或存在超出值范围的异常值的情况

新数据=(原始数据-平均值)/标准差

spss默认标准化方法是z分数标准化

用电子表格进行z分数标准化的方法:电子表格中没有现成的函数,需要一步一步计算。事实上,标准化公式非常简单。

步骤如下:

1。计算每个变量(指数)的算术平均值(数学期望)xi和标准差si;

2。标准化:zij=(XIJ-XI)/SI

其中:zij是标准化变量值;Xij是实际的变量值

3。切换反向指示器前的符号

归一化变量值在0左右上下波动。大于0的值表示高于平均水平,小于0的值表示低于平均水平

3。十进制标度十进制标度标准化

该方法通过移动数据的小数点位置来标准化 要移动的小数位数取决于属性a的最大绝对值 使用十进制缩放将属性a的初始值x归一化为x’的计算方法是:

x’=x/(10 * j)

其中j是满足条件的最小整数

例如,假设值为-986到917,最大绝对值为986。为了使用十进制缩放进行归一化,我们将1000(即j=3)除以每个值,因此,-986被归一化为-0.986

注意标准化会改变原始数据,因此需要保存所用标准化方法的参数,以便统一标准化后续数据。

收集报告投诉

能力验证报告数据(n数据)处理判断的方法是什么?这些问题都涉及数据标准化。

在数据分析之前,通常需要标准化数据,并使用标准化数据分析数据。 数据标准化也是统计数据的指数化

为什么数据应该标准化?

因为不同的变量通常有不同的单位和不同的变化程度 不同的单位常常使系数的实际解释变得困难。

例如,如果第一个变量的单位是千克,第二个变量的单位是厘米,则在计算绝对距离时,第一个变量的观测值(以千克为单位)和第二个变量的观测值(以厘米为单位)之间的差值的绝对值将被相加。 如何将5公斤的差异加到3厘米的差异上?当不同变量变化较大时,不同变量在计算的关系系数中的比例会有所不同。

例如,如果第一个变量(两个水稻品种的稻米脂肪含量)的值在2%和4%之间,而第二个变量(两个水稻品种的亩产量)的值在1000和5000之间 为了消除尺寸影响以及变量本身的变化和数值的影响,数据被标准化。

数据标准化主要包括数据趋化性和无量纲处理

数据趋化性主要解决数据属性不同的问题。不同性质指标的直接求和不能正确反映不同力的综合结果。有必要首先考虑改变逆指标的数据属性,使所有指标对评价方案的作用力具有趋化性,然后通过求和得到正确的结果。 数据无量纲处理主要解决数据的可比性。 数据标准化有多种方法,如“最小-最大标准化”、“Z值标准化”和“十进制标准化”等 经过上述标准化处理后,原始数据转化为无量纲指标评价值,即所有指标值都在同一数量级,可以进行综合评价分析

1。最小最大标准化

最小最大标准化方法是对原始数据进行线性变换 让minA和maxA分别为属性A的最小值和最大值,并通过最小-最大标准化将A的原始值X映射到间隔[0,1]中的值X。公式为:

新数据=(原始数据-最小值)/(最大值-最小值)

二,z分数标准化

该方法根据原始数据的平均值和标准偏差对数据进行标准化 使用z分数将a的原始值x标准化为x’

z-score标准化方法适用于属性a的最大值和最小值未知或存在超出值范围的异常值的情况

新数据=(原始数据-平均值)/标准差

spss默认标准化方法是z分数标准化

用电子表格进行z分数标准化的方法:电子表格中没有现成的函数,需要一步一步计算。事实上,标准化公式非常简单。

步骤如下:

1。计算每个变量(指数)的算术平均值(数学期望)xi和标准差si;

2。标准化:zij=(XIJ-XI)/SI

其中:zij是标准化变量值;Xij是实际的变量值

3。切换反向指示器前的符号

归一化变量值在0左右上下波动。大于0的值表示高于平均水平,小于0的值表示低于平均水平

3。十进制标度十进制标度标准化

该方法通过移动数据的小数点位置来标准化 要移动的小数位数取决于属性a的最大绝对值 使用十进制缩放将属性a的初始值x归一化为x’的计算方法是:

x’=x/(10 * j)

其中j是满足条件的最小整数

例如,假设值为-986到917,最大绝对值为986。为了使用十进制缩放进行归一化,我们将1000(即j=3)除以每个值,因此,-986被归一化为-0.986

注意标准化会改变原始数据,因此需要保存所用标准化方法的参数,以便统一标准化后续数据。

现场真人赌博娱乐 版权所有© www.avexasia.com 技术支持:现场真人赌博娱乐 | 网站地图