首页
数量归约是指从所有样本中选择一个有代表性的子集,因此也称为样本归约。
精华吧
→
答案
→
远程教育
→
国家开放大学
数量归约是指从所有样本中选择一个有代表性的子集,因此也称为样本归约。
A、正确
B、错误
正确答案:A
Tag:
样本
子集
代表性
时间:2024-03-21 12:26:18
上一篇:
具有不同的数据特征的变量可以直接纳入到同一个分析体系中。
下一篇:
简述数据离散化的操作含义。
相关答案
1.
过多的低频类别会严重影响建模的效率。
2.
Min()Max缩放可以将数据缩放至任意给定的范围内。
3.
数据缺失使得数据集信息含量降低,还会使一些模型无法应用。
4.
使用客观法得到的是分类形式或顺序形式定性变量,依据的是研究者基于研究目的所确定的类别。
5.
Spearman相关系数为()1时,两个变量不相关。
6.
如果输入数据是连续型数据,使用决策树模型时,就必须将连续型变量离散化为定性变量使用。
7.
完全随机缺失类型是指数据的缺失不受任何内部和外部因素的影响。
8.
逻辑纠错中比较简单的方式是将不合理的值替换为缺失值,这样既保持了变量的性质不变,又避免了错误数据的危害。
9.
通过考察变量中每一个样本值与变量分布中心的相对距离来识别异常值。
10.
经过标准化处理后,新值体现的是原值在序列中的相对位置。
热门答案
1.
数据离散化指的是将连续型变量在保留其基本数据含义的基础上转换为定性变量的操作。
2.
“分箱”是客观法数据离散化的方法。
3.
数据预处理是指在对数据进行分析前需要对数据进行的处理工作。
4.
数据中心化是数据标准化的第一个步骤。
5.
包含缺失值的数据集表现出来的不确定性与不包含缺失值的数据集相比显著增大。
6.
将数据离散化后,可以克服连续型变量中隐藏的缺陷,使模型结果更加稳定,得到更加有意义的研究结论。
7.
请简述异常值的含义。
8.
简述缺失值填补的思路。
9.
在进行变量选择时需要遵循的原则是,剔除的变量必须对数据分析影响较小
10.
利用箱线图可以识别出异常值。