首页
一些数据集是由合并数据源形成的,这就使其有可能含有重复数据或者近似重复的个体。
精华吧
→
答案
→
远程教育
→
国家开放大学
一些数据集是由合并数据源形成的,这就使其有可能含有重复数据或者近似重复的个体。
A、正确
B、错误
正确答案:A
Tag:
数据
数据源
个体
时间:2024-03-21 12:22:04
上一篇:
duplicated()函数可以将数据中的重复值直接筛选出来。
下一篇:
下列关于抽样的说法错误的是()。
相关答案
1.
缺失值会受到标准化过程影响。
2.
下列关于函数duplicated()的说法正确的是()。
3.
下列关于函数duplicated()的说法不正确的是()。
4.
数据整合是一个将两个或者多个对象的值合并成一个对象的预处理操作。
5.
数据整合是一个将两个或者多个对象的值合并成一个对象的预处理操作,数据整合不包括()。
6.
离散化是一种将连续取值的变量转换成一个分类变量的数据预处理步骤。
7.
下列不属于期望预测误差的是()。
8.
下列关于主成分的属性说法错误的是()。
9.
离散化是一种将分类取值的变量转换成一个连续变量的数据预处理步骤。
10.
下列关于抽样的说法正确的是()。
热门答案
1.
设定虚拟变量时,对于每个样本而言,同一个定性变量对应虚拟变量的值之和不超过1。
2.
数据整合是一个将两个或者多个对象的值合并成一个对象的预处理操作,数据整合包括()。
3.
无放回抽样有可能对同一个个体抽中了多次,有放回抽样则将抽出来的个体从抽样对象中去除,因此不会有重复的个体。
4.
有放回抽样有可能对同一个个体抽中了多次,无放回抽样则将抽出来的个体从抽样对象中去除,因此不会有重复的个体。
5.
设定虚拟变量时,对于有k个表现值的定性变量,只设定(k()1)个虚拟变量。
6.
设定虚拟变量时,虚拟变量的值通常用“0”或“1”来表示。
7.
主成分是原始变量的线性组合,它们相互正交(垂直),捕获了数据差异最大的方向。
8.
在回归学习中常用的损失函数是()。
9.
下列关于主成分分析的说法错误的是()。
10.
下列关于主成分分析的说法正确的是()。