大数据工具应用2023章节测试答案_大数据工具应用智慧树知到答案
我的答案:D
3、使用SimpleKMeans算法对天气数据集(weather.numeric.arff)进行聚类,保持默认参数,即3个簇以及欧氏距离。选择play属性为忽略属性,从结果中可知,下列选项中,( )是错误。
A、这组数据用算法迭代四次
B、产生了三个中心点
C、聚合为3个簇,分别有7,3,4个实例
D、平方和误差为8.928
我的答案:A
4、使用线性回归(LinearRegression)分类器和用M5P分类器对cpu.arff分别进行分类,由其输出的误差指标可知( )。
A、LinearRegression的标准误差比M5P的标准误差小
B、LinearRegression的平均绝对误差比M5P的平均绝对误差小
C、LinearRegression的相对误差比M5P的相对误差小
D、LinearRegression的平均方根误差比M5P的平均方根误差大
我的答案:D
5、删去cpu.arff数据文件中的CACH属性后,使用M5P分类器构建方案,在结果中,到达LM2的实例数有( )个。
A、165
B、21
C、23
D、30
我的答案:B
6、根据J48分类器训练weather.nominal.arff所生产的决策树,当outlook=sunny;temperature=cool;humidity =high;windy=TRUE时,分类的结果是( )。
A、Yes
B、No
C、没有结果
D、无法分类
我的答案:B
7、根据J48分类器训练iris.arff所生产的决策树,当sepallength=4.4;sepalwidth=3.0;petallength=1.3;petalwidth=0.2时,分类的结果是( )。
A、Iris-setosa
B、Iris-versicolor
C、Iris-virginica
D、无法分类
我的答案:A
8、关于Weka离散化说明正确的是( )。
A、离散化是将数值属性转换为字符串型属性
B、有监督离散化有两种等宽和等频方法
C、等宽离散化是使实例分布均匀的
D、离散化包括无监督离散化和有监督离散化
我的答案:D
9、以下( )不是Weka的数据类型。
A、numeric
B、nominal
C、string
D、decimal
我的答案:D
10、关于Weka的文件类型描述错误的是( )。
A、Weka可以打开文件格式有.arff、.csv、.xlsx
B、Weka处理的数据集类似于关系数据库横行实例,竖行属性
C、arff是ASCII文件,可以用Word等文本编辑器打开查看
D、@relation 定义数据集名称,@data之后呈现实例,每一行就是一个实例
我的答案:A
11、以下属于关联分析的是( )。
A、CPU性能预测
B、购物篮分析
C、自动判断鸢尾花类别
D、股票趋势建模
我的答案:B
12、大数据时代的到来,使我们无法人为地去发现数据中的奥妙,与此同时,我们更应该注重数据中的相关关系,而不是因果关系。其中,数据之间的相关关系可以通过以下( )算法直接挖掘。
A、K-means
B、Bayes Network
C、C4.5
D、Apriori
我的答案:D
13、某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的( )问题。
A、关联规则发现
B、聚类
C、分类