超星尔雅学习通《大数据算法(哈尔滨工业大学)》2024章节测试答案
1、在判定问题的近似中,对于近似解需要区分的是()。
A、是
B、否
C、差不离
D、差得很远
正确答案:AD
2、全0数组判定的近似算法的证据引理是:如果一次测试以大于等于p的概率获得一个证据,那么s=2/p轮测试得到证据的概率大于等于1/2。
A、正确
B、错误
正确答案:B
3、判定问题的近似解是指:输入满足某种性质或近似满足某种性质。
A、正确
B、错误
正确答案:B
3.1数据流中频繁元素
1、Zipf原则是指典型的频率分布是高度偏斜的,存在很多频繁元素。()
A、正确
B、错误
正确答案:B
2、在数据流模型中,从数据流中可以计算简单的函数,如最大值、最小值、求和等,且处理这些函数时通常使用单个寄存器s。()
A、正确
B、错误
正确答案:A
3、数据流模型中,数据流是指来自某个域中的元素序列。()
A、正确
B、错误
正确答案:A
4、在数据流模型中,内存远远大于数据的规模。()
A、正确
B、错误
正确答案:B
3.2频繁元素计算算法
1、频繁元素计算算法又称为()算法。
A、MM
B、MG
C、GM
D、MP
正确答案:B
2、频繁元素计算算法有效的原因是源于()。
A、取近似解
B、证据引理
C、错误界限和k成反比
D、Zipf原则
正确答案:D
3、在频繁元素计算算法中,计数器x减少的次数依赖于有几个减少计数器的步骤。()
A、正确
B、错误
正确答案:A
4、在频繁元素计算算法中,当数据流中元素的总个数远大于估计值与真实值相差的最多值时,可以得到频繁项一个好的估计。
A、正确
B、错误
正确答案:A
3.3最小生成树
1、时间亚线性算法的思想是:利用特定子图联通分量的数量估计最小生成树的()。
A、近似值
B、精确值
C、权重
D、界限
正确答案:C
2、求最小生成树是一个贪心法,可以用()算法来解决。
A、Prime
B、并行
C、MG
D、内存
正确答案:A
3、对联通分量个数的估计可以利用随机化方法。
A、正确
B、错误
正确答案:A
3.4序列有序的判定
1、对于输入n个数的数组(x1,x2,x3,……,xn),输出:这个数组是否有序。ℇ远离意味着必须删除大于()个元素才能保证剩下的元素有序。
A、ℇ-n
B、ℇn
C、ℇ/n
D、n/ℇ
正确答案:B
2、如果一次测试以大于等于p的概率获得一个证据,那么s=2/p轮测试得到证据的概率大于等于3/4。
A、正确
B、错误
正确答案:B
3、关于证明如果输入ℇ远离有序,则存在大于ℇn个“坏索引”的问题,可以采用证明其逆否命题的方法。
A、正确
B、错误
正确答案:A
4.1外存存储结构与外存算法
1、下列选项中叙述正确的是()。
A、磁盘的访问可以随机读、随机取