北语北外

北语22秋《大数据技术与应用》作业1[标准答案]

时间:2022-11-21  作者:在线  来源:互联网  点击: 次  

标签:
内容摘要:
北语22秋《大数据技术与应用》作业1[标准答案] 试卷总分:100 得分:100 一、单选题 (共 15 道试题,共 60 分) 1.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的中四分位数为 A.2 B.4 C.6 D.8

可做奥鹏各院校作业、国开形考作业、各网院作业,联系:QQ3064302332奥鹏作业答案,奥鹏成考作业代做联系优学网 微信:wxxygzs

北语22秋《大数据技术与应用》作业1[标准答案]
试卷总分:100  得分:100
一、单选题 (共 15 道试题,共 60 分)
1.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的中四分位数为
A.2
B.4
C.6
D.8
 
2.在pandas中脏数据的典型表示有()
A.np.nan
B.*
C.?
D.no
 
3.利用pandas处理数据缺失值时,用于丢弃缺失值的函数为
A.isnull
B.head
C.tail
D.dropna
 
4.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22}的中四分位数为
A.2
B.4
C.6
D.8
 
5.数据集{1,2,3,5,7,8,9}的中位数是
A.3
B.5
C.7
D.4
 
6.用训练好的LOF实例对数据进行LOF分数计算并排序的语句是
A.from sklean.neighbors import LocalOutlierFactor
B.clf=LocalOutlierFactor(n_neighbors=20)
C.y_pred=clf.fit_predict(X)
D.X_scores = clf.negative_outlier_factor_
 
7.利用pandas处理数据缺失值时,用于发现重复值的函数为
A.isnull
B.duplicated
C.fillna
D.dropna
 
8.分类的目标是
A.将一组对象分组以发现它们之间是否存在某种关系
B.从一组预定义的类中查找新对象所属的类
C.提高数据标签利用效率
D.以上都不对
 
9.项集 S ={ },则项集S称为
A.1项集
B.2项集
C.3项集
D.空集
 
10.训练随机森林模型实例的语句是
A.from sklearn.tree import DecisionTreetClassifier
B.clf=DecisionTreetClassifier()
C.clf.fit(Xtrain,Ytrain)
D.predictions=clf.predict(Xtest)
 
11.:from sklearn.tree import DecisionTreeClassifiernclf = DecisionTreeClassifier()nclf.fit(Xtrain,Ytrain) npredictions = clf.predict(Xtest)n上面代码第4行中Xtest表示
A.训练数据集
B.测试数据集
C.训练数据的类别标签数组
D.测试数据的类别标签数组
 
12.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的上四分位数为
A.20
B.22
C.20.5
D.28
 
13.关联规则 X→Y 表示中Y称为
A.前件
B.后件
C.中间件
D.以上都不对
 
14.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的四分位差为
A.20
B.22
C.20.5
D.18.5
 
15.用训练好的LOF实例判断数据是否异常,正常样本用1表示,异常样本用-1表示的语句
A.from sklean.neighbors import LocalOutlierFactor
B.clf=LocalOutlierFactor(n_neighbors=20)
C.y_pred=clf.fit_predict(X)
D.X_scores = clf.negative_outlier_factor_
 
二、多选题 (共 5 道试题,共 20 分)
16.常用的描述统计分析方法包括
A.对比分析法
B.平均分析法
C.交叉分析法
D.以上都不对
 
17.关联规则反映的是
A.可分类性
B.可分割性
C.事物之间相互依存性
D.事物之间相互关联性
 
18.数据集中趋势分析的常用指标包括
A.平均值
B.中位数
C.众数
D.四分位数
 
19.数据挖掘是适应信息社会从海量数据中提取信息的需要而产生的新学科,也是交叉学科,包括
A.统计学
B.机器学习
C.数据库
D.模式识别
 
20.常用的分类方法包括
A.朴素贝叶斯分类器
B.决策树
C.KNN
D.以上都不对
 
三、判断题 (共 5 道试题,共 20 分)
21.分箱法是针对连续的数值型数据中噪声进行处理
 
22.因为 Bayes 理论能够帮助理解基于概率估计的复杂现况,所以它成为了数据挖掘和概率论的基础
 
23.数据类型等级最高的是定类数据
 
24.分类算法的目的是找到数据的最优拟合
 
25.数据类型等级最低的是定比数据

出处:奥奥鹏作业答案_优学网_专业的奥鹏在离线作业答案辅导网【官网】
网址:youxue100f.com转载时请注明出处和网址
奥鹏作业答案_优学网_专业的奥鹏在离线作业答案辅导网

联系:QQ:3064302332 800pass网为您服务!点击这里给我发消息,谢谢

精彩推荐
热门点击
本类排行

奥鹏成考作业答案网-代做奥鹏所有学校在线作业包100分,代做奥鹏离线作业包通过,代做奥鹏东财、大工、南开、东师、福师、北航、北语、中医大、中石油、东大、吉大、浙大、西交、天大、川农等所有奥鹏平台在线作业,代做电算化会计、电大开放英语123,代做奥鹏东财、大工、南开、东师、东大、福师、北航电大论文等!全程包通过!
联系QQ:3064302332 优学网为您服务!点击这里给我发消息,谢谢
奥鹏成考作业答案网为您服务!
QQ:3064302332

奥鹏作业答案-优学网是国内专业的奥鹏作业答案、奥鹏离线作业答案及奥鹏毕业论文辅导型网站,主要提供中医大、大工、东财、北语、北航、川大、南开等作业答案。
微信:wxxygzs
联系:QQ:3064302332 800pass网为您服务!点击这里给我发消息,谢谢
奥鹏作业答案_奥鹏作业代做辅导平台_优学网滇ICP备2021005493号 奥鹏作业答案,奥鹏成考作业代做联系优学网网站地图
Copyright ©2002-2018 奥鹏作业答案_优学网_专业的奥鹏在线离线作业答案辅导网【官网】 文军科技 版权所有 Power by DedeCms