HCIE大数据考试题库及答案

本题库共有【168】题，答题练习

以下关于0-1损失函数意义理解正确的是?

最优化问题的目标函数必须是凸函数，才能保证优化的最优结果是全局最优而不是局部最优，否则要进行凸优化，

协同过滤推荐算法心是最经典、最常用的推荐算法。要实现协同过滤。以下哪个步骤不需要?

以下关于Spak MLlib中分类模型评估指标描述正确的是?

在华为MS中，"线性回归"书点的参数设置描述错误的是?

Oracle数据治理产品包括Oracle Database12c、()、Oracle大数据 SOL、和大数据连接器开始入手。

DUGP(Unitied Data Governance中1atform)华为大数据统一数据治理平台，为运营商提供全面高效的数据资产管控环境。实现了数据集中.统一和共享。包括统的数据采集和整合。统一的全、标准、生命周期和质量管理。以及多维度数提云图功能。提供开箱即用的可以实现全生命周期的主数据管理。包括主数据的集中存储、0、主数据清洗、主数据监管和主数据的共享满足集团对于企业级别主数据的管理平台的要求。

关于logit回归和SVM描述不正确的是？

关于模型部署的描述不正确的是?

TF-IDF(词频-逆文档频率)是在文本挖掘中广泛使用的特殊向量化方法，以反映词语对语料库中的文档的重要性。

Spark Mlib 中特征提取的基本方法,包括· TF-ID（F）Word2Vec、ChiSqselecdor 等方法。

以下哪些是数据理解阶段的工作?

假设场景如下:癌症检查数据样本有10000个,其中10个数据样本是有癌症,其他是无癌症,假设分类模型在无癌症数据9990中预测正确了9980个,在10个癌症数据中预测正确了9个,此时真阳=9,真阴=9980,假阳=10,假阴=1。则模型准确率是多少?

以下关于L1正则化和L2正则化的理解正确的是

以下哪些不属于模型超参数的搜索算法?

以下关于K最近邻方法的描述不正确的是?

在Logistic Regression 中如果同时加入L1正则和L2范数,不会产生什么效果

以下python 代码解决了什么问题?fromsklearnpreprocessiongimportNormalizerNornalizer().fit_transform(iris.data)

CRISP-DM(跨行业数据挖掘标准流程)是当今数据挖掘业界通用流行的标准之一除了商业理解和数据理解之外还包含了哪些步骤?

下哪些选项不是 n 重伯努利实验必须要满足的条件?

以下关于奇异值分解错误的是?

HCIE-Big Data-Data Mining：培训与认证具备通过华为FusionInsight HD或开源技术平台进行大数据端到端建模，解决业务实际问题能力的专家