亚马逊AWS机器学习答案-练习题

樊博雅
2023-12-01

本人所整理的劳动成果,转载请务必注明出处,谢谢!

有问题欢迎评论区讨论交流,大家一起学习~


[Module 2 - Introducing Machine Learning]

1.机器学习是有关算法和统计模型的科学研究,依靠推理而不是指令来执行任务

2.强化学习通过与环境交互并学习采取能够获得最大奖励的行动

3.为呼叫中心创建机器学习解决方案,系统模板是将客户转接到适当部门(共有八个可能的部门)

此场景描述了多类别分类问题

4.需要系统响应环境变化以提高性能:强化学习

5.机器学习管道的数据准备阶段设计验证数据是否全部属于统一类型

6.多个国家或地区的数据按缩写字幕顺序列出,哪些阶段涉及到将这些缩写转换为数值:数据准备

7.如果一个模型在训练数据上表现很好,但在评估数据上表现不佳,则属于过拟合模型。正确

8.哪些资源是用于处理机器学习问题的python库:pandas,scikit-learn

9.可以使用哪项Amazon服务部署机器学习实例并运行Jupyter笔记本:Amazon SageMaker

10.选择机器学习作为开发方法有哪些要求:包含大量变量的大型数据集


[Module 3 - Implementing a Machine Learning pipeline with Amazon SageMaker]

1.哪些资源有助于定义机器学习问题:对已标记数据的访问权、可咨询的领域专家

2.准备用于监督分类学习的数据应当具备哪些属性:数据应当已标记、数据应该是生产数据的代表

3.通过检查数据统计信息可以获得什么发现:发现数据异常

4.对于一个可用于训练模型的预处理的数据集,应该如何拆分训练数据:80%用于训练,剩余拆分为测试数据(10%)和验证数据(10%)

5.可以通过Amazon SageMaker机械能单模型和多模型托管。正确

6.混淆矩阵的作用:显示真假阳性和真假阴性

7.相关性热图显示哪些内容:数据集特征之间的相关度(正相关/负相关)

8.pandas支持导入以下哪些文件格式的数据:JSON、CSV

9.使用哪项Amazon服务部署机器学习实例并运行Jupyter笔记本:Amazon SageMaker

10.Amazon SageMaker超参数调优作业的目标是什么:优化模型参数以生成最佳模型


[Module 4 - Implementing a Machine Learning pipeline with Amazon SageMaker]

1.时间序列数据中有哪些常见模式:趋势性、季节性

2.哪些使用案例适合预测:预测仓库中货品必需的库存量、预测办公室的能源消耗

3.哪些数据集可以用作时间序列数据集(core:包含时间):包含货品、购买日期和数量的销售数据;包含IP地址、页面和时间戳的Web日志

4.对于一个气象站温度读数的数据集(每5分钟记录一次),每天都缺失了几个值,可以采取哪种对策:向前/向后填充缺失值

5.哪些场景展示了适当的下采样示例:使用mean函数将每分钟温度读数转换为小时制;使用sum函数将当日销售订单信息转换为每日总计

6.在时间序列数据中可以观察到哪些季节性示例:每季度、每年、春夏秋冬

7.Amazon Forecast生成P10、P50和P90预测结果。如果使用Amazon Forecast预测鞋靴销量,则可通过P10、P50和P90了解哪些信息(core:P值表示true值将低于预测值的百分比):P10表示在10%的时间内订购量小于预测值

8.使用Amazon Forecast生成零售预测需要哪些数据集(core:时间序列):包含时间戳、货品和数量的时间序列数据

9.为了使用可用的数据生成最佳模型,需要执行哪些步骤:使用pandas将数据按时间拆分为训练数据集合测试数据集;通过指定回测窗口,在Amazon Forecast中使用训练数据集;使用测试数据集来比较预测值和实际值


[Module 5 - Introducing Computer Vision (CV)]

1.哪些是计算机视觉的常见使用案例:图像分析、面部识别、家庭安全

2.图像中的对象位置叫什么:边界框

3.Amazon Rekognition提供哪些功能:搜索图像和视频库、识别面部、对图像执行情绪分析

4.当Amazon Rekognition执行预测时,它还会提供一个表示预测置信度的分数。正确

5.Amazon Rekognition在完成视频分析后会对结果执行什么操作:将结果发布到Amazon SNS队列

6.Amazon Rekognition Custom Labels具有哪些功能:标记图像和定义边界框的UI;自动选择机器学习算法

7.要使用Amazon SageMaker Ground Truth自动标记数据功能,所需的最小图像数量为:1250

8.什么是混淆矩阵:确定模型在分类对象时的准确性

9.Amazon SageMaker Ground Truth 清单文件中包含哪些类型的数据:置信度值、创建日期、类名称

10.以下哪些步骤用于为对象检测准备自定义数据集:收集图像、训练模型


[Module 6 - Introducing Natural Language Processing]

1.以下哪个问题不是自然语言处理(NLP)的主要挑战:存储限制

2.NLP应用程序有哪些常见的预处理任务:消除噪声、规范化类似词语

3.NLP早于机器学习系统出现。正确

4.有哪些用于NLP应用程序的常见机器学习模型:词袋、词频和逆文档频率

5.以下哪项不属于文本分析类别:自动更正文本

6.Amazon Transcribe支持哪些功能:将流式传输音频转换为文本;构建多种语言字幕

7.可以如何更改Amazon Polly的单词发音方式:向文本添加语音合成标记语言(SSML)标记

8.哪些功能属于Amazon Comprehend:识别文档中使用的语言;确定文档中包含的情绪(正面、负面、中性或混合)

9.可以使用以下哪项AWS服务根据Amazon Lex聊天机器人的输入来启动工作流:Amazon Lambda

10.当供职于一家为全球受众构建应用程序的公司,可以借助哪些服务分析客户使用应用程序的方式:Amazon Comprehend、Amazon Translate

 类似资料: