当前位置: 首页 > news >正文

如何将数据库导入网站wordpress微信机器人高级版 免费

如何将数据库导入网站,wordpress微信机器人高级版 免费,wordpress语言设置,南宁互联网公司前十名1、 下列说法错误的是#xff1f;c A、UserCF算法推荐的是那些和目标用户有共同兴趣爱好的其他用户所喜欢的物品 B、ItemCF算法推荐的是那些和目标用户之前喜欢的物品类似的其他物品 C、UserCF算法的推荐更偏向个性化 D、UserCF随着用户数目的增大#xff0c;用户相似度…1、 下列说法错误的是c A、UserCF算法推荐的是那些和目标用户有共同兴趣爱好的其他用户所喜欢的物品 B、ItemCF算法推荐的是那些和目标用户之前喜欢的物品类似的其他物品 C、UserCF算法的推荐更偏向个性化 D、UserCF随着用户数目的增大用户相似度计算复杂度越来越高 2、 下面关于UserCF算法和ItemCF算法的对比哪个是错误的c A、UserCF算法的推荐更偏向社会化适合应用于新闻推荐、微博话题推荐等应用场景其推荐结果在新颖性方面有一定的优势 B、ItemCF算法的推荐更偏向于个性化 C、ItemCF随着用户数目的增大用户相似度计算复杂度越来越高 D、UserCF推荐结果相关性较弱难以对推荐结果作出解释容易受大众影响而推荐热门物品 3、 下列关于推荐系统的描述哪一项是错误的D A、推荐系统是大数据在互联网领域的典型应用 B、推荐系统是自动联系用户和物品的一种工具 C、推荐系统可以创造全新的商业和经济模式帮助实现长尾商品的销售 D、推荐系统分为基于物品的协同过滤和基于商家的协同过滤 4、 下列哪一项不属于推荐算法A A、基于物品和商家的联合协同推荐 B、基于统计的推荐 C、专家推荐 D、基于内容的推荐 5、 下列描述有误的是B A、专家推荐人工推荐由资深的专业人士来进行物品的筛选和推荐需要较多的人力成本性 B、基于统计的推荐通过机器学习的方法去描述内容的特征并基于内容的特征来发现与之相似的内容 C、协同过滤推荐应用最早和最为成功的推荐方法之一 D、混合推荐结合多种推荐算法来提升推荐效果 6、 下列哪一项不属于完整推荐系统的三个模块之一D A、用户建模模块 B、推荐对象建模模块 C、推荐算法模块 D、数据采集模块 7、 下列关于协同过滤的说法哪一项是错误的C A、协同过滤可分为基于用户的协同过滤和基于物品的协同过滤 B、UserCF算法符合人们对于“趣味相投”的认知即兴趣相似的用户往往有相同的物品喜好 C、实现UserCF算法的关键步骤是计算物品与物品之间的相似度 D、基于物品的协同过滤算法简称ItemCF算法是目前业界应用最多的算法 8、 下列哪个说法是错误的D A、无论是亚马逊还是Netflix其推荐系统的基础都是ItemCF算法 B、ItemCF算法是给目标用户推荐那些和他们之前喜欢的物品相似的物品 C、ItemCF算法主要通过分析用户的行为记录来计算物品之间的相似度 D、实现UserCF算法的关键步骤是计算物品与物品之间的相似度 9、 下列哪一项说法是错误的C A、UserCF算法推荐的是那些和目标用户有共同兴趣爱好的其他用户所喜欢的物品 B、ItemCF算法推荐的是那些和目标用户之前喜欢的物品类似的其他物品 C、ItemCF算法的推荐更偏向社会化而UserCF算法的推荐更偏向于个性化 D、ItemCF算法倾向于推荐与用户已购买商品相似的商品往往会出现多样性不足、推荐新颖度较低的问题 多选 1、 下列哪些属于大数据应用ABCD A、推荐系统为用户推荐相关商品 B、物流基于大数据和物联网技术的智能物流 C、智能交通利用交通大数据实现交通实时监控 D、汽车无人驾驶汽车实时采集车辆各种行驶数据和周围环境 2、 下列关于推荐系统集群的描述哪些是正确的ABC A、为了让用户从海量信息中高效地获得自己所需的信息推荐系统应运而生 B、推荐系统是大数据在互联网领域的典型应用 C、推荐系统是自动联系用户和物品的一种工具 D、推荐系统是利用大数据调整线下门店布局、控制店内人流量 3、 下列关于推荐长尾理论的描述哪些是正确的ABCD A、推荐系统可以创造全新的商业和经济模式帮助实现长尾商品的销售 B、“长尾”概念于2004年提出用来描述以亚马逊为代表的电子商务网站的商业和经济模式 C、可以通过发掘长尾商品并推荐给感兴趣的用户来提高销售额 D、热门推荐的主要缺陷在于推荐的范围有限所推荐的内容在一定时期内也相对固定。无法实现长尾商品的推荐 4、 推荐系统的本质是建立用户与物品的联系根据推荐算法的不同推荐方法包括以下哪几类ABCD A、专家推荐人工推荐由资深的专业人士来进行物品的筛选和推荐需要较多的人力成本 B、基于统计的推荐基于统计信息的推荐如热门推荐易于实现但对用户个性化偏好的描述能力较弱 C、基于内容的推荐通过机器学习的方法去描述内容的特征并基于内容的特征来发现与之相似的内容 D、混合推荐结合多种推荐算法来提升推荐效果 5、 一个完整的推荐系统通常包括以下哪三个模块ACD A、用户建模模块 B、数据采集模块 C、推荐对象建模模块 D、推荐算法模块 6、 下列关于推荐系统的描述哪些是正确的ABCD A、用户建模模块对用户进行建模根据用户行为数据和用户属性数据来分析用户的兴趣和需求 B、推荐对象建模模块根据对象数据对推荐对象进行建模 C、推荐算法模块基于用户特征和物品特征采用推荐算法计算得到用户可能感兴趣的对象 D、推荐算法模块根据推荐场景对推荐结果进行一定调整将推荐结果最终展示给用户 7、 协同过滤可分为哪几种过滤方式AB A、基于用户的协同过滤 B、基于物品的协同过滤 C、基于用户和物品的联合协同过滤 D、基于商家的协同过滤 8、 关于基于用户的协同过滤下列哪些说法是正确的ABCD A、基于用户的协同过滤算法简称UserCF算法在1992年被提出是推荐系统中最古老的算法 B、UserCF算法符合人们对于“趣味相投”的认知 C、实现UserCF算法的关键步骤是计算用户与用户之间的兴趣相似度 D、UserCF算法符合兴趣相似的用户往往有相同的物品喜好 9、 实现UserCF算法的关键步骤是计算用户与用户之间的兴趣相似度下列哪些是属于计算相似度的算法A A、泊松相关系数 B、余弦相似度 C、调整余弦相似度 D、调整正弦相似度 10、 下列关于协同过滤算法的描述哪些是正确的ABCD A、基于物品的协同过滤算法简称ItemCF算法是目前业界应用最多的算法 B、ItemCF算法是给目标用户推荐那些和他们之前喜欢的物品相似的物品 C、ItemCF算法通过建立用户到物品倒排表每个用户喜欢的物品的列表来计算物品相似度 D、UserCF算法推荐的是那些和目标用户有共同兴趣爱好的其他用户所喜欢的物品 1、 下列关于数据可视化的描述哪个是错误的D A、数据可视化是指将大型数据集中的数据以图形图像形式表示 B、利用数据分析和开发工具发现其中未知信息的处理过程 C、数据可视化技术的基本思想是将数据库中每一个数据项作为单个图元素表示 D、将数据的各个属性值以一维数据的形式表示 2、 下列哪个不属于可视化工具A A、Google Chart API B、D3 C、Visual.ly D、Spark 3、 Spark B A、大数据魔镜是一款优秀的国产数据分析软件可以让用户真正理解探索分析数据 B、Tableau是桌面系统中最简单的商业智能工具软件是一个用于网页作图、生成互动图形的JavaScript函数库 C、Google Fusion Tables让一般使用者也可以轻松制作出专业的统计地图 D、Modest Maps是一个小型、可扩展、交互式的免费库提供了一套查看卫星地图的API 4、 下面关于Timetoast的描述哪个是错误的D A、Timetoast是在线创作基于时间轴事件记载服务的网站 B、提供个性化的时间线服务 C、Timetoast基于 flash 平台可以在类似flash时间轴上任意加入事件 D、Timetoast是一个提供复杂统计图表的工具 5、 下列关于可视化工具中高级分析工具的说法错误的是B A、R是属于GNU系统的一个自由、免费、源代码开放的软件 B、Weka主要用于社交图谱数据可视化分析可以生成非常酷炫的可视化图形 C、Gephi主要用于社交图谱数据可视化分析可以生成非常酷炫的可视化图形 D、R通常用于大数据集的统计与分析 多选 1、 在大数据时代可视化技术可以支持实现哪些目标ABCD A、观测、跟踪数据 B、分析数据 C、辅助理解数据 D、增强数据吸引力 2、 信息图表是信息、数据、知识等的视觉化表达下列哪个说法正确ABCD A、谷歌公司的制图服务接口Google Chart API可以用来为统计数据并自动生成图片 B、D3是最流行的可视化库之一是一个用于网页作图、生成互动图形的JavaScript函数库 C、ECharts是由百度公司前端数据可视化团队研发的图表库可以流畅地运行在PC和移动设备上 D、大数据魔镜是一款优秀的国产数据分析软件它丰富的数据公式和算法可以让用户真正理解探索分析数据 3、 下列关于数据可视化的描述正确的有ABC A、数据可视化是指将大型数据集中的数据以图形图像形式表示 B、数据可视化技术的基本思想是将数据库中每一个数据项作为单个图元素表示 C、利用数据分析和开发工具发现其中未知信息的处理过程 D、将数据的各个属性值以一维数据的形式表示 4、 下列说法中哪些是正确的ABCD A、Modest Maps是一个小型、可扩展、交互式的免费库 B、Leaflet是一个小型化的地图框架通过小型化和轻量化来满足移动网页的需要 C、Google Fusion Tables让一般使用者也可以轻松制作出专业的统计地图 D、大数据魔镜是一款优秀的国产数据分析软件它丰富的数据公式和算法可以让用户真正理解探索分析数据 多选 1、 下列关于图结构数据的描述错误的是A A、许多非图结构的大数据通常会被转换为关系模型后进行分析 B、许多大数据都是以大规模图或网络的形式呈现 C、图数据结构很好地表达了数据之间的关联性 D、关联性计算是大数据计算的核心 2、 在Pregel计算模型中图中的每个顶点会对应一个计算单元下列哪一项不属于计算单元的成员变量D A、顶点值Vertex value顶点对应的PR值 B、出射边Out edge只需要表示一条边可以不取值 C、消息Message传递的消息 D、入射边Iut edge只需要表示一条边可以不取值 3、 采用MapReduce实现PageRank的计算过程包括三个阶段下列哪一项是错的D A、第一阶段解析网页 B、第二阶段PageRank分配 C、第三阶段收敛阶段 D、第一阶段收集网页 4、 下列关于PageRank 算法在MapReduce 中的实现的描述错误的是A A、解析网页的任务就是分析一个页面的链接数但是不赋初值 B、PageRank 分配就是多次迭代计算页面的PageRank值 C、收敛阶段的任务就是由一个非并行组件决定是否达到收敛 D、一般判断是否收敛的条件是所有网页的PageRank值不再变化或者运行30次以后我们就认为已经收敛了 5、 下列哪个不属于PageRank算法在Pregel和MapReduce中实现方式的区别D A、Pregel将PageRank处理对象看成是连通图而MapReduce则将其看成是键值对 B、Pregel将计算细化到顶点同时在顶点内控制循环迭代次数 C、MapReduce将计算批量化处理按任务进行循环迭代控制 D、图算法如果用Pregel实现需要一系列的Pregel的调用 6、 下列哪项不属于在Vetex类中的值类型参数A A、顶点的出度 B、顶点 C、边 D、消息 7、 在每个超步中Worker调用顶点上的Compute()函数下列哪个参数是不需要传递D A、该顶点的当前值 B、一个接收到的消息的迭代器 C、一个出射边的迭代器 D、一个入射边的迭代器 8、 下列哪一项不属于每个超步的组件B A、全局计算 B、局部计算 C、通讯 D、栅栏同步 9、 在一个Worker中它所管辖的分区的状态信息是保存在内存中的下列哪一项不属于分区的状态信息D A、顶点的当前值 B、消息队列 C、标志位 D、一个接收到的消息的迭代器 多选 1、 很多传统的图计算算法都存在以下哪些典型问题ABC A、常常表现出比较差的内存访问局部性 B、针对单个顶点的处理工作过少 C、计算过程中伴随着并行度的改变 D、计算过程简易 2、 针对大型图比如社交网络和网络图的计算问题哪些说法是正确的ABCD A、为特定的图应用定制相应的分布式实现通用性不好 B、基于现有的分布式计算平台进行图计算在性能和易用性方面往往无法达到最优 C、使用单机的图算法库但是在可以解决的问题的规模方面具有很大的局限性 D、使用已有的并行图计算系统但是对大规模分布式系统非常重要的一些方面比如容错无法提供较好的支持 3、 针对大型图的计算目前通用的图计算软件主要哪些AB A、基于遍历算法的、实时的图数据库如Neo4j、OrientDB、DEX和 Infinite Graph B、以图顶点为中心的、基于消息传递批处理的并行引擎如GoldenOrb、Giraph、Pregel和Hama C、基于遍历算法的、实时的图数据库如GoldenOrb、Giraph、Pregel和Hama D、以图顶点为中心的、基于消息传递批处理的并行引擎如Neo4j、OrientDB、DEX和 Infinite Graph 4、 一次BSP(Bulk Synchronous Parallel Computing Model又称“大同步”模型)计算过程包括一系列全局超步所谓的超步就是计算中的一次迭代每个超步主要包括哪些组件ABC A、局部计算每个参与的 处理器都有自身的计算任务 B、通讯处理器群相互交换数据 C、栅栏同步当一个处理器遇到“路障”或栅栏会等到其他所有处理器完成它们的计算步骤 D、基于现有的分布式计算平台进行图计算 5、 下列说法正确的是ABCD A、在Pregel执行计算过程时在每个超步中都会并行调用每个顶点上定义的Compute()函数 B、顶点之间的通讯是借助于消息传递机制来实现的 C、在默认情况下Pregel计算框架并不会开启Combiner功能 D、通常只对那些满足交换律和结合律的操作才可以去开启Combiner功能 6、 在Pregel计算框架中图的保存格式多种多样具体包括哪些ABC A、文本文件 B、关系数据库 C、键值数据库 D、语音文件 7、 下列对于Pregel的执行过程哪些是正确的ABCD A、选择集群中的多台机器执行图计算任务每台机器上运行用户程序的一个副本 B、Master把一个图分成多个分区并把分区分配到多个Worker C、Master会把用户输入划分成多个部分通常是基于文件边界进行划分 D、Master向每个Worker发送指令Worker收到指令后开始运行一个超步 8、 在一个Worker中它所管辖的分区的状态信息是保存在内存中的分区中的顶点的状态信息包括ABCD A、顶点的当前值 B、以该顶点为起点的出射边列表每条出射边包含了目标顶点ID和边的值 C、消息队列包含了所有接收到的、发送给该顶点的消息 D、标志位用来标记顶点是否处于活跃状态 9、 在每个超步中Worker会对自己所管辖的分区中的每个顶点进行遍历并调用顶点上的Compute()函数在调用时会把以下哪些参数传递进去ABC A、该顶点的当前值 B、一个接收到的消息的迭代器 C、一个出射边的迭代器 D、标志位用来标记顶点是否处于活跃状态 10、 下列说法正确的有ABCD A、在Pregel中为了获得更好的性能“标志位”和输入消息队列是分开保存的 B、在超步S中当一个Worker在进行顶点处理时用于当前超步的消息会被处理 C、需要两个消息队列用于存放作用于当前超步S的消息和作用于下一个超步S1的消息 D、每个Worker上都保存了一个或多个分区的状态信息当一个Worker发生故障时它所负责维护的分区的当前状态信息就会丢失 多选 1、 下面描述错误的是D A、Storm虽然可以做到低延迟但是无法实现高吞吐也不能在故障发生时准确地处理计算状态 B、Spark Streaming通过采用微批处理方法实现了高吞吐和容错性但是牺牲了低延迟和实时处理能力 C、Flink实现了Google Dataflow流计算模型是一种兼具高吞吐、低延迟和高性能的实时流计算框架并且同时支持批处理和流处理 D、Spark Streaming可以实现毫秒级响应而Flink只能实现秒级响应 2、 以下哪个不属于事件驱动型应用D A、反欺诈 B、异常检测 C、基于规则的报警 D、消费者技术中的实时数据即席分析 3、 以下哪个不属于数据分析应用A A、基于规则的报警 B、移动应用中的产品更新及实验评估分析 C、消费者技术中的实时数据即席分析 D、大规模图分析 4、 以下哪个属于数据流水线应用B A、基于规则的报警 B、实时查询索引构建 C、移动应用中的产品更新及实验评估分析 D、消费者技术中的实时数据即席分析 多选 1、 企业数据架构的典型形式包括ABC A、传统数据处理架构 B、大数据Lambda架构 C、流处理架构 D、循环处理架构 2、 Flink的优势包括ABCD A、同时支持高吞吐、低延迟、高性能 B、同时支持流处理和批处理 C、支持有状态计算 D、具有独立的内存管理 3、 Flink常见的应用场景包括ABC A、事件驱动型应用 B、数据分析应用 C、数据流水线应用 D、正反馈应用 4、 Flink核心组件栈包括ACD A、物理部署层 B、算法库层 C、Runtime核心层 D、APILibraries层 5、 Flink系统主要由两个组件组成AD A、JobManager B、JobTrackder C、TaskTracker D、TaskManager 6、 Flink编程模型包括哪几层ABCD A、SQL B、Table API C、DataStream API / DataSet API D、有状态数据流处理 1、 下列关于流计算的说法哪项是错误的D A、实时获取来自不同数据源的海量数据经过实时分析处理获得有价值的信息 B、流计算秉承一个基本理念即 数据的价值随着时间的流逝而降低 C、对于一个流计算系统来说它应该支持TB级甚至是PB级的数据规模 D、流计算只需要保证较低的延迟时间即只达到秒级别即可处理一切问题 2、 下列关于数据处理流程说法有误的是D A、在传统的数据处理流程中存储的数据是旧的 B、在传统的数据处理流程中需要用户主动发出查询来获取结果 C、传统的数据处理流程需要先采集数据并存储在关系数据库等数据管理系统中 D、流计算的处理流程一般包含三个阶段数据实时采集、数据批量计算、实时查询服务 3、 下列哪项不属于流计算的处理流程的三个阶段B A、数据实时采集 B、数据批量采集 C、数据实时计算 D、实时查询服务 4、 下列哪一项不属于Storm的特点B A、支持各种编程语言Storm支持使用各种编程语言来定义任务 B、容错性Storm需要人工进行故障节点的重启、任务的重新分配 C、可扩展性Storm的并行特性使其可以运行在分布式集群中 D、免费、开源Storm是一款开源框架可以免费使用 5、 下列关于Storm设计思想描述有误的是A A、Storm将Streams的状态转换过程抽象为Spout B、Storm认为每个Stream都有一个源头并把这个源头抽象为Spout C、Storm将Spouts和Bolts组成的网络抽象成Topology D、Topology里面的每个处理组件Spout或Bolt都包含处理逻辑 而组件之间的连接则表示数据流动的方向 6、 下列关于Storm和Hadoop架构组件功能对应关系哪个是错误的C A、Hadoop Job 对应 Storm Topology B、Hadoop TaskTracker对应 Storm Supervisor C、Hadoop JobTracker对应 Storm Spout D、Hadoop Reduce对应 Storm Bolt 7、 下列哪个说法是错误的D A、从编程的灵活性来讲Storm是比较理想的选择它使用Apache Thrift可以用任何编程语言来编写拓扑结构Topology B、Spark Streaming可以实现毫秒级的流计算 C、Spark Streaming无法实现毫秒级的流计算 D、在Spark上可以统一部署Spark SQLSpark Streaming、MLlibGraphX等组件提供便捷的一体化编程模型 8、 下列关于Storm的描述有误的是A A、Storm将流数据Stream描述成一个有限的Tuple序列 B、Storm保证每个消息都能完整处理 C、Storm认为每个Stream都有一个源头并把这个源头抽象为Spout D、Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作 9、 下列哪个关于Stream Groupings的描述有误的是A A、FieldsGrouping广播发送每一个Task都会收到所有的Tuple B、GlobalGrouping全局分组所有的Tuple都发送到同一个Task中 C、NonGrouping不分组和ShuffleGrouping类似当前Task的执行会和它的被订阅者在同一个线程中执行 D、DirectGrouping直接分组直接指定由某个Task来执行Tuple的处理 多选 1、 流数据具有以下哪些特征ABC A、数据快速持续到达潜在大小也许是无穷无尽的 B、数据来源众多格式复杂 C、注重数据的整体价值不过分关注个别数据 D、系统可以控制将要处理的新到达的数据元素的顺序 2、 下列关于批量计算和实时计算的说法正确的有ACD A、批量计算充裕时间处理静态数据如Hadoop B、静态数据不适合采用批量计算因为它不适合用传统的关系模型建模 C、流数据必须采用实时计算 D、流数据的响应时间一般为秒级甚至需要毫秒级 3、 对于一个流计算系统来说它应达到以下哪些需求ABCD A、高性能处理大数据的基本要求如每秒处理几十万条数据 B、实时性保证较低的延迟时间达到秒级别甚至是毫秒级别 C、分布式支持大数据的基本架构必须能够平滑扩展 D、可靠性能可靠地处理流数据 4、 下列关于流处理系统与传统的数据处理系统的描述正确的有ABC A、流处理系统处理的是实时的数据而传统的数据处理系统处理的是预先存储好的静态数据 B、用户通过流处理系统获取的是实时结果而通过传统的数据处理系统获取的是过去某一时刻的结果 C、流处理系统无需用户主动发出查询实时查询服务可以主动将结果推送给用户 D、传统的数据处理系统系统无需用户主动发出查询批量查询服务可以主动将结果推送给用户 5、 Storm具有以下哪些特点ABCD A、整合性Storm可方便地与队列系统和数据库系统进行整合 B、简易的APIStorm的API在使用上即简单又方便 C、容错性Storm可自动进行故障节点的重启、任务的重新分配 D、可扩展性Storm的并行特性使其可以运行在分布式集群中 6、 目前Storm中的Stream Groupings有如下哪几种方式ABC A、AllGrouping广播发送每一个Task都会收到所有的Tuple B、GlobalGrouping全局分组所有的Tuple都发送到同一个Task中 C、FieldsGrouping按照字段分组保证相同字段的Tuple分配到同一个Task中 D、DirectGrouping随机分组随机分发Stream中的Tuple保证每个Bolt的Task接收Tuple数量大致一致 7、 下列关于Storm框架描述正确的有ABCD A、worker:每个worker进程都属于一个特定的Topology B、executorexecutor是产生于worker进程内部的线程 C、task:实际的数据处理由task完成 D、在Topology的生命周期中每个组件的task数目是不会发生变化的而executor的数目却不一定 8、 下列关于Spark Streaming与Storm的描述哪些是正确的的ABD A、Spark Streaming无法实现毫秒级的流计算 B、Storm可以实现毫秒级响应件 C、Storm无法用于实时计算 D、Spark Streaming采用的小批量处理的方式使得它可以同时兼容批量和实时数据处理的逻辑和算法 多选 1、 下列关于Spark的描述错误的是哪一项D A、Spark最初由美国加州伯克利大学UCBerkeley的AMP实验室于2009年开发 B、Spark在2014年打破了Hadoop保持的基准排序纪录. C、Spark用十分之一的计算资源获得了比Hadoop快3倍的速度 D、Spark运行模式单一 2、 下列关于Spark的描述错误的是哪一项C A、使用DAG执行引擎以支持循环数据流与内存计算析 B、可运行于独立的集群模式中可运行于Hadoop中也可运行于Amazon EC2等云环境中 C、支持使用Scala、Java、Python和R语言进行编程但是不可以通过Spark Shell进行交互式编程 D、可运行于独立的集群模式中可运行于Amazon EC2等云环境中 3、 下列关于Scala特性的描述错误的是哪一项A A、Scala语法复杂但是能提供优雅的API计算 B、Scala具备强大的并发性支持函数式编程可以更好地支持分布式系统 C、Scala兼容Java运行速度快且能融合到Hadoop生态圈中 D、Scala是Spark的主要编程语言 4、 下列说法哪项有误C A、相对于Spark来说使用Hadoop进行迭代计算非常耗资源 B、Spark将数据载入内存后之后的迭代计算都可以直接使用内存中的中间结果作运算避免了从磁盘中频繁读取数据 C、Hadoop的设计遵循“一个软件栈满足不同应用场景”的理念 D、Spark可以部署在资源管理器YARN之上提供一站式的大数据解决方案 5、 在Spark生态系统组件的应用场景中下列哪项说法是错误的C A、Spark应用在复杂的批量数据处理 B、Spark SQL是基于历史数据的交互式查询 C、Spark Streaming是基于历史数据的数据挖掘 D、GraphX是图结构数据的处理 6、 下列说法错误的是A A、RDDResillient Distributed Dataset是运行在工作节点WorkerNode的一个进程负责运行Task B、Application是用户编写的Spark应用程序 C、一个Job包含多个RDD及作用于相应RDD上的各种操作 D、Directed Acyclic Graph反映RDD之间的依赖关系 7、 下列关于RDD说法描述有误的是C A、一个RDD就是一个分布式对象集合本质上是一个只读的分区记录集合 B、每个RDD可分成多个分区每个分区就是一个数据集片段 C、RDD是可以直接修改的 D、RDD提供了一种高度受限的共享内存模型 8、 Spark生态系统组件Spark Streaming的应用场景是D A、基于历史数据的数据挖掘 B、图结构数据的处理 C、基于历史数据的交互式查询 D、基于实时数据流的数据处理 9、 Spark生态系统组件MLlib的应用场景是D A、图结构数据的处理 B、基于历史数据的交互式查询 C、复杂的批量数据处理 D、基于历史数据的数据挖掘 多选 1、 Spark具有以下哪几个主要特点ABC A、运行速度快 B、容易使用 C、通用性 D、运行模式单一 2、 Scala具有以下哪几个主要特点ABCD A、Scala的优势是提供了REPLRead-Eval-Print Loop交互式解释器提高程序开发效率 B、Scala兼容Java运行速度快且能融合到Hadoop生态圈中 C、Scala具备强大的并发性支持函数式编程 D、Scala可以更好地支持分布式系统 3、 下列哪些选项属于Hadoop的缺点ABCD A、表达能力有限 B、磁盘IO开销大 C、延迟高 D、在前一个任务执行完成之前其他任务就无法开始难以胜任复杂、多阶段的计算任务 4、 下列说法中哪些选项描述正确AB A、Spark在借鉴Hadoop MapReduce优点的同时很好地解决了MapReduce所面临的问题 B、Spark的计算模式也属于MapReduce但不局限于Map和Reduce操作 C、Hadoop MapReduce编程模型比Spark更灵活 D、Hadoop MapReduce提供了内存计算可将中间结果放到内存中对于迭代运算效率更高 5、 在实际应用中大数据处理主要包括以下哪三个类型ABD A、复杂的批量数据处理通常时间跨度在数十分钟到数小时之间 B、基于历史数据的交互式查询通常时间跨度在数十秒到数分钟之间 C、基于实时数据流的数据处理通常时间跨度在数十秒到数分钟之间 D、基于实时数据流的数据处理通常时间跨度在数百毫秒到数秒之间 6、 在实际应用中当采用多种计算架构来满足不同应用场景需求时大数据处理难免会带来哪些问题ABCD A、不同场景之间输入输出数据无法做到无缝共享通常需要进行数据格式的转换 B、不同的软件需要不同的开发和维护团队 C、需要较高的使用成本 D、比较难以对同一个集群中的各个系统进行统一的资源协调和分配 7、 与Hadoop MapReduce计算框架相比Spark所采用的Executor具有哪些优点AB A、利用多线程来执行具体的任务减少任务的启动开销 B、Executor中有一个BlockManager存储模块有效减少IO开销 C、提供了一种高度受限的共享内存模型 D、不同场景之间输入输出数据能做到无缝共享 8、 Spark运行架构具有以下哪些特点ABCD A、每个Application都有自己专属的Executor进程并且该进程在Application运行期间一直驻留 B、Executor进程以多线程的方式运行Task C、Spark运行过程与资源管理器无关只要能够获取Executor进程并保持通信即可 D、Task采用了数据本地性和推测执行等优化机制 9、 Spark采用RDD以后能够实现高效计算的原因主要在于ABC A、高效的容错性 B、中间结果持久化到内存数据在内存中的多个 C、存放的数据可以是Java对象避免了不必要的对象序列化和反序列化 D、采用数据复制实现容错 10、 Spark支持哪三种不同类型的部署方式ABC A、Standalone类似于MapReduce1.0slot为资源分配单位 B、Spark on Mesos和Spark有血缘关系更好支持Mesos C、Spark on YARN D、Spark on HDFS 1、 下列有关Hive和Impala的对比错误的是:D A、Hive与Impala使用相同的元数据 B、Hive与Impala中对SQL的解释处理比较相似都是通过词法分析生成执行计划 C、Hive适合于长时间的批处理查询分析而Impala适合于实时交互式SQL查询 D、Hive在内存不足以存储所有数据时会使用外存而Impala也是如此 2、 下列关于Hive基本操作命令的解释错误的是:C A、create database userdb;//创建数据库userdb B、create table if not exists usr(id bigint,name string,age int);//如果usr表不存在创建表usr含三个属性id,name,age C、load data local inpath ‘/usr/local/data’ overwrite into table usr; //把目录’/usr/local/data’下的数据文件中的数据以追加的方式装载进usr表 D、insert overwrite table student select * from user where age10; //向表usr1中插入来自usr表的age大于10的数据并覆盖student表中原有数据 3、 下面哪个不可能是Hive的执行引擎C A、MapReduce B、Tez C、Storm D、Spark 4、 下面描述错误的是C A、Hive的功能十分强大可以支持采用SQL方式查询Hadoop平台上的数据 B、在实际应用中Hive也暴露出不稳定的问题在极少数情况下甚至会出现端口不响应或者进程丢失的问题 C、在Hive HA中在Hadoop集群上构建的数据仓库是由单个Hive实例进行管理的 D、在Hive HA中客户端的查询请求首先访问HAProxy由HAProxy对访问请求进行转发 5、 以下哪个不是数据仓库的特性C A、面向主题的 B、集成的 C、动态变化的 D、反映历史变化的 6、 下面关于Hive的描述错误的是D A、Hive是一个构建在Hadoop之上的数据仓库工具 B、Hive是由Facebook公司开发的 C、Hive在某种程度上可以看作是用户编程接口其本身并不存储和处理数据 D、Hive定义了简单的类似SQL的查询语言——HiveQL它与大部分SQL语法无法兼容 7、 下面关于Hive的描述错误的是D A、HBase与Hive的功能是互补的它实现了Hive不能提供的功能 B、当采用MapReduce作为执行引擎时用HiveQL语句编写的处理逻辑最终都要转化为MapReduce任务来运行 C、Hive一般用于处理静态数据主要是BI报表数据 D、Hive主要是用于满足实时数据流的处理需求 8、 关于Hive和传统关系数据库的对比分析下面描述错误的是B A、Hive一般依赖于分布式文件系统HDFS而传统数据库则依赖于本地文件系统 B、传统的关系数据库可以针对多个列构建复杂的索引Hive不支持索引 C、Hive和传统关系数据库都支持分区 D、传统关系数据库很难实现横向扩展Hive具有很好的水平扩展性 9、 以下哪个不是Hive的用户接口模块A A、PMI B、HWIHive Web Interface C、JDBC/ODBC D、Thrift Server 多选 1、 下列说法正确的是BCD A、数据仓库Hive不需要借助于HDFS就可以完成数据的存储 B、Impala和Hive、HDFS、HBase等工具可以统一部署在一个Hadoop平台上 C、Hive本身不存储和处理数据依赖HDFS存储数据依赖MapReduce处理数据 D、HiveQL语法与传统的SQL语法很相似 2、 Impala主要由哪几个部分组成:ABC A、Impalad B、State Store C、CLI D、Hive 3、 以下属于Hive的基本数据类型是:ABCD A、TINYINT B、FLOAT C、STRING D、BINARY 4、 数据仓库Hive的执行引擎可以是ABD A、Tez B、MapReduce C、Pig D、Spark 5、 以下哪些是数据仓库的特性ABCD A、面向主题的Subject Oriented B、集成的Integrated C、相对稳定的Non-Volatile D、反映历史变化 6、 传统数据仓库面临哪些挑战AD A、无法满足快速增长的海量数据存储需求 B、无法有效处理不同类型的数据 C、具有很强的扩展性 D、计算和处理能力不足 7、 Hadoop生态系统中Hive与其他部分的关系的描述正确的是ABCD A、HDFS作为高可靠的底层存储用来存储Hive的海量数据 B、MapReduce对这些海量数据进行批处理实现Hive的高性能计算 C、当采用MapRedue作为Hive的执行引擎时用HiveQL语句编写的处理逻辑最终都要转化为MapReduce任务来运行 D、HBase与Hive的功能是互补的它实现了Hive不能提供的功能 8、 关于Hive与传统关系数据库的对比分析下面描述正确的是ABD A、在数据存储方面Hive一般依赖于分布式文件系统HDFS而传统数据库则依赖于本地文件系统 B、在索引方面传统的关系数据库可以针对多个列构建复杂的索引大幅度提升数据查询性能而Hive不像传统的关系型数据库那样有键的概念它只能提供有限的索引功能 C、在分区方面传统的数据库提供分区功能来改善大型表以及具有各种访问模式的表的可伸缩性、可管理性以及提高数据库效率Hive不支持分区功能 D、在执行引擎方面传统的关系数据库依赖自身的执行引擎而Hive则依赖于MapReduce、Tez和Spark等执行引擎 9、 Hive主要由哪三个模块组成ABD A、用户接口模块 B、用户查询模块 C、驱动模块 D、元数据存储模块 10、 当采用MapReduce作为Hive的执行引擎时下面描述正确的是ABC A、当用户向Hive输入一段命令或查询即HiveQL语句时Hive需要与Hadoop交互工作来完成该操作 B、命令或查询首先进入到驱动模块由驱动模块中的编译器进行解析编译并由优化器对该操作进行优化计算然后交给执行器去执行 C、执行器通常的任务是启动一个或多个MapReduce任务有时也不需要启动MapReduce任务 D、执行器通常的任务一定会包含Map和Reduce操作 1、 Hadoop1.0的核心组件仅指MapReduce和HDFS不包括Hadoop生态系统内的Pig、Hive、HBase等其他组件下列哪项是它的不足B A、抽象层次高 B、表达能力有限抽象层次低需人工编码 C、价格昂贵 D、可维护性低 2、 下面哪个选项不属于Hadoop1.0 的问题D A、单一名称节点存在单点失效问题 B、单一命名空间无法实现资源隔离 C、资源管理效率低 D、很难上手 3、 下列哪项是Hadoop生态系统中Spark的功能D A、处理大规模数据的脚本语言 B、工作流和协作服务引擎协调Hadoop上运行的不同任务 C、不支持DAG作业的计算框架 D、基于内存的分布式并行编程框架具有较高的实时性并且较好支持迭代计算 4、 在Hadoop生态系统中Kafka主要解决Hadoop 中存在哪些的问题A A、Hadoop生态系统中各个组件和其他产品之间缺乏统一的、高效的数据交换中介 B、不同的MapReduce任务之间存在重复操作降低了效率 C、延迟高而且不适合执行迭代计算 D、抽象层次低需要手工编写大量代码 5、 下列哪一个不属于HDFS1.0 中存在的问题A A、无法水平扩展 B、单点故障问题 C、单一命名空间 D、系统整体性能受限于单个名称节点的吞吐量 6、 关于HDFS Federation 的设计的描述哪个是错误的A A、属于不同命名空间的块可以构成同一个“块池” B、HDFS Federation中所有名称节点会共享底层的数据节点存储资源数据节点向所有名称节点汇报 C、设计了多个相互独立的名称节点 D、HDFS的命名服务能够水平扩展 7、 下列关于MapReduce1.0的描述错误的是B A、JobTracker“大包大揽”导致任务过重 B、不存在单点故障 C、容易出现内存溢出分配资源只考虑MapReduce任务数不考虑CPU、内存 D、资源划分不合理强制划分为slot 包括Map slot和Reduce slot 8、 下列哪个不属于YARN体系结构中ResourceManager的功能D A、处理客户端请求 B、监控NodeManager C、资源分配与调度 D、处理来自ApplicationMaster的命令 9、 下列哪个不属于YARN体系结构中ApplicationMaster的功能D A、任务调度、监控与容错 B、为应用程序申请资源 C、将申请的资源分配给内部任务 D、处理来自ResourceManger的命令 多选 1、 下列选项中哪些属于Hadoop1.0的核心组件的不足之处ABCD A、实时性差适合批处理不支持实时交互式 B、资源浪费Map和Reduce分两阶段执行 C、执行迭代操作效率低 D、难以看到程序整体逻辑 2、 Hadoop的优化与发展主要体现在哪几个方面ABC A、Hadoop自身核心组件MapReduce的架构设计改进 B、Hadoop自身核心组件HDFS的架构设计改进 C、Hadoop生态系统其它组件的不断丰富 D、Hadoop生态系统减少不必要的组件整合系统 3、 下列哪些属于Hadoop2.0相对于Hadoop1.0的改进ABCD A、设计了HDFS HA B、提供名称节点热备机制 C、设计了HDFS Federation管理多个命名空间 D、设计了新的资源管理框架YARN 4、 下面哪个属于不断完善的Hadoop生态系统中的组件ABC A、Pig B、Tez C、Kafka D、DN8 5、 HDFS1.0 主要存在哪些问题ACD A、单点故障问题 B、不可以水平扩展 C、单个名称节点难以提供不同程序之间的隔离性 D、系统整体性能受限于单个名称节点的吞吐量 6、 HDFS Federation 相对于HDFS1.0 的优势主要体现在哪里BCD A、能够解决单点故障问题 B、HDFS 集群扩展性 C、性能更高效 D、良好的隔离性 7、 JobTracker主要包括哪三大功能ABC A、资源管理 B、任务调度 C、任务监控 D、数据即服务 8、 YARN 体系结构主要包括哪三部分ABD A、ResourceManager B、NodeManager C、DataManager D、ApplicationMaster 9、 在YARN体系结构中ApplicationMaster主要功能包括哪些ABC A、当用户作业提交时ApplicationMaster与ResourceManager协商获取资源ResourceManager会以容器的形式为ApplicationMaster分配资源 B、把获得的资源进一步分配给内部的各个任务Map任务或Reduce任务实现资源的“二次分配” C、定时向ResourceManager发送“心跳”消息报告资源的使用情况和应用的进度信息 D、向ResourceManager汇报作业的资源使用情况和每个容器的运行状态 1、 下列传统并行计算框架说法错误的是哪一项B A、刀片服务器、高速网、SAN价格贵扩展性差上 B、共享式(共享内存/共享存储)容错性好 C、编程难度高 D、实时、细粒度计算、计算密集型 2、 下列关于MapReduce模型的描述错误的是哪一项D A、MapReduce采用“ 分而治之”策略 B、MapReduce设计的一个理念就是“ 计算向数据靠拢” C、MapReduce框架采用了Master/Slave架构 D、MapReduce应用程序只能用Java来写 3、 MapReduce1.0的体系结构中JobTracker是主要任务是什么A A、负责资源监控和作业调度监控所有TaskTracker与Job的健康状况 B、使用“slot”等量划分本节点上的资源量CPU、内存等 C、会周期性地通过“心跳”将本节点上资源的使用情况和任务的运行进度汇报给TaskTracker D、会跟踪任务的执行进度、资源使用量等信息并将这些信息告诉任务Task 4、 下列关于MapReduce工作流程哪个描述是正确的A A、所有的数据交换都是通过MapReduce框架自身去实现的 B、不同的Map任务之间会进行通信 C、不同的Reduce任务之间可以发生信息交换 D、用户可以显式地从一台机器向另一台机器发送消息 5、 下列关于MapReduce的说法哪个描述是错误的D A、MapReduce具有广泛的应用比如关系代数运算、分组与聚合运算等 B、MapReduce将复杂的、运行于大规模集群上的并行计算过程高度地抽象到了两个函数 C、编程人员在不会分布式并行编程的情况下也可以很容易将自己的程序运行在分布式系统上完成海量数据集的计算 D、不同的Map任务之间可以进行通信 6、 下列关于Map和Reduce函数的描述哪个是错误的C A、Map将小数据集进一步解析成一批key,value对输入Map函数中进行处理 B、Map每一个输入的k 1 ,v 1 会输出一批k 2 ,v 2 。k 2 ,v 2 是计算的中间结果 C、Reduce输入的中间结果k 2 ,List(v 2 )中的List(v 2 )表示是一批属于不同k 2 的value D、Reduce输入的中间结果k 2 ,List(v 2 )中的List(v 2 )表示是一批属于同一个k 2 的value 7、 下面哪一项不是MapReduce体系结构主要部分A A、Client B、JobTracker C、TaskTracker以及Task D、Job 8、 关于MapReduce1.0的体系结构的描述下列说法错误的是A A、Task 分为Map Task 和Reduce Task 两种分别由JobTracker 和TaskTracker 启动 B、slot 分为Map slot 和Reduce slot 两种分别供MapTask 和Reduce Task 使用 C、TaskTracker 使用“slot”等量划分本节点上的资源量CPU、内存等 D、TaskTracker 会周期性接收JobTracker 发送过来的命令并执行相应的操作如启动新任务、杀死任务等 9、 下列说法错误的是C A、Hadoop MapReduce是MapReduce的开源实现后者比前者使用门槛低很多 B、MapReduce采用非共享式架构容错性好 C、MapReduce主要用于批处理、实时、计算密集型应用 D、MapReduce采用“ 分而治之”策略 多选 1、 MapReduce相较于传统的并行计算框架有什么优势ABCD A、非共享式容错性好 B、普通PC机便宜扩展性好 C、编程简单只要告诉MapReduce做什么即可 D、批处理、非实时、数据密集型 2、 MapReduce体系结构主要由以下那几个部分构成ABCD A、Client B、JobTracker C、TaskTracker D、Task 3、 下列关于MapReduce的体系结构的描述说法正确的有ABD A、用户编写的MapReduce程序通过Client提交到JobTracker端 B、JobTracker负责资源监控和作业调度 C、TaskTracker监控所有TaskTracker与Job的健康状况 D、TaskTracker 使用“slot”等量划分本节点上的资源量CPU、内存等 4、 MapReduce的作业主要包括什么AB A、从磁盘或从网络读取数据即IO密集工作 B、计算数据即CPU密集工作 C、针对不同的工作节点选择合适硬件类型 D、负责协调集群中的数据存储 5、 对于MapReduce 而言其处理单位是split。split 是一个逻辑概念它包含哪些元数据信息AB A、数据起始位置 B、数据长度 C、数据所在节点 D、数据大小 6、 下列关于Map 端的Shuffle的描述哪些是正确的BC A、MapReduce默认为每个Map任务分配1000MB缓存 B、多个溢写文件归并成一个或多个大文件文件中的键值对是排序的 C、当数据很少时不需要溢写到磁盘直接在缓存中归并然后输出给Reduce D、每个Map任务分配多个缓存使得任务运行更有效率 7、 MapReduce的具体应用包括哪些ABCD A、关系代数运算选择、投影、并、交、差、连接 B、分组与聚合运算 C、矩阵-向量乘法 D、矩阵乘法 8、 MapReduce执行的全过程包括以下哪几个主要阶段ABCD A、从分布式文件系统读入数据 B、执行Map任务输出中间结果 C、通过 Shuffle阶段把中间结果分区排序整理后发送给Reduce任务 D、执行Reduce任务得到最终结果并写入分布式文件系统 9、 下列说法正确的是ABCD A、MapReduce体系结构主要由四个部分组成分别是Client、JobTracker、TaskTracker以及Task B、Task 分为Map Task 和Reduce Task 两种均由TaskTracker 启动 C、在MapReduce工作流程中所有的数据交换都是通过MapReduce框架自身去实现的 D、在MapReduce工作流程中用户不能显式地从一台机器向另一台机器发送消息 1、 下列哪个不属于云计算的优势D A、按需服务 B、随时服务 C、通用性 D、价格不菲 2、 下列关于云数据库的描述哪个是错误的C A、云数据库是部署和虚拟化在云计算环境中的数据库 B、云数据库是在云计算的大背景下发展起来的一种新兴的共享基础架构的方法 C、云数据库价格不菲维护费用极其昂贵 D、云数据库具有高可扩展性、高可用性、采用多租形式和支持资源有效分发等特点 3、 下列哪一个不属于云数据库产品A A、本地安装MySQL B、阿里云RDS C、Oracle Cloud D、百度云数据库 4、 UMP系统是构建在一个大的集群之上的下列哪一项不属于系统向用户提供的功能D A、读写分离 B、分库分表 C、数据安全 D、资源合并 5、 下列关于UMP系统功能的说法哪个是错误的D A、充分利用主从库实现用户读写操作的分离实现负载均衡 B、UMP系统实现了对于用户透明的读写分离功能 C、UMP采用的两种资源隔离方式用Cgroup限制MySQL进程资源和在Proxy服务器端限制QPS D、UMP系统只设计了一种机制来保证数据安全 6、 下列关于阿里云RDS的说法哪个是错误的D A、RDS是阿里云提供的关系型数据库服务 B、RDS由专业数据库管理团队维护 C、RDS具有安全稳定、数据可靠、自动备份 D、RDS实例是用户购买RDS服务的基本单位在实例中用户只能创建一个数据库 7、 下面哪一项不是云数据库的特性B A、动态可扩展 B、高成本 C、易用性 D、大规模并行处理 8、 下列哪个不是UMP系统中的角色D A、Controller服务器 B、Proxy服务器 C、愚公系统 D、阿斯隆服务器 9、 关于UMP系统架构依赖的开源组件Mnesia说法错误的是哪一项B A、Mnesia是一个分布式数据库管理系统 B、Mnesia的数据库模式(schema)只能在未运行前静态重配置 C、Mnesia的这些特性使其在开发云数据库时被用来提供分布式数据库服务 D、Mnesia支持事务支持透明的数据分片 10、 关于UMP系统架构的Controller 服务器说法错误的是哪一项C A、Controller服务器向UMP集群提供各种管理服务 B、Controller服务器上运行了一组Mnesia分布式数据库服务 C、当其它服务器组件需要获取用户数据时不可以向Controller服务器发送请求获取数据 D、为了避免单点故障保证系统的高可用性UMP系统中部署了多台Controller服务器 多选 1、 云数据库具有以下哪些特性ABCD A、动态可扩展 B、高可用性 C、免维护 D、安全 2、 下列关于云数据库的描述哪些是正确的ABCD A、Amazon是云数据库市场的先行者 B、Google Cloud SQL是谷歌公司推出的基于MySQL的云数据库 C、从数据模型的角度来说云数据库并非一种全新的数据库技术 D、云数据库并没有专属于自己的数据模型 3、 UMP系统架构设计遵循了以下哪些原则ABCD A、保持单一的系统对外入口并且为系统内部维护单一的资源池 B、消除单点故障保证服务的高可用性 C、保证系统具有良好的可伸缩能够动态地增加、删减计算与存储节点 D、保证分配给用户的资源也是弹性可伸缩的 4、 UMP系统架构依赖的哪些开源组件ABCD A、Mnesia B、LVS C、RabbitMQ D、ZooKeeper 5、 下列关于UMP系统架构的描述哪些是正确的ACD A、信息统计服务器定期将采集到的用户的连接数 B、Web控制台无法向用户提供系统管理界面 C、LVS(Linux Virtual Server)即Linux虚拟服务器 D、UMP系统借助于LVS来实现集群内部的负载均衡 6、 为什么说云数据库是个性化数据存储需求的理想选择ABCD A、云数据库可以满足大企业的海量数据存储需求 B、云数据库可以满足中小企业的低成本数据存储需求 C、云数据库可以满足企业动态变化的数据存储需求 D、前期零投入、后期免维护的数据库服务可以很好满足它们的需求 7、 下列关于云数据库与其他数据库的关系哪些是正确的ABD A、从数据模型的角度来说云数据库并非一种全新的数据库技术 B、云数据库并没有专属于自己的数据模型云数据库所采用的数据模型可以是关系数据库所使用的关系模型 C、同一个公司只能提供采用不同数据模型的单个云数据库服务 D、许多公司在开发云数据库时后端数据库都是直接使用现有的各种关系数据库或NoSQL数据库产品 8、 以下哪些是Amazon的云数据库产品ABC A、Amazon RDS云中的关系数据库 B、Amazon SimpleDB云中的键值数据库 C、Amazon DynamoDB云中的数据仓库 D、Amazon ElastiCache云中的分布式内存缓存 9、 Microsoft的云数据库产品SQL Azure具有以下哪些特性ABCD A、属于关系型数据库支持使用TSQL来管理、创建和操作云数据库 B、支持存储过程它的数据类型、存储过程和传统的SQL Server具有很大的相似性 C、支持大量数据类型 D、支持云中的事务支持局部事务但是不支持分布式事务 1、 下列哪个不属于NoSQL数据库的特点D A、灵活的可扩展性 B、灵活的数据模型 C、与云计算紧密融合 D、数据存储规模有限 2、 下面关于NoSQL和关系数据库的简单比较哪个是错误的B A、RDBMS有关系代数理论作为基础NoSQL没有统一的理论基础 B、NoSQL很难实现横向扩展RDBMS可以很容易通过添加更多设备来支持更大规模的数据 C、RDBMS需要定义数据库模式严格遵守数据定义NoSQL一般不存在数据库模式可以自由灵活定义并存储各种不同类型的数据 D、RDBMS借助于索引机制可以实现快速查询很多NoSQL数据库没有面向复杂查询的索引 3、 下列哪一项不属于NoSQL的四大类型D A、文档数据库 B、图数据库 C、列族数据库 D、时间戳数据库 4、 下列关于键值数据库的描述哪一项是错误的D A、扩展性好灵活性好 B、大量写操作时性能高 C、无法存储结构化信息 D、条件查询效率高 5、 下列关于列族数据库的描述哪一项是错误的A A、查找速度慢可扩展性差 B、功能较少大都不支持强事务一致性 C、容易进行分布式扩展 D、复杂性低 6、 下列哪一项不属于数据库事务具有ACID四性A A、间断性 B、原子性 C、一致性 D、持久性 7、 下面关于MongoDB说法哪一项是正确的D A、具有较差的水平可扩展性 B、设置个别属性的索引来实现更快的排序 C、提供了一个面向文档存储操作复杂 D、可以实现替换完成的文档数据或者一些指定的数据字段 8、 下列关于NoSQL与关系数据库的比较哪个说法是错误的D A、在一致性方面RDBMS强于NoSQL B、在数据完整性方面RDBMS容易实现 C、在扩展性方面NoSQL 比较好 D、在可用性方面NoSQL优于RDBMS 9、 关于文档数据库的说法下列哪一项是错误的A A、数据是规则的 B、性能好高并发 C、缺乏统一的查询语法 D、复杂性低 多选 1、 关系数据库已经无法满足Web2.0的需求主要表现在以下几个方面ABC A、无法满足海量数据的管理需求 B、无法满足数据高并发的需求 C、无法满足高可扩展性和高可用性的需求 D、使用难度高 2、 下列关于MySQL集群的描述哪些是正确的ABCD A、复杂性部署、管理、配置很复杂 B、数据库复制MySQL主备之间一般采用复制方式很多时候是异步复制 C、扩容问题如果系统压力过大需要增加新的机器这个过程涉及数据重新划分 D、动态数据迁移问题如果某个数据库组压力过大需要将其中部分数据迁移出去 3、 关系数据库引以为傲的两个关键特性完善的事务机制和高效的查询机制到了Web2.0时代却成了鸡肋主要表现在以下哪几个方面ACD A、Web2.0 网站系统通常不要求严格的数据库事务 B、Web2.0 网站系统基本上不用关系数据库来存储数据 C、Web2.0 并不要求严格的读写实时性 D、Web2.0 通常不包含大量复杂的SQL 查询 4、 下面关于NoSQL与关系数据库的比较哪些是正确的ABCD A、关系数据库以完善的关系代数理论作为基础有严格的标准 B、关系数据库可扩展性较差无法较好支持海量数据存储 C、NoSQL可以支持超大规模数据存储 D、NoSQL 数据库缺乏数学理论基础复杂查询性能不高 5、 下列关于文档数据库的描述哪些是正确的AD A、性能好高并发灵活性高 B、具备统一的查询语法 C、文档数据库支持文档间的事务 D、复杂性低数据结构灵活 6、 下列关于图数据库的描述哪些是正确的ABCD A、专门用于处理具有高度相互关联关系的数据 B、比较适合于社交网络、模式识别、依赖分析、推荐系统以及路径寻找等问题 C、灵活性高支持复杂的图算法 D、复杂性高只能支持一定的数据规模 7、 NoSQL的三大基石ABC A、CAP B、最终一致性 C、BASE D、DN8 8、 关于NoSQL的三大基石之一的CAP下列哪些说法是正确的ACD A、一致性是指任何一个读操作总是能够读到之前完成的写操作的结果量 B、一个分布式系统可以同时满足一致性、可用性和分区容忍性这三个需求 C、可用性是指快速获取数据 D、分区容忍性是指当出现网络分区的情况时即系统中的一部分节点无法和其他节点进行通信分离的系统也能够正常运行 9、 当处理CAP的问题时可以有哪几个明显的选择ABC A、CA也就是强调一致性C和可用性A放弃分区容忍性P B、CP也就是强调一致性C和分区容忍性P放弃可用性A C、AP也就是强调可用性A和分区容忍性P放弃一致性C D、CAP也就是同时兼顾可用性A、分区容忍性P和一致性C当时系统性能会下降很多 10、 数据库事务具有ACID四性下面哪几项属于四性ABD A、原子性 B、持久性 C、间断性 D、一致性 1、 下列关于BigTable的描述哪个是错误的A A、爬虫持续不断地抓取新页面这些页面每隔一段时间地存储到BigTable里 B、BigTable是一个分布式存储系统 C、BigTable起初用于解决典型的互联网搜索问题 D、网络搜索应用查询建立好的索引从BigTable得到网页 2、 下列选项中关于HBase和BigTable的底层技术对应关系哪个是错误的B A、GFS与HDFS相对应 B、GFS与Zookeeper相对应 C、MapReduce与Hadoop MapReduce相对应 D、Chubby与Zookeeper相对应 3、 在HBase中关于数据操作的描述下列哪一项是错误的C A、HBase采用了更加简单的数据模型它把数据存储为未经解释的字符串 B、HBase操作不存在复杂的表与表之间的关系 C、HBase不支持修改操作 D、HBase在设计上就避免了复杂的表和表之间的关系 4、 在HBase访问接口中Pig主要用在哪个场合D A、适合Hadoop MapReduce作业并行批处理HBase表数据 B、适合HBase管理使用 C、适合其他异构系统在线访问HBase表数据 D、适合做数据统计 5、 HBase中需要根据某些因素来确定一个单元格这些因素可以视为一个“四维坐标”下面哪个不属于“四维坐标”B A、行键 B、关键字 C、列族 D、时间戳 6、 关于HBase的三层结构中各层次的名称和作用的说法哪个是错误的A A、Zookeeper文件记录了用户数据表的Region位置信息 B、-ROOT-表记录了.META.表的Region位置信息 C、.META.表保存了HBase中所有用户数据表的Region位置信息 D、Zookeeper文件记录了-ROOT-表的位置信息 7、 下面关于主服务器Master主要负责表和Region的管理工作的描述哪个是错误的D A、在Region分裂或合并后负责重新调整Region的分布 B、对发生故障失效的Region服务器上的Region进行迁移 C、管理用户对表的增加、删除、修改、查询等操作 D、不支持不同Region服务器之间的负载均衡 8、 HBase只有一个针对行健的索引如果要访问HBase表中的行下面哪种方式是不可行的B A、通过单个行健访问 B、通过时间戳访问 C、通过一个行健的区间来访问 D、全表扫描 9、 下面关于Region的说法哪个是错误的C A、同一个Region不会被分拆到多个Region服务器 B、为了加快访问速度.META.表的全部Region都会被保存在内存中 C、一个-ROOT-表可以有多个Region D、为了加速寻址客户端会缓存位置信息同时需要解决缓存失效问题 多选 1、 关系数据库已经流行很多年并且Hadoop已经有了HDFS和MapReduce为什么需要HBase A、Hadoop可以很好地解决大规模数据的离线批量处理问题但是受限于Hadoop MapReduce编程框架的高延迟数据处理机制使得Hadoop无法满足大规模数据实时处理应用的需求上ABCD B、HDFS面向批量访问模式不是随机访问模式 C、传统的通用关系型数据库无法应对在数据规模剧增时导致的系统扩展性和性能问题 D、传统关系数据库在数据结构变化时一般需要停机维护空列浪费存储空间 2、 HBase与传统的关系数据库的区别主要体现在以下哪几个方面ABCD A、数据类型 B、数据操作 C、存储模式 D、数据维护 3、 HBase访问接口类型包括哪些ABCD A、Native Java API B、HBase Shell C、Thrift Gateway D、REST Gateway 4、 下列关于数据模型的描述哪些是正确的ABCD A、HBase采用表来组织数据表由行和列组成列划分为若干个列族 B、每个HBase表都由若干行组成每个行由行键row key来标识 C、列族里的数据通过列限定符或列来定位 D、每个单元格都保存着同一份数据的多个版本这些版本采用时间戳进行索引 5、 HBase的实现包括哪三个主要的功能组件ABC A、库函数链接到每个客户端 B、一个Master主服务器 C、许多个Region服务器 D、廉价的计算机集群 6、 HBase的三层结构中三层指的是哪三层ABC A、Zookeeper文件 B、-ROOT-表 C、.META.表 D、数据类型 7、 以下哪些软件可以对HBase进行性能监视ABCD A、Master-status(自带) B、Ganglia C、OpenTSDB D、Ambari 8、 Zookeeper是一个很好的集群管理工具被大量用于分布式计算它主要提供什么服务ABC A、配置维护 B、域名服务 C、分布式同步 D、负载均衡服务 9、 下列关于Region服务器工作原理的描述哪些是正确的ABCD A、每个Region服务器都有一个自己的HLog 文件 B、每次刷写都生成一个新的StoreFile数量太多影响查找速度 C、合并操作比较耗费资源只有数量达到一个阈值才启动合并 D、Store是Region服务器的核心 10、 下列关于HLog工作原理的描述哪些是正确的ABCD A、分布式环境必须要考虑系统出错。HBase采用HLog保证 B、HBase系统为每个Region服务器配置了一个HLog文件 C、Zookeeper会实时监测每个Region服务器的状态 D、Master首先会处理该故障Region服务器上面遗留的HLog文件 1、 分布式文件系统指的是什么A A、把文件分布存储到多个计算机节点上成千上万的计算机节点构成计算机集群 B、用于在 Hadoop 与传统数据库之间进行数据传递 C、一个高可用的高可靠的分布式的海量日志采集、聚合和传输的系统 D、一种高吞吐量的分布式发布订阅消息系统可以处理消费者规模的网站中的所有动作流数据 2、 下面哪一项不属于计算机集群中的节点B A、主节点(Master Node) B、源节点SourceNode C、名称结点(NameNode) D、从节点Slave Node 3、 在HDFS中默认一个块多大A A、64MB B、32KB C、128KB D、16KB 4、 下列哪一项不属于HDFS采用抽象的块概念带来的好处C A、简化系统设计 B、支持大规模文件存储 C、强大的跨平台兼容性 D、适合数据备份 5、 在HDFS中NameNode的主要功能是什么D A、维护了block id 到datanode本地文件的映射关系 B、存储文件内容 C、文件内存保存在磁盘中 D、存储元数据 6、 下面对FsImage的描述哪个是错误的D A、FsImage文件没有记录每个块存储在哪个数据节点 B、FsImage文件包含文件系统中所有目录和文件inode的序列化形式 C、FsImage用于维护文件系统树以及文件树中所有的文件和文件夹的元数据 D、FsImage文件记录了每个块具体被存储在哪个数据节点 7、 下面对SecondaryNameNode第二名称节点的描述哪个是错误的A A、SecondaryNameNode一般是并行运行在多台机器上 B、它是用来保存名称节点中对HDFS元数据信息的备份并减少名称节点重启的时间 C、SecondaryNameNode通过HTTPGET方式从NameNode上获取到FsImage和EditLog文件并下载到本地的相应目录下 D、SecondaryNameNode是HDFS架构中的一个组成部分 8、 HDFS采用了什么模型B A、分层模型 B、主从结构模型 C、管道-过滤器模型 D、点对点模型 9、 Hadoop项目结构中HDFS指的是什么A A、分布式文件系统 B、流数据读写 C、资源管理和调度器 D、Hadoop上的数据仓库 10、 下列关于HDFS的描述哪个不正确D A、HDFS还采用了相应的数据存放、数据读取和数据复制策略来提升系统整体读写响应性能 B、HDFS采用了主从Master/Slave结构模型 C、HDFS采用了冗余数据存储增强了数据可靠性 D、HDFS采用块的概念使得系统的设计变得更加复杂 1、 HDFS要实现以下哪几个目标ABC A、兼容廉价的硬件设备 B、流数据读写 C、大数据集 D、复杂的文件模型 2、 HDFS特殊的设计在实现优良特性的同时也使得自身具有一些应用局限性主要包括以下哪几个方面BCD A、较差的跨平台兼容性 B、无法高效存储大量小文件 C、不支持多用户写入及任意修改文件 D、不适合低延迟数据访问 3、 HDFS采用抽象的块概念可以带来以下哪几个明显的好处ACD A、支持大规模文件存储 B、支持小规模文件存储 C、适合数据备份 D、简化系统设计 4、 在HDFS中名称节点NameNode主要保存了哪些核心的数据结构AD A、FsImage B、DN8 C、Block D、EditLog 5、 数据节点DataNode的主要功能包括哪些ABC A、负责数据的存储和读取 B、根据客户端或者是名称节点的调度来进行数据的存储和检索 C、向名称节点定期发送自己所存储的块的列表 D、用来保存名称节点中对HDFS元数据信息的备份并减少名称节点重启的时间 6、 HDFS的命名空间包含什么BCD A、磁盘 B、文件 C、块 D、目录 7、 下列对于客服端的描述哪些是正确的ABCD A、客户端是用户操作HDFS最常用的方式HDFS在部署时都提供了客户端 B、HDFS客户端是一个库暴露了HDFS文件系统接口 C、严格来说客户端并不算是HDFS的一部分 D、客户端可以支持打开、读取、写入等常见的操作 8、 HDFS只设置唯一一个名称节点这样做虽然大大简化了系统设计但也带来了哪些明显的局限性ABCD A、命名空间的限制 B、性能的瓶颈 C、隔离问题 D、集群的可用性 9、 HDFS数据块多副本存储具备以下哪些优点ABC A、加快数据传输速度 B、容易检查数据错误 C、保证数据可靠性 D、适合多平台上运行 10、 HDFS具有较高的容错性设计了哪些相应的机制检测数据错误和进行自动恢复BCD A、数据源太大 B、数据节点出错 C、数据出错 D、名称节点出错 1、 下列哪个不属于Hadoop的特性A A、成本高 B、高可靠性 C、高容错性 D、运行在 Linux 平台上 2、 Hadoop框架中最核心的设计是什么A A、为海量数据提供存储的HDFS和对数据进行计算的MapReduce B、提供整个HDFS文件系统的NameSpace(命名空间)管理、块管理等所有服务 C、Hadoop不仅可以运行在企业内部的集群中也可以运行在云计算环境中 D、Hadoop被视为事实上的大数据处理标准 3、 在一个基本的Hadoop集群中DataNode主要负责什么D A、负责执行由JobTracker指派的任务 B、协调数据计算任务 C、负责协调集群中的数据存储 D、存储被拆分的数据块 4、 Hadoop最初是由谁创建的B A、Lucene B、Doug Cutting C、Apache D、MapReduce 5、 下列哪一个不属于Hadoop的大数据层的功能C A、数据挖掘 B、离线分析 C、实时计算 D、BI分析 6、 在一个基本的Hadoop集群中SecondaryNameNode主要负责什么A A、帮助 NameNode 收集文件系统运行的状态信息 B、负责执行由 JobTracker 指派的任务 C、协调数据计算任务 D、负责协调集群中的数据存储 7、 下面哪一项不是Hadoop的特性B A、可扩展性高 B、只支持少数几种编程语言 C、成本低 D、能在linux上运行 8、 在Hadoop项目结构中HDFS指的是什么A A、分布式文件系统 B、分布式并行编程模型 C、资源管理和调度器 D、Hadoop上的数据仓库 9、 在Hadoop项目结构中MapReduce指的是什么A A、分布式并行编程模型 B、流计算框架 C、Hadoop上的工作流管理系统 D、提供分布式协调一致性服务 10、 下面哪个不是Hadoop1.0的组件C A、HDFS B、MapReduce C、YARN D、NameNode 和 DataNode 多选 1、 Hadoop的特性包括哪些ABCD A、高可扩展性 B、支持多种编程语言 C、成本低 D、运行在Linux平台上 2、 下面哪个是Hadoop2.0的组件AD A、ResourceManager B、JobTracker C、TaskTracker D、NodeManager 3、 一个基本的Hadoop集群中的节点主要包括什么ABCD A、DataNode存储被拆分的数据块 B、JobTracker协调数据计算任务 C、TaskTracker负责执行由JobTracker指派的任务 D、SecondaryNameNode帮助NameNode收集文件系统运行的状态信息 4、 下列关于Hadoop的描述哪些是正确的ABCD A、为用户提供了系统底层细节透明的分布式基础架构 B、具有很好的跨平台特性 C、可以部署在廉价的计算机集群中 D、曾经被公认为行业大数据标准开源软件 5、 Hadoop集群的整体性能主要受到什么因素影响ABCD A、CPU性能 B、内存 C、网络 D、存储容量 6、 下列关于Hadoop的描述哪些是错误的AB A、只能支持一种编程语言 B、具有较差的跨平台特性 C、可以部署在廉价的计算机集群中 D、曾经被公认为行业大数据标准开源软件 7、 下列哪一项不属于Hadoop的特性AB A、较低可扩展性 B、只支持java语言 C、成本低 D、运行在Linux平台上 1、 第一次信息化浪潮主要解决什么问题B A、信息传输 B、信息处理 C、信息爆炸 D、信息转换 2、 下面哪个选项属于大数据技术的“数据存储和管理”技术层面的功能A A、利用分布式文件系统、数据仓库、关系数据库等实现对结构化、半结构化和非结构化海量数据的存储和管理。 B、利用分布式并行编程模型和计算框架结合机器学习和数据挖掘算法实现对海量数据的处理和分析 C、构建隐私数据保护体系和数据安全体系有效保护个人隐私和数据安全 D、把实时采集的数据作为流计算系统的输入进行实时处理分析 3、 在大数据的计算模式中流计算解决的是什么问题D A、针对大规模数据的批量处理 B、针对大规模图结构数据的处理 C、大规模数据的存储管理和查询分析 D、针对流数据的实时计算 4、 大数据产业指什么A A、一切与支撑大数据组织管理和价值发现相关的企业经济活动的集合 B、提供智能交通、智慧医疗、智能物流、智能电网等行业应用的企业 C、提供数据分享平台、数据分析平台、数据租售平台等服务的企业 D、提供分布式计算、数据挖掘、统计分析等服务的各类企业 5、 下列哪一个不属于大数据产业的产业链环节A A、数据循环层 B、数据源层 C、数据分析层 D、数据应用层 6、 下列哪一个不属于第三次信息化浪潮中新兴的技术A A、互联网 B、云计算 C、大数据 D、物联网 7、 云计算平台层PaaS指的是什么A A、操作系统和围绕特定应用的必需的服务 B、将基础设施(计算资源和存储)作为服务出租 C、从一个集中的系统部署软件使之在一台本地计算机上(或从云中远程地)运行的一个模型 D、提供硬件、软件、网络等基础设施以及提供咨询、规划和系统集成服务 8、 下面关于云计算数据中心的描述正确的是A A、数据中心是云计算的重要载体为各种平台和应用提供运行支撑环境 B、数据中心就是放在企业内部的一台中心服务器 C、每个企业都需要建设一个云计算数据中心 D、数据中心不需要网络带宽的支撑 9、 下列哪个不属于物联网的应用D A、智能物流 B、智能安防 C、环保监测 D、数据清洗 10、 下列哪项不属于大数据的发展历程D A、成熟期 B、萌芽期 C、大规模应用期 D、迷茫期 多选 1、 第三次信息化浪潮的标志是哪些技术的兴起BCD A、个人计算机 B、物联网 C、云计算 D、大数据 2、 信息科技为大数据时代提供哪些技术支撑ABC A、存储设备容量不断增加 B、网络带宽不断增加 C、CPU 处理能力大幅提升 D、数据量不断增大 3、 大数据具有哪些特点ABCD A、数据的“大量化” B、数据的“快速化” C、数据的“多样化” D、数据的“价值密度比较低” 4、 下面哪个属于大数据的应用领域ABCD A、智能医疗研发 B、监控身体情况 C、实时掌握交通状况 D、金融交易 5、 大数据的两个核心技术是什么AC A、分布式存储 B、分布式应用 C、分布式处理 D、集中式存储 6、 云计算关键技术包括什么ABCD A、分布式存储 B、虚拟化 C、分布式计算 D、多租户 7、 云计算的服务模式和类型主要包括哪三类ABC A、软件即服务SaaS B、平台即服务PaaS C、基础设施即服务IaaS D、数据采集即服务DaaS 8、 物联网主要由下列哪些部分组成的ABCD A、应用层 B、处理层 C、感知层 D、网络层 9、 物联网的关键技术包括哪些ABC A、识别和感知技术 B、网络与通信技术 C、数据挖掘与融合技术 D、信息处理一体化技术 10、 大数据对社会发展的影响有哪些ABC A、大数据成为一种新的决策方式 B、大数据应用促进信息技术与各行业的深度融合 C、大数据开发推动新技术和新应用的不断涌现 D、大数据对社会发展没有产生积极影响
http://www.dnsts.com.cn/news/147822.html

相关文章:

  • 网页开发和网站开发做网站的创始人
  • 火锅料网站方案怎么做知名自助建站平台
  • 网站建设培训学费网站关键字描述
  • 连云港建网站小网站文案
  • 丹徒网站建设建e室内设计网官网平面图
  • 网站压缩网站程序更换
  • 网站添加flv视频代码北京青鸟培训机构哪家是正规的
  • 优仔电话手表网站经典wordpress网站
  • 苏州网站建设电话苏州市建设厅网站
  • 域名和空间网站雕塑网站模板
  • 建设部网站办事大厅网站备案包括哪些东西
  • 大兴企业官网网站建设报价部队门户网站建设方案
  • 怎样做国外网站推广升级wordpress无法创建目录
  • 怎样做淘宝商品链接导航网站微信小程序商店怎么开
  • 电商网站建设需要哪些技术网络优化与维护是做什么
  • 平凉网站设计网页图片不能保存怎么办
  • 网站建设有几种方式网站建设怎么汇报
  • 企业网站官网赣州网吧
  • 楚雄做网站的公司恒大房地产最新消息
  • 湖南优化网站建设情感营销
  • wordpress站点标题字体建设银行温州分行网站
  • 专题网站建设工作猪八戒logo设计网站
  • 个人做网络推广哪个网站好怎么做网站推广多少钱
  • 计算机网络网站wordpress随机文章小工具
  • 德阳建设局网站宜昌seo优化服务
  • 网站开发公司盈利网上企业登记注册流程
  • 东莞长安网站设计公司模板建站有什么优势
  • 德州做网站的公司上海招标网站
  • wordpress php 版本号贵阳做网站seo
  • 没有网站怎么做淘宝客如何做网上水果网站系统