首页 试题详情
单选题

在大数据计算服务中,使用MapReduce开发一个分词程序,即输入为保存在表中的多篇文章(每篇文章一行记录),参考一个字典文件(该文件会经常更新)进行分词。简而言之,在执行该程序的时候,既需要输入待分词的文章(已经保存在表中了),又需要输入字典(为经常变动的本地文件),以下最合理的解决方案为?

A将字典文件保存在本地,在MR中通过访问本地最新的字典文件实现

B将这个字典与源代码一起进行打包,直接执行即可

C将字典达成jar包,使用jar命令执行MR程序时,通过resource参数指定该jar包

D每次都将字典文件作为资源上传到大数据计算服务上,然后MR中通过资源的方式来访问

正确答案:A (备注:此答案有误)

相似试题

  • 多选题

    数据计算服务MaxCompute是阿里巴巴自主研发的海量数据处理平台,主要服务于批量结构化数据的存储和计算。以下哪几个场景适合使用数据计算服务MaxCompute的SQL来实现?

    答案解析

  • 单选题

    数据计算服务MaxCompute提供了MapReduce编程接口,用户可以使用MapReduce提供的SDK编写程序处理数据计算服务的中的数据。目前提供了语言的SDK。

    答案解析

热门题库