hadoop集群上运行自定义wordcount-白红宇

hadoop集群上运行自定义wordcount

阅读量：7072 次

发布时间：2019-06-28

本文共 1849 字，大约阅读时间需要 6 分钟。

hadoop jar /root/apps/wc.jar cn.itcast.bigdata.mr.wcdemo.WordcountDriver hdfs://mini1:9000/1.txt.copy hdfs://mini1:9000/out1

1，编写好wordcount程序，打成jar包放到服务器上，指定文件的输入和输出位置。

public static void main(String[] args) throws Exception {

Configuration conf = new Configuration();

//是否运行为本地模式，就是看这个参数值是否为local，默认就是local

/*conf.set("mapreduce.framework.name", "local");*/

//本地模式运行mr程序时，输入输出的数据可以在本地，也可以在hdfs上

//到底在哪里，就看以下两行配置你用哪行，默认就是file:///

/*conf.set("fs.defaultFS", "hdfs://mini1:9000/");*/

/*conf.set("fs.defaultFS", "file:///");*/

//运行集群模式，就是把程序提交到yarn中去运行

//要想运行为集群模式，以下3个参数要指定为集群上的值

conf.set("mapreduce.framework.name", "yarn");

conf.set("yarn.resourcemanager.hostname", "mini1");

conf.set("fs.defaultFS", "hdfs://mini1:9000/");

Job job = Job.getInstance(conf);

// job.setJar("c:/wc.jar");

//指定本程序的jar包所在的本地路径

job.setJarByClass(WordcountDriver.class);

//指定本业务job要使用的mapper/Reducer业务类

job.setMapperClass(WordcountMapper.class);

job.setReducerClass(WordcountReducer.class);

//指定mapper输出数据的kv类型

job.setMapOutputKeyClass(Text.class);

job.setMapOutputValueClass(IntWritable.class);

//指定最终输出的数据的kv类型

job.setOutputKeyClass(Text.class);

job.setOutputValueClass(IntWritable.class);

//指定需要使用combiner，以及用哪个类作为combiner的逻辑

/*job.setCombinerClass(WordcountCombiner.class);*/

job.setCombinerClass(WordcountReducer.class);

//如果不设置InputFormat，它默认用的是TextInputformat.class

job.setInputFormatClass(CombineTextInputFormat.class);

CombineTextInputFormat.setMaxInputSplitSize(job, 4194304);

CombineTextInputFormat.setMinInputSplitSize(job, 2097152);

//指定job的输入原始文件所在目录

FileInputFormat.setInputPaths(job, new Path(args[0]));

//指定job的输出结果所在目录

FileOutputFormat.setOutputPath(job, new Path(args[1]));

//将job中配置的相关参数，以及job所用的java类所在的jar包，提交给yarn去运行

/*job.submit();*/

boolean res = job.waitForCompletion(true);

System.exit(res?0:1);

}

转载于:https://my.oschina.net/u/3027545/blog/876639

你可能感兴趣的文章

将Excel文件中的数据导入到mysql【Excel中拼sql】

Yaf框架的扩展-mvc-路由配置-模版视图smarty加载

查看>>

单行文本溢出and多行文本溢出...以省略号展现

查看>>

MYSQL语句

查看>>

Android WebView 详解（持续更新)

查看>>

ElasticSearch动态添加节点及相关配置项

查看>>

Android studio 使用心得(十)---android studio 多渠道打包(三)

查看>>

数据库选型的一些看法

查看>>