0

0

hama学习笔记(2)

php中文网

php中文网

发布时间:2016-06-07 15:30:51

|

1740人浏览过

|

来源于php中文网

原创

写hama job 如果只是写hama job,根本不需要eclipse,所有的代码都可一在一个java文件中搞定。不过用惯了eclipse的人表示vim之类的实在用不惯。 在eclipse中可以建一个user library: 在eclipse菜单栏中:Window-Preferences-Java-Build Path-User Libraries

写hama job

如果只是写hama job,根本不需要eclipse,所有的代码都可一在一个java文件中搞定。不过用惯了eclipse的人表示vim之类的实在用不惯。

在eclipse中可以建一个user library:

在eclipse菜单栏中:Window->Preferences->Java->Build Path->User Libraries->New新建一个user library,例如hama-0.6.0,勾选System Library。然后Add External JARs,将HAMA_HOME/lib中的jar包和HAMA_HOME下的jar包加进来。

新建Java Project时将这个user library加入工程,就OK了,可以试试hama example中计算PI的例子:

http://blog.csdn.net/bhq2010/article/details/8513052]

import java.io.IOException;

import org.apache.commons.logging.Log;
import org.apache.commons.logging.LogFactory;
import org.apache.hadoop.fs.FSDataInputStream;
import org.apache.hadoop.fs.FileStatus;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.DoubleWritable;
import org.apache.hadoop.io.IOUtils;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hama.HamaConfiguration;
import org.apache.hama.bsp.BSP;
import org.apache.hama.bsp.BSPJob;
import org.apache.hama.bsp.BSPJobClient;
import org.apache.hama.bsp.BSPPeer;
import org.apache.hama.bsp.ClusterStatus;
import org.apache.hama.bsp.FileOutputFormat;
import org.apache.hama.bsp.NullInputFormat;
import org.apache.hama.bsp.TextOutputFormat;
import org.apache.hama.bsp.sync.SyncException;

public class PiEstimator
{
    private static Path TMP_OUTPUT = new Path("/tmp/pi-"
	    + System.currentTimeMillis());

    public static class MyEstimator
	    extends
	    BSP
    {
	public static final Log LOG = LogFactory.getLog(MyEstimator.class);
	private String masterTask;
	private static final int iterations = 10000;

	@Override
	public void bsp(
		BSPPeer peer)
		throws IOException, SyncException, InterruptedException
	{

	    int in = 0;
	    for (int i = 0; i < iterations; i++)
	    {
		double x = 2.0 * Math.random() - 1.0, y = 2.0 * Math.random() - 1.0;
		if ((Math.sqrt(x * x + y * y) < 1.0))
		{
		    in++;
		}
	    }

	    double data = 4.0 * in / iterations;

	    peer.send(masterTask, new DoubleWritable(data));
	    peer.sync();
	}

	@Override
	public void setup(
		BSPPeer peer)
		throws IOException
	{
	    // Choose one as a master
	    this.masterTask = peer.getPeerName(peer.getNumPeers() / 2);
	}

	@Override
	public void cleanup(
		BSPPeer peer)
		throws IOException
	{
	    if (peer.getPeerName().equals(masterTask))
	    {
		double pi = 0.0;
		int numPeers = peer.getNumCurrentMessages();
		DoubleWritable received;
		while ((received = peer.getCurrentMessage()) != null)
		{
		    pi += received.get();
		}

		pi = pi / numPeers;
		peer.write(new Text("Estimated value of PI is"),
			new DoubleWritable(pi));
	    }
	}
    }

    static void printOutput(HamaConfiguration conf) throws IOException
    {
	FileSystem fs = FileSystem.get(conf);
	FileStatus[] files = fs.listStatus(TMP_OUTPUT);
	for (int i = 0; i < files.length; i++)
	{
	    if (files[i].getLen() > 0)
	    {
		FSDataInputStream in = fs.open(files[i].getPath());
		IOUtils.copyBytes(in, System.out, conf, false);
		in.close();
		break;
	    }
	}

	fs.delete(TMP_OUTPUT, true);
    }

    public static void main(String[] args) throws InterruptedException,
	    IOException, ClassNotFoundException
    {
	// BSP job configuration
	HamaConfiguration conf = new HamaConfiguration();

	BSPJob bsp = new BSPJob(conf, PiEstimator.class);
	// Set the job name
	bsp.setJobName("Pi Estimation Example");
	bsp.setBspClass(MyEstimator.class);
	bsp.setInputFormat(NullInputFormat.class);
	bsp.setOutputKeyClass(Text.class);
	bsp.setOutputValueClass(DoubleWritable.class);
	bsp.setOutputFormat(TextOutputFormat.class);
	FileOutputFormat.setOutputPath(bsp, TMP_OUTPUT);

	BSPJobClient jobClient = new BSPJobClient(conf);
	ClusterStatus cluster = jobClient.getClusterStatus(true);

	if (args.length > 0)
	{
	    bsp.setNumBspTask(Integer.parseInt(args[0]));
	} else
	{
	    // Set to maximum
	    bsp.setNumBspTask(cluster.getMaxTasks());
	}

	long startTime = System.currentTimeMillis();
	if (bsp.waitForCompletion(true))
	{
	    printOutput(conf);
	    System.out.println("Job Finished in "
		    + (System.currentTimeMillis() - startTime) / 1000.0
		    + " seconds");
	}
    }
}

Run as Java Application即可,这样运行是在单机模式下的,不需要安装和启动Hama集群。如果要在集群上运行可以将工程Export成Jar文件,发到集群上运行。

编译hama源码

hama的源码工程是用maven构建的,下载hama的src包,解压;

AI Note
AI Note

AI Note 助手,像贴心女仆一样助力你的笔记!智能总结内容,精确划重点,提供专业建议,让学习与工作更高效。让你的笔记更清晰、有条理,知识尽在眼前!

下载

在eclipse中安装m2e即可Import->Maven->Existing Maven Project->选择解压后的hama源码所在的目录,就可以导入,第一次导入时,maven会去下载依赖的包,所以时间比较长。

导入后有hama-core\hama-graph等6个工程,之后就可以用maven插件编译、调试,研究hama源码了。

如果不用eclipse,则需要下载安装maven2,过程google一下,随处可见。

为了省事,可以下载Juno版的eclipse for jave EE developer.这个版本的eclipse中带有了完整的m2e插件。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
go语言 注释编码
go语言 注释编码

本专题整合了go语言注释、注释规范等等内容,阅读专题下面的文章了解更多详细内容。

2

2026.01.31

go语言 math包
go语言 math包

本专题整合了go语言math包相关内容,阅读专题下面的文章了解更多详细内容。

1

2026.01.31

go语言输入函数
go语言输入函数

本专题整合了go语言输入相关教程内容,阅读专题下面的文章了解更多详细内容。

1

2026.01.31

golang 循环遍历
golang 循环遍历

本专题整合了golang循环遍历相关教程,阅读专题下面的文章了解更多详细内容。

0

2026.01.31

Golang人工智能合集
Golang人工智能合集

本专题整合了Golang人工智能相关内容,阅读专题下面的文章了解更多详细内容。

1

2026.01.31

2026赚钱平台入口大全
2026赚钱平台入口大全

2026年最新赚钱平台入口汇总,涵盖任务众包、内容创作、电商运营、技能变现等多类正规渠道,助你轻松开启副业增收之路。阅读专题下面的文章了解更多详细内容。

76

2026.01.31

高干文在线阅读网站大全
高干文在线阅读网站大全

汇集热门1v1高干文免费阅读资源,涵盖都市言情、京味大院、军旅高干等经典题材,情节紧凑、人物鲜明。阅读专题下面的文章了解更多详细内容。

73

2026.01.31

无需付费的漫画app大全
无需付费的漫画app大全

想找真正免费又无套路的漫画App?本合集精选多款永久免费、资源丰富、无广告干扰的优质漫画应用,涵盖国漫、日漫、韩漫及经典老番,满足各类阅读需求。阅读专题下面的文章了解更多详细内容。

67

2026.01.31

漫画免费在线观看地址大全
漫画免费在线观看地址大全

想找免费又资源丰富的漫画网站?本合集精选2025-2026年热门平台,涵盖国漫、日漫、韩漫等多类型作品,支持高清流畅阅读与离线缓存。阅读专题下面的文章了解更多详细内容。

19

2026.01.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Node.js 教程
Node.js 教程

共57课时 | 9.9万人学习

CSS3 教程
CSS3 教程

共18课时 | 5万人学习

Rust 教程
Rust 教程

共28课时 | 5.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号