网站首页娱乐新闻焦点新闻历史秘闻社会百态技术文章科技资讯其他资讯女性专栏

首页 > 网络文摘 > 正文

Flume结合Spark测试

浏览数：37 / 时间：2015年06月09日

近日，在测试Flume结合Kafka结合Spark Streaming的实验。今天把Flume与Spark的简单结合做出来了，这里记录一下，避免网友走弯路。有不周到的地方还希望路过的大神多多指教。

实验比较简单，分为两部分：一、使用avro-client发送数据二、使用netcat发送数据

首先Spark程序需要Flume的两个jar包：

flume-ng-sdk-1.4.0、spark-streaming-flume_2.11-1.2.0

一、使用avro-client发送数据

1、编写Spark程序，该程序的功能是接收Flume事件

import org.apache.log4j.{Level, Logger}

import org.apache.spark.SparkConf

importorg.apache.spark.storage.StorageLevel

import org.apache.spark.streaming._

import org.apache.spark.streaming.flume._

object FlumeEventTest{

defmain(args:Array[String]) {

Logger.getLogger("org.apache.spark").setLevel(Level.WARN)

Logger.getLogger("org.apache.eclipse.jetty.server").setLevel(Level.OFF)

val hostname = args(0)

val port = args(1).toInt

val batchInterval = args(2)

val sparkConf = newSparkConf().setAppName("FlumeEventCount").setMaster("local[2]")

val ssc = new StreamingContext(sparkConf,batchInterval)

valstream = FlumeUtils.createStream(ssc,hostname,port,StorageLevel.MEMORY_ONLY)

stream.count().map(cnt => "Received " + cnt + " flumeevents." ).print()

ssc.start()

ssc.awaitTermination()

}

}

2、 Flume配置文件参数

a1.channels = c1

a1.sinks = k1

a1.sources = r1

a1.sinks.k1.type = avro

a1.sinks.k1.channel = c1

a1.sinks.k1.hostname = localhost

a1.sinks.k1.port = 9999

a1.sources.r1.type = avro

a1.sources.r1.bind = localhost

a1.sources.r1.port = 44444

a1.sources.r1.channels = c1

a1.channels.c1.type = memory

a1.channels.c1.capacity = 1000

a1.channels.c1.transactionCapacity = 100

这里，使用avro向flume的44444端口发送数据；然后flume通过9999向Spark发送数据。

3、运行Spark程序：

4、通过Flume配置文件启动Flumeagent

../bin/flume-ng agent --conf conf--conf-file ./flume-conf.conf --name a1

-Dflume.root.logger=INFO,console

Spark运行效果：

5、使用avro来发送文件：

./flume-ng avro-client --conf conf -Hlocalhost -p 44444 -F/opt/servicesClient/Spark/spark/conf/spark-env.sh.template-Dflume.root.logger=DEBUG,console

Flume agent效果：

Spark效果：

二、使用netcat发送数据

1、 Spark程序同上

2、配置Flume参数

a1.channels = c1

a1.sinks = k1

a1.sources = r1

a1.sinks.k1.type = avro

a1.sinks.k1.channel = c1

a1.sinks.k1.hostname = localhost

a1.sinks.k1.port = 9999

a1.sources.r1.type = netcat

a1.sources.r1.bind = localhost

a1.sources.r1.port = 44444

a1.sources.r1.channels = c1

a1.channels.c1.type = memory

a1.channels.c1.capacity = 1000

a1.channels.c1.transactionCapacity = 100

这里，使用telnet作为Flume的数据源

3、运行Spark程序同上

4、通过Flume配置文件启动Flumeagent

../bin/flume-ng agent --conf conf--conf-file ./flume-conf.conf --name a1

-Dflume.root.logger=INFO,console

注意：这里使用netcat作为Flume的数据源，注意与avro作为源的效果区别

5、使用telnet发送数据

Spark效果：

这是两个比较简单的demo，如果真正在项目中使用Flume来收集数据，使用Kafka作为分布式消息队列，使用Spark Streaming实时计算，还需要详细研究Flume和Spark流计算。

前段时间给部门做培训，演示了Spark Streaming的几个例子：文本处理、网络数据处理、stateful操作和window操作，这几天有时间整理整理，分享给大家。包括Spark MLlib的两个简单demo：基于K-Means的用户分类和基于协同过滤的电影推荐系统。

今天看了斯坦福Andrew Ng教授的ML课程，讲的很棒，这里把链接分享给大家：

http://open.163.com/special/opencourse/machinelearning.html

本文出自 “一步.一步” 博客，请务必保留此出处http://snglw.blog.51cto.com/5832405/1652508

原文地址：http://snglw.blog.51cto.com/5832405/1652508

郑重声明：本站内容如果来自互联网及其他传播媒体，其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享，并不代表本站赞同其观点和对其真实性负责，也不构成任何其他建议。

Flume结合Spark测试

标签： import 程序记录 import 程序记录

相关文章

随机文章

您可能还喜欢

您可能还喜欢

最新图文

更多

可爱穿搭很重要

可爱穿搭很重要

工藤美樱写真集

工藤美樱写真集

斯米兰海水是真不错

斯米兰海水是真不错

海边想拍氛围照

海边想拍氛围照

海岛度假

海岛度假

甜妹 ootd 穿搭

甜妹 ootd 穿搭

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

7080后儿时集体回忆插画

7080后儿时集体回忆插画

西安子午峪满山的白杜鹃太美了

西安子午峪满山的白杜鹃太美了

职业模特拍摄省事很多

职业模特拍摄省事很多

您可能还喜欢

更多

51岁关之琳抹浓妆现身活动脸颊深陷美人迟暮

51岁关之琳抹浓妆现身活动脸颊深陷美人迟暮

台湾人气双胞胎曝近照 12岁姐妹俩爱跳舞

台湾人气双胞胎曝近照 12岁姐妹俩爱跳舞

普京政敌、俄罗斯前副总理遭枪杀

普京政敌、俄罗斯前副总理遭枪杀

2022年哈尔滨国际比基尼模特大赛

2022年哈尔滨国际比基尼模特大赛

湖北砍小学生现场及凶手曝光

湖北砍小学生现场及凶手曝光

东莞孝子举刀弑母后的90个日与夜

东莞孝子举刀弑母后的90个日与夜

泰国平潭岛旅游

泰国平潭岛旅游

广西桂平石龙镇的5月22日车祸事故

广西桂平石龙镇的5月22日车祸事故

启功书法部分欣赏

启功书法部分欣赏

乌克兰美女领导克里米亚辛菲罗波尔

乌克兰美女领导克里米亚辛菲罗波尔

您可能还喜欢

更多

英国男子走遍非洲拍摄土著面孔

英国男子走遍非洲拍摄土著面孔

惠州海滩试拍

惠州海滩试拍

广州打工妈妈哭诉8岁女儿被强奸4次

广州打工妈妈哭诉8岁女儿被强奸4次

海边想拍氛围照

海边想拍氛围照

中国美女城市排行：哈尔滨第一北京未入榜

中国美女城市排行：哈尔滨第一北京未入榜

11岁女孩因抄作业被父亲发现吊打身亡

11岁女孩因抄作业被父亲发现吊打身亡

美国19周的早产儿

美国19周的早产儿

货车侧翻市民：不抢是傻子

货车侧翻市民：不抢是傻子

职业模特拍摄省事很多

职业模特拍摄省事很多

巴西男子头颈颠倒身残志坚

巴西男子头颈颠倒身残志坚