名词解释:
1、netcat:通过网络端口获取数据,source的实现类
2、logger:将数据显示到控制台,sink的实现类
3、memory: ,channel的实现类
4、capacity:是指channel的最大容量
5、spooldir:本地文件目录(文件夹)用来读取数据(文件)
6、file Header:存取采集数据所在文件的绝对路径,默认为true
7、event:将数据反序列化生成的对象,有两个属性,分别是header 和 body
8、fileSuffix:更改文件后缀名
9、flume在采集数据的时候,会将数据封装成一个event对象,event对象的里面有:header:Map[String,String]属性,还有一个body(数据的本身):byte[ ]属性;
10,kafkaSink:将数据存储到Kafka集群中
11、filePrefix:文件的前缀名
12、exec :执行,exec source 是指命令行的source,可以执行Unix命令
# Name the components on this agenta1.sources = r1a1.sinks = k1a1.channels = c1# Describe/configure the sourcea1.sources.r1.type = netcata1.sources.r1.bind = localhosta1.sources.r1.port = 44444# Describe the sinka1.sinks.k1.type = logger# Use a channel which buffers events in memorya1.channels.c1.type = memorya1.channels.c1.capacity = 1000a1.channels.c1.transactionCapacity = 100# Bind the source and sink to the channela1.sources.r1.channels = c1a1.sinks.k1.channel = c1
Flume参数小结
原文地址:https://www.cnblogs.com/beiyi888/p/9859131.html