分享web开发知识

注册/登录|最近发布|今日推荐

主页 IT知识网页技术软件开发前端开发代码编程运营维护技术分享教程案例
当前位置:首页 > 运营维护

Flume案例之采集特定目录的数据到HDFS

发布时间:2023-09-06 02:18责任编辑:董明明关键词:暂无标签

一,准备环境

  CentOs7,jdk1.7,hadoop -2.6.1, apache-flume-1.6.0-bin.tar.gz

二,编写配置文件

        在/home/flume/conf的目录下  创建 配置文件

#定义三大组件的名称agent1.sources = source1agent1.sinks = sink1agent1.channels = channel1# 配置source组件agent1.sources.source1.type = spooldiragent1.sources.source1.spoolDir = /home/dataagent1.sources.source1.fileHeader = false#配置拦截器agent1.sources.source1.interceptors = i1agent1.sources.source1.interceptors.i1.type = hostagent1.sources.source1.interceptors.i1.hostHeader = hostname# 配置sink组件agent1.sinks.sink1.type = hdfsagent1.sinks.sink1.hdfs.path =hdfs://server1:9000/flume/collection/%y-%m-%d/%H-%M ??#按时间的格式命名agent1.sinks.sink1.hdfs.filePrefix = access_logagent1.sinks.sink1.hdfs.maxOpenFiles = 5000agent1.sinks.sink1.hdfs.batchSize= 100agent1.sinks.sink1.hdfs.fileType = DataStreamagent1.sinks.sink1.hdfs.writeFormat =Textagent1.sinks.sink1.hdfs.rollSize = 102400agent1.sinks.sink1.hdfs.rollCount = 1000000agent1.sinks.sink1.hdfs.rollInterval = 60agent1.sinks.sink1.hdfs.useLocalTimeStamp = true# 配置channels组件agent1.channels.channel1.type = memoryagent1.channels.channel1.keep-alive = 120agent1.channels.channel1.capacity = 500000agent1.channels.channel1.transactionCapacity = 600# 配置组件关系agent1.sources.source1.channels = channel1agent1.sinks.sink1.channel = channel1

  在/home下创建data文件夹

三,运行程序

  在/home/flume 目录下运行代码

 bin/flume-ng agent -c conf -f conf/hdfs-logger.conf -n agent1 ?-Dflume.root.logger=INFO,console

  成功后,向data中添加txt文件。

四,查看结果

  用HDFS查看Flume目录下的结果收集文件。

五,错误纠正

Resources are low on NN. Please add or free up more resources then turn off safe mode manually.NOTE: ?If you turn off safe mode before adding resources, the NN will immediately return to safe mode. Use "hdfs dfsadmin -safemode leave" to turn safe mode off.

  在hadoop的目录下运行代码:

 bin/hadoop  dfsadmin -safemode leave

  

Flume案例之采集特定目录的数据到HDFS

原文地址:https://www.cnblogs.com/songweideboke/p/9820001.html

知识推荐

我的编程学习网——分享web前端后端开发技术知识。 垃圾信息处理邮箱 tousu563@163.com 网站地图
icp备案号 闽ICP备2023006418号-8 不良信息举报平台 互联网安全管理备案 Copyright 2023 www.wodecom.cn All Rights Reserved