它将从source处接收到的event格式的数据缓存起来
Flume-og给与了多Master的方法。为了保证配置数据的一致性,Flume引入了ZooKeeper,用于生存配置数据,ZooKeeper自己可保证配置数据的一致性和高可用,此外,在配置数据产生变革时,ZooKeeper可以通知Flume Master节点。Flume Master间使用gossip协议同步数据。
Flume-ng最明显的窜改就是打消了集中打点配置的 Master 和 Zookeeper,变为一个纯粹的传输工具。Flume-ng另一个主要的差别点是读入数据和写出数据由差此外事情线程措置惩罚惩罚(称为 Runner)。 在 Flume-og 中,,读入线程同样做写出事情(除了故障重试)。如果写出慢的话(不是完全掉败),它将梗阻 Flume 接收数据的能力。这种异步的设计使读入线程可以顺畅的事情而无需存眷下游的任何问题。
优势
2. 当收集数据的速度赶过将写入数据的时候,也就是当收集信息遇到峰值时,这时候收集的信息非常大,甚至赶过了系统的写入数据能力,这时候,Flume会在数据出产者和数据收容器间做出调解,保证其能够在两者之间供给平稳的数据.
布局 编纂
Agent主要由:source,channel,sink三个组件构成.
Source:
从数据产生器接收数据,并将接收的数据以Flume的event格局通报给一个或者多个通道channel,Flume供给多种数据接收的方法,好比Avro,Thrift,twitter1%等
Channel:
channel是一种短暂的存储容器,它将从source处接收到的event格局的数据缓存起来,直到它们被sinks消费失,它在source和sink间起着桥梁的感化,channel是一个完整的事务,这一点保证了数据在收发的时候的一致性. 并且它可以和任意数量的source和sink链接. 撑持的类型有: JDBC channel , File System channel , Memory channel等.
sink:
sink将数据存储到集中存储器好比Hbase和HDFS,它从channels消费数据(events)并将其通报给方针地. 方针地可能是另一个sink,也可能HDFS,HBase.
【根本组件1】Flume入门(二)Agent
温馨提示: 本文由Jm博客推荐,转载请保留链接: https://www.jmwww.net/file/web/31305.html