当前位置: 首页 > news >正文

已经建网站做外贸怎么制作网站链接

已经建网站做外贸,怎么制作网站链接,企业网站模板 优帮云,58同城烟台网站建设一、目的 在离线数仓中#xff0c;需要用Flume去采集Kafka中的数据#xff0c;然后写入HDFS中。 由于每种数据类型的频率、数据大小、数据规模不同#xff0c;因此每种数据的采集需要不同的Flume配置文件。玩了几天Flume#xff0c;感觉Flume的使用难点就是配置文件 二、…一、目的 在离线数仓中需要用Flume去采集Kafka中的数据然后写入HDFS中。 由于每种数据类型的频率、数据大小、数据规模不同因此每种数据的采集需要不同的Flume配置文件。玩了几天Flume感觉Flume的使用难点就是配置文件 二、使用场景 转向比数据是数据频率为5分钟的数据类型代表数据量很小、频率不高因此搞定了转向比数据的采集就搞定了这一类低频率数据的实时采集问题 1台设备每日的转向比数据规模是30KB25台设备的数据规模则是750KB 三、转向比数据ODS层建表 create external table if not exists ods_turnratio(turnratio_json string ) comment 转向比数据外部表——静态分区 partitioned by (day string) row format delimited fields terminated by \x001 lines terminated by \n stored as SequenceFile tblproperties(skip.header.line.count1); 四、转向比数据的配置文件 ## agent a1 a1.sources s1 a1.channels c1 a1.sinks k1 ## configure source s1 a1.sources.s1.type org.apache.flume.source.kafka.KafkaSource a1.sources.s1.kafka.bootstrap.servers 192.168.0.27:9092 a1.sources.s1.kafka.topics topic_b_turnratio a1.sources.s1.kafka.consumer.group.id turnratio_group a1.sources.s1.kafka.consumer.auto.offset.reset latest a1.sources.s1.batchSize 1000 ## configure channel c1 ## a1.channels.c1.type memory ## a1.channels.c1.capacity 10000 ## a1.channels.c1.transactionCapacity 1000 a1.channels.c1.type file a1.channels.c1.checkpointDir /home/data/flumeData/checkpoint/turnratio a1.channels.c1.dataDirs /home/data/flumeData/flumedata/turnratio ## configure sink k1 a1.sinks.k1.type hdfs a1.sinks.k1.hdfs.path hdfs://hurys23:8020/user/hive/warehouse/hurys_dc_ods.db/ods_turnratio/day%Y-%m-%d/ a1.sinks.k1.hdfs.filePrefix turnratio a1.sinks.k1.hdfs.fileSuffix .loga1.sinks.k1.hdfs.round true a1.sinks.k1.hdfs.roundValue 10 a1.sinks.k1.hdfs.roundUnit second a1.sinks.k1.hdfs.rollSize 62500 a1.sinks.k1.hdfs.rollCount 0 a1.sinks.k1.hdfs.rollInterval 0 a1.sinks.k1.hdfs.idleTimeout 600 a1.sinks.k1.hdfs.minBlockReplicas 1 ## Bind the source and sink to the channel a1.sources.s1.channels c1 a1.sinks.k1.channel c1 注意62500约为61KB 五、Flume写入HDFS结果 Flume根据时间戳按照ODS层表的分区将数据写入对应HDFS文件 25台设备50分钟1个文件文件大小66.18 KB  六、ODS表刷新分区后查验数据 一刷新表分区 MSCK REPAIR TABLE ods_turnratio; 二查看表数据 select * from ods_turnratio; 三验证数据完整性 --2023-11-19 数据基本完整 23时297条 标准300 少3条 --2023-11-20 数据基本完整 23时299条 标准300 少1条 数据基本完整尤其是调度文件大小之后 19日a1.sinks.k1.hdfs.rollSize 31250        数据基本完整 23时297条 标准300 少3条 20日a1.sinks.k1.hdfs.rollSize 62500        数据基本完整 23时299条 标准300 少1条 七、注意点 一配置文件中的重点是红色标记的几点 a1.sinks.k1.hdfs.round true a1.sinks.k1.hdfs.roundValue 10 a1.sinks.k1.hdfs.roundUnit second a1.sinks.k1.hdfs.rollSize 62500 a1.sinks.k1.hdfs.rollCount 0 a1.sinks.k1.hdfs.rollInterval 0 a1.sinks.k1.hdfs.idleTimeout 600 a1.sinks.k1.hdfs.minBlockReplicas 1 二任务配置文件中rollSize参数设置可大不可小 rollSize参数小的话数据会丢失大的话没问题 配置文件的参数还是不断调试中争取调到最优的状态。能够及时、完整的消费Kafka数据并且能够最大化的利用HDFS资源。 目前就先这样如果有问题的话后面再更新
http://www.yutouwan.com/news/424487/

相关文章:

  • 平顶山网站关键词优化Ul设计网站
  • 三只松鼠有趣的软文百度排名优化软件
  • 优秀的门户网站wordpress怎么增加按钮
  • 网站建设与维护题库及答案鞋子软文推广300字
  • 网站开发周记30篇html网站设计
  • 常州网站制作公司网站流量盈利
  • 无锡 电子商务网站建设wordpress 优酷
  • 网站开发文档模板江西核工业建设有限公司网站
  • 建立网站的流程的合理顺序优秀网站案例
  • 做网站找合作伙伴广州做网站 信科便宜
  • 网站内部优化建设商城网站设计费用
  • 网站建设与案例管理的心得体会三门峡网站建设电话
  • 东莞长安网站开发公司做外贸需要做网站吗
  • 设计开发建设网站平台公司建网站制作平台
  • 为什么网站找不到了wordpress is single
  • 青浦网站开发广西中小企业网站建设
  • 网站如何做导航条下拉菜单网页设计服务
  • 各类网站网站建设的目标是什么意思h5 移动 网站 开发
  • 做课件最好的素材网站饿了吗外卖网站怎么做
  • 珠宝网站模版怎么做网站注册推广
  • 有什么知名网站是用织梦做的外贸网站产品分析
  • 网络销售网站济南网站优化收费
  • 无锡网站制作优化排名网站建设只有一个空间吗
  • 对网站建设的建议网站上传附件目录格式
  • 一个网站建设的流程网站建设的研发项目
  • 重庆网站设计软件网站建设项目组织图
  • 广州网站建设易企我国省级档案网站建设状况
  • 无锡网站建设公司哪家好wordpress 悬浮网易云
  • 上市的网站设计公司如何做网站代理
  • 常平众展做网站男女做暧昧试看网站