请选择 进入手机版 | 继续访问电脑版

学途无忧

 找回密码
 立即注册
  • 论坛学币充多少送多少
 共有 267 条信息    默认    按推荐    按免费    按付费   按浏览量    按下载量    专题列表
推荐下载
热门下载
最新专题
      暂无相关信息
0 次点评

大数据Spark企业级实战

分类:spark    下载:11    浏览:384    时间:2018-12-02
《大数据Spark企业级实战》这本书讲解了spark的企业级实战内容
0 次点评

Netty框架快速入门教程

分类:Netty    下载:39    浏览:474    时间:2018-11-29
不错的Netty视频教程,希望大家喜欢目录1、第一课NIO2、第二课netty服务端3、第三课netty客户端4、第四课netty线程模型源码分析(一)5、第五课netty线程模型源码分析(二)6、第六课netty5案例学习7、第七课netty学习之心跳8、第八课protocol buff学习9、第九课自定义序列化协议之自定义序列化协议10、第十课自定义数据包协议11、第十一课粘包分包分析,如何避免socket攻击12、分析设计一个聊天室的小项目
0 次点评

Hadoop视频教程

分类:Hadoop    下载:330    浏览:4187    时间:2018-11-28
01,课程介绍,HDFS架构和原理,搭建CentOS开发环境> Hadoop背景> HDFS设计目标,应用场景,架构分析> 使用Virtual安装CentOS虚拟机> 虚拟机环境配置 02,hdfs单机和集群的配置安装> Hadoop单机版安装和配置> Hadoop集群安装和配置> Hadoop命令行和WebUI的使用 03,hdfs应用-云存储系统(1)> 云存储系统介绍和基本架构> 搭建Eclipse和Maven开发环境> 使用Maven创建并配置Struts2应用> 使用bootstrap搭建UI框架 04,hdfs应用-云存储系统(2)> 安装和配置Redis> 用户管理模块开发 05,hdfs应用-云存储系统(3)> gson介绍和使用实例> 实现普通的文件上传,删除,下载 06,hdfs应用-云存储系统(4)> 实现基于HDFS的上传,下载和删除> HDFS小文件管理方式:SequenceFile和Har 07,深入hdfs-NameNode和DataNode> hdfs的架构介绍> hdfs如何读写文件> FSImage和EditLog> Rack Awareness> hdfs基本管理 08,深入hdfs-HDFS federation> HDFS节点管理> HDFS升级和回滚> HDFS Federation> 如何使用ViewFS 09,namenode HA> zookeeper配置> namenode HA(双机)安装和配置 10,yarn和mapreduce> 配置Yarn(单机和集群)> MapReduce的工作原理> 第一个MapRedcue程序> Yarn命令行工具 11,mapreduce应用-搜索提示(1)> 工作原理介绍(Ajax)> 使用JQuery的AutoComplete控件搭建UI 12,mapreduce应用-搜索提示(2)> 继承Mapreduce程序> 使用Redis保存中间数据> 如何对增量和全量数据进行统计> ”潜在好友推荐“算法介绍 13,mapreduce的采样工具和partitiion> 采样和分区的工作原理> RandomSampler,InputSampler,IntervalSampler> TotalOrderPartitioner(全局排序) 14,Map Join和Reduce Join> Reduce side join> Map side join> 如何自定义数据类型> 如何使用DistributedCache 15,mapreduce应用-PageRank> PageRank算法详细讲解> 如何用mapreduce实现PageRank算法 16, Hive入门> Hive的架构> CLI, Hive Server, HWI介绍> 配置Hive,使用Mysql存储元数据> CLI的基本使用 17, hive应用-搜索提示(1)> Tomcat日志解析> 使用正则表达式解析Tomcat日志> 在查询中使用正则表达式 18, hive应用-搜索提示(2)> 在hive查询中调用python脚本实现Redis插入 19,HQL(1)> HQL基础:DDL,DML> 数据类型:原子与集合> TextFile的默认编码及自定义编码 20,HQL(2)> Hive查询> 正则表达式,基本函数,集合函数,表函数> 嵌套查询,case when语句,like和rlike> Groupby和Having等 21,Hive自定义函数> 如何编写自定义函数> 在自定义函数中连接Redis> 在自定义函数中使用CacheFile 22,Compression in Hadoop> Compression in Hadoop介绍> 在MapReduce和Hive中使用Compression> 安装和配置lzo 23,24, HBase入门> Hbase架构> Hbase集群安装> 使用HBase Shell 25,26,27,HBase应用 - 话单查询> Hbase Java API> Struts2 and JSP> Jquery Datatable and Datepicker 28,29,30,HBase应用 - 微博> 表结构设计> 关注好友> 发微博> 我的主页
0 次点评

企业大数据处理:Spark、Druid、Flume与Kafka应用实践(完整超清版).pdf

分类:spark    下载:19    浏览:574    时间:2018-11-25
这是一本立足于企业真实的商用项目来讲解如何高效从事大数据实践的著作。技术层面,从全栈的角度系统梳理和详尽讲解了大数据的核心技术,包括Spark、Druid、Flume、Kafka等,让我们在纷繁复杂的技术中少走弯路
0 次点评

Kafka源码解析与实战

分类:kafka    下载:12    浏览:542    时间:2018-11-12
(完整目录,高清,无水印)Kafka源码解析与实战 理论联系实战,迅速使用API开发高并发的消息系统
0 次点评

从零开始学Storm

分类:Storm    下载:12    浏览:395    时间:2018-11-08
本书有基本知识,安装与部署,研发与维护,进阶知识,企业应用5个模块构成。本书通过理论联系实际,并通过大量的实例分析,让读者能够在较短时间掌握storm的使用。
0 次点评

Flink基本教程

分类:flink    下载:16    浏览:806    时间:2018-11-08
Flink项目核心人员执笔,阿里巴巴资深技术专家翻译。全文包含:流计算架构,对时间的处理,有状态的计算,批处理等。前言 ..............................................................................................................................ix第 1 章 为何选择 Flink ......................................................................................... 11.1 流处理欠佳的后果 ......................................................................................... 21.1.1 零售业和市场营销 ............................................................................ 21.1.2 物联网 ................................................................................................ 31.1.3 电信业 ................................................................................................ 51.1.4 银行和金融业 .................................................................................... 51.2 连续事件处理的目标 ..................................................................................... 61.3 流处理技术的演变 ......................................................................................... 61.4 初探 Flink ....................................................................................................... 91.5 生产环境中的 Flink ..................................................................................... 121.5.1 布衣格电信 ...................................................................................... 131.5.2 其他案例 .......................................................................................... 141.6 Flink 的适用场景 ......................................................................................... 15第 2 章 流处理架构 ............................................................................................. 172.1 传统架构与流处理架构 ............................................................................... 172.2 消息传输层和流处理层 ............................................................................... 182.3 消息传输层的理想功能 ............................................................................... 192.3.1 兼具高性能和持久性 ...................................................................... 202.3.2 将生产者和消费者解耦 .................................................................. 202.4 支持微服务架构的流数据 ........................................................................... 21vi | 目录2.4.1 数据流作为中心数据源 .................................................................. 222.4.2 欺诈检测:流处理架构用例 .......................................................... 222.4.3 给开发人员带来的灵活性 .............................................................. 242.5 不限于实时应用程序 ................................................................................... 242.6 流的跨地域复制 ........................................................................................... 26第 3 章 Flink 的用途 ............................................................................................ 293.1 不同类型的正确性 ....................................................................................... 293.1.1 符合产生数据的自然规律 .............................................................. 293.1.2 事件时间 .......................................................................................... 313.1.3 发生故障后仍保持准确 .................................................................. 323.1.4 及时给出所需结果 .......................................................................... 333.1.5 使开发和运维更轻松 ...................................................................... 333.2 分阶段采用 Flink ......................................................................................... 34第 4 章 对时间的处理 ......................................................................................... 354.1 采用批处理架构和 Lambda 架构计数 ........................................................ 354.2 采用流处理架构计数 ................................................................................... 384.3 时间概念 ....................................................................................................... 404.4 窗口 ............................................................................................................... 414.4.1 时间窗口 .......................................................................................... 414.4.2 计数窗口 .......................................................................................... 434.4.3 会话窗口 .......................................................................................... 434.4.4 触发器 .............................................................................................. 444.4.5 窗口的实现 ...................................................................................... 444.5 时空穿梭 ....................................................................................................... 444.6 水印 ............................................................................................................... 454.7 真实案例:爱立信公司的 Kappa 架构 ...................................................... 47第 5 章 有状态的计算 ......................................................................................... 495.1 一致性 ........................................................................................................... 505.2 检查点:保证 exactly-once ......................................................................... 515.3 保存点:状态版本控制 ............................................................................... 595.4 端到端的一致性和作为数据库的流处理器 ............................................... 625.5 Flink 的性能 ................................................................................................. 655.5.1 Yahoo! Streaming Benchmark .......................................................... 65目录 | vii5.5.2 变化 1:使用 Flink 状态 ................................................................. 665.5.3 变化 2:改进数据生成器并增加吞吐量 ....................................... 675.5.4 变化 3:消除网络瓶颈 ................................................................... 685.5.5 变化 4:使用 MapR Streams........................................................... 695.5.6 变化 5:增加 key 基数 .................................................................... 695.6 结论 ............................................................................................................... 71第 6 章 批处理:一种特殊的流处理 .............................................................. 736.1 批处理技术 ................................................................................................... 756.2 案例研究:Flink 作为批处理器 ................................................................. 76附录 其他资源 ...................................................................................................... 79
0 次点评

高效算法:竞赛、应试与提高必修128例

分类:算法与数据结构    下载:12    浏览:375    时间:2018-11-08
高效算法:竞赛、应试与提高必修128例!!!!!!!!
0 次点评

企业大数据处理:Spark、Druid、Flume与Kafka应用实践(超清完整版+目录)_wrapper.pdf

分类:spark    下载:26    浏览:610    时间:2018-11-08
这是一本立足于企业真实的商用项目来讲解如何高效从事大数据实践的著作。技术层面,从全栈的角度系统梳理和详尽讲解了大数据的核心技术,包括Spark、Druid、Flume、Kafka等,让我们在纷繁复杂的技术中少走弯路......
0 次点评

Cloudera Hadoop4实战课程(高清,无密)

分类:Hadoop    下载:128    浏览:1386    时间:2018-11-08
课程详细大纲列表: 第一讲:Cloudera Manager介绍与安装第二讲:Cloudera Manager详解第三讲:CDH4.1介绍与环境搭建一第四讲:CDH4.1环境搭建二第五讲:Hadoop工作原理、调度策略第六讲:Hadoop开发作业形式第七讲:CM下CDH4.1集群高级管理一第八讲:CM下CDH4.1集群高级管理二第九讲:小结及Hadoop工作原理第十讲:Hive工作原理和基本使用第十一讲:Hive元数据管理和语法详解第十二讲:Hive表和存储结构第十三讲:运维案例分享_单机存储均衡和坏block处理第十四讲:Hive QL 一第十五讲:Hive QL 二第十六讲:UDF和UDAF开发第十七讲:UDAF开发和JDBC访问第十八讲:Hive优化规则总结第十九讲:Hive数据压缩技术第二十讲:Hive-f封装支持传参一第二十一讲:Hive-f封装支持传参二第二十二讲:Sqoop使用一第二十三讲:Sqoop使用二第二十四讲:Sqoop作业调度第二十五讲:HBase体系结构第二十六讲:HBase 表设计案例第二十七讲:HBase数据加载(Sqoop和Java)第二十八讲:HBase存储机制第二十九讲:Java操作HBase一第三十讲:Java操作HBase二第三十一讲:Java操作HBase三第三十二讲:hbase与Hive接口及项目介绍第三十三讲:订单在线实时查询_Schema设计和HBase数据加载第三十四讲:订单在线实时查询_DAO层实现第三十五讲:订单在线实时查询_DAO层和前台实现第三十六讲:电商日志流量分析_项目介绍第三十七讲:电商日志流量分析_业务实现一第三十八讲:电商日志流量分析_业务实现二第三十九讲:电商日志流量分析_业务实现三第四十讲:电商日志流量分析_业务实现四第四十一讲:CDH5搭建之CM5安装部署第四十二讲:CDH5搭建和CM界面化集群管理
0 次点评

CDH5.14.0安装配置优化文档。

分类:Hadoop    下载:7    浏览:278    时间:2018-11-06
本人自己的CDH5.14.0的安装记录,保存LINUX配置,MYSQL安装,所有过程记录,以及优化记录。
0 次点评

hive视频教程|深入浅出Hive企业级架构优化、Hive Sql优化、压缩和分布式缓存

分类:Hive    下载:106    浏览:888    时间:2018-11-05
作为企业Hadoop应用的核心产品,Hive承载着FaceBook、淘宝等大佬 95%以上的离线统计,很多企业里的离线统计甚至全由Hive完成,如我所在的电商。Hive在企业云计算平台发挥的作用和影响愈来愈大,如何优化提速已经显得至关重要。Hive作业的规模决定着优化层级,一个Hive作业的优化和一万的Hive作业的优化截然不同。拥有1万多个Hive作业的大电商如何进行Hive优化的?本系列课结合企业实战和场景从作业架构层面、Hql(Hive sql)语法层面、Hive参数层面依次讲述。第一章:架构方面优化策略(5讲)Hadoop的主要性能瓶颈是IO负载,降IO负载是优化的重头戏。本章大纲:作业架构优化手段大探底多个降IO负载的策略和场景...分表、源表归纳合理设计表分区、动态分区压缩、分布式缓存 第二章:Hive Sql语法层面和Properties参数层面优化(4讲)语法优化手段归纳Map数和Reduce数的决定和控制及案例分析数据倾斜的避免和解决办法执行计划剖析,从执行计划上找倾斜根本Properties参数高效Join、MapJoin、SEMI JOIN减少Job 合并MRMapreduce中间参数 第三章:Impala熟悉和使用(1讲)Impala是Cloudera 公司推出仿Hive的一个产品,目前已经有稳定的发行版本。理论上性能比Hive好,但目前版本功能和扩展性上远不能替代Hive。未来该产品或会有一定影响力。特点:同Hive一样是类sql产品公用Hive的元数据库

QQ|Archiver|手机版|小黑屋|学途无忧 ( 沪ICP备18043903号 )

GMT+8, 2021-10-17 20:36 , Processed in 0.056641 second(s), 72 queries .

Powered by xuetuwuyou.com

© 2001-2018 学途无忧

返回顶部