当前位置：首页 > news >正文

协会网站开发卖货到海外的免费平台

news 2026/1/10 3:10:48

协会网站开发,卖货到海外的免费平台,网站怎么做会员系统,dedecms采集规则各类网站转载自 Redis面试题#xff08;2020最新版#xff09; 概述什么是Redis Redis(Remote Dictionary Server) 是一个使用 C 语言编写的#xff0c;开源的#xff08;BSD许可#xff09;高性能非关系型#xff08;NoSQL#xff09;的键值对数据库。 Redis 可以存储键和五…转载自 Redis面试题2020最新版概述什么是Redis Redis(Remote Dictionary Server) 是一个使用 C 语言编写的开源的BSD许可高性能非关系型NoSQL的键值对数据库。 Redis 可以存储键和五种不同类型的值之间的映射。键的类型只能为字符串值支持五种数据类型字符串、列表、集合、散列表、有序集合。与传统数据库不同的是 Redis 的数据是存在内存中的所以读写速度非常快因此 redis 被广泛应用于缓存方向每秒可以处理超过 10万次读写操作是已知性能最快的Key-Value DB。另外Redis 也经常用来做分布式锁。除此之外Redis 支持事务、持久化、LUA脚本、LRU驱动事件、多种集群方案。 Redis有哪些优缺点优点读写性能优异 Redis能读的速度是110000次/s写的速度是81000次/s。支持数据持久化支持AOF和RDB两种持久化方式。支持事务Redis的所有操作都是原子性的同时Redis还支持对几个操作合并后的原子性执行。数据结构丰富除了支持string类型的value外还支持hash、set、zset、list等数据结构。支持主从复制主机会自动将数据同步到从机可以进行读写分离。缺点数据库容量受到物理内存的限制不能用作海量数据的高性能读写因此Redis适合的场景主要局限在较小数据量的高性能操作和运算上。 Redis 不具备自动容错和恢复功能主机从机的宕机都会导致前端部分读写请求失败需要等待机器重启或者手动切换前端的IP才能恢复。主机宕机宕机前有部分数据未能及时同步到从机切换IP后还会引入数据不一致的问题降低了系统的可用性。 Redis 较难支持在线扩容在集群容量达到上限时在线扩容会变得很复杂。为避免这一问题运维人员在系统上线时必须确保有足够的空间这对资源造成了很大的浪费。为什么要用 Redis /为什么要用缓存主要从“高性能”和“高并发”这两点来看待这个问题。高性能假如用户第一次访问数据库中的某些数据。这个过程会比较慢因为是从硬盘上读取的。将该用户访问的数据存在数缓存中这样下一次再访问这些数据的时候就可以直接从缓存中获取了。操作缓存就是直接操作内存所以速度相当快。如果数据库中的对应数据改变的之后同步改变缓存中相应的数据即可高并发直接操作缓存能够承受的请求是远远大于直接访问数据库的所以我们可以考虑把数据库中的部分数据转移到缓存中去这样用户的一部分请求会直接到缓存这里而不用经过数据库。为什么要用 Redis 而不用 map/guava 做缓存? 缓存分为本地缓存和分布式缓存。以 Java 为例使用自带的 map 或者 guava 实现的是本地缓存最主要的特点是轻量以及快速生命周期随着 jvm 的销毁而结束并且在多实例的情况下每个实例都需要各自保存一份缓存缓存不具有一致性。使用 redis 或 memcached 之类的称为分布式缓存在多实例的情况下各实例共用一份缓存数据缓存具有一致性。缺点是需要保持 redis 或 memcached服务的高可用整个程序架构上较为复杂。 Redis为什么这么快 1、完全基于内存绝大部分请求是纯粹的内存操作非常快速。数据存在内存中类似于 HashMapHashMap 的优势就是查找和操作的时间复杂度都是O(1) 2、数据结构简单对数据操作也简单Redis 中的数据结构是专门进行设计的 3、采用单线程避免了不必要的上下文切换和竞争条件也不存在多进程或者多线程导致的切换而消耗 CPU不用去考虑各种锁的问题不存在加锁释放锁操作没有因为可能出现死锁而导致的性能消耗 4、使用多路 I/O 复用模型非阻塞 IO 5、使用底层模型不同它们之间底层实现方式以及与客户端之间通信的应用协议不一样Redis 直接自己构建了 VM 机制因为一般的系统调用系统函数的话会浪费一定的时间去移动和请求数据类型 Redis有哪些数据类型 Redis主要有5种数据类型包括StringListSetZsetHash满足大部分的使用要求 Redis的应用场景总结一计数器可以对 String 进行自增自减运算从而实现计数器功能。Redis 这种内存型数据库的读写性能非常高很适合存储频繁读写的计数量。缓存将热点数据放到内存中设置内存的最大使用量以及淘汰策略来保证缓存的命中率。会话缓存可以使用 Redis 来统一存储多台应用服务器的会话信息。当应用服务器不再存储用户的会话信息也就不再具有状态一个用户可以请求任意一个应用服务器从而更容易实现高可用性以及可伸缩性。全页缓存FPC 除基本的会话token之外Redis还提供很简便的FPC平台。以Magento为例Magento提供一个插件来使用Redis作为全页缓存后端。此外对WordPress的用户来说Pantheon有一个非常好的插件 wp-redis这个插件能帮助你以最快速度加载你曾浏览过的页面。查找表例如 DNS 记录就很适合使用 Redis 进行存储。查找表和缓存类似也是利用了 Redis 快速的查找特性。但是查找表的内容不能失效而缓存的内容可以失效因为缓存不作为可靠的数据来源。消息队列(发布/订阅功能) List 是一个双向链表可以通过 lpush 和 rpop 写入和读取消息。不过最好使用 Kafka、RabbitMQ 等消息中间件。分布式锁实现在分布式场景下无法使用单机环境下的锁来对多个节点上的进程进行同步。可以使用 Redis 自带的 SETNX 命令实现分布式锁除此之外还可以使用官方提供的 RedLock 分布式锁实现。其它 Set 可以实现交集、并集等操作从而实现共同好友等功能。ZSet 可以实现有序性操作从而实现排行榜等功能。总结二 Redis相比其他缓存有一个非常大的优势就是支持多种数据类型。数据类型说明string字符串最简单的k-v存储hashhash格式value为field和value适合ID-Detail这样的场景。list简单的list顺序列表支持首位或者末尾插入数据set无序list查找速度快适合交集、并集、差集处理sorted set有序的set 其实通过上面的数据类型的特性基本就能想到合适的应用场景了。 string——适合最简单的k-v存储类似于memcached的存储结构短信验证码配置信息等就用这种类型来存储。 hash——一般key为ID或者唯一标示value对应的就是详情了。如商品详情个人信息详情新闻详情等。 list——因为list是有序的比较适合存储一些有序且数据相对固定的数据。如省市区表、字典表等。因为list是有序的适合根据写入的时间来排序如最新的***消息队列等。 set——可以简单的理解为ID-List的模式如微博中一个人有哪些好友set最牛的地方在于可以对两个set提供交集、并集、差集操作。例如查找两个人共同的好友等。 Sorted Set——是set的增强版本增加了一个score参数自动会根据score的值进行排序。比较适合类似于top 10等不根据插入的时间来排序的数据。如上所述虽然Redis不像关系数据库那么复杂的数据结构但是也能适合很多场景比一般的缓存数据结构要多。了解每种数据结构适合的业务场景不仅有利于提升开发效率也能有效利用Redis的性能。持久化什么是Redis持久化持久化就是把内存的数据写到磁盘中去防止服务宕机了内存数据丢失。 Redis 的持久化机制是什么各自的优缺点 Redis 提供两种持久化机制 RDB默认和 AOF 机制: RDB是Redis DataBase缩写快照 RDB是Redis默认的持久化方式。按照一定的时间将内存的数据以快照的形式保存到硬盘中对应产生的数据文件为dump.rdb。通过配置文件中的save参数来定义快照的周期。优点 1、只有一个文件 dump.rdb方便持久化。 2、容灾性好一个文件可以保存到安全的磁盘。 3、性能最大化fork 子进程来完成写操作让主进程继续处理命令所以是 IO 最大化。使用单独子进程来进行持久化主进程不会进行任何 IO 操作保证了 redis 的高性能 4.相对于数据集大时比 AOF 的启动效率更高。缺点 1、数据安全性低。RDB 是间隔一段时间进行持久化如果持久化之间 redis 发生故障会发生数据丢失。所以这种方式更适合数据要求不严谨的时候) 2、AOFAppend-only file)持久化方式是指所有的命令行记录以 redis 命令请求协议的格式完全持久化存储)保存为 aof 文件。 AOF持久化 AOF持久化(即Append Only File持久化)则是将Redis执行的每次写命令记录到单独的日志文件中当重启Redis会重新将持久化的日志中文件恢复数据。当两种方式同时开启时数据恢复Redis会优先选择AOF恢复。优点 1、数据安全aof 持久化可以配置 appendfsync 属性有 always每进行一次命令操作就记录到 aof 文件中一次。 2、通过 append 模式写文件即使中途服务器宕机可以通过 redis-check-aof 工具解决数据一致性问题。 3、AOF 机制的 rewrite 模式。AOF 文件没被 rewrite 之前文件过大时会对命令进行合并重写可以删除其中的某些命令比如误操作的 flushall) 缺点 1、AOF 文件比 RDB 文件大且恢复速度慢。 2、数据集大的时候比 rdb 启动效率低。优缺点是什么 AOF文件比RDB更新频率高优先使用AOF还原数据。 AOF比RDB更安全也更大 RDB性能比AOF好如果两个都配了优先加载AOF 如何选择合适的持久化方式一般来说如果想达到足以媲美PostgreSQL的数据安全性你应该同时使用两种持久化功能。在这种情况下当 Redis 重启的时候会优先载入AOF文件来恢复原始的数据因为在通常情况下AOF文件保存的数据集要比RDB文件保存的数据集要完整。如果你非常关心你的数据但仍然可以承受数分钟以内的数据丢失那么你可以只使用RDB持久化。有很多用户都只使用AOF持久化但并不推荐这种方式因为定时生成RDB快照snapshot非常便于进行数据库备份并且 RDB 恢复数据集的速度也要比AOF恢复的速度要快除此之外使用RDB还可以避免AOF程序的bug。如果你只希望你的数据在服务器运行的时候存在你也可以不使用任何持久化方式。 Redis持久化数据和缓存怎么做扩容如果Redis被当做缓存使用使用一致性哈希实现动态扩容缩容。如果Redis被当做一个持久化存储使用必须使用固定的keys-to-nodes映射关系节点的数量一旦确定不能变化。否则的话(即Redis节点需要动态变化的情况必须使用可以在运行时进行数据再平衡的一套系统而当前只有Redis集群可以做到这样。过期键的删除策略 Redis的过期键的删除策略我们都知道Redis是key-value数据库我们可以设置Redis中缓存的key的过期时间。Redis的过期策略就是指当Redis中缓存的key过期了Redis如何处理。过期策略通常有以下三种定时过期每个设置过期时间的key都需要创建一个定时器到过期时间就会立即清除。该策略可以立即清除过期的数据对内存很友好但是会占用大量的CPU资源去处理过期的数据从而影响缓存的响应时间和吞吐量。惰性过期只有当访问一个key时才会判断该key是否已过期过期则清除。该策略可以最大化地节省CPU资源却对内存非常不友好。极端情况可能出现大量的过期key没有再次被访问从而不会被清除占用大量内存。定期过期每隔一定的时间会扫描一定数量的数据库的expires字典中一定数量的key并清除其中已过期的key。该策略是前两者的一个折中方案。通过调整定时扫描的时间间隔和每次扫描的限定耗时可以在不同情况下使得CPU和内存资源达到最优的平衡效果。 (expires字典会保存所有设置了过期时间的key的过期时间数据其中key是指向键空间中的某个键的指针value是该键的毫秒精度的UNIX时间戳表示的过期时间。键空间是指该Redis集群中保存的所有键。) Redis中同时使用了惰性过期和定期过期两种过期策略。 Redis key的过期时间和永久有效分别怎么设置 EXPIRE和PERSIST命令。我们知道通过expire来设置key 的过期时间那么对过期的数据怎么处理呢? 除了缓存服务器自带的缓存失效策略之外Redis默认的有6中策略可供选择我们还可以根据具体的业务需求进行自定义的缓存淘汰常见的策略有两种定时去清理过期的缓存当有用户请求过来时再判断这个请求所用到的缓存是否过期过期的话就去底层系统得到新数据并更新缓存。两者各有优劣第一种的缺点是维护大量缓存的key是比较麻烦的第二种的缺点就是每次用户请求过来都要判断缓存失效逻辑相对比较复杂具体用哪种方案大家可以根据自己的应用场景来权衡。内存相关 MySQL里有2000w数据redis中只存20w的数据如何保证redis中的数据都是热点数据 redis内存数据集大小上升到一定大小的时候就会施行数据淘汰策略。 Redis的内存淘汰策略有哪些 Redis的内存淘汰策略是指在Redis的用于缓存的内存不足时怎么处理需要新写入且需要申请额外空间的数据。全局的键空间选择性移除 noeviction当内存不足以容纳新写入数据时新写入操作会报错。 allkeys-lru当内存不足以容纳新写入数据时在键空间中移除最近最少使用的key。这个是最常用的 allkeys-random当内存不足以容纳新写入数据时在键空间中随机移除某个key。设置过期时间的键空间选择性移除 volatile-lru当内存不足以容纳新写入数据时在设置了过期时间的键空间中移除最近最少使用的key。 volatile-random当内存不足以容纳新写入数据时在设置了过期时间的键空间中随机移除某个key。 volatile-ttl当内存不足以容纳新写入数据时在设置了过期时间的键空间中有更早过期时间的key优先移除。总结 Redis的内存淘汰策略的选取并不会影响过期的key的处理。内存淘汰策略用于处理内存不足时的需要申请额外空间的数据过期策略用于处理过期的缓存数据。 Redis主要消耗什么物理资源内存。 Redis的内存用完了会发生什么如果达到设置的上限Redis的写命令会返回错误信息但是读命令还可以正常返回。或者你可以配置内存淘汰机制当Redis达到内存上限时会冲刷掉旧的内容。 Redis如何做内存优化可以好好利用Hash,list,sorted set,set等集合类型数据因为通常情况下很多小的Key-Value可以用更紧凑的方式存放到一起。尽可能使用散列表hashes散列表是说散列表里面存储的数少使用的内存非常小所以你应该尽可能的将你的数据模型抽象到一个散列表里面。比如你的web系统中有一个用户对象不要为这个用户的名称姓氏邮箱密码设置单独的key而是应该把这个用户的所有信息存储到一张散列表里面线程模型 Redis线程模型 Redis基于Reactor模式开发了网络事件处理器这个处理器被称为文件事件处理器file event handler。它的组成结构为4部分多个套接字、IO多路复用程序、文件事件分派器、事件处理器。因为文件事件分派器队列的消费是单线程的所以Redis才叫单线程模型。文件事件处理器使用 I/O 多路复用multiplexing程序来同时监听多个套接字并根据套接字目前执行的任务来为套接字关联不同的事件处理器。当被监听的套接字准备好执行连接应答accept、读取read、写入write、关闭close等操作时与操作相对应的文件事件就会产生这时文件事件处理器就会调用套接字之前关联好的事件处理器来处理这些事件。虽然文件事件处理器以单线程方式运行但通过使用 I/O 多路复用程序来监听多个套接字文件事件处理器既实现了高性能的网络通信模型又可以很好地与 redis 服务器中其他同样以单线程方式运行的模块进行对接这保持了 Redis 内部单线程设计的简单性。参考https://www.cnblogs.com/barrywxx/p/8570821.html 事务什么是事务事务是一个单独的隔离操作事务中的所有命令都会序列化、按顺序地执行。事务在执行的过程中不会被其他客户端发送来的命令请求所打断。事务是一个原子操作事务中的命令要么全部被执行要么全部都不执行。 Redis事务的概念 Redis 事务的本质是通过MULTI、EXEC、WATCH等一组命令的集合。事务支持一次执行多个命令一个事务中所有命令都会被序列化。在事务执行过程会按照顺序串行化执行队列中的命令其他客户端提交的命令请求不会插入到事务执行命令序列中。总结说redis事务就是一次性、顺序性、排他性的执行一个队列中的一系列命令。 Redis事务的三个阶段事务开始 MULTI 命令入队事务执行 EXEC 事务执行过程中如果服务端收到有EXEC、DISCARD、WATCH、MULTI之外的请求将会把请求放入队列中排队 Redis事务相关命令 Redis事务功能是通过MULTI、EXEC、DISCARD和WATCH 四个原语实现的 Redis会将一个事务中的所有命令序列化然后按顺序执行。 redis 不支持回滚“Redis 在事务失败时不进行回滚而是继续执行余下的命令” 所以 Redis 的内部可以保持简单且快速。如果在一个事务中的命令出现错误那么所有的命令都不会执行如果在一个事务中出现运行错误那么正确的命令会被执行 WATCH 命令是一个乐观锁可以为 Redis 事务提供 check-and-set CAS行为。可以监控一个或多个键一旦其中有一个键被修改或删除之后的事务就不会执行监控一直持续到EXEC命令。 MULTI命令用于开启一个事务它总是返回OK。MULTI执行之后客户端可以继续向服务器发送任意多条命令这些命令不会立即被执行而是被放到一个队列中当EXEC命令被调用时所有队列中的命令才会被执行。 EXEC执行所有事务块内的命令。返回事务块内所有命令的返回值按命令执行的先后顺序排列。当操作被打断时返回空值 nil 。通过调用DISCARD客户端可以清空事务队列并放弃执行事务并且客户端会从事务状态中退出。 UNWATCH命令可以取消watch对所有key的监控。事务管理ACID概述原子性Atomicity 原子性是指事务是一个不可分割的工作单位事务中的操作要么都发生要么都不发生。一致性Consistency 事务前后数据的完整性必须保持一致。隔离性Isolation 多个事务并发执行时一个事务的执行不应影响其他事务的执行持久性Durability 持久性是指一个事务一旦被提交它对数据库中数据的改变就是永久性的接下来即使数据库发生故障也不应该对其有任何影响 Redis的事务总是具有ACID中的一致性和隔离性其他特性是不支持的。当服务器运行在AOF持久化模式下并且appendfsync选项的值为always时事务也具有耐久性。 Redis事务支持隔离性吗 Redis 是单进程程序并且它保证在执行事务时不会对事务进行中断事务可以运行直到执行完所有事务队列中的命令为止。因此Redis 的事务是总是带有隔离性的。 Redis事务保证原子性吗支持回滚吗 Redis中单条命令是原子性执行的但事务不保证原子性且没有回滚。事务中任意命令执行失败其余的命令仍会被执行。 Redis事务其他实现基于Lua脚本Redis可以保证脚本内的命令一次性、按顺序地执行其同时也不提供事务运行错误的回滚执行过程中如果部分命令运行错误剩下的命令还是会继续运行完基于中间标记变量通过另外的标记变量来标识事务是否执行完成读取数据时先读取该标记变量判断是否事务执行完成。但这样会需要额外写代码实现比较繁琐集群方案哨兵模式哨兵的介绍 sentinel中文名是哨兵。哨兵是 redis 集群机构中非常重要的一个组件主要有以下功能集群监控负责监控 redis master 和 slave 进程是否正常工作。消息通知如果某个 redis 实例有故障那么哨兵负责发送消息作为报警通知给管理员。故障转移如果 master node 挂掉了会自动转移到 slave node 上。配置中心如果故障转移发生了通知 client 客户端新的 master 地址。哨兵用于实现 redis 集群的高可用本身也是分布式的作为一个哨兵集群去运行互相协同工作。故障转移时判断一个 master node 是否宕机了需要大部分的哨兵都同意才行涉及到了分布式选举的问题。即使部分哨兵节点挂掉了哨兵集群还是能正常工作的因为如果一个作为高可用机制重要组成部分的故障转移系统本身是单点的那就很坑爹了。哨兵的核心知识哨兵至少需要 3 个实例来保证自己的健壮性。哨兵 redis 主从的部署架构是不保证数据零丢失的只能保证 redis 集群的高可用性。对于哨兵 redis 主从这种复杂的部署架构尽量在测试环境和生产环境都进行充足的测试和演练。官方Redis Cluster 方案(服务端路由查询) edis 集群模式的工作原理能说一下么在集群模式下redis 的 key 是如何寻址的分布式寻址都有哪些算法了解一致性 hash 算法吗简介 Redis Cluster是一种服务端Sharding技术3.0版本开始正式提供。Redis Cluster并没有使用一致性hash而是采用slot(槽)的概念一共分成16384个槽。将请求发送到任意节点接收到请求的节点会将查询请求发送到正确的节点上执行方案说明通过哈希的方式将数据分片每个节点均分存储一定哈希槽(哈希值)区间的数据默认分配了16384 个槽位每份数据分片会存储在多个互为主从的多节点上数据写入先写主节点再同步到从节点(支持配置为阻塞同步) 同一分片多个节点间的数据不保持一致性读取数据时当客户端操作的key没有分配在该节点上时redis会返回转向指令指向正确的节点扩容时时需要需要把旧节点的数据迁移一部分到新节点在 redis cluster 架构下每个 redis 要放开两个端口号比如一个是 6379另外一个就是加1w 的端口号比如 16379。 16379 端口号是用来进行节点间通信的也就是 cluster bus 的东西cluster bus 的通信用来进行故障检测、配置更新、故障转移授权。cluster bus 用了另外一种二进制的协议gossip 协议用于节点间进行高效的数据交换占用更少的网络带宽和处理时间。节点间的内部通信机制基本通信原理集群元数据的维护有两种方式集中式、Gossip 协议。redis cluster 节点间采用 gossip 协议进行通信。分布式寻址算法 hash 算法大量缓存重建一致性 hash 算法自动缓存迁移虚拟节点自动负载均衡 redis cluster 的 hash slot 算法优点无中心架构支持动态扩容对业务透明具备Sentinel的监控和自动Failover(故障转移)能力客户端不需要连接集群所有节点连接集群中任何一个可用节点即可高性能客户端直连redis服务免去了proxy代理的损耗缺点运维也很复杂数据迁移需要人工干预只能使用0号数据库不支持批量操作(pipeline管道操作) 分布式逻辑和存储模块耦合等基于客户端分配简介 Redis Sharding是Redis Cluster出来之前业界普遍使用的多Redis实例集群方法。其主要思想是采用哈希算法将Redis数据的key进行散列通过hash函数特定的key会映射到特定的Redis节点上。Java redis客户端驱动jedis支持Redis Sharding功能即ShardedJedis以及结合缓存池的ShardedJedisPool 优点优势在于非常简单服务端的Redis实例彼此独立相互无关联每个Redis实例像单服务器一样运行非常容易线性扩展系统的灵活性很强缺点由于sharding处理放到客户端规模进一步扩大时给运维带来挑战。客户端sharding不支持动态增删节点。服务端Redis实例群拓扑结构有变化时每个客户端都需要更新调整。连接不能共享当应用规模增大时资源浪费制约优化基于代理服务器分片简介客户端发送请求到一个代理组件代理解析客户端的数据并将请求转发至正确的节点最后将结果回复给客户端特征透明接入业务程序不用关心后端Redis实例切换成本低 Proxy 的逻辑和存储的逻辑是隔离的代理层多了一次转发性能有所损耗业界开源方案 Twtter开源的Twemproxy 豌豆荚开源的Codis Redis 主从架构单机的 redis能够承载的 QPS 大概就在上万到几万不等。对于缓存来说一般都是用来支撑读高并发的。因此架构做成主从(master-slave)架构一主多从主负责写并且将数据复制到其它的 slave 节点从节点负责读。所有的读请求全部走从节点。这样也可以很轻松实现水平扩容支撑读高并发。 redis replication - 主从架构 - 读写分离 - 水平扩容支撑读高并发 redis replication 的核心机制 redis 采用异步方式复制数据到 slave 节点不过 redis2.8 开始slave node 会周期性地确认自己每次复制的数据量一个 master node 是可以配置多个 slave node 的 slave node 也可以连接其他的 slave node slave node 做复制的时候不会 block master node 的正常工作 slave node 在做复制的时候也不会 block 对自己的查询操作它会用旧的数据集来提供服务但是复制完成的时候需要删除旧数据集加载新数据集这个时候就会暂停对外服务了 slave node 主要用来进行横向扩容做读写分离扩容的 slave node 可以提高读的吞吐量。注意如果采用了主从架构那么建议必须开启 master node 的持久化不建议用 slave node 作为 master node 的数据热备因为那样的话如果你关掉 master 的持久化可能在 master 宕机重启的时候数据是空的然后可能一经过复制 slave node 的数据也丢了。另外master 的各种备份方案也需要做。万一本地的所有文件丢失了从备份中挑选一份 rdb 去恢复 master这样才能确保启动的时候是有数据的即使采用了后续讲解的高可用机制slave node 可以自动接管 master node但也可能 sentinel 还没检测到 master failuremaster node 就自动重启了还是可能导致上面所有的 slave node 数据被清空。 redis 主从复制的核心原理当启动一个 slave node 的时候它会发送一个 PSYNC 命令给 master node。如果这是 slave node 初次连接到 master node那么会触发一次 full resynchronization 全量复制。此时 master 会启动一个后台线程开始生成一份 RDB 快照文件同时还会将从客户端 client 新收到的所有写命令缓存在内存中。RDB 文件生成完毕后 master 会将这个 RDB 发送给 slaveslave 会先写入本地磁盘然后再从本地磁盘加载到内存中接着 master 会将内存中缓存的写命令发送到 slaveslave 也会同步这些数据。 slave node 如果跟 master node 有网络故障断开了连接会自动重连连接之后 master node 仅会复制给 slave 部分缺少的数据。过程原理当从库和主库建立MS关系后会向主数据库发送SYNC命令主库接收到SYNC命令后会开始在后台保存快照(RDB持久化过程)并将期间接收到的写命令缓存起来当快照完成后主Redis会将快照文件和所有缓存的写命令发送给从Redis 从Redis接收到后会载入快照文件并且执行收到的缓存的命令之后主Redis每当接收到写命令时就会将命令发送从Redis从而保证数据的一致缺点所有的slave节点数据的复制和同步都由master节点来处理会照成master节点压力太大使用主从从结构来解决 Redis集群的主从复制模型是怎样的为了使在部分节点失败或者大部分节点无法通信的情况下集群仍然可用所以集群使用了主从复制模型每个节点都会有N-1个复制品生产环境中的 redis 是怎么部署的 redis cluster10 台机器5 台机器部署了 redis 主实例另外 5 台机器部署了 redis 的从实例每个主实例挂了一个从实例5 个节点对外提供读写服务每个节点的读写高峰qps可能可以达到每秒 5 万5 台机器最多是 25 万读写请求/s。机器是什么配置32G 内存 8 核 CPU 1T 磁盘但是分配给 redis 进程的是10g内存一般线上生产环境redis 的内存尽量不要超过 10g超过 10g 可能会有问题。 5 台机器对外提供读写一共有 50g 内存。因为每个主实例都挂了一个从实例所以是高可用的任何一个主实例宕机都会自动故障迁移redis 从实例会自动变成主实例继续提供读写服务。你往内存里写的是什么数据每条数据的大小是多少商品数据每条数据是 10kb。100 条数据是 1mb10 万条数据是 1g。常驻内存的是 200 万条商品数据占用内存是 20g仅仅不到总内存的 50%。目前高峰期每秒就是 3500 左右的请求量。其实大型的公司会有基础架构的 team 负责缓存集群的运维。说说Redis哈希槽的概念 Redis集群没有使用一致性hash,而是引入了哈希槽的概念Redis集群有16384个哈希槽每个key通过CRC16校验后对16384取模来决定放置哪个槽集群的每个节点负责一部分hash槽。 Redis集群会有写操作丢失吗为什么 Redis并不能保证数据的强一致性这意味这在实际中集群在特定的条件下可能会丢失写操作。 Redis集群之间是如何复制的异步复制 Redis集群最大节点个数是多少 16384个 Redis集群如何选择数据库 Redis集群目前无法做数据库选择默认在0数据库。分区 Redis是单线程的如何提高多核CPU的利用率可以在同一个服务器部署多个Redis的实例并把他们当作不同的服务器来使用在某些时候无论如何一个服务器是不够的所以如果你想使用多个CPU你可以考虑一下分片shard。为什么要做Redis分区分区可以让Redis管理更大的内存Redis将可以使用所有机器的内存。如果没有分区你最多只能使用一台机器的内存。分区使Redis的计算能力通过简单地增加计算机得到成倍提升Redis的网络带宽也会随着计算机和网卡的增加而成倍增长。你知道有哪些Redis分区实现方案客户端分区就是在客户端就已经决定数据会被存储到哪个redis节点或者从哪个redis节点读取。大多数客户端已经实现了客户端分区。代理分区意味着客户端将请求发送给代理然后代理决定去哪个节点写数据或者读数据。代理根据分区规则决定请求哪些Redis实例然后根据Redis的响应结果返回给客户端。redis和memcached的一种代理实现就是Twemproxy 查询路由(Query routing) 的意思是客户端随机地请求任意一个redis实例然后由Redis将请求转发给正确的Redis节点。Redis Cluster实现了一种混合形式的查询路由但并不是直接将请求从一个redis节点转发到另一个redis节点而是在客户端的帮助下直接redirected到正确的redis节点。 Redis分区有什么缺点涉及多个key的操作通常不会被支持。例如你不能对两个集合求交集因为他们可能被存储到不同的Redis实例实际上这种情况也有办法但是不能直接使用交集指令。同时操作多个key,则不能使用Redis事务. 分区使用的粒度是key不能使用一个非常长的排序key存储一个数据集The partitioning granularity is the key, so it is not possible to shard a dataset with a single huge key like a very big sorted set 当使用分区的时候数据处理会非常复杂例如为了备份你必须从不同的Redis实例和主机同时收集RDB / AOF文件。分区时动态扩容或缩容可能非常复杂。Redis集群在运行时增加或者删除Redis节点能做到最大程度对用户透明地数据再平衡但其他一些客户端分区或者代理分区方法则不支持这种特性。然而有一种预分片的技术也可以较好的解决这个问题。分布式问题 Redis实现分布式锁 Redis为单进程单线程模式采用队列模式将并发访问变成串行访问且多客户端对Redis的连接并不存在竞争关系Redis中可以使用SETNX命令实现分布式锁。当且仅当 key 不存在将 key 的值设为 value。若给定的 key 已经存在则 SETNX 不做任何动作 SETNX 是『SET if Not eXists』(如果不存在则 SET)的简写。返回值设置成功返回 1 。设置失败返回 0 。使用SETNX完成同步锁的流程及事项如下使用SETNX命令获取锁若返回0key已存在锁已存在则获取失败反之获取成功为了防止获取锁后程序出现异常导致其他线程/进程调用SETNX命令总是返回0而进入死锁状态需要为该key设置一个“合理”的过期时间释放锁使用DEL命令将锁数据删除如何解决 Redis 的并发竞争 Key 问题所谓 Redis 的并发竞争 Key 的问题也就是多个系统同时对一个 key 进行操作但是最后执行的顺序和我们期望的顺序不同这样也就导致了结果的不同推荐一种方案分布式锁zookeeper 和 redis 都可以实现分布式锁。如果不存在 Redis 的并发竞争 Key 问题不要使用分布式锁这样会影响性能基于zookeeper临时有序节点可以实现的分布式锁。大致思想为每个客户端对某个方法加锁时在zookeeper上的与该方法对应的指定节点的目录下生成一个唯一的瞬时有序节点。判断是否获取锁的方式很简单只需要判断有序节点中序号最小的一个。当释放锁的时候只需将这个瞬时节点删除即可。同时其可以避免服务宕机导致的锁无法释放而产生的死锁问题。完成业务流程后删除对应的子节点释放锁。在实践中当然是从以可靠性为主。所以首推Zookeeper。参考https://www.jianshu.com/p/8bddd381de06 分布式Redis是前期做还是后期规模上来了再做好为什么既然Redis是如此的轻量单实例只使用1M内存为防止以后的扩容最好的办法就是一开始就启动较多实例。即便你只有一台服务器你也可以一开始就让Redis以分布式的方式运行使用分区在同一台服务器上启动多个实例。一开始就多设置几个Redis实例例如32或者64个实例对大多数用户来说这操作起来可能比较麻烦但是从长久来看做这点牺牲是值得的。这样的话当你的数据不断增长需要更多的Redis服务器时你需要做的就是仅仅将Redis实例从一台服务迁移到另外一台服务器而已而不用考虑重新分区的问题。一旦你添加了另一台服务器你需要将你一半的Redis实例从第一台机器迁移到第二台机器。什么是 RedLock Redis 官方站提出了一种权威的基于 Redis 实现分布式锁的方式名叫 Redlock此种方式比原先的单节点的方法更安全。它可以保证以下特性安全特性互斥访问即永远只有一个 client 能拿到锁避免死锁最终 client 都可能拿到锁不会出现死锁的情况即使原本锁住某资源的 client crash 了或者出现了网络分区容错性只要大部分 Redis 节点存活就可以正常提供服务缓存异常缓存雪崩缓存雪崩是指缓存同一时间大面积的失效所以后面的请求都会落到数据库上造成数据库短时间内承受大量请求而崩掉。解决方案缓存数据的过期时间设置随机防止同一时间大量数据过期现象发生。一般并发量不是特别多的时候使用最多的解决方案是加锁排队。给每一个缓存数据增加相应的缓存标记记录缓存的是否失效如果缓存标记失效则更新数据缓存。缓存穿透缓存穿透是指缓存和数据库中都没有的数据导致所有的请求都落到数据库上造成数据库短时间内承受大量请求而崩掉。解决方案接口层增加校验如用户鉴权校验id做基础校验id0的直接拦截从缓存取不到的数据在数据库中也没有取到这时也可以将key-value对写为key-null缓存有效时间可以设置短点如30秒设置太长会导致正常情况也没法使用。这样可以防止攻击用户反复用同一个id暴力攻击采用布隆过滤器将所有可能存在的数据哈希到一个足够大的 bitmap 中一个一定不存在的数据会被这个 bitmap 拦截掉从而避免了对底层存储系统的查询压力附加对于空间的利用到达了一种极致那就是Bitmap和布隆过滤器(Bloom Filter)。 Bitmap典型的就是哈希表缺点是Bitmap对于每个元素只能记录1bit信息如果还想完成额外的功能恐怕只能靠牺牲更多的空间、时间来完成了。布隆过滤器推荐就是引入了k(k1)k(k1)个相互独立的哈希函数保证在给定的空间、误判率下完成元素判重的过程。它的优点是空间效率和查询时间都远远超过一般的算法缺点是有一定的误识别率和删除困难。 Bloom-Filter算法的核心思想就是利用多个不同的Hash函数来解决“冲突”。 Hash存在一个冲突碰撞的问题用同一个Hash得到的两个URL的值有可能相同。为了减少冲突我们可以多引入几个Hash如果通过其中的一个Hash值我们得出某元素不在集合中那么该元素肯定不在集合中。只有在所有的Hash函数告诉我们该元素在集合中时才能确定该元素存在于集合中。这便是Bloom-Filter的基本思想。 Bloom-Filter一般用于在大数据量的集合中判定某元素是否存在。缓存击穿缓存击穿是指缓存中没有但数据库中有的数据一般是缓存时间到期这时由于并发用户特别多同时读缓存没读到数据又同时去数据库去取数据引起数据库压力瞬间增大造成过大压力。和缓存雪崩不同的是缓存击穿指并发查同一条数据缓存雪崩是不同数据都过期了很多数据都查不到从而查数据库。解决方案设置热点数据永远不过期。加互斥锁互斥锁缓存预热缓存预热就是系统上线后将相关的缓存数据直接加载到缓存系统。这样就可以避免在用户请求的时候先查询数据库然后再将数据缓存的问题用户直接查询事先被预热的缓存数据解决方案直接写个缓存刷新页面上线时手工操作一下数据量不大可以在项目启动的时候自动进行加载定时刷新缓存缓存降级当访问量剧增、服务出现问题如响应时间慢或不响应或非核心服务影响到核心流程的性能时仍然需要保证服务还是可用的即使是有损服务。系统可以根据一些关键数据进行自动降级也可以配置开关实现人工降级。缓存降级的最终目的是保证核心服务可用即使是有损的。而且有些服务是无法降级的如加入购物车、结算。在进行降级之前要对系统进行梳理看看系统是不是可以丢卒保帅从而梳理出哪些必须誓死保护哪些可降级比如可以参考日志级别设置预案一般比如有些服务偶尔因为网络抖动或者服务正在上线而超时可以自动降级警告有些服务在一段时间内成功率有波动如在95~100%之间可以自动降级或人工降级并发送告警错误比如可用率低于90%或者数据库连接池被打爆了或者访问量突然猛增到系统能承受的最大阀值此时可以根据情况自动降级或者人工降级严重错误比如因为特殊原因数据错误了此时需要紧急人工降级。服务降级的目的是为了防止Redis服务故障导致数据库跟着一起发生雪崩问题。因此对于不重要的缓存数据可以采取服务降级策略例如一个比较常见的做法就是Redis出现问题不去数据库查询而是直接返回默认值给用户。热点数据和冷数据热点数据缓存才有价值对于冷数据而言大部分数据可能还没有再次访问到就已经被挤出内存不仅占用内存而且价值不大。频繁修改的数据看情况考虑使用缓存对于热点数据比如我们的某IM产品生日祝福模块当天的寿星列表缓存以后可能读取数十万次。再举个例子某导航产品我们将导航信息缓存以后可能读取数百万次。数据更新前至少读取两次缓存才有意义。这个是最基本的策略如果缓存还没有起作用就失效了那就没有太大价值了。那存不存在修改频率很高但是又不得不考虑缓存的场景呢有比如这个读取接口对数据库的压力很大但是又是热点数据这个时候就需要考虑通过缓存手段减少数据库的压力比如我们的某助手产品的点赞数收藏数分享数等是非常典型的热点数据但是又不断变化此时就需要将数据同步保存到Redis缓存减少数据库压力。缓存热点key 缓存中的一个Key(比如一个促销商品)在某个时间点过期的时候恰好在这个时间点对这个Key有大量的并发请求过来这些请求发现缓存过期一般都会从后端DB加载数据并回设到缓存这个时候大并发的请求可能会瞬间把后端DB压垮。解决方案对缓存查询加锁如果KEY不存在就加锁然后查DB入缓存然后解锁其他进程如果发现有锁就等待然后等解锁后返回数据或者进入DB查询常用工具 Redis支持的Java客户端都有哪些官方推荐用哪个 Redisson、Jedis、lettuce等等官方推荐使用Redisson。 Redis和Redisson有什么关系 Redisson是一个高级的分布式协调Redis客服端能帮助用户在分布式环境中轻松实现一些Java的对象 (Bloom filter, BitSet, Set, SetMultimap, ScoredSortedSet, SortedSet, Map, ConcurrentMap, List, ListMultimap, Queue, BlockingQueue, Deque, BlockingDeque, Semaphore, Lock, ReadWriteLock, AtomicLong, CountDownLatch, Publish / Subscribe, HyperLogLog)。 Jedis与Redisson对比有什么优缺点 Jedis是Redis的Java实现的客户端其API提供了比较全面的Redis命令的支持Redisson实现了分布式和可扩展的Java数据结构和Jedis相比功能较为简单不支持字符串操作不支持排序、事务、管道、分区等Redis特性。Redisson的宗旨是促进使用者对Redis的关注分离从而让使用者能够将精力更集中地放在处理业务逻辑上。其他问题 Redis与Memcached的区别两者都是非关系型内存键值数据库现在公司一般都是用 Redis 来实现缓存而且 Redis 自身也越来越强大了Redis 与 Memcached 主要有以下不同 (1) memcached所有的值均是简单的字符串redis作为其替代者支持更为丰富的数据类型 (2) redis的速度比memcached快很多 (3) redis可以持久化其数据如何保证缓存与数据库双写时的数据一致性你只要用缓存就可能会涉及到缓存与数据库双存储双写你只要是双写就一定会有数据一致性的问题那么你如何解决一致性问题一般来说就是如果你的系统不是严格要求缓存数据库必须一致性的话缓存可以稍微的跟数据库偶尔有不一致的情况最好不要做这个方案读请求和写请求串行化串到一个内存队列里去这样就可以保证一定不会出现不一致的情况串行化之后就会导致系统的吞吐量会大幅度的降低用比正常情况下多几倍的机器去支撑线上的一个请求。还有一种方式就是可能会暂时产生不一致的情况但是发生的几率特别小就是先更新数据库然后再删除缓存。 Redis常见性能问题和解决方案 Master最好不要做任何持久化工作包括内存快照和AOF日志文件特别是不要启用内存快照做持久化。如果数据比较关键某个Slave开启AOF备份数据策略为每秒同步一次。为了主从复制的速度和连接的稳定性Slave和Master最好在同一个局域网内。尽量避免在压力较大的主库上增加从库 Master调用BGREWRITEAOF重写AOF文件AOF在重写的时候会占大量的CPU和内存资源导致服务load过高出现短暂服务暂停现象。为了Master的稳定性主从复制不要用图状结构用单向链表结构更稳定即主从关系为Master–Slave1–Slave2–Slave3…这样的结构也方便解决单点故障问题实现Slave对Master的替换也即如果Master挂了可以立马启用Slave1做Master其他不变。 Redis官方为什么不提供Windows版本因为目前Linux版本已经相当稳定而且用户量很大无需开发windows版本反而会带来兼容性等问题。一个字符串类型的值能存储最大容量是多少 512M Redis如何做大量数据插入 Redis2.6开始redis-cli支持一种新的被称之为pipe mode的新模式用于执行大量数据插入工作。假如Redis里面有1亿个key其中有10w个key是以某个固定的已知的前缀开头的如果将它们全部找出来使用keys指令可以扫出指定模式的key列表。对方接着追问如果这个redis正在给线上的业务提供服务那使用keys指令会有什么问题这个时候你要回答redis关键的一个特性redis的单线程的。keys指令会导致线程阻塞一段时间线上服务会停顿直到指令执行完毕服务才能恢复。这个时候可以使用scan指令scan指令可以无阻塞的提取出指定模式的key列表但是会有一定的重复概率在客户端做一次去重就可以了但是整体所花费的时间会比直接用keys指令长。使用Redis做过异步队列吗是如何实现的使用list类型保存数据信息rpush生产消息lpop消费消息当lpop没有消息时可以sleep一段时间然后再检查有没有信息如果不想sleep的话可以使用blpop, 在没有信息的时候会一直阻塞直到信息的到来。redis可以通过pub/sub主题订阅模式实现一个生产者多个消费者当然也存在一定的缺点当消费者下线时生产的消息会丢失。 Redis如何实现延时队列使用sortedset使用时间戳做score, 消息内容作为key,调用zadd来生产消息消费者使用zrangbyscore获取n秒之前的数据做轮询处理。 Redis回收进程如何工作的一个客户端运行了新的命令添加了新的数据。 Redis检查内存使用情况如果大于maxmemory的限制则根据设定好的策略进行回收。一个新的命令被执行等等。所以我们不断地穿越内存限制的边界通过不断达到边界然后不断地回收回到边界以下。如果一个命令的结果导致大量内存被使用例如很大的集合的交集保存到一个新的键不用多久内存限制就会被这个内存使用量超越。 Redis回收使用的是什么算法 LRU算法

查看全文

http://www.huolong8.cn/news/166641/