系统架构面试题(4)开源软件

系统架构面试题(4)开源软件

1.常用的Web服务器优缺点是什么?

  • 1、Apache是世界上应用最多的WEB服务器,优势主要在于源代码开放、有一支开放的开发队伍、支持跨平台应用以及其可移植性等。Apache的模块支持非常丰富,虽在速度和性能上不及其他轻量级WEB服务器,是属于重量级产品,所消耗的内存也比其他WEB服务器要高。

  • 2、Lighttpd是提供一个专门针对高性能网站,安全、快速、兼容性好并且灵活的WEB Server环境,它具有内存开销低、CPU占有率低、效能好,以及模块丰富等特点。支持FastCGI、CGI、Auth、输出压缩、URL重写及Alias等重要功能,属于轻量级WEB服务器。

  • 3、Tomcat是一个开放源代码、运行servlet和JSP Web应用软件的基于Java的web应用软件容器,Tomcat server是根据servlet和jsp规范执行的,因此也可以说Tomcat server实行了Apache-Jakarta规范,且比绝大多数商用应用软件服务器要好。Tomcat对静态文件和高并发的处理比较弱。

  • 4、IBM WebSphere是一种功能完善、开放的WEB应用程序服务器,它基于Java的应用环境,建立、部署和管理Internet和Intranet Web应用程序。相对于其他流行的WEB服务器而言,应用的数量很少。

  • 5、IIS是微软开发的的WEB服务器,包括WEB服务器、FTP服务器、NNTP服务器和SMTP服务器,分别用于网页浏览、文件传输、新闻服务和邮件发送等方面。它提供ISAPI作为扩展WEB服务器功能的编程接口,同时还提供了Internet,可以实现对数据库的查询和更新。

  • 6、Nginx是一款高性能的HTTP和反向代理服务器,能够选择高效的epoll、kqueue、eventport最为网络I/O模型,在高连接并发的情况下,能够支持高达5万个并发连接数的响应,而内存、CPU等系统资源消耗却非常低,运行非常稳定。

2.有哪些开源的分布式缓存系统?Sharding方案有哪些,优缺点是什么?

常见的分布式缓存系统:

  • Memcached:Memcached一个免费开源的、高性能的、具有分布式内存对象的缓存系统。Memcached服务器端并没有分布式功能,各个机器之间不会互相通信以共享信息,分布式功能完全取决于客户端的实现。Memcached保存的数据都存储在内存空间中,宕机后数据就会丢失。Memcached内存容量达到指定值之后,就基于LRU(Least Recently Used)算法自动删除不使用的缓存。

  • Redis:Redis是一款开源的内存数据结构存储,用作数据库、分布式缓存、消息中间件,支持多种数据结构。Redis内置了主从复制、事务以及不同级别的持久化功能,并通过Sentinel和自动分区的Cluster提供了高可用性。

为了使得集群能够水平扩展,首要解决的问题就是如何将整个数据集按照一定的规则分配到多个节点上,常用的数据分片的方法有:范围分片、哈希分片、一致性哈希算法和虚拟哈希槽等。

  • 范围分片

假设数据集是有序,将顺序相临近的数据放在一起,可以很好的支持遍历操作。范围分片的缺点是面对顺序写时,会存在热点。比如日志类型的写入,一般日志的顺序都是和时间相关的,时间是单调递增的,因此写入的热点永远在最后一个分片。

  • 哈希分片

由哈希值决定请求交予哪个具体的服务器处理。假设有三台服务器,[0, 1, 2];使用哈希函数,例如取模,hash = key % 3;得到key的哈希值之后,将key发送到对应的服务器中处理。由于key是完全无规律的,当其中一台服务器挂掉之后,hash变成hash = key%2;这样几乎所有key的哈希值都会改变,也就导致几乎所有key的缓存都失效了,造成缓存雪崩。根本原因就是因为一个服务器宕机之后,哈希函数发生了变化(由之前的key%3变成了key%2),所以影响到了所有的key。

  • 一致性哈希算法

一致性哈希固定一个数组的长度为2^32-1,hash函数为(key % 2^32)。这个数组是环状的,2^32-1的下一个数字是0。所有的服务器被均匀的放在环上,当key得到一个hash值之后,就沿着顺时针方向寻找遇到的第一个服务器。这样当一个服务器1宕机时,影响的只是原来从服务器0到服务器1之间的这部分数据,这部分数据被顺时针流向了服务器2。但是当增加一台服务器时,带来的影响也变得有限。比如加了台服务器3,那么影响的只是服务器2~服务器3之间的这部分key。为了解决这个问题,一致性哈希引入了虚拟节点。整个环上的节点都是虚拟节点,虚拟节点放置的数量可以远远多于实际机器的数量。一台服务器可以处理多个虚拟节点的请求。这样可以根据服务器本身的处理能力强弱,为每一台服务器分配数量不同虚拟节点。对于配置好的服务器处理的虚拟节点多一些,配置差的虚拟节点少一些即可。

  • 虚拟哈希槽

Redis Cluster 采用虚拟哈希槽分区,所有的键根据哈希函数映射到 0 ~ 16383 整数槽内,计算公式:slot = CRC16(key) & 16383。每一个节点负责维护一部分槽以及槽所映射的键值数据。Redis 虚拟槽分区解耦数据和节点之间的关系,简化了节点扩容和收缩难度。节点自身维护槽的映射关系,不需要客户端或者代理服务维护槽分区元数据支持节点、槽和键之间的映射查询,用于数据路由,在线集群伸缩等场景。

参考(摘抄的文字版权属于原作者)
https://blog.csdn.net/u012094957/article/details/116496118
https://blog.csdn.net/wr_java/article/details/116755332

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注