文章汇总

知识点/面试题 : (必看:+1: ):

重要知识点详解

集合

知识点/面试题

  1. Java 集合常见知识点&面试题总结(上) (必看 :+1:)
  2. Java 集合常见知识点&面试题总结(下) (必看 :+1:)
  3. Java 容器使用注意事项总结

源码分析

并发

知识点/面试题 : (必看 :+1:)

  1. Java 并发常见知识点&面试题总结(基础篇)
  2. Java 并发常见知识点&面试题总结(进阶篇)

重要知识点详解

  1. 线程池Java 线程池详解Java 线程池最佳实践
  2. ThreadLocal 关键字解析
  3. Java 并发容器总结
  4. Atomic 原子类总结
  5. AQS 原理以及 AQS 同步组件总结
  6. CompletableFuture 入门

JVM (必看 :+1:)

JVM 这部分内容主要参考 JVM 虚拟机规范-Java8 和周志明老师的《深入理解 Java 虚拟机(第 3 版)》 (强烈建议阅读多遍!)。

  1. Java 内存区域
  2. JVM 垃圾回收
  3. JDK 监控和故障处理工具
  4. 类文件结构
  5. 类加载过程
  6. 类加载器
  7. 【待完成】最重要的 JVM 参数总结(翻译完善了一半)
  8. 【加餐】大白话带你认识 JVM

新特性

  1. Java 8Java 8 新特性总结(翻译)Java8 常用新特性总结
  2. Java 9 新特性概览
  3. Java 10 新特性概览
  4. Java 11 新特性概览
  5. Java 12~13 新特性概览
  6. Java 14~15 新特性概览

计算机基础

操作系统

  1. 操作系统常见问题总结!
  2. 后端程序员必备的 Linux 基础知识总结
  3. Shell 编程入门

网络

  1. OSI 和 TCP/IP 网络分层模型详解(基础)
  2. HTTP vs HTTPS(应用层)
  3. HTTP 1.0 vs HTTP 1.1(应用层)
  4. 计算机网络常见知识点&面试题(补充)
  5. 谢希仁老师的《计算机网络》内容总结

数据结构

图解数据结构:

  1. 线性数据结构 :数组、链表、栈、队列
  2. :重点关注红黑树、B-,B+,B*树、LSM 树

其他常用数据结构 :

  1. 布隆过滤器

算法

算法这部分内容非常重要,如果你不知道如何学习算法的话,可以看下我写的:

常见算法问题总结

另外,GeeksforGeeks 这个网站总结了常见的算法 ,比较全面系统。

数据库

MySQL

总结:

  1. 数据库基础知识总结
  2. MySQL 知识点总结 (必看 :+1:)
  3. 一千行 MySQL 学习笔记
  4. MySQL 高性能优化规范建议
  5. MySQL 入门

重要知识点:

  1. MySQL 数据库索引总结
  2. 事务隔离级别(图文详解)
  3. MySQL 三大日志(binlog、redo log 和 undo log)详解
  4. InnoDB 存储引擎对 MVCC 的实现
  5. 一条 SQL 语句在 MySQL 中如何被执行的?
  6. 字符集详解:为什么不建议在 MySQL 中使用 utf8 ?
  7. 关于数据库中如何存储时间的一点思考

Redis

  1. Redis 常见问题总结
  2. 3 种常用的缓存读写策略
  3. Redis 内存碎片

搜索引擎

用于提高搜索效率,功能和浏览器搜索引擎类似。比较常见的搜索引擎是 Elasticsearch(推荐) 和 Solr。

开发工具

Docker

Git

系统设计

基础

常用框架

如果你没有接触过 Java Web 开发的话,可以先看一下我总结的 《J2EE 基础知识》 。虽然,这篇文章中的很多内容已经淘汰,但是可以让你对 Java 后台技术发展有更深的认识。

Spring/SpringBoot (必看 :+1:)

知识点/面试题 :

  1. Spring 常见知识点&面试题总结
  2. SpringBoot 入门指南

重要知识点详解

  1. Spring/Spring Boot 常用注解总结!安排!
  2. Spring 事务总结
  3. Spring 中都用到了那些设计模式?
  4. SpringBoot 自动装配原理

MyBatis

MyBatis 常见面试题总结

Spring Cloud

大白话入门 Spring Cloud

安全

认证授权

《认证授权基础》 这篇文章中我会介绍认证授权常见概念: Authentication, Authorization 以及 CookieSession、Token、OAuth 2SSO 。如果你不清楚这些概念的话,建议好好阅读一下这篇文章。

数据脱敏

数据脱敏说的就是我们根据特定的规则对敏感信息数据进行变形,比如我们把手机号、身份证号某些位数使用 * 来代替。

敏感词过滤

系统需要对用户输入的文本进行敏感词过滤如色情、政治、暴力相关的词汇。

相关阅读:《敏感词过滤》

定时任务

最近有朋友问到定时任务相关的问题。于是,我简单写了一篇文章总结一下定时任务的一些概念以及一些常见的定时任务技术选型:《Java 定时任务大揭秘》

分布式

CAP 理论和 BASE 理论

CAP 也就是 Consistency(一致性)、Availability(可用性)、Partition Tolerance(分区容错性) 这三个单词首字母组合。

BASEBasically Available(基本可用)Soft-state(软状态)Eventually Consistent(最终一致性) 三个短语的缩写。BASE 理论是对 CAP 中一致性和可用性权衡的结果,其来源于对大规模互联网系统分布式实践的总结,是基于 CAP 定理逐步演化而来的,它大大降低了我们对系统的要求。

相关阅读:CAP 理论和 BASE 理论解读

Paxos 算法和 Raft 算法

Paxos 算法 诞生于 1990 年,这是一种解决分布式系统一致性的经典算法 。但是,由于 Paxos 算法非常难以理解和实现,不断有人尝试简化这一算法。到了 2013 年才诞生了一个比 Paxos 算法更易理解和实现的分布式一致性算法—Raft 算法

相关阅读:

RPC

RPC 让调用远程服务调用像调用本地方法那样简单。

Dubbo 是一款国产的 RPC 框架,由阿里开源。相关阅读:

API 网关

网关主要用于请求转发、安全认证、协议转换、容灾。

相关阅读:

分布式 id

在复杂分布式系统中,往往需要对大量的数据和消息进行唯一标识。比如数据量太大之后,往往需要对数据进行分库分表,分库分表后需要有一个唯一 ID 来标识一条数据或消息,数据库的自增 ID 显然不能满足需求。相关阅读:为什么要分布式 id ?分布式 id 生成方案有哪些?

分布式事务

分布式事务就是指事务的参与者、支持事务的服务器、资源服务器以及事务管理器分别位于不同的分布式系统的不同节点之上。

简单的说,就是一次大的操作由不同的小操作组成,这些小的操作分布在不同的服务器上,且属于不同的应用,分布式事务需要保证这些小操作要么全部成功,要么全部失败。本质上来说,分布式事务就是为了保证不同数据库的数据一致性。

分布式协调

ZooKeeper

前两篇文章可能有内容重合部分,推荐都看一遍。

  1. 【入门】ZooKeeper 相关概念总结
  2. 【进阶】ZooKeeper 相关概念总结
  3. 【实战】ZooKeeper 实战

高性能

消息队列

消息队列在分布式系统中主要是为了解耦和削峰。相关阅读: 消息队列常见问题总结

  1. RabbitMQ : RabbitMQ 入门
  2. RocketMQ : RocketMQ 入门RocketMQ 的几个简单问题与答案
  3. KafkaKafka 常见问题总结

读写分离&分库分表

读写分离主要是为了将数据库的读和写操作分不到不同的数据库节点上。主服务器负责写,从服务器负责读。另外,一主一从或者一主多从都可以。

读写分离可以大幅提高读性能,小幅提高写的性能。因此,读写分离更适合单机并发读请求比较多的场景。

分库分表是为了解决由于库、表数据量过大,而导致数据库性能持续下降的问题。

常见的分库分表工具有: sharding-jdbc (当当)、 TSharding (蘑菇街)、 MyCAT (基于 Cobar)、 Cobar (阿里巴巴)…。 推荐使用 sharding-jdbc 。 因为, sharding-jdbc 是一款轻量级 Java 框架,以 jar 包形式提供服务,不要我们做额外的运维工作,并且兼容性也很好。

相关阅读: 读写分离&分库分表常见问题总结

负载均衡

负载均衡系统通常用于将任务比如用户请求处理分配到多个服务器处理以提高网站、应用或者数据库的性能和可靠性。

常见的负载均衡系统包括 3 种:

  1. DNS 负载均衡 :一般用来实现地理级别的均衡。
  2. 硬件负载均衡 : 通过单独的硬件设备比如 F5 来实现负载均衡功能(硬件的价格一般很贵)。
  3. 软件负载均衡 :通过负载均衡软件比如 Nginx 来实现负载均衡功能。

高可用

高可用描述的是一个系统在大部分时间都是可用的,可以为我们提供服务的。高可用代表系统即使在发生硬件故障或者系统升级的时候,服务仍然是可用的 。

相关阅读: 如何设计一个高可用系统?要考虑哪些地方?

限流

限流是从用户访问压力的角度来考虑如何应对系统故障。

限流为了对服务端的接口接受请求的频率进行限制,防止服务挂掉。比如某一接口的请求限制为 100 个每秒, 对超过限制的请求放弃处理或者放到队列中等待处理。限流可以有效应对突发请求过多。相关阅读:何为限流?限流算法有哪些?

降级

降级是从系统功能优先级的角度考虑如何应对系统故障。

服务降级指的是当服务器压力剧增的情况下,根据当前业务情况及流量对一些服务和页面有策略的降级,以此释放服务器资源以保证核心任务的正常运行。

熔断

熔断和降级是两个比较容易混淆的概念,两者的含义并不相同。

降级的目的在于应对系统自身的故障,而熔断的目的在于应对当前系统依赖的外部系统或者第三方系统的故障。

排队

另类的一种限流,类比于现实世界的排队。玩过英雄联盟的小伙伴应该有体会,每次一有活动,就要经历一波排队才能进入游戏。

集群

相同的服务部署多份,避免单点故障。

超时和重试机制

一旦用户的请求超过某个时间得不到响应就结束此次请求并抛出异常。 如果不进行超时设置可能会导致请求响应速度慢,甚至导致请求堆积进而让系统无法再处理请求。

重试的次数一般设为 3 次,再多的重试次数没有好处,反而会加重服务器压力(部分场景使用失败重试机制会不太适合)。在一次重试失败之后通常会加上一个时间间隔 delay 再进行下一次重试,时间间隔 delay 通常建议是随机的。

并且,为了更好地保护下游,我们还可以结合断路器。

灾备设计和异地多活

灾备 = 容灾+备份。

异地多活 描述的是将服务部署在异地并且服务同时对外提供服务。和传统的灾备设计的最主要区别在于“多活”,即所有站点都是同时在对外提供服务的。异地多活是为了应对突发状况比如火灾、地震等自然或者人为灾害。

相关阅读:

开源

开发工具

  1. Git

Docker

Linux