docs: update article

This commit is contained in:
yanglbme 2022-09-14 11:14:04 +08:00
parent 13b19265e9
commit 3cb5dd8143
11 changed files with 154 additions and 163 deletions

View File

@ -14,7 +14,6 @@
学习本项目之前,先来看看 [Discussions 讨论区](https://github.com/doocs/advanced-java/discussions/9)的技术面试官是怎么说的吧。本项目欢迎各位开发者朋友到 Discussions 讨论区分享自己的一些想法和实践经验。也不妨 Star 关注 [doocs/advanced-java](https://github.com/doocs/advanced-java),随时追踪项目最新动态。
- Gitee Pages: https://doocs.gitee.io/advanced-java
- GitHub Pages: https://doocs.github.io/advanced-java

View File

@ -36,4 +36,4 @@
关注「**Doocs**」公众号,回复 **PDF**,即可获取本项目离线 PDF 文档283 页精华),学习更加方便!
<img src="https://cdn-doocs.oss-cn-shenzhen.aliyuncs.com/gh/doocs/advanced-java@main/images/pdf.png" style="width: 600px;"><br>
<img src="https://cdn-doocs.oss-cn-shenzhen.aliyuncs.com/gh/doocs/advanced-java@main/images/pdf.png" style="width: 600px;"><br>

View File

@ -1,8 +1,6 @@
## 大数据中 TopK 问题的常用套路
> **作者 Chunel Feng编程爱好者阿里巴巴搜索引擎开发工程师。**<br><br>个人微信ChunelFeng <br>个人博客:[一面之猿网](http://www.chunel.cn) <br>开源项目:[Caiss 智能相似搜索引擎](https://github.com/ChunelFeng/caiss)
> **作者 Chunel Feng编程爱好者阿里巴巴搜索引擎开发工程师。**<br><br>个人微信ChunelFeng <br>个人博客:[一面之猿网](http://www.chunel.cn) <br>开源项目:[Caiss 智能相似搜索引擎](https://github.com/ChunelFeng/caiss)
Doocs 社区的朋友们,大家好。我是你们的新朋友 [Chunel Feng](https://github.com/ChunelFeng)。今天想跟大家聊一些**常见的 topK 问题**。
@ -10,7 +8,6 @@ Doocs 社区的朋友们,大家好。我是你们的新朋友 [Chunel Feng](ht
首先,我们来举几个常见的 topK 问题的例子:
1. 给定 100 个 int 数字,在其中找出最大的 10 个;
1. 给定 10 亿个 int 数字,在其中找出最大的 10 个(这 10 个数字可以无序);
1. 给定 10 亿个 int 数字,在其中找出最大的 10 个(这 10 个数字依次排序);
@ -19,7 +16,6 @@ Doocs 社区的朋友们,大家好。我是你们的新朋友 [Chunel Feng](ht
1. 给定 10 亿个 string 类型的数字,在其中找出最大的 10 个(仅需要查 1 次);
1. 给定 10 亿个 string 类型的数字,在其中找出最大的 k 个(需要反复多次查询,其中 k 是一个随机数字)。
上面这些问题看起来很相似,但是解决的方式却千差万别。稍有不慎,就可能使得 topK 问题成为系统的瓶颈。不过也不用太担心,接下来我会总结几种常见的解决思路,遇到问题的时候,大家把这些基础思路融会贯通并且杂糅组合,即可做到见招拆招。
<br>
@ -137,7 +133,6 @@ int main() {
![](./images/topk-trie.png)
字典树的思想,还是通过前期建立索引信息,后期可以反复多次查询,并且后期增删数据也很方便。比较适合于需要反复多次查询的情况。
比如反复多次查询字符序例如z>y>...>b>a最大的 k 个 url 这种,使用字典树把数据存储一遍,就非常适合。既减少了空间复杂度,也加速了查询效率。

View File

@ -40,4 +40,4 @@
关注「**Doocs**」公众号,回复 **PDF**,即可获取本项目离线 PDF 文档283 页精华),学习更加方便!
<img src="https://cdn-doocs.oss-cn-shenzhen.aliyuncs.com/gh/doocs/advanced-java@main/images/pdf.png" style="width: 600px;"><br>
<img src="https://cdn-doocs.oss-cn-shenzhen.aliyuncs.com/gh/doocs/advanced-java@main/images/pdf.png" style="width: 600px;"><br>

View File

@ -32,19 +32,16 @@
| # | 文章 | 抄袭者 |
| --- | ---- | ------ |
### 头条号
| # | 文章 | 抄袭者 |
| --- | ---- | ------ |
### 掘金
| # | 文章 | 抄袭者 |
| --- | ---- | ------ |
### 知乎
| # | 文章 | 抄袭者 | 备注 |

View File

@ -1,4 +1,4 @@
# Doocs的公众号来了
# Doocs 的公众号来了
GitHub 开源社区 Doocs 旗下唯一公众号“**Doocs**”,专注于挖掘 IT 技术知识,助力开发者成长。

View File

@ -38,4 +38,4 @@
如果系统访问量很高Nginx 本地缓存过期失效了redis 中的缓存也被 LRU 算法给清理掉了,那么会有较高的访问量,从缓存服务调用商品服务。但如果此时商品服务的接口发生故障,调用出现了延时,缓存服务全部的线程都被这个调用商品服务接口给耗尽了,每个线程去调用商品服务接口的时候,都会卡住很长时间,后面大量的请求过来都会卡在那儿,此时缓存服务没有足够的线程去调用其它一些服务的接口,从而导致整个大量的商品详情页无法正常显示。
这其实就是一个商品接口服务故障导致缓存服务资源耗尽的现象。
这其实就是一个商品接口服务故障导致缓存服务资源耗尽的现象。

View File

@ -40,4 +40,4 @@ rehash 过程在数据量非常大(几千万、亿)的情况下并不是一
渐进式 rehash 的本质:
1. 借助 rehashidx将 rehash 键值对所需的计算工作均摊到对字典的每个添加、删除、查找和更新操作上,从而避免了集中式 rehash 而带来的庞大计算量。
2. 在 rehash 进行期间,每次对字典执行添加、删除、查找或者更新操作时,程序除了执行指定的操作以外,还会顺带将原哈希表在 rehashidx 索引上的所有键值对 rehash 到备用哈希表,当 rehash 工作完成之后,程序将 rehashidx 属性的值加 1。
2. 在 rehash 进行期间,每次对字典执行添加、删除、查找或者更新操作时,程序除了执行指定的操作以外,还会顺带将原哈希表在 rehashidx 索引上的所有键值对 rehash 到备用哈希表,当 rehash 工作完成之后,程序将 rehashidx 属性的值加 1。

View File

@ -70,4 +70,4 @@ Redis 内部使用文件事件处理器 `file event handler` ,这个文件事
### 总结
Redis 选择使用单线程模型处理客户端的请求主要还是因为 CPU 不是 Redis 服务器的瓶颈,所以使用多线程模型带来的性能提升并不能抵消它带来的开发成本和维护成本,系统的性能瓶颈也主要在网络 I/O 操作上;而 Redis 引入多线程操作也是出于性能上的考虑,对于一些大键值对的删除操作,通过多线程非阻塞地释放内存空间(释放操作不会阻塞网络IO读写,因为网络IO读写与释放的命令执行不是同一个线程)也能减少对 Redis 主线程阻塞的时间,提高执行的效率。
Redis 选择使用单线程模型处理客户端的请求主要还是因为 CPU 不是 Redis 服务器的瓶颈,所以使用多线程模型带来的性能提升并不能抵消它带来的开发成本和维护成本,系统的性能瓶颈也主要在网络 I/O 操作上;而 Redis 引入多线程操作也是出于性能上的考虑,对于一些大键值对的删除操作,通过多线程非阻塞地释放内存空间(释放操作不会阻塞网络 IO 读写,因为网络 IO 读写与释放的命令执行不是同一个线程)也能减少对 Redis 主线程阻塞的时间,提高执行的效率。

View File

@ -128,9 +128,9 @@
const subscription = `---
## 公众号
[Doocs](https://github.com/doocs) 技术社区旗下唯一公众号**Doocs开源社区**欢迎扫码关注**专注分享技术领域相关知识及业内最新资讯**当然也可以加我个人微信备注GitHub拉你进技术交流群
[Doocs](https://github.com/doocs) 技术社区旗下唯一公众号**Doocs**欢迎扫码关注**专注分享技术领域相关知识及业内最新资讯**当然也可以加我个人微信备注GitHub拉你进技术交流群
关注**Doocs开源社区**公众号回复 **PDF**即可获取本项目离线 PDF 文档学习更加方便
关注**Doocs**公众号回复 **PDF**即可获取本项目离线 PDF 文档学习更加方便
<table>
<tr>

View File

@ -1,145 +1,145 @@
- 高并发架构
- [消息队列](/docs/high-concurrency/mq-interview.md)
- [为什么使用消息队列?](/docs/high-concurrency/why-mq.md)
- [如何保证消息队列的高可用?](/docs/high-concurrency/how-to-ensure-high-availability-of-message-queues.md)
- [如何保证消息不被重复消费?](/docs/high-concurrency/how-to-ensure-that-messages-are-not-repeatedly-consumed.md)
- [如何保证消息的可靠性传输?](/docs/high-concurrency/how-to-ensure-the-reliable-transmission-of-messages.md)
- [如何保证消息的顺序性?](/docs/high-concurrency/how-to-ensure-the-order-of-messages.md)
- [如何解决消息队列的延时以及过期失效问题?](/docs/high-concurrency/mq-time-delay-and-expired-failure.md)
- [如何设计一个消息队列?](/docs/high-concurrency/mq-design.md)
- [搜索引擎](/docs/high-concurrency/es-introduction.md)
- [ES 的分布式架构原理是什么?](/docs/high-concurrency/es-architecture.md)
- [ES 写入数据的工作原理是什么?](/docs/high-concurrency/es-write-query-search.md)
- [ES 在数十亿级别数量下如何提高查询效率?](/docs/high-concurrency/es-optimizing-query-performance.md)
- [ES 生产集群的部署架构是什么?](/docs/high-concurrency/es-production-cluster.md)
- 缓存
- [在项目中缓存是如何使用的?](/docs/high-concurrency/why-cache.md)
- [Redis 和 Memcached 有什么区别?](/docs/high-concurrency/redis-single-thread-model.md)
- [Redis 都有哪些数据类型以及适用场景?](/docs/high-concurrency/redis-data-types.md)
- [Redis 的过期策略都有哪些?](/docs/high-concurrency/redis-expiration-policies-and-lru.md)
- [如何保证 Redis 高并发、高可用?](/docs/high-concurrency/how-to-ensure-high-concurrency-and-high-availability-of-redis.md)
- [Redis 主从架构是怎样的?](/docs/high-concurrency/redis-master-slave.md)
- [Redis 的持久化有哪几种方式?](/docs/high-concurrency/redis-persistence.md)
- [Redis 如何基于哨兵集群实现高可用?](/docs/high-concurrency/redis-sentinel.md)
- [Redis 集群模式的工作原理能说一下么?](/docs/high-concurrency/redis-cluster.md)
- [Redis 的雪崩、穿透和击穿,如何应对?](/docs/high-concurrency/redis-caching-avalanche-and-caching-penetration.md)
- [如何保证缓存与数据库双写一致性?](/docs/high-concurrency/redis-consistence.md)
- [如何解决 Redis 的并发竞争问题?](/docs/high-concurrency/redis-cas.md)
- [生产环境中的 Redis 是怎么部署的?](/docs/high-concurrency/redis-production-environment.md)
- 分库分表
- [为什么要分库分表?](/docs/high-concurrency/database-shard.md)
- [分库分表如何平滑过渡?](/docs/high-concurrency/database-shard-method.md)
- [设计一个动态扩容缩容的分库分表方案?](/docs/high-concurrency/database-shard-dynamic-expand.md)
- [分库分表之后id 主键如何处理?](/docs/high-concurrency/database-shard-global-id-generate.md)
- 读写分离
- [如何实现 MySQL 的读写分离?](/docs/high-concurrency/mysql-read-write-separation.md)
- 高并发系统
- [如何设计一个高并发系统?](/docs/high-concurrency/high-concurrency-design.md)
* 分布式系统
- [面试连环炮](/docs/distributed-system/distributed-system-interview.md)
- 系统拆分
- [为什么要进行系统拆分?](/docs/distributed-system/why-dubbo.md)
- 分布式服务框架
- [说一下 Dubbo 的工作原理?](/docs/distributed-system/dubbo-operating-principle.md)
- [Dubbo 支持哪些序列化协议?](/docs/distributed-system/dubbo-serialization-protocol.md)
- [Dubbo 负载均衡策略和集群容错策略?](/docs/distributed-system/dubbo-load-balancing.md)
- [Dubbo 的 SPI 思想是什么?](/docs/distributed-system/dubbo-spi.md)
- [如何基于 Dubbo 进行服务治理?](/docs/distributed-system/dubbo-service-management.md)
- [分布式服务接口的幂等性如何设计?](/docs/distributed-system/distributed-system-idempotency.md)
- [分布式服务接口请求的顺序性如何保证?](/docs/distributed-system/distributed-system-request-sequence.md)
- [如何自己设计一个类似 Dubbo 的 RPC 框架?](/docs/distributed-system/dubbo-rpc-design.md)
- [CAP 定理的 P 是什么?](/docs/distributed-system/distributed-system-cap.md)
- 分布式锁
- [Zookeeper 都有哪些应用场景?](/docs/distributed-system/zookeeper-application-scenarios.md)
- [分布式锁如何设计?](/docs/distributed-system/distributed-lock-redis-vs-zookeeper.md)
- 分布式事务
- [分布式事务了解吗?](/docs/distributed-system/distributed-transaction.md)
- 分布式会话
- [集群分布式 Session 如何实现?](/docs/distributed-system/distributed-session.md)
* 高可用架构
- 基于 Hystrix 实现高可用
- [Hystrix 介绍](/docs/high-availability/hystrix-introduction.md)
- [电商网站详情页系统架构](/docs/high-availability/e-commerce-website-detail-page-architecture.md)
- [Hystrix 线程池技术实现资源隔离](/docs/high-availability/hystrix-thread-pool-isolation.md)
- [Hystrix 信号量机制实现资源隔离](/docs/high-availability/hystrix-semphore-isolation.md)
- [Hystrix 隔离策略细粒度控制](/docs/high-availability/hystrix-execution-isolation.md)
- [深入 Hystrix 执行时内部原理](/docs/high-availability/hystrix-process.md)
- [基于 request cache 请求缓存技术优化批量商品数据查询接口](/docs/high-availability/hystrix-request-cache.md)
- [基于本地缓存的 fallback 降级机制](/docs/high-availability/hystrix-fallback.md)
- [深入 Hystrix 断路器执行原理](/docs/high-availability/hystrix-circuit-breaker.md)
- [深入 Hystrix 线程池隔离与接口限流](/docs/high-availability/hystrix-thread-pool-current-limiting.md)
- [基于 timeout 机制为服务接口调用超时提供安全保护](/docs/high-availability/hystrix-timeout.md)
- 高可用系统
- 如何设计一个高可用系统?
- 限流
- [如何限流?说一下具体的实现?](/docs/high-concurrency/how-to-limit-current.md)
- 熔断
- 如何进行熔断?
- 熔断框架都有哪些?具体实现原理知道吗?
- [熔断框架,选用 Sentinel 还是 Hystrix](/docs/high-availability/sentinel-vs-hystrix.md)
- 降级
- 如何进行降级?
* 微服务架构
- 微服务的一些概念
- [关于微服务架构的描述](/docs/micro-services/microservices-introduction.md)
- [从单体式架构迁移到微服务架构](/docs/micro-services/migrating-from-a-monolithic-architecture-to-a-microservices-architecture.md)
- [微服务的事件驱动数据管理](/docs/micro-services/event-driven-data-management-for-microservices.md)
- [选择微服务部署策略](/docs/micro-services/choose-microservice-deployment-strategy.md)
- Spring Cloud 微服务架构
- [什么是微服务?微服务之间是如何独立通讯的?](/docs/micro-services/what's-microservice-how-to-communicate.md)
- Spring Cloud 和 Dubbo 有哪些区别?
- Spring Boot 和 Spring Cloud谈谈你对它们的理解
- 什么是服务熔断?什么是服务降级?
- 微服务的优缺点分别是什么?说一下你在项目开发中碰到的坑?
- [你所知道的微服务技术栈都有哪些?](/docs/micro-services/micro-services-technology-stack.md)
- [微服务治理策略](/docs/micro-services/micro-service-governance.md)
- Eureka 和 Zookeeper 都可以提供服务注册与发现的功能,它们有什么区别?
- [谈谈服务发现组件 Eureka 的主要调用过程?](/docs/micro-services/how-eureka-enable-service-discovery-and-service-registration.md)
* 海量数据处理
- 10 道经典的海量数据处理面试题
- [如何从大量的 URL 中找出相同的 URL](/docs/big-data/find-common-urls.md)
- [如何从大量数据中找出高频词?](/docs/big-data/find-top-100-words.md)
- [如何找出某一天访问百度网站最多的 IP](/docs/big-data/find-top-1-ip.md)
- [如何在大量的数据中找出不重复的整数?](/docs/big-data/find-no-repeat-number.md)
- [如何在大量的数据中判断一个数是否存在?](/docs/big-data/find-a-number-if-exists.md)
- [如何查询最热门的查询串?](/docs/big-data/find-hotest-query-string.md)
- [如何统计不同电话号码的个数?](/docs/big-data/count-different-phone-numbers.md)
- [如何从 5 亿个数中找出中位数?](/docs/big-data/find-mid-value-in-500-millions.md)
- [如何按照 query 的频度排序?](/docs/big-data/sort-the-query-strings-by-counts.md)
- [如何找出排名前 500 的数?](/docs/big-data/find-rank-top-500-numbers.md)
- 高并发架构
- [消息队列](/docs/high-concurrency/mq-interview.md)
- [为什么使用消息队列?](/docs/high-concurrency/why-mq.md)
- [如何保证消息队列的高可用?](/docs/high-concurrency/how-to-ensure-high-availability-of-message-queues.md)
- [如何保证消息不被重复消费?](/docs/high-concurrency/how-to-ensure-that-messages-are-not-repeatedly-consumed.md)
- [如何保证消息的可靠性传输?](/docs/high-concurrency/how-to-ensure-the-reliable-transmission-of-messages.md)
- [如何保证消息的顺序性?](/docs/high-concurrency/how-to-ensure-the-order-of-messages.md)
- [如何解决消息队列的延时以及过期失效问题?](/docs/high-concurrency/mq-time-delay-and-expired-failure.md)
- [如何设计一个消息队列?](/docs/high-concurrency/mq-design.md)
- [搜索引擎](/docs/high-concurrency/es-introduction.md)
- [ES 的分布式架构原理是什么?](/docs/high-concurrency/es-architecture.md)
- [ES 写入数据的工作原理是什么?](/docs/high-concurrency/es-write-query-search.md)
- [ES 在数十亿级别数量下如何提高查询效率?](/docs/high-concurrency/es-optimizing-query-performance.md)
- [ES 生产集群的部署架构是什么?](/docs/high-concurrency/es-production-cluster.md)
- 缓存
- [在项目中缓存是如何使用的?](/docs/high-concurrency/why-cache.md)
- [Redis 和 Memcached 有什么区别?](/docs/high-concurrency/redis-single-thread-model.md)
- [Redis 都有哪些数据类型以及适用场景?](/docs/high-concurrency/redis-data-types.md)
- [Redis 的过期策略都有哪些?](/docs/high-concurrency/redis-expiration-policies-and-lru.md)
- [如何保证 Redis 高并发、高可用?](/docs/high-concurrency/how-to-ensure-high-concurrency-and-high-availability-of-redis.md)
- [Redis 主从架构是怎样的?](/docs/high-concurrency/redis-master-slave.md)
- [Redis 的持久化有哪几种方式?](/docs/high-concurrency/redis-persistence.md)
- [Redis 如何基于哨兵集群实现高可用?](/docs/high-concurrency/redis-sentinel.md)
- [Redis 集群模式的工作原理能说一下么?](/docs/high-concurrency/redis-cluster.md)
- [Redis 的雪崩、穿透和击穿,如何应对?](/docs/high-concurrency/redis-caching-avalanche-and-caching-penetration.md)
- [如何保证缓存与数据库双写一致性?](/docs/high-concurrency/redis-consistence.md)
- [如何解决 Redis 的并发竞争问题?](/docs/high-concurrency/redis-cas.md)
- [生产环境中的 Redis 是怎么部署的?](/docs/high-concurrency/redis-production-environment.md)
- 分库分表
- [为什么要分库分表?](/docs/high-concurrency/database-shard.md)
- [分库分表如何平滑过渡?](/docs/high-concurrency/database-shard-method.md)
- [设计一个动态扩容缩容的分库分表方案?](/docs/high-concurrency/database-shard-dynamic-expand.md)
- [分库分表之后id 主键如何处理?](/docs/high-concurrency/database-shard-global-id-generate.md)
- 读写分离
- [如何实现 MySQL 的读写分离?](/docs/high-concurrency/mysql-read-write-separation.md)
- 高并发系统
- [如何设计一个高并发系统?](/docs/high-concurrency/high-concurrency-design.md)
* 分布式系统
- [面试连环炮](/docs/distributed-system/distributed-system-interview.md)
- 系统拆分
- [为什么要进行系统拆分?](/docs/distributed-system/why-dubbo.md)
- 分布式服务框架
- [说一下 Dubbo 的工作原理?](/docs/distributed-system/dubbo-operating-principle.md)
- [Dubbo 支持哪些序列化协议?](/docs/distributed-system/dubbo-serialization-protocol.md)
- [Dubbo 负载均衡策略和集群容错策略?](/docs/distributed-system/dubbo-load-balancing.md)
- [Dubbo 的 SPI 思想是什么?](/docs/distributed-system/dubbo-spi.md)
- [如何基于 Dubbo 进行服务治理?](/docs/distributed-system/dubbo-service-management.md)
- [分布式服务接口的幂等性如何设计?](/docs/distributed-system/distributed-system-idempotency.md)
- [分布式服务接口请求的顺序性如何保证?](/docs/distributed-system/distributed-system-request-sequence.md)
- [如何自己设计一个类似 Dubbo 的 RPC 框架?](/docs/distributed-system/dubbo-rpc-design.md)
- [CAP 定理的 P 是什么?](/docs/distributed-system/distributed-system-cap.md)
- 分布式锁
- [Zookeeper 都有哪些应用场景?](/docs/distributed-system/zookeeper-application-scenarios.md)
- [分布式锁如何设计?](/docs/distributed-system/distributed-lock-redis-vs-zookeeper.md)
- 分布式事务
- [分布式事务了解吗?](/docs/distributed-system/distributed-transaction.md)
- 分布式会话
- [集群分布式 Session 如何实现?](/docs/distributed-system/distributed-session.md)
* 高可用架构
- 基于 Hystrix 实现高可用
- [Hystrix 介绍](/docs/high-availability/hystrix-introduction.md)
- [电商网站详情页系统架构](/docs/high-availability/e-commerce-website-detail-page-architecture.md)
- [Hystrix 线程池技术实现资源隔离](/docs/high-availability/hystrix-thread-pool-isolation.md)
- [Hystrix 信号量机制实现资源隔离](/docs/high-availability/hystrix-semphore-isolation.md)
- [Hystrix 隔离策略细粒度控制](/docs/high-availability/hystrix-execution-isolation.md)
- [深入 Hystrix 执行时内部原理](/docs/high-availability/hystrix-process.md)
- [基于 request cache 请求缓存技术优化批量商品数据查询接口](/docs/high-availability/hystrix-request-cache.md)
- [基于本地缓存的 fallback 降级机制](/docs/high-availability/hystrix-fallback.md)
- [深入 Hystrix 断路器执行原理](/docs/high-availability/hystrix-circuit-breaker.md)
- [深入 Hystrix 线程池隔离与接口限流](/docs/high-availability/hystrix-thread-pool-current-limiting.md)
- [基于 timeout 机制为服务接口调用超时提供安全保护](/docs/high-availability/hystrix-timeout.md)
- 高可用系统
- 如何设计一个高可用系统?
- 限流
- [如何限流?说一下具体的实现?](/docs/high-concurrency/how-to-limit-current.md)
- 熔断
- 如何进行熔断?
- 熔断框架都有哪些?具体实现原理知道吗?
- [熔断框架,选用 Sentinel 还是 Hystrix](/docs/high-availability/sentinel-vs-hystrix.md)
- 降级
- 如何进行降级?
* 微服务架构
- 微服务的一些概念
- [关于微服务架构的描述](/docs/micro-services/microservices-introduction.md)
- [从单体式架构迁移到微服务架构](/docs/micro-services/migrating-from-a-monolithic-architecture-to-a-microservices-architecture.md)
- [微服务的事件驱动数据管理](/docs/micro-services/event-driven-data-management-for-microservices.md)
- [选择微服务部署策略](/docs/micro-services/choose-microservice-deployment-strategy.md)
- Spring Cloud 微服务架构
- [什么是微服务?微服务之间是如何独立通讯的?](/docs/micro-services/what's-microservice-how-to-communicate.md)
- Spring Cloud 和 Dubbo 有哪些区别?
- Spring Boot 和 Spring Cloud谈谈你对它们的理解
- 什么是服务熔断?什么是服务降级?
- 微服务的优缺点分别是什么?说一下你在项目开发中碰到的坑?
- [你所知道的微服务技术栈都有哪些?](/docs/micro-services/micro-services-technology-stack.md)
- [微服务治理策略](/docs/micro-services/micro-service-governance.md)
- Eureka 和 Zookeeper 都可以提供服务注册与发现的功能,它们有什么区别?
- [谈谈服务发现组件 Eureka 的主要调用过程?](/docs/micro-services/how-eureka-enable-service-discovery-and-service-registration.md)
* 海量数据处理
- 10 道经典的海量数据处理面试题
- [如何从大量的 URL 中找出相同的 URL](/docs/big-data/find-common-urls.md)
- [如何从大量数据中找出高频词?](/docs/big-data/find-top-100-words.md)
- [如何找出某一天访问百度网站最多的 IP](/docs/big-data/find-top-1-ip.md)
- [如何在大量的数据中找出不重复的整数?](/docs/big-data/find-no-repeat-number.md)
- [如何在大量的数据中判断一个数是否存在?](/docs/big-data/find-a-number-if-exists.md)
- [如何查询最热门的查询串?](/docs/big-data/find-hotest-query-string.md)
- [如何统计不同电话号码的个数?](/docs/big-data/count-different-phone-numbers.md)
- [如何从 5 亿个数中找出中位数?](/docs/big-data/find-mid-value-in-500-millions.md)
- [如何按照 query 的频度排序?](/docs/big-data/sort-the-query-strings-by-counts.md)
- [如何找出排名前 500 的数?](/docs/big-data/find-rank-top-500-numbers.md)