mirror of
https://github.com/Vonng/ddia.git
synced 2024-12-06 15:20:12 +08:00
commit
b7515fceb2
40
ch1.md
40
ch1.md
@ -10,33 +10,17 @@
|
|||||||
|
|
||||||
[TOC]
|
[TOC]
|
||||||
|
|
||||||
现今很多应用程序都是**数据密集型(data-intensive)**的,而非**计算密集型(compute-intensive)**的。因此CPU很少成为这类应用的瓶颈,更大的问题通常来自数据量、数据复杂性、以及数据的变更速度。
|
现今很多应用程序都是 **数据密集型(data-intensive)** 的,而非 **计算密集型(compute-intensive)** 的。因此CPU很少成为这类应用的瓶颈,更大的问题通常来自数据量、数据复杂性、以及数据的变更速度。
|
||||||
|
|
||||||
数据密集型应用通常由标准组件构建而成,标准组件提供了很多通用的功能;例如,许多应用程序都需要:
|
数据密集型应用通常由标准组件构建而成,标准组件提供了很多通用的功能;例如,许多应用程序都需要:
|
||||||
|
|
||||||
***数据库(database)***
|
- 存储数据,以便自己或其他应用程序之后能再次找到 (***(数据库(database))***)
|
||||||
|
- 记住开销昂贵操作的结果,加快读取速度(***缓存(cache)***)
|
||||||
|
- 允许用户按关键字搜索数据,或以各种方式对数据进行过滤(***搜索索引(search indexes)***)
|
||||||
|
- 向其他进程发送消息,进行异步处理(***流处理(stream processing)***)
|
||||||
|
- 定期处理累积的大批量数据(***批处理(batch processing)***)
|
||||||
|
|
||||||
存储数据,以便自己或其他应用程序之后能再次找到
|
如果这些功能听上去平淡无奇,那是因为这些 **数据系统(data system)** 是非常成功的抽象:我们一直不假思索地使用它们并习以为常。绝大多数工程师不会幻想从零开始编写存储引擎,因为在开发应用时,数据库已经是足够完美的工具了。
|
||||||
|
|
||||||
***缓存(cache)***
|
|
||||||
|
|
||||||
记住开销昂贵操作的结果,加快读取速度
|
|
||||||
|
|
||||||
***搜索索引(search indexes)***
|
|
||||||
|
|
||||||
允许用户按关键字搜索数据,或以各种方式对数据进行过滤
|
|
||||||
|
|
||||||
***流处理(stream processing)***
|
|
||||||
|
|
||||||
向其他进程发送消息,进行异步处理
|
|
||||||
|
|
||||||
***批处理(batch processing)***
|
|
||||||
|
|
||||||
定期处理累积的大批量数据
|
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
如果这些功能听上去平淡无奇,那是因为这些**数据系统(data system)**是非常成功的抽象:我们一直不假思索地使用它们并习以为常。绝大多数工程师不会幻想从零开始编写存储引擎,因为在开发应用时,数据库已经是足够完美的工具了。
|
|
||||||
|
|
||||||
但现实没有这么简单。不同的应用有着不同的需求,因而数据库系统也是百花齐放,有着各式各样的特性。实现缓存有很多种手段,创建搜索索引也有好几种方法,诸如此类。因此在开发应用前,我们依然有必要先弄清楚最适合手头工作的工具和方法。而且当单个工具解决不了你的问题时,组合使用这些工具可能还是有些难度的。
|
但现实没有这么简单。不同的应用有着不同的需求,因而数据库系统也是百花齐放,有着各式各样的特性。实现缓存有很多种手段,创建搜索索引也有好几种方法,诸如此类。因此在开发应用前,我们依然有必要先弄清楚最适合手头工作的工具和方法。而且当单个工具解决不了你的问题时,组合使用这些工具可能还是有些难度的。
|
||||||
|
|
||||||
@ -193,10 +177,10 @@
|
|||||||
1. 发布推文时,只需将新推文插入全局推文集合即可。当一个用户请求自己的主页时间线时,首先查找他关注的所有人,查询这些被关注用户发布的推文并按时间顺序合并。在如[图1-2](img/fig1-2.png)所示的关系型数据库中,可以编写这样的查询:
|
1. 发布推文时,只需将新推文插入全局推文集合即可。当一个用户请求自己的主页时间线时,首先查找他关注的所有人,查询这些被关注用户发布的推文并按时间顺序合并。在如[图1-2](img/fig1-2.png)所示的关系型数据库中,可以编写这样的查询:
|
||||||
|
|
||||||
```sql
|
```sql
|
||||||
SELECT tweets.*, users.*
|
SELECT tweets.*, users.*
|
||||||
FROM tweets
|
FROM tweets
|
||||||
JOIN users ON tweets.sender_id = users.id
|
JOIN users ON tweets.sender_id = users.id
|
||||||
JOIN follows ON follows.followee_id = users.id
|
JOIN follows ON follows.followee_id = users.id
|
||||||
WHERE follows.follower_id = current_user
|
WHERE follows.follower_id = current_user
|
||||||
```
|
```
|
||||||
![](img/fig1-2.png)
|
![](img/fig1-2.png)
|
||||||
@ -476,4 +460,4 @@
|
|||||||
|
|
||||||
| 上一章 | 目录 | 下一章 |
|
| 上一章 | 目录 | 下一章 |
|
||||||
| ----------------------------------- | ------------------------------- | ------------------------------------ |
|
| ----------------------------------- | ------------------------------- | ------------------------------------ |
|
||||||
| [第一部分:数据系统基础](part-i.md) | [设计数据密集型应用](README.md) | [第二章:数据模型与查询语言](ch2.md) |
|
| [第一部分:数据系统基础](part-i.md) | [设计数据密集型应用](README.md) | [第二章:数据模型与查询语言](ch2.md) |
|
||||||
|
Loading…
Reference in New Issue
Block a user