2019-11-25 15:54:26 +08:00
|
|
|
|
# 海量数据处理
|
2020-05-06 20:23:11 +08:00
|
|
|
|
|
2020-09-24 09:54:38 +08:00
|
|
|
|
- [如何从大量的 URL 中找出相同的 URL?](/docs/big-data/find-common-urls.md)
|
|
|
|
|
- [如何从大量数据中找出高频词?](/docs/big-data/find-top-100-words.md)
|
|
|
|
|
- [如何找出某一天访问百度网站最多的 IP?](/docs/big-data/find-top-1-ip.md)
|
|
|
|
|
- [如何在大量的数据中找出不重复的整数?](/docs/big-data/find-no-repeat-number.md)
|
|
|
|
|
- [如何在大量的数据中判断一个数是否存在?](/docs/big-data/find-a-number-if-exists.md)
|
|
|
|
|
- [如何查询最热门的查询串?](/docs/big-data/find-hotest-query-string.md)
|
|
|
|
|
- [如何统计不同电话号码的个数?](/docs/big-data/count-different-phone-numbers.md)
|
|
|
|
|
- [如何从 5 亿个数中找出中位数?](/docs/big-data/find-mid-value-in-500-millions.md)
|
|
|
|
|
- [如何按照 query 的频度排序?](/docs/big-data/sort-the-query-strings-by-counts.md)
|
|
|
|
|
- [如何找出排名前 500 的数?](/docs/big-data/find-rank-top-500-numbers.md)
|
2019-11-27 17:47:27 +08:00
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
## 公众号
|
2020-05-06 20:23:11 +08:00
|
|
|
|
|
2020-10-21 09:21:04 +08:00
|
|
|
|
[Doocs](https://github.com/doocs) 技术社区旗下唯一公众号「**Doocs 开源社区**」,欢迎扫码关注,**专注分享技术领域相关知识及行业最新资讯**。当然,也可以加我个人微信(备注:GitHub),拉你进技术交流群。
|
2020-08-30 17:02:56 +08:00
|
|
|
|
|
2019-11-27 17:47:27 +08:00
|
|
|
|
<table>
|
2020-10-21 09:21:04 +08:00
|
|
|
|
<tr>
|
|
|
|
|
<td align="center" style="width: 200px;">
|
|
|
|
|
<a href="https://github.com/doocs">
|
|
|
|
|
<img src="./images/qrcode-for-doocs.jpg" style="width: 400px;"><br>
|
|
|
|
|
<sub>公众平台</sub>
|
|
|
|
|
</a><br>
|
|
|
|
|
</td>
|
|
|
|
|
<td align="center" style="width: 200px;">
|
|
|
|
|
<a href="https://github.com/yanglbme">
|
|
|
|
|
<img src="./images/qrcode-for-yanglbme.jpg" style="width: 400px;"><br>
|
|
|
|
|
<sub>个人微信</sub>
|
|
|
|
|
</a><br>
|
|
|
|
|
</td>
|
|
|
|
|
</tr>
|
2020-05-06 20:23:11 +08:00
|
|
|
|
</table>
|
2020-10-21 09:21:04 +08:00
|
|
|
|
|
|
|
|
|
关注「**Doocs 开源社区**」公众号,回复 **PDF**,即可获取本项目离线 PDF 文档(283 页精华),学习更加方便!
|
|
|
|
|
|
2020-10-21 09:22:18 +08:00
|
|
|
|
![](./images/pdf.png)
|