mirror of
https://github.com/doocs/advanced-java.git
synced 2024-12-28 04:10:08 +08:00
parent
ebda3d212c
commit
94c6899ee7
@ -1,7 +1,7 @@
|
||||
## 如何查询最热门的查询串?
|
||||
|
||||
### 题目描述
|
||||
搜索引擎会通过日志文件把用户每次检索使用的所有查询串都记录下来,每个查询床的长度不超过 255 字节。
|
||||
搜索引擎会通过日志文件把用户每次检索使用的所有查询串都记录下来,每个查询串的长度不超过 255 字节。
|
||||
|
||||
假设目前有 1000w 个记录(这些查询串的重复度比较高,虽然总数是 1000w,但如果除去重复后,则不超过 300w 个)。请统计最热门的 10 个查询串,要求使用的内存不能超过 1G。(一个查询串的重复度越高,说明查询它的用户越多,也就越热门。)
|
||||
|
||||
@ -36,4 +36,4 @@
|
||||
最后依然使用小顶堆来对字符串的出现次数进行排序。
|
||||
|
||||
### 方法总结
|
||||
前缀树经常被用来统计字符串的出现次数。它的另外一个大的用途是字符串查找,判断是否有重复的字符串等。
|
||||
前缀树经常被用来统计字符串的出现次数。它的另外一个大的用途是字符串查找,判断是否有重复的字符串等。
|
||||
|
Loading…
Reference in New Issue
Block a user