搜索关键字：检索，搜索到7375个结果！码迷,mamicode.com！

《我想进大厂》之mysql夺命连环13问

想进大厂，mysql不会那可不行，来接受mysql面试挑战吧，看看你能坚持到哪里？ 1. 能说下myisam 和 innodb的区别吗？ myisam引擎是5.1版本之前的默认引擎，支持全文检索、压缩、空间函数等，但是不支持事务和行级锁，所以一般用于有大量查询少量插入的场景来使用，而且myisam不 ...

分类：数据库时间：2020-11-18 13:16:01 阅读次数：18

架构师之路17年精选80篇

2017精选索引，入选规则为：截止至2017年12月28日文章截止到发文，阅读1W+【架构必备】《互联网架构如何实现“高并发”》4W+《TCP接入层的负载均衡、高可用、扩展性架构设计》2.2W+《配置中心架构设计演进》1.7W+《跨公网调用的大坑与架构优化》1.4W+《DNS在架构设计中的巧用》1.9W+《消息如何在网络上安全传输》1.2W+《10W定时任务，如何高效触发》2.9W+《工作线程究竟

分类：其他好文时间：2020-11-18 12:18:05 阅读次数：2

图像检索（image retrieval）- 13 - Smooth-AP: Smoothing the Path Towards Large-Scale Image Retrieval -1 - 论文学习

https://www.robots.ox.ac.uk/~vgg/research/smooth-ap/ https://github.com/Andrew-Brown1/Smooth_AP Smooth-AP: Smoothing the Path Towards Large-Scale Imag ...

分类：其他好文时间：2020-11-17 13:00:10 阅读次数：25

elasticsearch - Lucene分片内部逻辑

1.分片内部基本结构在一个分片中（Lucene），数据（数据原文和倒排索引）以段为单位存储，只有成为段的数据才能被检索。因为文档先被缓存在内存中，创建倒排索引和其他索引结构之后才会成为段，才能被检索就像下图中文档先被写入内存，为文档构建一系列索引之后成为段，并且写入磁盘，只有段才是 Searc ...

分类：Web程序时间：2020-11-17 12:23:50 阅读次数：17

“搜索”的原理，架构，实现，实践，面试不用再怕了（值得收藏）！！！

可能99%的同学不做搜索引擎，但99%的同学一定实现过检索功能。搜索，检索，这里面到底包含哪些技术的东西，希望本文能够给大家一些启示。全网搜索引擎架构与流程如何？全网搜索引擎的宏观架构如上图，核心子系统主要分为三部分（粉色部分）：（1）spider爬虫系统；（2）search&index建立索引与查询索引系统，这个系统又主要分为两部分：一部分用于生成索引数据build_index一部分用于

分类：其他好文时间：2020-11-16 13:57:29 阅读次数：12

Hbase中 Rowkey设计时需要遵循三大原则：

Rowkey设计时需要遵循三大原则： 1. 唯一性原则 rowkey在设计上保证其唯一性。rowkey是按照字典顺序排序存储的，因此，设计rowkey的时候，要充分利用这个排序的特点，将经常读取的数据存储到一块，将最近可能会被访问的数据放到一块。 2. 长度原则 rowkey是一个二进制码流，可以是 ...

分类：其他好文时间：2020-11-13 13:05:38 阅读次数：7

每秒20W次并发分词检索，架构如何设计？

继续回答星球水友提问。沈哥，我们有个业务，类似于“标题分词检索”，并发量非常大，大概20W次每秒，数据量不是很大，大概500W级别，而且数据不会频繁更新，平均每天更新一次，请问有什么好的方案么？这是一个典型的，短文本分词搜索的问题，简单聊聊自己的经验。常见的文本检索方案有哪些？（1）数据库LIKE法将标题数据存放在数据库中，使用like来查询，方案非常简单，能支持简单的模糊搜索，但不支持分词。画外

分类：其他好文时间：2020-11-10 11:31:19 阅读次数：7

1000亿文本信息，高并发MD5查询，这么大数据量的业务怎么弄？

==星球水友提问==沈老师，你好，想请教一个身份证信息检索的问题。公司有一个每秒5万并发查询的业务，（假设）根据身份证MD5查询身份证信息，目前有1000亿条数据，纯文本存储，前几天看你写LevelDB，请问这个业务能利用LevelDB内存数据库进行存储么？有没有其他优化方案？画外音：LevelDB《内存KV缓存/数据库》。==问题描述完==上一位星球水友问的是36亿日志后台分页查询，紧接着又来了

分类：其他好文时间：2020-11-10 11:30:25 阅读次数：10

30亿日志，检索+分页+后台展示，你是否遇到过更奇葩的需求？

沈老师，你好，想请教一个数据库查询日志，前台页面显示的问题。需求：（1）按照某些特定检索条件查询日志；（2）通过前台Web页面查询并显示相关日志信息；（3）检索需求包含用户，时间段区间，类型等特定字段；希望做到：（1）查询速度尽可能快；（2）支持分页查询；目前方案：日志信息存储在Oracle中，根据日期对Oracle做了分区处理，每天生成一个分区表，每个分区表中的数据总量大概在1000W左右。在相

分类：其他好文时间：2020-11-10 11:30:08 阅读次数：11

19、Haystack

Haystack 1.什么是Haystack Haystack是django的开源全文搜索框架(全文检索不同于特定字段的模糊查询，使用全文检索的效率更高 )，该框架支持Solr,Elasticsearch,Whoosh, Xapian，搜索引擎它是一个可插拔的后端（很像Django的数据库层），所以 ...

分类：其他好文时间：2020-11-10 11:17:18 阅读次数：8

共7375条上一页 1 ... 8 9 10 11 12 ... 738 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)