好久没发博客了,今天来发一篇分析股价相关度的。╮ ( ╯ ▽ ╰ ) ╭ 为什么要分析股价相关度呢,我们来引入一个概念——配对交易 所谓的配对交易,是基于统计套利的配对交易策略是一种市场中性策略,具体的说,是指从市场上找出历史股价走势相近的股票进行配对,当配对的股票价格差偏离历史均值时,则做空股价较 ...
分类:
编程语言 时间:
2021-07-02 15:37:28
阅读次数:
0
ES:1:倒排索引 基于Document 关键词索引实现 、 根据关键词做索引 相关度 a. 数据结构 i. 包含关键词的Document List ii. 关键词在每个doc中出现的次数 词频 TF term frequency iii. 关键词在整个索引中出现的次数 IDF inverse do ...
分类:
其他好文 时间:
2021-03-29 12:21:55
阅读次数:
0
少啰嗦,直接看东西。——罗永浩1、query和filter的本质区别?以下几张图能更好的概括:query关注点:此文档与此查询子句的匹配程度如何?filter关注点:此文档和查询子句匹配吗?2、Query检索细化关注点1)是否包含?确定文档是否应该成为结果的一部分.2)相关度得分多少?除了确定文档是否匹配外,查询子句还计算了表示文档与其他文档相比匹配程度的_score。3)得分越高,相关度越高。更
分类:
其他好文 时间:
2020-12-15 12:29:26
阅读次数:
3
elastic.co 一、什么是搜索? 通过一个关键词或一段描述,得到你想要的(相关度高)结果 二、如何实现搜索功能? 关系型数据库:性能差、不可靠、结果不准确(相关度很低) 使用mysql数据库时,建立索引会加快查询效率(索引会对字段进行排序) 但若使用模糊查询:select * from emp ...
分类:
其他好文 时间:
2020-09-17 20:56:49
阅读次数:
39
Metricbeat介绍 Metricbeat是一种轻量级的托运人,可以将其安装在服务器上,以定期从操作系统和服务器上运行的服务收集指标。Metricbeat会收集它收集的度量标准和统计信息,并将其运送到指定的输出,例如Elasticsearch或Logstash。 Metricbeat通过从服务器 ...
分类:
其他好文 时间:
2020-06-25 13:37:38
阅读次数:
138
概述 PCA(principal components analysis)即主成分分析技术,又称为主分量分析,旨在利用降维的思想,把多个指标转换为少数的几个综合指标。 主成分分析是一种简化数据集的技术,它是一个线性变换。这个线性变化把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个 ...
分类:
其他好文 时间:
2020-06-18 10:57:17
阅读次数:
151
概要上一篇中多次提到了按相关性评分,本篇我们就来简单了解一下相关性评分的算法,以及正排索引排序的优势。评分算法Elasticsearch进行全文搜索时,BooleanModel是匹配的基础,先用booleanmodel将匹配的文档挑选出来,然后再运用评分函数计算相关度,参与的函数如我们提到的TF/IDF、LengthNorm等,再加上一些控制权重的参数设置,得到最后的评分。BooleanModel
分类:
编程语言 时间:
2020-05-25 13:56:39
阅读次数:
77
相关度研究记录手稿 1.orderNum字段相关度 增强 score = math.sqrt(orderNum*0.001) ScoreFunctionBuilder<?> dateFieldValueScoreFunction = ScoreFunctionBuilders.fieldValueF ...
分类:
其他好文 时间:
2020-05-22 12:51:01
阅读次数:
62
lucene详细存储结构: 索引 (Index) : 一个目录一个索引,在 Lucene 中一个索引是放在一个文件夹中的。 段(Segment) : 一个索引 (逻辑索引)由多个段组成, 多个段可以合并, 以减少读取内容时候的磁盘IO. Lucene 中的数据写入会先写在内存的一个Buffer,当B ...
分类:
编程语言 时间:
2020-03-23 09:15:59
阅读次数:
107
https://segmentfault.com/a/1190000019753737?utm_source=tag-newest 1、结构化搜索 1.1 精确值查找 过滤器很重要,因为它们执行速度非常快,不会计算相关度(直接跳过了整个评分阶段)而且很容易被缓存。请尽可能多的使用过滤式查询。 ter ...
分类:
其他好文 时间:
2020-02-21 19:55:02
阅读次数:
82