TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术,常用于挖掘文章中的关键词,而且算法简单高效,常被工业用于最开始的文本数据清洗。 TF-IDF有两层意思,一层是"词频"(Term Frequency,缩写为T ...
分类:
其他好文 时间:
2020-07-26 01:56:59
阅读次数:
77
[LuoguP4208][JSOI2008]最小生成树计数 题面 现在给出了一个简单无向加权图。你不满足于求出这个图的最小生成树,而希望知道这个图中有多少个不同的最小生成树。(如果两颗最小生成树中至少有一条边不同,则这两个最小生成树就是不同的)。由于不同的最小生成树可能很多,所以你只需要输出方案数对 ...
分类:
Web程序 时间:
2020-07-26 00:42:11
阅读次数:
88
有 n 个城市,按从 0 到 n-1 编号。给你一个边数组 edges,其中 edges[i] = [fromi, toi, weighti] 代表 fromi 和 toi 两个城市之间的双向加权边,距离阈值是一个整数 distanceThreshold。 返回能通过某些路径到达其他城市数目最少、且 ...
分类:
其他好文 时间:
2020-07-26 00:11:35
阅读次数:
59
一、申请钉钉账号,登录账号。二、创建一个告警群组,添加一个自定义机器人三,监控脚本配置(首先找到alertscripts目录)在/usr/local/zabbix/share/zabbix/alertscripts目录下面创建脚本,名称为zabbix_dingding.py脚本的内容如下:#!/usr/bin/envpython#coding:utf-8importrequests,json,sy
分类:
其他好文 时间:
2020-07-19 11:24:28
阅读次数:
79
Scikit-learn 之 TF-IDF TF-IDF基础 TF-IDF(Term Frequency-InversDocument Frequency)是一种常用于信息处理和数据挖掘的加权技术。该技术采用一种统计方法,根据字词在文本中出现的次数和在整个语料中出现的文档频率来计算一个字词在整个语料 ...
分类:
其他好文 时间:
2020-07-17 16:09:27
阅读次数:
71
重新做了一下这道并查集的题目,关键要点是抓住这种循环的关系和模运算的通性,进而利用加权并查集 #include <cstdio> #include <iostream> #include <algorithm> #include <cstring> using namespace std; cons ...
分类:
其他好文 时间:
2020-07-15 23:39:09
阅读次数:
63
原理 BM25算法,通常用来作搜索相关性平分。一句话概况其主要思想:对Query进行语素解析,生成语素qi;然后,对于每个搜索结果D,计算每个语素qi与D的相关性得分,最后,将qi相对于D的相关性得分进行加权求和,从而得到Query与D的相关性得分。 BM25算法的一般性公式如下: 其中,Q表示Qu ...
分类:
编程语言 时间:
2020-07-14 21:46:51
阅读次数:
72
熟悉Spring Boot、Spring Cloud等框架 熟悉MySQL、Oracle、ES、Redis等数据库 nginx负载均衡算法,及其差异1.轮询2.ip_hash3.加权4.5.6. mysql或oracle查看数据库正在执行的sql的思路或方法SELECT SE.SID,OPNAME, ...
分类:
其他好文 时间:
2020-07-14 00:57:56
阅读次数:
113
一、\(R^{2}\)、RSS、TSS、ESS 局部加权回归 二、二分类:Logistic回归 广义线性模型 对数线性模型 Logistic回归的损失 指数族 多分类:Softmax回归 二、AUC ...
分类:
其他好文 时间:
2020-07-08 22:46:33
阅读次数:
52