今天学习自然语言的算法 TF-IDF 算法 :关键词提取 TF-IDF的主要思想就是:如果某个词在一篇文档中出现的频率高,也就是TF高;在语料库中其他的文档中很少出现,就是DF低,也就是IDF高,则认为这个词具有很好的类区分能力。 TF为词频(Term Frequency),表示词t在文档d中出现的 ...
分类:
其他好文 时间:
2020-02-02 00:59:39
阅读次数:
86
pandas.io 1.概述,主要从txt,json,pkl,csv,excel中读取数据,读取的数据最终转化为pandas.core.frame.DataFrame类型的df 先来看总的api from pandas.io.clipboards import read_clipboard #读剪切 ...
分类:
其他好文 时间:
2020-02-01 10:54:31
阅读次数:
125
也许是刚学会CAD的缘故,配合风螺旋插件,画图的感觉真是蛮爽的,忍不住画了一张又一张。 接着昨天的离场保护区,我们来聊一下PBN指定高度转弯保护区的画法。指定高度转弯的计算本身没有太多复杂的地方,真正复杂的是DF(直飞定位点)与CF(沿航迹飞至定位点)飞行方式上的差别。规范里有这样两张图例: 图II ...
分类:
其他好文 时间:
2020-01-30 14:44:25
阅读次数:
189
df命令用于显示目前在Linux系统上的文件系统的磁盘使用情况统计。 ...
分类:
系统相关 时间:
2020-01-30 12:48:10
阅读次数:
97
一、挂载数据盘下面以新买的服务器为例介绍挂载数据盘的操作过程。参考资料 https://help.aliyun.com/document_detail/25426.html [root@iZ2ze41df2mogmrk6x6e5jZ ~]# df -hlFilesystem Size Used Av ...
分类:
其他好文 时间:
2020-01-30 12:27:55
阅读次数:
91
我们都知道军队里,哨兵的角色很重要,敌人来了先把哨兵解决了。猴子,在企业网站 架构里,这个监控系统就相当于哨兵的作用,监控系统非常重要。体检。。 监控系统都需要监控: 1、本地资源:负载uptime, CPU(top,sar), 磁盘(df h),内存(free swap ),lO(iostat), ...
分类:
移动开发 时间:
2020-01-30 09:41:25
阅读次数:
89
一、读取单个表单 import pandas as pdexcel_reader=pd.ExcelFile('文件.xlsx') # 指定文件 sheet_names = excel_reader.sheet_names # 读取文件的所有表单名,得到列表 df_data = excel_reade ...
分类:
其他好文 时间:
2020-01-29 18:05:04
阅读次数:
136
1. KVM常见使用命令: 1.1 查看命令 列出所有虚拟机 virsh list all 显示虚拟机信息 virsh dominfo vm_name 显示虚拟机内存和cpu使用情况 virsh top 显示虚拟机分区信息 virsh df vm_name 1.2 修改命令 给虚拟机添加硬盘(支持热 ...
分类:
其他好文 时间:
2020-01-27 09:43:57
阅读次数:
102
1.回顾: 某在线主机深夜连续接到告警系统的disk Used 超限告警。 登陆主机查看却遇到了困惑:在检查磁盘使用量 df –h 出来的磁盘使用量确实和告警信息一样,已经被100%占用,但是查看目录大小 du 时,却显示实际目录大小并非这样,而是有很大空闲空间。 如图:磁盘用量 df –h 结果为 ...
分类:
系统相关 时间:
2020-01-26 17:19:33
阅读次数:
84
cummax,cummin,cumprod,cumsum 有时候我们需要求出从第一行开始截止到当前行的最大值、最小值,以及实现累乘、累和等等。 ~~~python import pandas as pd df = pd.DataFrame({"a": [10, 20, 15, 50, 40]}) c ...
分类:
其他好文 时间:
2020-01-26 17:16:52
阅读次数:
128