码迷,mamicode.com
首页 > 2018年10月13日 > 全部分享
非结构化数据与结构化数据提取---正则表达式re模块
页面解析和数据提取 一般来讲对我们而言,需要抓取的是某个网站或者某个应用的内容,提取有用的价值。内容一般分为两部分,非结构化的数据 和 结构化的数据。 非结构化数据:先有数据,再有结构, 结构化数据:先有结构、再有数据 不同类型的数据,我们需要采用不同的方式来处理。 非结构化的数据处理 正则表达式 ...
分类:其他好文   时间:2018-10-13 11:39:51    阅读次数:155
Node http,buffer
buffer代表一个缓冲区,存储二进制,是字节流。网络传输时,就传输的这种字节流,写文件时,也是写的字节流 创建 Buffer 类Buffer 提供了以下 API 来创建 Buffer 类:Buffer.alloc(size[, fill[, encoding]]): 返回一个指定大小的 Buffe ...
分类:Web程序   时间:2018-10-13 11:39:41    阅读次数:142
数组的深拷贝
slice 方法实现数组的深拷贝 这个代码实现非常简单。原理也比较好理解,他是将原数组中抽离部分出来形成一个新数组。我们只要设置为抽离全部,即可完成数组的深拷贝。代码如下: var arr = [1,2,3,4,5] var arr2 = arr.slice(0) arr[2] = 5 consol... ...
分类:编程语言   时间:2018-10-13 11:39:33    阅读次数:194
关于Jupyter Notebook快捷操作
Jupyter Notebook 的快捷键 Jupyter Notebook 有两种键盘输入模式。编辑模式,允许你往单元中键入代码或文本;这时的单元框线是绿色的。命令模式,键盘输入运行程序命令;这时的单元框线是灰色。 命令模式 (按键 Esc 开启) Enter : 转入编辑模式 Shift-Ent ...
分类:其他好文   时间:2018-10-13 11:39:27    阅读次数:149
Jvm类的加载机制
1.概述 虚拟机加载Class文件(二进制字节流)到内存,并对数据进行校验、转换解析和初始化,最终形成可被虚拟机直接使用的Java类型,这一系列过程就是类的加载机制。 2.类的加载时机 类从被虚拟机加载到内存开始,直到卸载出内存为止,整个生命周期包括:加载——验证——准备——解析——初始化——使用— ...
分类:其他好文   时间:2018-10-13 11:39:20    阅读次数:137
少买笑傲
#include<bits/stdc++.h>using namespace std;typedef long long ll; int n;int sum[40000];int mark[40000];void nodeupdate(int root,int l,int r,ll num){ ma ...
分类:其他好文   时间:2018-10-13 11:39:13    阅读次数:115
微擎人人店路由
1、http://weiqin.com/web/index.php?c=site&a=entry&m=ewei_shopv2&do=web&r=shop.adv 当传入的 c 值为 “site”, a 值为 “entry”时则是一个模块路由,m则表示模块对应的名称,该页面对应的视图和控制器文件都在 ...
分类:其他好文   时间:2018-10-13 11:38:55    阅读次数:592
PowerShell执行脚本时“系统上禁止运行脚本”问题解决
PowerShell执行脚本策略错误 错误信息:PowerShell运行脚本错误——“系统上禁止运行脚本” 原因:默认执行策略为Restricted 解决:执行Set ExecutionPolicy RemoteSigned 解: "奇葩史" ...
分类:系统相关   时间:2018-10-13 11:38:47    阅读次数:158
零基础学Arcgis系列教程
零基础学Arcgis(七)|空间数据采集与管理(4)数据检查 (一)创建地理数据库拓扑 1.创建地理数… 零基础学Arcgis(六)|空间数据采集与管理(3)数据编辑 (一)使用要素模板 1.使用要素模板 [… 零基础学Arcgis(八)|空间参考 (一)新建Shapefile文件 [1]… 零基础 ...
分类:其他好文   时间:2018-10-13 11:38:39    阅读次数:341
java中数组实现的错误
作为一个刚学java的小白 真是错误百出 下面就是一个大神会非常不屑的一个小错误 数组在初始化的时候仅仅是定义了一个数组,并未其中的内容初始化。 附上错误代码 : class student{public int grade=1;} public class array { public stati ...
分类:编程语言   时间:2018-10-13 11:38:32    阅读次数:159
简单排序算法———冒泡排序
我们都知道冒泡排序的时间复杂度为O(n^2)。 我就来总结一下冒泡排序。 排序的时间复杂度主要是:比较+交换 首先来看下最优情况下 arrLowToHigh[] 数组已经是从小到大排列,所以 最优时间复杂度为O(n),一次都不用交换; 最坏的是情况 arrHighToLow[] 要完全倒序,每次进入 ...
分类:编程语言   时间:2018-10-13 11:38:16    阅读次数:149
解析什么是绝对定位,相对定位与浮动
在理解定位之前,先说一个概念,文档普通流,就是元素标签正常在HTML里的顺序,块级元素从上至下排列,行内元素从左到右排列。 绝对定位 绝对定位:absolute,元素相对于离它最近的已定位祖先元素进行移动,如果元素没有已定位的祖先元素,那么它的位置相对于最初的包含块(一般是HTML元素,也可能是画布 ...
分类:其他好文   时间:2018-10-13 11:38:07    阅读次数:182
suoi38 卖XY序列 (贪心+前缀和)
因为只能带一个,买卖价格又一样,所以只要右边的比左边的大,就从这买下来然后带到下一个卖掉就行了(我想到别处再卖的话大不了再重新买回来嘛) 所以给max(w[i]-w[i-1],0)维护一个前缀和就行了 ...
分类:其他好文   时间:2018-10-13 11:37:58    阅读次数:151
面向对象进阶
1,组合 #组合 在一个类中以另外一个类的对象作为数据属性,称为类的组合 #圆形与圆环类 # from math import pi # class Circle: # def __init__(self,r): # self.r=r # def perimeter(self): # return ...
分类:其他好文   时间:2018-10-13 11:37:48    阅读次数:137
SPFA模板
#include #include #include #include #include #include #include #include #include #include using namespace std; int n,m,d[200],inq[200];//inq记录该点是否在队列里... ...
分类:其他好文   时间:2018-10-13 11:37:32    阅读次数:163
nvidia 的一些命令
直接在命令行使用 NVIDIA-smi会有问题 首先要确保电脑下了cuda。 然后打开cmd,使用cd命令进入: C:\Program Files\NVIDIA Corporation\NVSMI 然后就可以直接使用“nvidia-smi”这个命令了。对了记得开启管理员权限,否则会显示“拒绝访问” ...
分类:其他好文   时间:2018-10-13 11:37:24    阅读次数:363
线程1
一,基本概念: 程序(program):是为了完成特定的任务,而用某种语言编写的一段静态代码 进程(process): 是程序的一次执行过程,或是正在运行的一个程序。 线程(Thread) :是进程的进一步细分,是一个程序内部的一条执行路径。 -->程序是静态的,进程是动态的。一个程序同一个时间运行 ...
分类:编程语言   时间:2018-10-13 11:37:03    阅读次数:141
1170条   上一页 1 ... 47 48 49 50 51 52 53 ... 69 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!