以前的公司和现在的公司,都用到了hadoop和hdfs。一直没入门,今天照着官网写了一个hadoop worldcount demo 1. hadoop是一个框架,什么是框架,spring是一个框架、mybatis是一个框架,框架是把系统中通用的功能写进去,减少开发工作量。比如基于spring bo ...
分类:
其他好文 时间:
2018-12-02 18:31:16
阅读次数:
421
Nginx (engine x) 是一个高性能的HTTP和反向代理服务,也是一个IMAP/POP3/SMTP服务。 wsgi是PythonWeb服务器网关接口(Web Server Gateway Interface),WSGI是作为Web服务器与Web应用程序或应用框架之间的一种低级别的接口,以提 ...
分类:
Web程序 时间:
2018-11-08 10:11:43
阅读次数:
267
Command "c:\python36\python.exe -u -c "import setuptools, tokenize;__file__=='C:\\Users\\yaya\\AppData\\Local\\Temp\\pip-build-10ew2ma_\\Twisted\\setu ...
今天在服务器上搭建django开发环境的时候遇到了一问题,就是在python3下安装pymysql 出现以下问题 1.Failed cleaning build dir for cryptography 2.Command "/usr/bin/python3 -u -c "import setupt ...
分类:
数据库 时间:
2018-09-09 22:12:49
阅读次数:
308
Java编程MapReduce实现WordCount 1.编写Mapper package net.toocruel.yarn.mapreduce.wordcount; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop ...
分类:
编程语言 时间:
2018-09-07 21:11:48
阅读次数:
286
1.词性标注器 parts-of-speech 或 POS tagger nltk自带英文标注器 import nltk text = nltk.word_tokenize("And now for something completely different")#list print(nltk.p ...
分类:
其他好文 时间:
2018-08-24 14:56:34
阅读次数:
236
逻辑斯蒂回归: 逻辑斯蒂回归是统计学习中的经典分类方法,属于对数线性模型。logistic回归的因变量可以是二分类的, 也可以是多分类的 基本原理 logistic 分布 折X是连续的随机变量,X服从logistic分布是指X具有下列分布函数和密度函数: 其中为位置参数,为形状参数。与图像如下,其中 ...
分类:
其他好文 时间:
2018-08-22 14:03:12
阅读次数:
323
[TOC] 编程时,常常需要集中存放多个数据。可以使用数组来保存,但一旦初始化时指定了数组的长度,数组就不可变了。而集合类就很好的解决了这一问题。Java集合大致可分为 Set、List、Queue、Map四种体系。Java集合框架图: "【简图】" Set 不可重复集合 {HashSet, Tre ...
分类:
编程语言 时间:
2018-08-20 21:44:20
阅读次数:
191
一、前述 Python上著名的?然语?处理库?带语料库,词性分类库?带分类,分词,等等功能强?的社区?持,还有N多的简单版wrapper。 二、文本预处理 1、安装nltk 安装语料库 (一堆对话,一对模型) 2、功能一览表: 3、文本处理流程 4、Tokenize 把长句?拆成有“意义”的?部件 ...
分类:
编程语言 时间:
2018-07-08 10:46:46
阅读次数:
524
拦截器与过滤器的区别 : 1. 拦截器是基于java的反射机制的。而过滤器是基于函数回调,Spring框架支持,可Spring中的数据源、事务管理等。 2. 使用范围不同:拦截器不依赖与servlet容器,过滤器依赖与servlet容器。 3. 拦截器只能对action请求起作用,针对类,拦截器可以 ...
分类:
其他好文 时间:
2018-06-24 11:34:16
阅读次数:
297