码迷,mamicode.com
首页 >  
搜索关键字:文本处理    ( 1321个结果
awk(1)-简述
1.概述 AWK is a programming language designed for text processing and typically used as a data extraction and reporting tool. AWK是一种设计用于文本处理的编程语言,通常用作数据... ...
分类:其他好文   时间:2016-11-20 16:02:38    阅读次数:229
linux基础篇07,linux文本处理cat more less head tail sort uniq grep cut jion sed awk
文本处理catmorelessheadtailsortuniqgrepcutjionsedawk################################################cat:concatenatefilesandprintonthestandardoutput显示文件内容到标准输出(显示器)-e:显示最后一个结尾的字符-n:显示行编号[root@Jameszhan~]#cat-n/etc/shells1/bi..
分类:系统相关   时间:2016-11-18 08:03:27    阅读次数:268
Python之mmap内存映射模块(大文本处理)说明
背景: 通常在UNIX下面处理文本文件的方法是sed、awk等shell命令,对于处理大文件受CPU,IO等因素影响,对服务器也有一定的压力。关于sed的说明可以看了解sed的工作原理,本文将介绍通过python的mmap模块来实现对大文件的处理,来对比看他们的差异。 说明: mmap是一种虚拟内存 ...
分类:编程语言   时间:2016-11-17 13:19:00    阅读次数:477
正则表达式
正则表达式,一个十分古老而又强大的文本处理工具,仅仅用一段非常简短的表达式语句,便能够快速实现一个非常复杂的业务逻辑。熟练地掌握正则表达式的话,能够使你的开发效率得到极大的提升。 正则表达式经常被用于字段或任意字符串的校验,如下面这段校验基本日期格式的JavaScript代码: 下面是技匠整理的,在 ...
分类:其他好文   时间:2016-11-14 12:16:55    阅读次数:150
Python基础
Python基础(下) 一、循环 1、for循环 for循环需要预先设定好循环的次数(n),然后执行隶属于for的语句n次。 基本构造是: 举例来说,我们编辑一个叫forDemo.py的文件: 这个循环就是每次从表[3,4.4,'life'] 中取出一个元素(回忆:表是一种序列),然后将这个元素赋值 ...
分类:编程语言   时间:2016-11-12 17:01:51    阅读次数:220
unit6.文本处理工具
File:/run/media/kiosk/CA9C-5CE5/11.11/11.5(1)Page1of3**************unit6.文本处理工具***********1.diff(比较文件不同)difffilefile1/*比较两个文件的不同-c/*显示周围的行-u/*按照同一个是输出生成补丁-r/*比较两个目录中的文件的不同patchfilefile.path/*打补丁-b/*备..
分类:其他好文   时间:2016-11-11 15:43:21    阅读次数:132
常用的js正则表达式
正则表达式,一个十分古老而又强大的文本处理工具,仅仅用一段非常简短的表达式语句,便能够快速实现一个非常复杂的业务逻辑。熟练地掌握正则表达式的话,能够使你的开发效率得到极大的提升。 下面是一些,在前端开发中经常使用到的正则表达式。 1 . 校验密码强度 密码的强度必须是包含大小写字母和数字的组合,不能 ...
分类:Web程序   时间:2016-11-10 02:32:56    阅读次数:218
Linux上文本三剑客之awk详解
AWK介绍Linux文本处理工具三剑客:grep、sed、awk。其中grep是一种文本过滤工具;sed是文本行编辑器,而awk是一种报表生成器,就是对文件进行格式化处理的,但这里的格式化不是文件系统的格式化,而是对文件内容进行各种“排版”,进而格式化显示;在Linux之上我们使用的是GNUa..
分类:系统相关   时间:2016-11-09 15:53:41    阅读次数:202
【Python进阶】02、文本处理与IO深入理解
1、有一个文件,单词之间使用空格、分号、逗号、或者句号分隔,请提取全部单词。解决方案:使用\w匹配并提取单词,但是存在误判使用str.split分隔字符字符串,但是需要多次分隔使用re.split分隔字符串In[4]:help(re.split) Helponfunctionsplitinmodulere: split(pattern,str..
分类:编程语言   时间:2016-11-09 13:18:28    阅读次数:241
【NLP】干货!Python NLTK结合stanford NLP工具包进行文本处理
摘要:NLTK是由宾夕法尼亚大学计算机和信息科学使用python语言实现的一种自然语言工具包,其收集的大量公开数据集、模型上提供了全面、易用的接口,涵盖了分词、词性标注(Part-Of-Speech tag, POS-tag)、命名实体识别(Named Entity Recognition, NER... ...
分类:编程语言   时间:2016-11-07 01:12:27    阅读次数:377
1321条   上一页 1 ... 76 77 78 79 80 ... 133 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!