一、背景 利用Requests模块获取有道词典web页面的post信息,BeautifulSoup来获取需要的内容,通过tkinter模块生成gui界面。 二、代码 git源码地址 fanyi.py代码如下: #!/bin/env python # -*- coding:utf-8 -*- # _a ...
分类:
编程语言 时间:
2020-03-20 22:14:47
阅读次数:
92
题意:给出p串字符(每串都是20个字母) 给出k ,k表示总共可以分成几部分; 给出词典,这个词典最多包含6个单词, 求如何分,能够得到最多单词; 注:每份中包含的单词可以部分重叠。当选用一个单词之后,其第一个字母不能再用 思路:很明显,这道题应该用dp解法; 首先,我们先将p串字符连成一串 我们需 ...
分类:
其他好文 时间:
2020-03-14 19:51:45
阅读次数:
52
简单分词: 1 from pyhanlp import * 2 content = "现如今,机器学习和深度学习带动人工智能飞速的发展,并在图片处理、语音识别领域取得巨大成功。" 3 Get_value=HanLP.segment(content) 4 print(Get_value) 输出: 加词 ...
分类:
其他好文 时间:
2020-03-14 18:38:54
阅读次数:
109
Monolithic Kernel 无论是Windows还是Linux等等,这些寻常使用的操作系统,都是用内核和管理和使用硬件的。 宏内核。 Monolithic,词典义是『单一的,庞大的』,简单理解,就是内核的所有功能,从文件系统,到内存管理,到CPU调度,等等等等,都放在内核态中。这样做有一个很 ...
分类:
其他好文 时间:
2020-03-05 16:42:02
阅读次数:
191
词典路径 D:\hanlp\data\dictionary\custom 在该目录下有如下内容 其中可以在CustomDictionary.txt的文件中添加自定义词和词性。 添加完成之后,删除 .bin 文件,重新运行hanlp程序,等待重新生成新的 .bin 文件即可 注意: 每行共包含三个内容 ...
分类:
其他好文 时间:
2020-03-04 22:53:26
阅读次数:
705
一、IK分词器简介 IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer已经推出 了3个大版本。最初,它是以开源项目Lucene为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IKAnalyzer3. ...
分类:
其他好文 时间:
2020-02-26 18:50:38
阅读次数:
82
机器翻译及相关技术 翻译前准备 清洗(大小写转换 标点符号) 分词(每个单词分开,生成一一对应的列表) 建立词典(根据词频进行统计 单词对应唯一id) Encoder Decoder encoder将输入转化为隐藏状态,再由decoder将隐藏状态输出为翻译后语言。 sequence to sequ ...
分类:
其他好文 时间:
2020-02-19 20:57:50
阅读次数:
62
安装pyhanlp pyhanlp是java写的,外层封装了python。 对于新手,在使用的时候稍有难度。 1. 下载源码 https://github.com/hankcs/pyhanlp 2. 创建虚机 3. 安装pyhanlp 以下是日志 尝试调用,加载词典 4. 下载词典文件 手动下载。 ...
分类:
其他好文 时间:
2020-02-17 19:59:48
阅读次数:
204
不知道大家对使用苹果电脑的体验如何?您充分利用您的mac了吗?其实macOS上存在着许多快捷方式和技巧可以帮助简化我们的工作流程,提高效率,但是在日常生活中经常被人们忽略或者遗忘。以下是macdown小编整理的一些macOS实用小技巧,希望能够帮助大家更好地使用苹果电脑。 桌面和应用程序管理 激活聚 ...
分类:
系统相关 时间:
2020-02-13 12:54:23
阅读次数:
103
Python中最基本的数据结构是序列,序列中的每个元素被分配了一个序号即元素位置,也叫索引(从0开始),最后一个元素也可以标记位-1。 序列的元素可以是之前讲的所有基础数据类型,也可以是另一个序列,还可以是对象(后面介绍)。 最常用的序列有两类:元素(tuple)和列表(list)。两者的区别:列表 ...
分类:
编程语言 时间:
2020-02-09 16:42:47
阅读次数:
71