机器翻译及相关技术 翻译前准备 清洗(大小写转换 标点符号) 分词(每个单词分开,生成一一对应的列表) 建立词典(根据词频进行统计 单词对应唯一id) Encoder Decoder encoder将输入转化为隐藏状态,再由decoder将隐藏状态输出为翻译后语言。 sequence to sequ ...
分类:
其他好文 时间:
2020-02-19 20:57:50
阅读次数:
62
看起来舒服多了!主要是中英文标点符号好区分。 ...
分类:
其他好文 时间:
2020-02-18 15:07:27
阅读次数:
114
字符 字符和字节不太一样,任何一个文字或符号都是一个字符,但是所占字节不一定,不同的编码导致一个字符所占的内存不同。 例如:标点符号"+"是一个字符,汉字"我们"是两个字符,在GBK编码中一个汉字占2个字节,在UTF-8编码中一个汉字占3个字节。 随着时代的发展,程序员们希望在计算机中显示字符,但计 ...
分类:
其他好文 时间:
2020-02-16 14:35:15
阅读次数:
68
摩尔斯电码(Morse code) 摩尔斯电码(Morse Code) 摩尔斯电码(又译为摩斯密码,Morse code)是一种时通时断的信号代码,通过不同的排列顺序来表达不同的英文字母、数字和标点符号。它发明于1837年,发明者有争议,是美国人塞缪尔·莫尔斯或者艾尔菲德·维尔。 摩尔斯电码是一种早 ...
分类:
其他好文 时间:
2020-02-11 19:35:27
阅读次数:
256
今天学习了python,下学期要学习python语言 Python 简介Python 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。 Python 的设计具有很强的可读性,相比其他语言经常使用英文关键字,其他语言的一些标点符号,它具有比其他语言更有特色语法结构。 Python 是一 ...
分类:
其他好文 时间:
2020-02-09 20:12:18
阅读次数:
50
描述:正则表达式能够从一段文本中提取有用的信息。 0、使用正则表达式有如下步骤: (1)寻找规律; (2)使用正则符号表示规律 (3)提取信息 1、正则表达式的基本符号 1.1 点号“.” 一个点号可以代替除了换行符以外的任何一个字符,包括但不限于英文字母、数字、汉字、英文标点符号和中文标点符号。 ...
分类:
其他好文 时间:
2020-02-09 14:54:21
阅读次数:
75
主要用于 NLP 处理,里面存在一些常量列表,包括数字、字母、大写字母、小写字母、标点符号、空格等。 参考:6.1. string — Common string operations 可以用于删除文本中的标点符号,将标点符号 replace 为 空。 >>> import string >>> s ...
分类:
编程语言 时间:
2020-02-07 19:10:15
阅读次数:
93
给定一个字符串,翻转该字符串,翻转时单词中的字符顺序不变。例如,如果字符串为"Hello World",则翻转后为"World Hello"。单词间以一个或多个空格分隔。注意,字符串开头和结尾都可能有多个空格。 输入格式: 输入可能包括多行。每行代表一个字符串,除了空格外,标点符号和普通字母一样处理 ...
分类:
其他好文 时间:
2020-02-04 21:57:03
阅读次数:
114
面试题58:翻转字符串 问题描述 问题(1) 翻转单词顺序 输入一个英文句子,翻转句子中单词的顺序,但单词内字符的顺序不变。为简单起见,标点符号和普通字母一样处理。 例如输入字符串"I am a student. ",则输出"student. a am I"。 问题(2)左旋转字符串 字符串的左旋转 ...
分类:
其他好文 时间:
2020-02-01 19:15:35
阅读次数:
112
print()函数的四种使用方法:无引号,单引号,双引号,三引号 注意:在Python中,默认所有正确的语法,包括标点符号都是【英文】。不小心用了中文标点的话,计算机会无法识别,然后报错。 在终端里,你能看到的最常见的符号报错提示就是【syntaxError:invalid syntax】(语法错误 ...
分类:
编程语言 时间:
2020-01-31 14:26:38
阅读次数:
75