5.4.1 实例层的融合和匹配 空间复杂度挑战 时间复杂度挑战: 匹配元素对的相似度计算次数(n2) 每次相似度计算时间复杂度(t) 匹配结果质量挑战5.4.2 基于快速相似度计算的实例匹配方法 思想:降低每次相似度计算的时间复杂度,即t 映射过程只能使用简单且速度较快的匹配器,映射线索尽量简单; ...
分类:
其他好文 时间:
2019-12-23 19:16:36
阅读次数:
184
pandas 强大的数据处理工具学习目标:无需记忆确切的api名称,需要知识pandas能做什么,并根据实际需要使用的功能可以快速索引查询。 速查手册: (1) pandas中文给出的教学文档 https://www.pypandas.cn/docs/getting_started/10min.ht ...
分类:
其他好文 时间:
2019-12-21 20:16:04
阅读次数:
123
一、爬虫的定义 爬虫定义:程序或者脚本——自动的爬取万维网的数据的程序或者脚本。 二、爬虫可以解决的问题 1、解决冷启动问题。 2、搜索引擎的根基——通用爬虫。 3、帮助机器学习建立知识图谱。 4、制作各种比价软件。 三、爬虫工程师的进阶之路 1、初级爬虫工程师 (1)web 前端的知识: HTML ...
分类:
编程语言 时间:
2019-12-18 21:59:23
阅读次数:
90
概念: 知识图谱是由一些相互连接的实体和他们的属性构成的。换句话说,知识图谱是由一条条知识组成,每条知识表示为一个SPO三元组(Subject-Predicate-Object)。 表示方法:传统+向量 传统的知识图谱表示方法是采用OWL、RDF、RDFS(改进)等本体语言进行描述; RDF:(Re ...
分类:
其他好文 时间:
2019-12-05 01:30:23
阅读次数:
618
1.爬虫的定义:脚本,程序 >自动抓取万维网上信息的程序。 2、爬虫可以解决的问题: (1)解决冷启动的问题。(初创网站没有自己的信息直接爬取其他平台获取信息) (2)搜索引擎的根基。做搜索引擎,必须使用爬虫。 (3)帮助机器学习建立知识图谱。 机器学习最终的是训练集。训练集可以靠爬虫爬去。 (4) ...
分类:
其他好文 时间:
2019-11-30 00:16:52
阅读次数:
90
摘石晓文简书: https://www.jianshu.com/p/6a5e796499e8 一、知识图谱 背景: 知识图谱于2012年5月17日由Google正式提出,其初衷是为了提高搜索引擎的能力,改善用户的搜索质量以及搜索体验。随着人工智能的技术发展和应用,知识图谱逐渐成为关键技术之一,现已被 ...
分类:
其他好文 时间:
2019-11-25 23:23:23
阅读次数:
118
Java 自学指南 Java 面试题汇总PC端浏览【点这里】 Java知识图谱 Java 面试题汇总小程序浏览,扫二维码 所有资源资源汇总于公众号 ...
分类:
其他好文 时间:
2019-11-25 11:16:04
阅读次数:
78
Java 自学指南 Java 面试题汇总PC端浏览【点这里】 Java知识图谱 Java 面试题汇总小程序浏览,扫二维码 所有资源资源汇总于公众号 ...
分类:
其他好文 时间:
2019-11-25 11:12:24
阅读次数:
106
介绍 在参与的项目和产品中,涉及到模型和算法的需求,主要以自然语言处理(NLP)和知识图谱(KG)为主。NLP涉及面太广,而聚焦在具体场景下,想要生产落地的还需要花很多功夫。 作为NLP的主要方向,情感分析,文本多分类,实体识别等已经在项目中得到应用。例如 通过实体识别,抽取文本中提及到的公司、个人 ...
分类:
其他好文 时间:
2019-11-25 11:09:08
阅读次数:
85
HashMap、LinkedHashMap Hashtable TreeMap IdentityHashMap Java 自学指南 Java 面试题汇总PC端浏览【点这里】 Java知识图谱 Java 面试题汇总小程序浏览,扫二维码 所有资源资源汇总于公众号 ...
分类:
编程语言 时间:
2019-11-24 12:14:55
阅读次数:
111