码迷,mamicode.com
首页 >  
搜索关键字:思想    ( 25748个结果
Mahout kmeans聚类
K-means算法是最为经典的基于划分的聚类方法,是十大经典数据挖掘算法之一。K-means算法的基本思想是:以空间中k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果。Mahout kmeans MapReduce实现的原理和上述的一致,值得注意的是,Mahout将数据存储在HDFS,用MapReduce做批量并行的计算。在做kmeans之前,需要将文本用Mahout向量化模块工具做向量化。计算过程主要分为三个步骤:初始中心选取,寻找簇中心,划分数...
分类:其他好文   时间:2014-05-26 06:00:31    阅读次数:239
C++必知必会(1)
条款1数据抽象 抽象数据类型的用途在于将变成语言扩展到一个特定的问题领域。一般对抽象数据类型的定义需要准训以下步骤: 1.     为类型取一个描述性的名字 2.     列出类型所能执行的操作 3.     为类型设计接口 4.     实现类型 条款2多态 多态类型,从基类继承的最重要的多系就是它们的接口,而不是它们的实现。 条款3设计模式 条款4 STL STL优秀思想体...
分类:编程语言   时间:2014-05-26 05:47:41    阅读次数:315
sitemesh的使用
由于最近项目的原因,接触到了sitemesh。 SiteMesh是一个用来在JSP中实现页面布局和装饰(layout and decoration)的框架组件,能够帮助网站开发人员较容易实现页面中动态内容和静态装饰外观的分离。提供了一种在网站中更有效的组织页面布局的方式。      SiteMesh设计思想是,用户发送request至服务器,服务器根据此request生成动态数据,生成网页...
分类:其他好文   时间:2014-05-26 05:23:47    阅读次数:221
java MongoDB分页优化
最近项目在做网站用户数据新访客统计,数据存储在MongoDB中,统计的数据其实也并不是很大,1000W上下,但是公司只配给我4G内存的电脑,让我程序跑起来气喘吁吁...很是疲惫不堪。     最常见的问题莫过于查询MongoDB内存溢出,没办法只能分页查询。这种思想大家可能都会想到,但是如何分页,确实多有门道!     网上用的最多的,也是最常见的分页采用的是skip+limit这种组合方式,...
分类:数据库   时间:2014-05-26 04:13:29    阅读次数:399
数组中最小的K个数
思路:1、排序,取前k个元素;O(NlogN);2、分治,O(n),利用快排的思想;3、用set 维护最小的k个数,O(NlogK),可处理海量数据。...
分类:其他好文   时间:2014-05-26 03:38:58    阅读次数:222
Struts2 Interceptor学习
Interceptor的设计思想,其实是Spring里面的AOP思想,尽管Struts2又有自己的Interceptor但是,在实际开发中,用的较少,SSH整合之后你可以采用AOP事务处理进行拦截,更方便---------------------------------华丽的分割线---------...
分类:其他好文   时间:2014-05-26 03:09:30    阅读次数:196
基于数据仓库星形模式的广东省高速公路一张网资金结算情况分析系统
星形模式是基于关系数据库的数据仓库中的一个著名概念,由于星形连接模式的设计思想能够满足人们从不同观察角度(维)分析数据的需求,所以在基于关系数据库的数据仓库的设计中广泛地使用了星形模式。本文主要介绍《广东省高速公路一张网资金结算情况分析系统》中的数据仓库技术。...
分类:其他好文   时间:2014-05-24 18:24:43    阅读次数:297
javascript常见的设计模式举例
近日重读《javascript面型对象编程指南》这本书,最后一章介绍了常见的javascript设计模式的实现。主要讲解了四种设计模式:单例模式、工厂模式、装饰器模式和观察者模式。js作为动态语言,实现这四种模式的实例相对简单,当然既然称之为模式,那么吃透思想更重要,那么下面,由乐帝来实例讲解四种模式。    1.单例模式    顾名思义,对象构造出来的是实例,从字面上理解,单例即单实例,这意...
分类:编程语言   时间:2014-05-24 18:21:35    阅读次数:335
【推荐系统】协同过滤之基于用户的最近邻推荐
1.算法简介 协同过滤(collaborative filtering)的核心思想:利用其他用户的行为来预测当前用户。协同过滤算法是推荐系统中最基本的,同时在业界广为使用。根据使用的方法不同,可以分为基于用户(user-based)、基于物品(item-based)的最近邻推荐。 基于用户的最近邻推荐的主要思想:对于一个给定的评分集,找出与当前用户u口味相近的k个用户;然后,对...
分类:其他好文   时间:2014-05-24 17:59:03    阅读次数:308
让数组中奇数位于偶数的前面
让数组中基数位于偶数的前面,用快排的思想解决。...
分类:其他好文   时间:2014-05-24 17:10:26    阅读次数:170
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!