标签:mode 数学 统计 顺序 双击 sso 介绍 ica 聚类
一、软件介绍
1.spss
SPSS原名StatisticalPackage for the Social Sciences(社会科学统计软件包),现在已被IBM收购,改名后仍然是叫SPSS,不过全称变更为StatisticalProduct and Service Solutions(统计产品与服务解决方案)。SPSS是一个专业的统计分析软件。除了基本的统计分析功能之外,还提供非线性回归、聚类分析(Clustering)、主成份分析(PCA)和基本的时序分析。SPSS在某种程度上可以进行简单的数据挖掘工作,比如K-Means聚类,不过数据挖掘的主要工作一般都是使用其自家的Clementine(现已改名为SPSS Modeler)完成。需要提一点的是SPSS Modeler的建模功能非常强大且智能化,同时还可以通过其自身的CLEF(ClementineExtension Framework)框架和Java开发新的建模插件,扩展性相当好,是一个不错的商业BI方案。
2.R
R是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统;数组运算工具(其向量、矩阵运算方面功能尤其强大);完整连贯的统计分析工具;优秀的统计制图功能;简便而强大的编程语言:可操纵数据的输入和输出,可实现分支、循环,用户可自定义功能。与其说R是一种统计软件,还不如说R是一种数学计算的环境,因为R并不是仅仅提供若干统计程序、使用者只需指定数据库和若干参数便可进行一个统计分析。R的思想是:它可以提供一些集成的统计工具,但更大量的是它提供各种数学计算、统计计算的函数,从而使使用者能灵活机动的进行数据分析,甚至创造出符合需要的
3.Stata
Stata 是一套提供其使用者数据分析、数据管理以及绘制专业图表的完整及整合性统计软件。它提供许许多多功能,包含线性混合模型、均衡重复反复及多项式普罗比模式。用Stata绘制的统计图形相当精美。Stata的统计功能很强,除了传统的统计分析方法外,还收集了近20年发展起来的新方法,如Cox比例风险回归,指数与Weibull回归,多类结果与有序结果的logistic回归,Poisson回归,负二项回归及广义负二项回归,随机效应模型等。
4.Python
Python是一种面向对象、解释型计算机程序设计语言。Python语法简洁而清晰,阅读一个良好的Python程序就感觉像是在读英语一样。它使你能够专注于解决问题而不是去搞明白语言本身。另外具有丰富和强大的类库,例如numpy、matplotlib、Pandas的引入,是的python能支持几乎所有统计分析和建模的工作,另外由于Pandas,使得Python在结构化数据的处理上非常给力。它常被昵称为胶水语言,能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。常见的一种应用情形是,使用Python快速生成程序的原型(有时甚至是程序的最终界面),然后对其中有特别要求的部分,用更合适的语言改写,比如3D游戏中的图形渲染模块,性能要求特别高,就可以用C/C++重写,而后封装为Python可以调用的扩展类库。
二、数据操作
1.打开数据集
操作:文件→打开→数据→选择要打开的数据集
2.增删改数据
(1)修改数据
操作:找到需要修改的数据,双击激活后即可修改
(2)插入或删除一行数据
操作:点击所要插入行号→点击工具栏的“插入行”图标
选中所要删除的行→按Delete键(3)插入或删除一列
操作:找到所要插入的列→点击工具栏的“插入列”图标
选中索要删除的列→按Delete键
3.产生新变量
基本操作:点击转换按钮→计算变量
(1)求差求和
操作:基于上述基本操作后,目标变量命名→编写变量标签→输入表达式→输出结果,此操作可运用于求差求和求均值最大值等。
(2)加上IF条件求平均值
操作:基于基本操作后,点击如果按钮→输入条件→输入公式→输出结果
(4)排序
操作:点击数据按钮→排序个案→选择排序依据和排列顺序→输出结果
(5)合并文件
操作:点击数据按钮→合并文件→添加个案→选择要新加入的数据集→Ctrl键同时选中不同名变量→配对→输出
附图:
标签:mode 数学 统计 顺序 双击 sso 介绍 ica 聚类
原文地址:http://www.cnblogs.com/fanqinglin/p/7783813.html