码迷,mamicode.com
首页 > 编程语言 > 详细

Scala笔记整理(二):Scala数据结构—数组、map与tuple

时间:2018-04-18 19:11:47      阅读:166      评论:0      收藏:0      [点我收藏+]

标签:大数据   Scala   

[TOC]


数组

定长数组

如果你需要一个长度不变的数组,可以用Scala中的Array。例如:

val numsArray = new Array[Int] (30) //长度为30的整数数组,所有元素初始化为0
val stringArrays = new Array [String] (30) //长度为30的字符串数组,所有元素初始化为null
val sHello = Array("Hello", "World") //长度为2的Array[String]类型是推断出来的,已提供初始值就不需要new
sHello(0) = "Hello Tom",使用()而不是[]来访问元素

在JVM中,Scala的Array以Java数组方式实现。示例中的数组在JVM中的类型为java.lang.String[]。Int、Double或其他与Java中基本类型对应的数组都是基本类型数组。

举例来说,Array(2,3,5,6,7,10, 11)在JVM中就是一个int[]。

定长数组Array-赋值

  • 方法1
val stringArrays = new Array[String] (5) 
stringArrays(0) = “tom”
  • 方法2
val array = Array(1, 2, 3, 4, 5)
  • 方法3
// Array.fill(length)(value)
val array = Array.fill(5)(3.5)

如果fill第二个参数只写一个值的话,那么该数组的所有元素都是该值,但是如果第二个参数是一个iterator或者random,那么数组就会被赋值为它们的值。

val array = Array.fill(2)(math.random)

变长数组ArrayBuffer

1、对于那种长度按需要变化的数组,Java有ArrayList,C++有vector。Scala中的等效数据结构为ArrayBuffer

2、ArrayBuffer是一种mutable的数据容器,相对于Array来说,最大的区别就是可以自由增删元素。当ArrayBuffer构建完毕后,还可以转换为immutable的Array容器。

import scala.collection.mutable.ArrayBuffer
val buffer = ArrayBuffer[lnt]() // 或者new ArrayBuffer [int],一个空的数组缓冲,准备存放整数

buffer += 1 // ArrayBuffer (1),用+=在尾端添加元素

buffer.append(300)

buffer += (1,2,3,5) // ArrayBuffer(1,1,2,3,5),在尾端添加多个元素,以括号包起来

buffer ++= Array(8, 13, 21) // ArrayBuffer(1, 1, 2, 3, 5, 8,13, 21) //用++=操作符追加任何集合

buffer.insert(2, 150) //在第2元素(索引)后插入150:

buffer.insert(3, 147,21) //在第2元素后插入147,21:

buffer.trimEnd(5) // ArrayBuffer(1, 1, 2),移除最后5个元素,在数组缓冲的尾端添加或移除元素是一个高效的操作

buffer.remove(index, n) //移除第index元素后的n个元素

一个完整的例子如下:

import scala.collection.mutable.ArrayBuffer
object _07ArrayBufferDemo {
    def main(args:Array[String]):Unit = {
        val ab = new ArrayBuffer[Int]()

        // 增
        ab += 1
        println(ab)
        ab.append(2)
        println(ab)
        ab += (3, 4, 5)
        println(ab)
        ab ++= Array(6, 7)
        println(ab)
        // insert
        ab.insert(3, -1, -2)    // 可以在某一个位置插入多个元素
        println(ab)

        // 删
        ab.trimEnd(1)   // 删除数组末尾的1个元素
        println(ab)
        ab.remove(3, 1) // 从索引位置3开始删除,删除2个元素
        println(ab)

        // 改
        ab(3) = -3
        println(ab)

        // 查
        println("==============================")
        for(i <- ab) {
            println(i)
        }
    }
}

遍历数组

val array = Array(1, 2, 3, 4, 5)

1、全遍历常用遍历(//如果不需要使用下标,用这种方式最简单了)

for(i <- array) print(i +" ")

2、条件遍历

for(i <- arrayif i !=2 ) print(i +“ ”) //打印出除2之外的所有整数的值

3、For推导式

在前面,你看到了如何像Java或C++那样操作数组。不过在Scala中,你可以走得更远。从一个数组或数组缓冲出发,以某种方式对它进行转换是很简单的。这些转换动作不会修改原始数组,而是产生一个全新的数组。像这样使用for推导式:

val arr = ArrayBuffer(1, 3, 2, -1, -2)
for(i <- 0 until arr.length) yield arr(i) * 2 //将得到Vector(2, 6, 4, -2, -4)
for(i <- array) yield print(i * 2)  // ArrayBuffer[Unit] = ArrayBuffer((), (), (), (), ())

另外一种等价方法(借助于函数式编程的思想),某些有着函数式编程经验的程序员倾向于使用filter和map而不是守卫和yield,这不过是一种风格罢了与for循环所做的事完全相同。你可以根据喜好任意选择:

array.filter( _ > 0).map{ 2 * _}.foreach(println(_)) //生成array中的正数的两倍的新集合
array.filter {_ > 0}.map {2 * _}.foreach(println //另一种写法

常用算法(Scala内置函数)

1、求和与排序

println(Array(1,7,2,9).sum)

2、求最大值

println(ArrayBuffer("Mary","had","a","little","lamb").max) 

3、排序

  • 升序
val b = ArrayBuffer(1,7,2, 9)
val bSorted = b.sorted //1,2,7,9
b.sortWith(_ < ).foreach(println())

降序

b.sortWith(_ > ).foreach(println())

4、显示数组内容

println(b.mkString("And")) //分隔符
println(b.mkString("<",",",">"))//<1,7,2,9> //指定前缀、分隔符、后缀

多维数组

1、定长多维数组(和Java一样,多维数组是通过数组的数组来实现的)

val array = new Array[Array[Int]](5) 
scala> val array = new Array[Array[Int]](5)
array: Array[Array[Int]] = Array(null, null, null, null, null)

2、Scala中的多维数组同Java中一样,多维数组都是数组的数组。(推荐使用这种方式)

通过 Array.ofDi[类型](维度1, 维度2, 维度3,….)来声明多维数组,如声明二维数组;

或者也可以这么定义用ofDim[T](rows,column, height,…)函数定义,但最多可以定义五维数组。

scala> val array = Array.ofDim[Double](2,3)
array: Array[Array[Double]] = Array(Array(0.0, 0.0, 0.0), Array(0.0, 0.0, 0.0))

scala> for(a <- array) println(a.toList)
List(0.0, 0.0, 0.0)
List(0.0, 0.0, 0.0)

3、变长多维数组

val arr1 = new ArrayBuffer[ArrayBuffer[Int]]()

定长数组和变长数组的转换

1、定长数组a转换成变长数组array:

array = a.toBuffer

2、变长数组array转换成定长数组a:

a = array.toArray

与Java互操作(了解)

由于Scala数组是用java数组实现的,你可以在Java和Scala之间来回传递。可以引入scala.collection.JavaConversions里的隐式转换方法,这样在调用Java方法时,这些对象会被自动包装成Java列表。

举例来说,java.lang.ProcessBuilder类有一个以List<String>为参数的构造器。以下是在Scala中调用它的写法:

  • Scala到Java之间的转换工作
def conversionArray: Unit ={
    import scala.collection.JavaConversions.bufferAsJavaList
    import scala.collection.mutable.ArrayBuffer
    val command = ArrayBuffer("ls", "-al", "/home/cay")
    val pb = new ProcessBuilder(command) // Scala到Java的转换
    println(pb.command())
  • Java到Scala之间的转换工作
def conversionArray: Unit ={
    import scala.collection.JavaConversions.bufferAsJavaList
    import scala.collection.mutable._
    val command = ArrayBuffer("ls", "-al", "/home/cay")
    val pb = new ProcessBuilder(command) // Scala到Java的转换
    println(pb.command())

    import scala.collection.JavaConversions.asScalaBuffer
    import scala.collection.mutable.Buffer
    val cmd: Buffer[String] = pb.command() // Java到Scala的转换
    println(cmd.head +"\t tail=> " + cmd.tail)
  }

Map

Map创建

1、不可变映射

我们可以这样构造一个映射:

val personAges = Map("Alice"-> 20, "Job"->28, "Garry"->18)

上述代码构造出一个不可变的Map[String,Int],其值不能被改变。

也可以用此方法创建Map

val personAges = Map(("Alice"-> 20), ("Job"->28),("Garry"->18))

注:->用来创建元组, "sa" -> 1即(" sa ", 1)

2、可变映射

如果你想要一个可变映射,则用

val personAges = scala.collection.mutable.Map("Alice"->20, "Job"->28, "Garry"->18)

如果想从—个空的映射开始,你需要选定一个映射实现并给出类型参数:

val personAges1 =new scala.collection.mutable.HashMap [String, Int]

在Scala中,映射是对偶的集合。对偶简单地说就是两个值构成的组,这两个值并不一定是同一个类型的,比如("Alice",10)

获取Map中的值

  • 方式1
println("Alice=>  " + personAges.get("Alice111"))

类似于Java中的personAges.get("Alice111"),如果映射并不包含请求中使用的键,则会抛出异常。要检查映射中是否有某个指定的键,可以用contains方法。

  • 方式2:contains方法
val personAlice = if (personAges.contains ("Alice")) { personAges("Alice") }else 0
println("personAlice===> " + personAlice)
  • 方式3
println("Alice1.else=>  " + personAges.getOrElse("Alice",0))     // 如果映射包含键“Alice",返回对应的值;否则,返回0

最后,映射.get(键)这样的调用返回一个Option对象,要么是Some(键对应的值),要么是None,Option对象有get函数,直接调用即可获取原来Map中key所对应的value

更新Map中的值

1、更新可变映射

在可变映射中,你可以更新某个映射的值,或者添加一个新的映射关系,做法是在=号的左侧使用():

personAges("Job") = 31 // 更新键"Job"对应的值
personAges("Garry") = 27 // 增加新的键/值对偶到personAges

或者,你也可以用+=操作来添加多个关系:

personAges += ("Bob"-> 10, "Fred"->7)

要移除某个键和对应的值,使用-=操作符:

personAges -="Alice"

2、更新不可变映射

虽然不能更新一个不可变的映射,但你可以做一些同样有用的操作,即获取一个包含所需要的更新的新映射

val personAges = Map("Alice" -> 20, "Job" -> 28, "Garry" -> 18)
val newPersonAges = personAges + ("Job" -> 10,"Fred" -> 7) // 更新过的新映射
println("newPersonAges=> " + newPersonAges)

同时也可以声明var变量

var personA = Map("Alice"-> 20, "Job"->28, "Garry"->18)
personA = personA + ("Bob"->10, "Fred"->7)
println("personA=> " +personA)

同时移除不可变映射的值

personA = personA -"Alice"  // 其实也相当于是重新创建了一个新的Map对象
println("remove.personA => "+ personA)

遍历Map

val personAges = Map ("Alice"-> 20, "Job"->28, "Garry"->18)

for ((k,v) <- personAges) print("k=> " + k +"\t v=> " + v +" ") println()   // 同时获取key和value

for((k,_)<- personAges) print("k => " + k +" ") println()   // 只获取key

for(k <- personAges.keySet) print("kkkk=> " + k +" ") println() // 只获取key

for((_,v) <- personAges) print("v=> " + v +" ") println()   // 只获取value

for ( v <- personAges.values) print("vvvv=> " + v)  // 只获取value

scala> person.foreach(me => println(me._1)) // 只获取key,通过元组的方式
jieling
xiaoqiutian
xpleaf

scala> person.foreach(me => println(me._2)) // 只获取value,通过元组的方式
22
17
23

要反转一个映射,即交换键和值的位置,可以用:

for ( (k,v) <- personAges) yield print(v,k)

scala> for((k,v) <- person) yield print(v, k)
(22,jieling)(17,xiaoqiutian)(23,xpleaf)res177: scala.collection.mutable.Iterable[Unit] = ArrayBuffer((), (), ())

scala> for((k,v) <- person) yield(v, k) // 应该是这样才对,因为上面的方式值为空的
res178: scala.collection.mutable.Map[Int,String] = Map(23 -> xpleaf, 17 -> xiaoqiutian, 22 -> jieling)

Map排序

val personAges = scala.collection.immutable.SortedMap("Alice"->10,"Fred"->7,"Bob"->3,"Cindy"->8)    // 会按照key的字典顺序进行排序
println("personAges==> " + personAges)  // personAges==> Map(Alice -> 10, Bob -> 3, Cindy -> 8, Fred -> 7)

val months = scala.collection.mutable.LinkedHashMap("January" -> 1,"February" -> 2,"March" -> 3)    // 创建一个顺序的Map
months += ("Fourth" -> 4)
println("months=> " + months)   // months=> Map(January -> 1, February -> 2, March -> 3, Fourth -> 4)

tuple

元组定义

映射是键/值对偶的集合。对偶是元组( tuple)的最简单形态,元组是不同类型的值的聚集。元组的值是通过将单个的值包含在圆括号中构成的。例如:

(1, 3.14, "Fred")

是一个元组,类型为:

Tuple3 [Int, Double, java.lang.String]

下面是元组简单的定义方式:

val t = (1,3.14, "John")
println(t._1 +"\t " + t._2 +"\t " + t._3)

需要注意的是:和数组或字符串中的位置不同,元组的各组元从1开始,而不是0。你可以把t._2写为t _2,即用空格而不是句点,但不能写成t_2

当然也可以通过下面的方式进行定义:

scala> val tuple = new Tuple4[String, Int, String, Double]("xpleaf", 1, "guangdong", 17000)
tuple: (String, Int, String, Double) = (xpleaf,1,guangdong,17000.0)

获取元组

val t = (1, 3.14, "John", "Garry")
println(t._1 +"\t " + t._2 +"\t " + t._3 + "\t" + t._4)
val (first,second,third,fourth) = t // 这种赋值方式与Python是一样的,通过元组赋值给多个值
println(first + "\t" + second + "\t" + third + "\t" + fourth)
println("New York".partition ( _.isUpper))  // (NY,ew ork)

遍历元素:

t.productIterator.foreach(x => print(x +" "))

Scala笔记整理(二):Scala数据结构—数组、map与tuple

标签:大数据   Scala   

原文地址:http://blog.51cto.com/xpleaf/2105020

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!