掌握Spark机器学习库-07.6-线性回归实现房价预测

时间：2018-10-15 12:23:30 阅读：552 评论：0 收藏：0 [点我收藏+]

标签：creat example session ade ora color ota count oca

数据集

house.csv

数据概览

技术分享图片

代码

package org.apache.spark.examples.examplesforml

import org.apache.spark.ml.feature.VectorAssembler
import org.apache.spark.ml.regression.LinearRegression
import org.apache.spark.sql.SparkSession
import org.apache.spark.{SparkConf, SparkContext}

import scala.util.Random
/*
日期：2018.10.15
描述：
7-6
线性回归算法
预测房价
数据集：house.csv
 */
object Linear {
  def main(args:Array[String]): Unit ={
    val conf=new SparkConf().setMaster("local[*]").setAppName("LinearregRession")
    val sc=new SparkContext(conf)
    val spark=SparkSession.builder().config(conf).getOrCreate()
    val file=spark.read.format("csv")
      .option("header","true")//y
      .option("sep",";")//分隔符
      .load("D:\\机器学习算法准备\\7-6线性回归-预测房价\\house.csv")
    import spark.implicits._
    val random =new Random()
    val data=file.select("square","price")
      .map(row => (row.getAs[String](0).toDouble,row.getAs[String](1).toDouble,random.nextDouble()))
      .toDF("square","price","rand")
      .sort("rand")
    data.show()

    val assembler=new VectorAssembler()
      .setInputCols(Array("square"))
      .setOutputCol("features")
    val dataset=assembler.transform(data)
    var Array(train,test)=dataset.randomSplit(Array(0.8,0.2),1234L)
    train.show()
    println(test.count())

    var regression=new LinearRegression().setMaxIter(10).setRegParam(0.3).setElasticNetParam(0.8)
    val model=regression.setLabelCol("price").setFeaturesCol("features").fit(train)
    model.transform(test).show()

    val s = model.summary.totalIterations
    println(s"iter: ${s}")

  }
}

输出：

技术分享图片

掌握Spark机器学习库-07.6-线性回归实现房价预测

标签：creat example session ade ora color ota count oca

原文地址：https://www.cnblogs.com/moonlightml/p/9789344.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行