美文网首页
LinearRegressionWithSGD 问题

LinearRegressionWithSGD 问题

作者: moonmoon222 | 来源:发表于2016-10-06 20:16 被阅读0次

数据源(file/data/mllib/input/ridge-data/defDemo1):

42,0.10

43.5,0.11

45,0.12

45.5,0.13

45,0.14

47.5,0.15

49,0.16

53,0.17

50,0.18

55,0.20

55,0.21

60,0.23


代码:

import org.apache.spark.mllib.linalg.Vectors

import org.apache.spark.mllib.regression.{ LinearRegressionWithSGD, LabeledPoint }

import org.apache.spark.{ SparkConf, SparkContext }

def main(args: Array[String]): Unit = {

val conf=new SparkConf().setMaster("local").setAppName(this.getClass().getSimpleName().filter(!_.equals('$')))

val sc=new SparkContext(conf)

val data=sc.textFile("file/data/mllib/input/ridge-data/defDemo1")//获取数据集路径

val parsedData=data.map { line =>//开始对数据集处理

val parts=line.split(',')//根据逗号进行分区

LabeledPoint(parts(0).toDouble, Vectors.dense(parts(1).trim().split(' ').map(_.toDouble)))

}//转化数据格式

//val parsedData = data.map { line => //开始对数据集处理

//val parts = line.split(',') //根据逗号进行分区

//LabeledPoint(parts(0).toDouble, Vectors.dense(parts(1).trim().split(' ').map(d=>{

//(d.toDouble-0.10)/(0.23-0.10) //归一化 (x-minX)/(maxX-minX)

//})))

//} //转化数据格式 归一化无效果

parsedData.foreach(line=>{

println(line.label+" , "+line.features)

})

val model= LinearRegressionWithSGD.train(parsedData,1000,0.001)//建立模型

val result=model.predict(Vectors.dense(0.19))//通过模型预测模型

println("model weights:")

println(model.weights)

println("model intercept:")

println(model.intercept)

println("result:")

println(result)//打印预测结果

sc.stop

}

运行结果:

model weights:

[0.11670307429843765]

model intercept:

0.0

result:

0.022173584116703154

实际线性函数(y=mx+n)应该接近:y=130.835x + 28.493

当x=0.19 时,y=53.35

LinearRegressionWithSGD 执行的结果跟实际结果函数对不上.....

相应的数据R语言执行的结果:

相关文章

  • LinearRegressionWithSGD 问题

    数据源(file/data/mllib/input/ridge-data/defDemo1): 42,0.10 4...

  • 问题,不是问题;问题,还是问题

    问题,不是问题 今天,是到新校舍的第一天。没水没电没床铺,教室里连黑板都没有。面对诸多问题,幸运的是...

  • 问题问题还是问题?

    问题实在是太多了!菜要这样做,不这样做是问题;饭没煮好,也是问题;自己不知道学会搞吃的也是问题;生活好像只剩下无尽...

  • 问题不是问题,如何对待问题才是问题。

    这几天身体状态一直不太好,反复头疼,但仍然坚持上课,我知道我要什么。我渴望找到那个自由绽放的自己。 早上怀着期待的...

  • “问题”不是问题,认为“是问题”才是问题

    大概从一个多星期前,腹部就开始有间断的疼痛感了,有时甚至会很难受。这种感觉在今天上午坐车时达到了最强烈,我简直不知...

  • 问题不是问题,怎样看问题才是问题。

    焦点幸福教师 坚持分享第1349天2020.11.17周二 小风波 1.购物 最近布置班级文化,我从网上购...

  • 问题的问题

    “你别总给我说问题、问题,给我提一些建设性的建议行不?” “你咋变成了意见篓子?” 满腔热血地跑到领导面前表功,结...

  • 问题的问题

    “你别总给我说问题、问题,给我提些建设性的建议行不?” “你咋变成了意见篓子?” 满腔热血地跑到领导面前表功,结果...

  • 问题不是问题!?

    创45:3-5 约瑟对他弟兄们说:“我是约瑟,我的父亲还在吗?”他弟兄不能回答,因为在他面前都惊惶。约瑟又对他弟兄...

  • 问题的问题

    问题家庭的问题是:家长本身用着有问题的方法教育孩子,没问题的孩子也变得有问题。 而且更严重的问题是:家长并没有意识...

网友评论

      本文标题:LinearRegressionWithSGD 问题

      本文链接:https://www.haomeiwen.com/subject/ihaeyttx.html