基于R语言实现Lasso回归分析

转载   2017-03-14   浏览量:567


主要步骤:

将数据存成csv格式,逗号分隔 在R中,读取数据,然后将数据转成矩阵形式 加载lars包,先安装 调用lars函数 确定Cp值最小的步数

确定筛选出的变量,并计算回归系数

具体代码如下:
这里写图片描述
这里写图片描述
这里写图片描述
需要注意的地方:
1、数据读取的方法,这里用的file.choose( ),这样做的好处是,会弹出窗口让你选择你要加载进来的文件,免去了输入路径的苦恼。
2、数据要转为矩阵形式
3、(la) 可以看到R方,这里为0.66,略低
4、图如何看? summary的结果里,第1步是Cp最小的,在图里,看到第1步与横轴0.0的交界处,只有变量1是非0的。所以筛选出的是nongyangungun

Ps: R语言只学习了数据输入,及一些简单的处理,图形可视化部分尚未学习,等论文写完了,再把这部分认真学习一下~~在这里立个flag

转载自:https://www.2cto.com/database/201703/611461.html

招聘 不方便扫码就复制添加关注:程序员招聘谷,微信号:jobs1024



《数据挖掘:R语言实战》神经网络完整代码
《数据挖掘:R语言实战》神经网络完整代码。
R语言中的多维数组、矩阵、列表、数据框
R语言中的多维数组、矩阵、列表、数据框。在R中,数组(Arrary)可以看做是带多个下标的相同类型的元素集合,常用的是数值型的数组如矩阵,也可以是别的类型的数组,比如字符型,逻辑型等。
《数据挖掘:R语言实战》P234中,UCI数据库中白酒品质研究数据集4898个样本下载问题
《数据挖掘:R语言实战》P234中,UCI数据库中白酒品质研究数据集4898个样本下载问题
R语言中fivenum函数的用法?
R语言中fivenum函数的用法?主要是求平均:fivenum():返回五个数据:最小值、下四分位数、中位数、上四分位数、最大值。
R语言中cut函数的用法?
R语言中cut()函数的用法?cut():切割将x的范围划分为时间间隔,并根据其所处的时间间隔对x中的值进行编码。参数:breaks:两个或更多个唯一切割点或单个数字(大于或等于2)的数字向量,给出x被切割的间隔的个数。breaks:采用fivenum()。
R语言--批量读取和写入目录
R语言--批量读取和写入目录。在对很多数据处理时,通常要循环读取文件夹中的文件,这个时候需要批量读取和写入文件,在R语言中,批量读取和写入文件夹中文件的方法如下所示。
R语言检测文件名后缀案例
R语言检测文件名后缀案例。
R语言实战总结--第二章数据类型及数据结构
R语言实战总结--第二章数据类型及数据结构。
R语言笔记
最近做的几个项目都是用R语言来完成的。正如老师所说,学起来很快,忘起来也很快。整理一下放在这里,方便以后查阅。安装所需的包:install.packages("xxxx")加载包:library("xxxx")显示/改变工作目录getwd()/setwd("d:/temp")文件操作:1.读取csv文件var=read.csv("demo.csv",header=FALSE)——header表示是