读取csv格式数据
数据来源是西南财经大学 司亚卿 老师的课程作业
方法一:read.csv()函数
1 file.choose()2 read.csv("C:\\Users\\Administrator\\Desktop\\Astocks.csv",3 head=T,sep=',',nrows = 5,stringsAsFactors = FALSE)
file.choose():读入该文件,这样我们知道该文件的具体路径。
file参数: 路径和文件名,windows下用的是反斜杠\\
head=T: 是首行问题,T表明文件有标题,将文件中的第一行作为列名。若head=F,则原来文件没有
标题,增加一行V1,V2,...作为文件的第一行,即作为列名。read.csv()函数默认为head=T。
sep=“,”: 分隔符问题,这里分隔符的选择会影响输入的被引用的字符串。
nrows=200: 行数问题,表明读取该文件的前200行。
stringsAsFactors = FALSE : 字符型数据读入时自动转换为因子,防止转换为因子,
令参数stringsAsFactors = FALSE, 防止导入的数据任何因子的转换。
还有一个参数:fileEncoding='utf-8',在win下一般不用设置,但是在Linux下若出现乱码问题,基本上就是要加上这个参数。就这个文件而言加上这个会报错,应该是fileEncoding='GBK',这样才能正常运行。这里涉及到字符集的问题。
方法二:read.table()函数
1 a<-read.table('C:\\Users\\Administrator\\Desktop\\Astocks.csv',2 head=T,sep=',',nrows = 5,stringsAsFactors = FALSE )3 a
1 a[1:3,1:3]
结果
切片:选取行数和列数(选取1到3行和1到3列)
也可以进行这样读取:
1 a<-read.table(file.choose(),header = T,sep = ',',nrows = 5)2 a
结果: