范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

从零开始学R数据分析,数据概览

  对于统计学专业的学生,对于R软件的使用并不陌生,堪称数理统计软件的标配,R软件也可以做数据处理和数据分析,虽说职场工作对于R软件使用不多,但是R软件绝对是科研人数据分析的最爱。
  本文主要讲解获取数据后,如何对于数据的整体情况做预览,包括数据导入、数据表查看、数据导出等功能,下面一起来学习。 示例工具:R x64 3.5.3、RStudio
  本文讲解内容:数据概览
  适用范围:数据导入、导出、概览
  R软件读取数据文件,这里主要介绍三种文件的读取,分别是文本文件读取、csv文件读取、xlsx文件读取。
  一、数据读取与生成
  1.纯文本文件
  读纯文本文件使用的是read.table()函数,read.table()函数的参数如下所示。 read.table(file, header = FALSE, sep = "", quote = """",row.names, col.names,nrows = -1,skip = 0, encoding = "unknown", text, skipNul = FALSE)
  file是读入数据的文件名,header=TRUE表示所读数据的第一行为变量名,sep是数据分隔的字符,row.names, col.names对于行名和列名可以指定命名,skip表示读数据时跳过的行数,使用ead.table()函数导入文本数据如下所示,指定分隔符为逗号,第一行作为变量名。 df <- read.table("C:Users尚天强DesktopR数据集data.txt",sep = ",",header=TRUE) df
  2.CSV文件
  读CSV文件跟读文本文件的参数一样,参数如下所示。 read.csv(file, header = TRUE, sep = ",", quote = """,dec = ".", fill = TRUE, comment.char = "")
  这里直接使用read.csv读取,默认是逗号分隔这里可以不写。 df1 <- read.csv("C:Users尚天强DesktopR数据集data.csv") df1
  3.XLSX文件
  R读取Excel数据,需要安装readxl包,安装完成才能加载使用。 #安装包 install.packages("readxl")  #进行加载包 library(readxl)
  安装完成readxl包后,使用read_excel命令即可导入数据。 df2=read_excel("C:Users尚天强DesktopR数据集data.xlsx") df2
  4.生成数据表
  生成数据表使用data.frame命令,与之前pandas生成数据表类似,生成的数据表如下。 #手动创建数据表 data<-data.frame(ID=c("c001","c002","c003","c004","c005","c006","c007","c008","c009","c0010"),                              NAME=c("Rmesh","Khilan","Kaushik","Chaitali","Hardik","Komal","Tom","Muffy","Susan","Kevin"),                             AGE=c(23,20,23,25,27,24,26,31,26,30),                             ADDRESS=c("Ahmed","Delhi","Kota","Mumbai","Bhopal","MP-A","MP-B","Indore","JP-No.1","JP-No.2"),                             SAL=c(2000,1500,2000,NA,8500,NA,5500,9500,NA,900))
  二、数据概览
  1.数据维度 #查看数据维度 dim(data)
  数据的维度为10行5列。
  2.查看数据表 #查看数据表 fix(data)
  调用fix函数,会出现交互模式,对于其中的一些数据和变量名进行修改,使用起来跟EXCEL一样方便。
  3.查看特定列的格式
  使用typeof函数查看数据格式,其中ID、NAME、ADDRESS为字符类型,AGE、SAL为数值类型。 typeof(data$ID) typeof(data$NAME) typeof(data$AGE) typeof(data$ADDRESS) typeof(data$SAL)
  4.查看空值
  Is.na函数用于检查R中的空值,当返回的结果为True时,说明数据有空值,返回的结果为False时,说明数据没有空值,以下可以看到数据有3个空值。 #查看空值 is.na(data)
  查看具体某一列是否有空值,可以单独索引那一列,然后使用Is.na函数。 #查看单列的空值 is.na(data$SAL)
  计算某一列有几个空值,可以先判断是否为空值,然后使用length函数计算其个数,听过计算可以得出SAL列有3个空值。 #判断并计算某一列有几个空值 length(data$SAL[is.na(data$SAL)==TRUE])
  5.查看唯一值
  unique()函数用于查看数据表的唯一值,功能与EXCEL中去除重复值的功能一致。 #查看数据表的唯一值(删除重复值) unique(data)
  对于单列去除重复值,可以将那一列索引出来,然后使用unique()函数去除重复值。 #查看数据表中SAL列的唯一值 unique(data$SAL)
  6.查看数据表数值
  R中有多个函数用来查看数据表中的数据,包括数据的范围、数据的极值等,下面的代码用于查看数据范围与极值的范围。 #查看数据范围 range(data$AGE) #查找最小值 min(data$AGE) #查看最小值最在的行位置 which.min(data$AGE) #查找最大值 max(data$AGE) #查看最大值所在的行位置 which.max(data$AGE)
  7.查看列名称
  names()函数查看数据表中的列名称。 names(data)
  8.数据预览
  head()函数用来查看数据表中的前N行数据,默认显示前10行数据,可以自己设置参数n的值来确定查看的行数。 #查看前5行 head(data,n = 5)
  tail函数与head()函数相反,用来查看数据表中后N行的数据,默认显示后10行数据,可以自己设置参数n的值来确定查看的行数。 #查看后3行 tail(data,n=3)
  三、数据导出
  1.导出为csv文件 #输出到csv格式文件 write.csv(x = data,file = "C:Users尚天强Desktopout_table.csv",row.names = FALSE)
  2.导出为txt文件 #输出到txt格式文件 write.table(x=data,file = "C:Users尚天强Desktopout_txt.txt",sep = ",",row.names = FALSE)

美股三大股指集体重挫互联网半导体板块拖累纳指跌近4。3美股三大股指集体重挫互联网半导体板块拖累纳指跌近4。3财联社5月10日电,美股三大股指大幅收跌,道指跌1。99,纳指跌4。29,标普500指数跌3。2。油气银行半导体和互联网科技板直板旗舰手机终极演化不妥协的中兴Axon40Ultra(计育青文)在中兴手机的产品线里,Axon系列一直承担了高端旗舰的角色,主打最新科技最新配置最强体验。从2019年与中国5G网络同步宣告商用,到2020年全球第一次配备屏下摄像头,跑出芯片研发的中国速度在针尖上跳舞的青年造芯者在一个不足指甲盖大小的芯片上布局几十亿个晶体管,其难度相当于在一根头发直径十万分之一大小的地基上盖高楼大厦。也正因此,集成电路是公认的人类迄今制造过最复杂的产品之一。一群年轻人挑起485000!中国5G大洗牌华为还是输了,最大黑马还是国产的485000!中国5G大洗牌华为还是输了,最大黑马还是国产的!大家都知道,全球手机巨头在不停地变换,从最初的摩托罗拉到诺基亚,再到如今的三星。但是如今三星在中国手机市场的份额已经越不只有华为,中国十大领先世界的产业都知道中国产品价格便宜,大多时候并不是我们用的材料差,或者技术弱,更大原因是中国本身超大规模市场带来的极大边际成本优势,能让成本降低30以上,从而使我们的产品在国际上存在较大竞争力GoogleAds中国第一社群2022年05月10日一分钟跨境新闻分享GoogleAds中国第一社群跨境早报NO。1行业新闻1。2022年第一季度意大利网购消费者达3330万人2。阿里巴巴全球速卖通发布5月韩国跨境市场洞察35月TikTok推出跨境商帝豪L雷神HIX全球混动领域的YYDS帝豪L雷神HIX在当前增速快,潜力大,竞争小的PHEV市场下,帝豪家族不断向上,开拓新能源时代,推出旗下首款雷神超级电混全能轿车帝豪L雷神HIX,天花板级技术优势,全球混动领域的Y下一个互联网风口猜想地图?前言关于地图的应用,之前一直想分享出来,做过两个视频,第一个视频走马观花似的说了一下心中的想法,当时在发烧,稀里糊涂的就上传了,朋友说没看懂,后来聊天聊起来,发现视频完全没有讲清楚同方股份董秘回复我们已经关注到知网的舆情知网也在进行反思,积极进行整改同方股份(600100)05月09日在投资者关系平台上答复了投资者关心的问题。投资者目前,知网因高昂的使用费引来科研院所高校学子和教授们的声讨天下苦知网久已!,面对国内外互联网巨头宁德时代被大佬质疑庞氏骗局,氢能源有机会吗?5月9日著名私募基金大佬董宝珍痛斥宁德时代,是否基金庞氏骗局。氢能源会取代锂电会成为下一个风口吗?据报道俄乌冲突后,在德国影响力排名第一的副总理绿党领袖哈贝克为解决能源危机去阿联酋炬芯科技新一代高端蓝牙音箱芯片ATS283XP已大规模量产炬芯科技在最新披露的投资者关系活动记录中指出,公司新一代的高端蓝牙音箱芯片ATS283XP目前已进入大规模量产阶段。公司第一代高集成度的智能手表芯片ATS308X系列已成功推出,目
港珠澳大桥,历经7年建设,今年终于可以开车去香港了港珠澳大桥是,2009年12月开建,是香港,澳门,珠海三地政府合资建造的方案,投资超过1000亿元。港珠澳大桥它是世界上最长的跨海大桥,全长55公里,也是施工最难,最复杂的大桥,它刚刚,这位娶了女明星的前首富,栽了一hr悬赏2100余万元!只为抓住前山西首富著名富二代李兆会!9月15日,上海市第一中级人民法院公开发布一则执行悬赏公告。公告显示,上海一中院执行的美锦能源集团有限公司与上海海博鑫永劫无间锦鲤杯战神实锤!虎牙狂鸟状态正猛,不吃鸡照样拿第一作为永劫无间首届官方赛事,在为其两天的单排赛的激烈角逐结束后,锦鲤杯三排赛的比赛也随之拉开了序幕。从阵容来看,本次三排赛包含了虎牙等各大平台通过分站赛保送决赛的队伍,以及在入围赛中娇小女生秋冬怎么穿?注意这3要3不要,轻松穿出瘦高感对于小个子女生来讲,每年到了秋冬季节搭配的时候都会非常纠结,因为身高不够很容易在秋冬季节搭配中因为穿得太厚呈现出显矮又显胖的搭配效果。因此对于小个子女生们来讲,在秋冬季节穿搭中,既驱动IC大厂忙于扩产与涨价,LED显示缺芯难题何时解决?全球最大的晶圆代工厂台积电宣布,将会从明年第一季度开始上调代工价格,16纳米及以上的成熟制程芯片价格上调10至20,7纳米及更先进制程芯片的价格上调10。若消息属实,恐将引发新一轮vivoS5正式开售,销售场面火爆,成2。5K3K价位段冠军就在近日,预热已久的vivoS5终于正式开售了。其凭借着出色的外观设计和强劲的拍照实力,在还没开售之前就引起了很多消费者的关注了。而在正式开售以后,vivoS5更是遭到了V粉们的疯玩转新零售,LED透明屏成时尚商圈新宠儿LED显示屏技术近年来不断发展,衍生出众多极具创意的新产品。LED透明屏就是其中之一,它以应用场景广,屏体通透,轻薄,高亮度等特点受到了广大终端客户的欢迎。随着新零售概念的兴起,各电商平台都在百亿补贴,谁才是真补贴?比一比就知道真相刚刚过去的一年,电商行业好热闹。从去年的618开始,新电商拼多多百亿补贴横空出世,粗暴式一降到底的价格引起整个行业震动,拼多多也一举成为了网友心中的价格屠夫。紧接着,各大传统平台纷为党献礼心向党共起舞百人街舞快闪活动掀起热浪,献上中山祝福!历经百年征程,饱经风雨沧桑,中国共产党从一艘小小红船发展成为领航中国行稳致远的巍巍巨轮,终于迎来百年华诞。为庆祝中国共产党建党100周年,由小米第一款感应手电筒能有多方便?能当充电宝感应灯,是很多朋友都熟悉的产品了,但是感应手电筒是个什么东西?小编之前也是没听说过,这次刚好收到米家感应手电筒的抢先体验版本,和米粉们一起分享一下。笔者对这个米家这个感应手电筒还是WiFi信号随身行,蒲公英X4C4G路由器搁哪哪有网笔者发现在互联网信息时代竟有很多场景无法自由上网,给日常生活造成一丢丢的不愉快。就像笔者农村老家父母住的老房子,因为附近没有光纤端口拉不到网线,想装个网络摄像头监护老人家也是有想法