范冰冰佟大为溶室视频,动漫美女黄漫视频,陈乔恩内衣视频

初始化

options(stringsAsFactors=F,scipen=99)rm(list=ls());gc()getwd() 獲得工作路徑信息setwd() 設(shè)置工作路徑1
2
3
4

清空控制臺

快捷鍵control+L1

獲取目錄下所有文件名

filenames=dir("/Users/yuyin/Downloads/數(shù)據(jù)/Excel數(shù)據(jù)")##or推薦第二種setwd("/Users/yuyin/Downloads/數(shù)據(jù)/Excel數(shù)據(jù)")filenames=dir()1
2
3
4

讀取文件輸出文件

require(data.table)library(data.table)da<- fread("/Users/yuyin/Downloads/train_all_weekday.csv",header = FALSE)#讀取gbk編碼文件u<- read.csv("JData_User.csv",fileEncoding='gbk',header = TRUE)write.table (out, file ="/Users/yuyin/Downloads/2.csv",sep =",",row.names = F,col.names=F,quote =F)1
2
3
4
5
6

讀寫xlsx文件

library("xlsx")t=read.xlsx('吉林2014.xlsx',sheetIndex=1)write.xlsx(t, file="./s.xlsx")1
2
3

SQL查詢

library(sqldf)re=sqldf("select V1,V2,V6 from da where V2>=20161004 and V2<=20161017 order by V1,V2")1
2

繪圖

library(recharts)echartr(tmp,as.character(tmp$V2),V6,type = 'line')1
2

分位數(shù)

#四個(gè)分位數(shù)quantile(ck)  #自定義分位數(shù) quantile(ck,  probs = c(0.85,0.95))median中位數(shù)mean均值1
2
3
4
5
6

查看行數(shù)

nrow(data.frame)1

字符串操作

拼接字符串

##方法一paste(Y,'/',m,'/',d,sep='')##方法二library(stringr)pout=str_c(path,name,collapse='')1
2
3
4
5

替換字符串

name=str_replace_all(name,"/","_")1

DF去重

tt=unique(tt)1

合并數(shù)據(jù)框

合并行rbind(t1,t2)合并列cbind(t1,t2)1
2
3
4

DF排序

x=x[order(x$bad_comment_rate,decreasing=F),]1

生成隨機(jī)數(shù)

runif(n, min=0, max=1) 均勻分布rnorm(n, mean=0, sd=1) 正態(tài)分布sample(seq(0,100,by=1),1,replace=TRUE) 抽樣生成隨機(jī)數(shù)1
2
3

最大最小歸一化

b1=(data[,1]-min(data[,1]))/(max(data[,1])-min(data[,1]))  b1=(d-min(d))/(max(d)-min(d))  1
2

日期轉(zhuǎn)換

dateChar<-("2014-04-06")dtV<-as.POSIXct(dateChar,format="%Y-%m-%d")##或者dtV<-as.Date(dateChar,format="%Y-%m-%d")format(dtV,"%Y/%m/%d %H:%M:%S")#轉(zhuǎn)換為2014/4/6Y=format(dtV,"%Y")m=as.character(as.numeric(format(dtV,"%m")))d=as.character(as.numeric(format(dtV,"%d")))dt<-paste(Y,'/',m,'/',d,sep='')1
2
3
4
5
6
7
8
9

計(jì)算時(shí)間差

d <- c('2013-12-05 18:43:00','2013-08-23 22:29:00')difftime(d[2],d[1])difftime(strptime(d, "%Y-%m-%d %H:%M:%S")[2],strptime(d, "%Y-%m-%d %H:%M:%S")[1],units='secs')1
2
3

高效數(shù)據(jù)清洗包dplyr代替sqldf

速度比sqldf快很多適合數(shù)據(jù)量大處理

library(dplyr)#將數(shù)據(jù)整理成的tbl_df數(shù)據(jù)(處理速度快) iris <- tbl_df(iris)##變量篩選select  對應(yīng)select  刪除-select(iris,Sepal.Length,Sepal.Width)select(iris,-Species)##對數(shù)據(jù)運(yùn)算并添加為新列mutate() 對應(yīng) count(a) as t1mutate(iris,t1=Sepal.Length*2)##計(jì)算n(): 計(jì)算個(gè)數(shù)n_distinct() #: 計(jì)算 x 中唯一值的個(gè)數(shù)first(x), last(x) 和 nth(x, n)#: 返回對應(yīng)秩的值, 類似于自帶函數(shù) x[1], x[length(x)], 和 x[n]##過濾filter  對應(yīng) wherefilter(iris,Sepal.Length>5,Sepal.Width<4)filter(iris,Sepal.Length>5 & Sepal.Width<4 & (Species == "setosa" | Species == "versicolor"))##數(shù)據(jù)排序arrange  對應(yīng) order byarrange(iris,Sepal.Length)arrange(iris,desc(Sepal.Length))##匯總group_by() 分組-匯總group_by(iris, Species)group_by(iris,Species,Petal.Width)  %>% summarise(c1=n(),c2=n_distinct(Species))##計(jì)算summarise()summarise(iris,c1=n(),c2=mean(Sepal.Length))##多步操作連接符%>%filter(iris,Sepal.Length>5,Sepal.Width<4) %>% summarise(c1=n(),c2=mean(Sepal.Length)) ##抽樣sample_n sample_fracsample_n(iris,20) ##左連接 ab交集 差集left_join(a, b, by="x1")right_join(a, b, by="x1")inner_join(a, b, by="x1")##保留匹配的數(shù)據(jù)outer_join(a, b, by="x1")##保留所有數(shù)據(jù)semi_join(a, b, by="x1") # 數(shù)據(jù)集a中能與數(shù)據(jù)集b匹配的記錄anti_join(a, b, by="x1") # 數(shù)據(jù)集a中雨數(shù)據(jù)集b不匹配的記錄intersect(x, y): x 和 y 的交集（按行）union(x, y): x 和 y 的并集（按行）setdiff(x, y): x 和 y 的補(bǔ)集 （在x中不在y中）##列合并bind_cols(y, z)##行合并bind_rows(y, z)1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41

參考(特別是文章后面的翻譯圖片)

查詢相關(guān)R包

library(sos)findFn('onehot')##具體看sos的help1
2
3

本站僅提供存儲服務(wù)，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點(diǎn)擊舉報(bào)。

中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频

初始化

清空控制臺

獲取目錄下所有文件名

讀取文件輸出文件

讀寫xlsx文件

SQL查詢

繪圖

分位數(shù)

查看行數(shù)

字符串操作

拼接字符串

替換字符串

DF去重

合并數(shù)據(jù)框

DF排序

生成隨機(jī)數(shù)

最大最小歸一化

日期轉(zhuǎn)換

計(jì)算時(shí)間差

高效數(shù)據(jù)清洗包dplyr代替sqldf

查詢相關(guān)R包