① r語言的下移命令
1.getwd()#查看當前工作目錄
2.setwd('E:graation-design/OC/sctransform')#設置工作路徑,引號內的內容是一個例子,注意路徑最好不要有中文和特殊符號。
3.install.packages.('包')#下載包
4.library(包)#載入包
5.update.packages(包)# 可以更新已經安裝的包。
6.help(package = "包") # 獲取該R包的幫助文件
7.head(object) #查看對象的前6行
8.tail()#查看對象的後6行
9.[,1]#訪問數據的第一列
10.rm(object) #刪除對象
11.save.image("myfile") #保存工作空間到文件myfile中(默認值為.RData)
12.example("foo")#函數foo的使用示例(引號可以省略)
13.class(object) #顯示某個對象的類或類型
14.c()#定義向量
15.print() #展示數據
16.mode() # 查看數據類型
17.na.rm = TRUE# 去除缺失值
18.is.na() #檢查是否有缺失值
19.na.omit() # 刪除包含缺失值的行
20.nchar() #統計字元串長度
21.substr(x = ,start = 1, stop = 3) # 提取字元串(首字母大寫)
22.toupper()#將字元串都轉化成大寫
23.tolower() #將字元串都轉化成小寫
24.gsub("^(\\w)","\\U\\1",tolower(temp),perl = T) #首字母大寫
25.gsub("^(\\w)","\\L\\1",upper(temp),perl = T) #首字母小寫
26.Sys.Date() # 顯示目前系統的時間
27.read.table("c:/路徑",seq = "") # 讀取excel
28.read.table(網址) #讀取網站內容
29.read.table("clipboard")#讀取剪切板中的文件
30.read.table(gzfile("文件")) #讀取壓縮文件
31.write(x,file = "x,txt") #輸出文本
32.write.table(x,gzfile("文件名"))# 輸出壓縮文件
② 【每天一個R語言命令】-read.table
以R自帶的mtcars數據為例進行說明
【描述】
【參數】
(1)file
file是一個帶分隔符的ASCII文本文件。
(2)header
一個表示文件是否在第一行包含了變數的邏輯型變數。
如果header設置為TRUE,則要求第一行要比數據列的數量少一列。
(3)sep
分開數據的分隔符。默認sep=""。
read.table()函數可以將1個或多個空格、tab製表符、換行符或回車符作為分隔符。
(4)quote
用於對有特殊字元的字元串劃定接線的字元串,默認值是TRUE。
【用法】
③ R語言基礎知識筆記
1、向量是用於存儲數值型,字元型或者邏輯型數據的一維數組。執行組合功能的函數為c(),可以用來創建向量。向量可根據位置進行索引,需要用[]。
2、矩陣是一個二維數組,每個元素都擁有相同的模式,可通過函數matrix()創建矩陣。
3、數組是一個可以在兩個以上維度存儲數據的數據對象。例如,如果創建尺寸(2,3,4)的數組,那麼就是創建4個矩形矩陣每個2行3列。數組只能存儲數據類型。
4、矩陣和數組一樣都只能包含一種數據類型,當有多種模式的數據時,使用數據框就更為方便。數據框可以用函數data.frame () 創建。
5、$ 被用來選取一個給定數據框中的某個特定變數。
6、attach()綁定數據集,detach()解除數據集。
7、with:attach,detach最好在單獨的數據框內使用,在多個同名對象最好不要使用,函數with(),可以再具有多個同名對象的數據框內使用,但是必須加入花括弧{},這樣就無須擔心名稱沖突了,但是它也有局限性,賦值僅在此函數的括弧內生效。
8、列表是一些對象的有序集合。
9,、數據導入 read.table(),其中header = T,代表第一行為變數名稱,不作為數據,header = F相反。sep代表數據分隔符,txt為"\t",csv為","。
10、table函數,用 table() 函數統計因子各水平的出現次數(稱為頻數或頻率)。
>sex = c("女","女","女","男","男")
>table(sex)
>sex
男 女
2 3
求眾數
> aim = table(sex)[table(sex)==max(table(sex))]
> aim
女
3
> max(table(sex))
[1] 3
> table(sex)==max(table(sex))
sex
男 女
FALSE TRUE
11、 無尺度網路: 是指在某一復雜的 系統 中,大部分節點只有少數幾個連結,而某些節點卻擁有與其他節點的大量連結。這些具有大量連結的節點稱為「集散節點」,所擁有的連結可能高達數百、數千甚至數百萬。這一特性說明該網路是無尺度的,因此,凡具有這一特性的網路都是無尺度網路。
12、options(stringsAsFactors = F)
#在調用as.data.frame的時,將stringsAsFactors設置為FALSE可以避免character類型自動轉化為factor類型。
13、class():查看數據結構:vector、matrix、array、dataframe、list。
14、str():作用用英語來表示是:check classification of viriables,一般用於檢查數據框當中有哪些數據。
15、mode() :查看數據元素類型。
16、typeof() :查看數據元素類型,基本等同於mode(),比mode()更為詳細。
17、example():假設有一個函數foo,example("foo"),函數foo的使用示例。
18、apropos():列出名稱中含有foo的所有可用函數。apropos("foo",mode="function")。
19、data():列出當前已載入包中所含的所有可用示例數據集。
20、ls():列出當前工作空間中的對象。
21、rm():移除(刪除)一個或多個對象。
22、history(#):顯示最近使用過的#個命令(默認值為25)。
23、options():顯示或設置當前選項。有一個收藏文件有介紹options的功能。
24、boxplot():生成盒型圖。
25、sum():計算和。sum(x,na.rm = TRUE)。
26、median():計算中位數。
27、cbind():以列結合變數。cbind(x,y,z)。
28、rbind():以行結合變數。
29、vector():以向量形式結合數據。vector(length = 10)。
30、rep():以矩陣形式結合數據。rep(c(1,,2,3),each = 10)
31、seq():生成一個有序的數列。seq(1,10)。
32、dim():矩陣或者cbind輸出的維數。dim(Mydata)。
33、scan():從ascii文件中讀取數據。scan(file = "test.txt")。
34、write.table():把一個變數寫入到ascii文件。write.table(Z,file = "test.txt")。
35、order():確定數據的順序。order(x)。
36、merge():合並兩個數據框。merge(x,y,by = "ID")。
37、str():顯示一個對象的內部結構。str(Mydata)。
38、factor():定義變數作為因子。factor(x)。
39、tapply():tapply(X = Veg$R,INDEX = Veg$Transect,FUN = mean).tapply函數根據第二個變數(Transect)的不同水平對第一變數(R)進行了求平均值運算。還可以求sd,var,length等操作。R語言初學者指南P75詳細介紹了這個函數。
40、下一頁介紹了sapply和lapply。
41、summary():計算基本信息。
42、table():計算列聯表,統計因子各水平的出現次數(頻數或頻率)。table(x,y)。
43、plot():y對x的圖形。pch形狀,col顏色。
44、par():par(mfrow = c(2,2),mar = c(3,3,2,1))
mfrow生成一個具有4個面板的圖形窗口。mar選項指定每個圖形周圍空白的大小,底部、左側、頂部、右側。
45、paste():將變數連接成字元串。paste("a","b",sep = "")。
46、log(): log = "x",log = "y",log = "xy",生成對數軸。
47、%in%:
a<-c(1,3,13,1443,43,43,4,34,3,4,3)
b<-c(1,13,11,1313,434,1)
a%in%b
# 返回內容#
[1] TRUE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
# 取反操作
!(a%in%b)
48、sort()函數是對向量進行從小到大的排序
rank()函數返回的是對向量中每個數值對應的秩
order()函數返回的值表示位置,依次對應的是向量的最小值、次小值、第三小值……最大值等(位置索引)
arrange()函數(需載入dplyr包)針對數據框,返回基於某列排序後的數據框,方便多重依據排序。
49、subset(): df <- data.frame( a = 1:10, b = 2:11, c = 3:12 )
df <- subset(df, select = c(a,c)) #選取列a和c
df <- subset(df, select = -c(a,c) ) #去除列a和c
④ R語言基礎匯總
%>%是管道符的意思,把左邊的輸出(不包括 <- 之前的)當成右邊的輸入。
都可以shift + alt + 上下 :快速復制粘貼
alt + 上下 :移動行
ctrl + alt + 上下 :多重遊標
首先選中要注釋掉的行,然後按Ctrl+shift+C ,這樣就注釋掉了。
sessionInfo()
.libPaths()
一篇關於包的博客
library(installr)
updateR()
COS中文論壇 統計之都旗下的論壇網站(d.cosx.org),它和其主站(cosx.org)一 起,是一個致力於推廣與應用統計學知識的網站和社區。
1 help("t.test")
2 ?t.test
3 help.search("t.test")
4 apropos("t.test")
5 RGui>Help>Html help
6 查看R包pdf手冊
getwd() 顯示工作目錄
setwd() 設定工作目錄
list.files() 列出目錄或文件夾下的文件
demo( ) 顯示R的基本程序包
example( ) 顯示在線幫助的例子
example(barplot)
可以把若干行命令保存在一個文本文件(比如Eg3.R)中,然 後用source函數來運行整個文件: source("E:/R demo/Chapter1-Eg3.R")
sum, mean, var, sd, min, max, range, median, IQR(四分位間距)等為統計量, sort,order,rank與排序有關, 其它還有ave,fivenum,mad,quantile, stem等
-1:1/0 當中/是優先順序靠後的操作。相當於c(-1,0,1)/0
names(df) <- c("male", "female", "unknown")
對於矩陣,我們可以使用屬性rownames和colnames來訪問行名和列名。
我們也可以先定義矩陣x然後再為dimnames(x)賦值:
數值型數據 :1.2345e30
復數常量就用3.5-2.1i
缺失值:NA(Not Available)
是否含有缺失值:
NaN表示不確定的數
• NaN屬於NA的一種
• NA不是NaN
注意下面例子的比較 :
assign("x1", c(1, 2))
sort(x)返回x的元素從小到大排序的結果向量。
x=c(2,10,6,8,4,5); sort(x) [1] 2 4 5 6 8 10 order(x)返回使得x從小到大排列的元素下標向量(x[order(x)]等效於sort(x))。
此外numeric(n)可以產生一個長度為n的零向量(numeric(n)是一個 很好用的外部存儲器)
paste函數用來把它的自變數連成一個字元串,中間用空格分開
Re( )計算實部,Im( )計算虛部, Mod( ) 計算復數模,Arg( )計算復數幅角。
v為一個向量,取值在-length(x)到-1之間,表示扣除相應 位置的元素。例如:
可以用x[]的寫法:
R的對象有兩個基本的屬性:類型屬性(mode)和長度屬性(length)。
長度為零的向量 numeric( ) 或者 numeric(0) character( ) 或者 character(0)
數組(array): 帶多個下標的類型相同的元素的集合,
函數matrix():用於構造二維數組,即矩陣
函數factor( )用來把一個向量編碼成為一個因子。
可以自行指定各離散取值水平(levels),不指定時由x的不同值來求得。
• labels可以用來指定各水平的標簽,不指定時用各離散取值的對應字元串。
• exclude參數用來指定要轉換為缺失值(NA)的元素值集合。
• ordered取真值時表示因子水平(Levels)是有次序的
因子可以用來作為另外的同長度變數的分類變數,使用tapply() 函數可以完成分類統計
nchar()這個函數簡單,統計向量中每個元素的字元個數
tolower()和toupper()可以進行大小寫字母的轉換
chartr()把字元串里的元素,按要求進行轉換
拆分字元串用strsplit()函數,strsplit得到的結果是列表,後面的處理要調用列表
其任何一個語句都可以看成是一個表達式。
表達式之間以分號分隔或用換行分隔。
表達式可以續行,只要前一行不是完整表達式,則下一行為上一行的繼續。
線性回歸模型:
lm()函數的返回值叫做模型擬合結果對象,本質上是一個列表, 有model 、coefficients、resials等成員。lm()的結果顯示十分 簡單,為了獲得更多的擬合信息,可以使用對lm類對象有特 殊操作的通用函數,這些函數包括:
add1 coef effects kappa predict resials alias deviance family labels print summary anova drop1 formula plot proj
加號+或 者減號-,表示在模型中加入一項或去掉一項,第一項前面如果是加號可以 省略
在非交互運行(程序)中應使用print()來輸出。
• digits參數指定每個數輸出的有效數字位數;
• quote 參數指定字元串輸出時是否帶兩邊的撇號;
• print.gap參數指定矩陣或數組輸出時列之間的間距
也用來輸出,但它可以把多個參數連接起來再輸出(具有paste() 的功能)。例如:
讀取文件:
strsplit()得到的結果是 列表。
grep() 和 grepl()
sub()和gsub()
但嚴格地說R語言 沒有字元串替換的函數,因為R語言不管什麼操作對參數都是傳值不傳址,區別如下:
用substr()和substring() 可以通過位置進行字元串拆分或提取,兩者的參數設置基本相同:
strtrim() 函數可以用於將字元串修剪到特定的顯示寬度通過位置進 行字元串拆分或提取:
由於日期內部是用double存儲的天數,所以是可以相減的。
weekdays ( )取日期對象所處的周幾;
months ( )取日期對象的月份;
quarters ( )取日期對象的季度;
其任何一個語句都可以看成是一個表達式。
表達式之間以分號分隔或用換行分隔。
表達式可以續行,只要前一行不是完整表達式,則下一行為上一行的繼續。
quantile(x, probs=seq(0,1,0.25), na.rm=FALSE, names=TRUE, type=7, …)
probs給出相應的百分位數,默認值是0,0.25,0.5,0.75,1;na.rm是處 理缺失數據的,na.rm=TRUE時,NA和NaN將從數據中移走,向量取值中 若有NA或NaN,要添加這一參數,否則會出錯;names若為TRUE,返回 值當中有names這個屬性"; type是取值1-9的整數,選擇了九種分位數演算法 (具體演算法見幫助文件)中的一種。
數據的分布主要考察分布函數(p), 密度函數(d), 分位數函數(q)及產生隨機數(r)
以正態分布為例:
hist(x, breaks="Sturges", freq=NULL, probability=!freq,… )
break規定了直方圖的組距(必須覆蓋數據的范圍);freq是邏輯變數,TRUE是頻率直方圖, FALSE是密度直方圖;probability和freq相反,TRUE是密度直方圖,FALSE是頻率直方圖
其形式為 coplot(y ~ x | z),其中x 和y是數值型向量,z是同長度的因子。 對z的每一水平,繪制相應組的x和y的散點圖
R預設的圖形邊空常常太大,以至於有時圖形窗口較小時邊空佔了整個圖形的很大一部分。
R可以在同一頁面開若干個按行、列排列的窗格,在每個窗格中可以作一 幅圖。每個圖有自己的邊空,而所有圖的外面可以包一個「外邊空」。
一頁多圖用 mfrow 參數或 mfcol 參數規定,如
函數 mtext 用來在外邊空加文字標注。其用法為
在多圖環境中還可以用 mfg 參數來直接跳到某一個窗格,比如
可以不使用多圖環境而直接在頁面中的任意位置產生一個窗格來繪圖,參數為 fig ,如:
先用as.factor()轉化成因子。因為levels()函數裡面必須是因子。
dat$Genre沒有轉化成因子形式,as.factor(dat$Genre)就可以了
該消息表明文件的最後一行不以行尾 (EOL) 字元結尾(換行符 ( ) 或回車 + 換行符 ( ))。此消息的初衷是警告您該文件可能不完整;大多數數據文件都有一個 EOL 字元作為文件中的最後一個字元。
這是因為R讀取文件的時候,是一整段character,所以它只會返回1,適當給他分一下段。
⑤ R語言的清屏命令
命令代碼參考如下:
# An R function to clear the screen on RGui:
cls <- function() {
if (.Platform$GUI[1] != "Rgui")
return(invisible(FALSE))
if (!require(rcom, quietly = TRUE)) # Not shown any way!
stop("Package rcom is required for 'cls()'")
wsh <- comCreateObject("Wscript.Shell")
if (is.null(wsh)) {
return(invisible(FALSE))
} else {
comInvoke(wsh, "SendKeys", "\014")
return(invisible(TRUE))
}
}
#cls() # test
# If you want to make sure that it worked (well, not 100% sure, but...)
res <- cls()
if (res) cat("Console should be cleared now!\n")
⑥ 在r語言中用什麼命令讀取全部數據
使用R語言的時候,如果是少量數據,不妨使用c()或其他函數進行創建;但是對於大量數據,最好還是先通過其他更方便的軟體創建數據文件,然後使用R讀入這個文件。
.csv是非常好的數據文件格式,跨平台支持非常好。我在Excel或者SPSS中創建的數據,只要存為csv格式,就可以使用幾乎任何數據處理軟體對這些數據進行處理了。使用通用格式在多人合作、不同版本兼容等常見行為中,優勢十分明顯。另外,之所以使用不同的數據處理軟體,第一,可以取長補短。比如有些工作SPSS很復雜的,可以用R語言幾行命令搞定。第二,可以進行軟體間處理結果對照,發現問題。
R語言中讀取外部文件的最基本函數是read.table(),還有用來讀csv的read.csv(), .csv是非常好的數據文件格式,跨平台支持非常好。。
輸入help(read.table)命令,就看到了關於數據輸入函數的說明。
⑦ r語言head函數什麼意思
head(dataframe)——查看數據集前6行數據
<head> 標簽用於定義網頁文檔的頭部,它是所有頭部元素的容器。
<head> 中的元素可以引用腳本、指示瀏覽器在哪裡找到樣式表、提供元信息等等。[1]
文檔的頭部描述了文檔的各種屬性和信息,包括文檔的標題、在 Web 中的位置以及和其他文檔的關系等。絕大多數文檔頭部包含的數據都不會真正作為內容顯示給讀者。
下面這些標簽可用在 head 部分:<base>、<link>、<meta>、<script>、<style>以及<title>。<title>;定義文檔的標題,它是 head 部分中必需存在的元素。
(7)r語言命令大全擴展閱讀
Returns the first or last parts of a vector, matrix, table, data frame or function.
Since head() and tail() are generic functions, they may also have been extended to other classes.
返迴向量、矩陣、表、數據框或函數的前(或者最後)一部分。head()和tail()相似,他們也可能被擴展到其他類。
R語言常用命令如下:
數學運算:
+,-,*,/,^,%%。(加,減,乘,除,乘方,求余。)
比較運算:
>,<,>=,<=,==,!=。(大於,小於,大於等於,小於等於,等於,不等於。)
邏輯運算:
&,|,!。(與,或,非。)