❶ r語言 如何查看有哪些package
search() #查環境的,裡面就包含了你載入了哪些package
❷ R語言library(psych)什麼意思
導入函數包psych
library()這個函數是把括弧內包含的函數包導入,然後才可以運用psych中的一些現成的函數or模型。
psych函數包好像是一個和心理學等有關的函數包,Rstudio里給的psych函數包的定義如下:
A general purpose toolbox for personality, psychometric theory and experimental psychology. Functions are primarily for multivariate analysis and scale construction using factor analysis, principal component analysis, cluster analysis and reliability analysis, although others provide basic descriptive statistics. Item Response Theory is done using factor analysis of tetrachoric and polychoric correlations. Functions for analyzing data at multiple levels include within and between group statistics, including correlations and factor analysis. Functions for simulating and testing particular item and test structures are included. Several functions serve as a useful front end for structural equation modeling. Graphical displays of path diagrams, factor analysis and structural equation models are created using basic graphics. Some of the functions are written to support a book on psychometric theory as well as publications in personality research. For more information, see the <https://personality-project.org/r> web page.
上述英文來自:網頁鏈接
❸ r語言怎麼查看富集分析的數據
r語言怎麼查看富集分析的數據
1.首先利用r語言的install中的packages方法,輸入參數【xlsx】即可。
2.此時利用library(xlsx)語句,打開xlsx這個庫。
3.此時通過read的xlsx語法就能讀取某個文件夾下的Excel文件。
4.這個時候,我們按下回車,就能看到通過r語言讀取excel的一批數據。
❹ R語言的R包及其使用
1、通過選擇菜單:
程序包->安裝程序包->在彈出的對話框中,選擇你要安裝的包,然後確定。
2、使用命令
install.packages(package_name,dir)
package_name:是指定要安裝的包名,請注意大小寫。
dir:包安裝的路徑。默認情況下是安裝在..library 文件夾中的。可以通過本參數來進行修改,來選擇安裝的文件夾。
3、本地來安裝
如果你已經下載的相應的包的壓縮文件,則可以在本地來進行安裝。請注意在windows、unix、macOS操作系統下安裝文件的後綴名是不一樣的:
1)linux環境編譯運行:tar.gz文件
2)windows 環境編譯運行 :.zip文件
3)MacOSg環境編譯運行:.tgz文件
註:包安裝好後,並不可以直接使用,如果在使用包中相關的函數,必須每次使用前包載入到內存中。通過library(package_name)來完成。 包安裝後,如果要使用包的功能。必須先把包載入到內存中(默認情況下,R啟動後默認載入基本包),載入包命令:
Library(「包名」)
Require(「包名」) 1、查看包幫忙
library(help=package_name)
主要內容包括:例如:包名、作者、版本、更新時間、功能描述、開源協議、存儲位置、主要的函數
help(package = package_name)
主要內容包括:包的內置所有函數,是更為詳細的幫助文檔
2、查看當前環境哪些包載入
find.package() 或者 .path.package()
3、移除包出內存
detach()
4、把其它包的數據載入到內存中
data(dsname, package=package_name)
5、查看這個包里的包有數據
data( package=package_name)
6、列出所有安裝的包
library()
❺ R語言怎麼獲取當前文件所在文件夾
R語言讀取文件都是在工作空間里,或者給定的文件地址讓他去讀
##getwd()獲取當前工作目錄
##setwd()設置工作目錄
❻ R語言-v1-基礎知識
R語言-v1-基礎知識
Iretara 12-17 21:18
以例題的形式簡述R語言基礎知識
# 讀取文件
setwd(" 文件鏈接的時候,用 / ")
install.packages(" readxl ")
library(readxl)
library (tidyverse)
hw1_a<- read_excel ("hw1_a.xlsx", col_types=c("numeric", "numeric", "numeric", "numeric", "numeric") )
hw1_b<- read_excel ("hw1_b.xlsx")
#讀取csv
library(readr)
hw1_a<- read_csv ("/")
View(hw1_a)
# 描述型函數
hw1_a + hw1_b 表
#描述最小值,最大值,中值,均值,標准差
Str (hw1_a) #查看數據並指出各個 變數的形式
summary (hw1_a) #指出各個變數的形式, 最小值,最大值,中值,均值
library(psych)
describe (hw1_a) #比summary更簡便的方法, 可以直接讀取標准差等;但是,使用describe不可讀取 NA值, 可以嘗試使用 Hmisc包中 describe
描述型函數-R
# 連接
hw1_a %>% inner_join (hw1_b, by ="ID")
hw1_a %>% left_join (hw1_b, by ="ID")
hw1_a %>% right_join (hw1_b, by ="ID")
hw1_a %>% full_join (hw1_b, by ="ID")
inner_join<- inner_join (hw1_a,hw1_b, by =「ID」) #報告合並後的 總行數 ,178行
full_join<- full_join (hw1_a,hw1_b, by ="ID")
( nrow (full_join)) #報告合並後的 總行數 ,200行
> length (full_join$ID)
#找出各個列的 缺失值
i<-NA
a<-NA
for(i in 1:length(full_join[1,])){ a[i]<- sum(is.na( full_join[,i] ) ) }
paste("缺失值是",a)
#缺失值總數
sum(is.na(full_join))
#刪除缺失值 na.omit()
full_join1=filter(full_join,!is.na(full_join[2]))
full_join1=filter(full_join1,!is.na(full_join1[3]))
full_join1=filter(full_join1,!is.na(full_join1[4]))
full_join1=filter(full_join1,!is.na(full_join1[5]))
full_join1=filter(full_join1,!is.na(full_join1[6]))
full_join1=filter(full_join1,!is.na(full_join1[7]))
full_join1=filter(full_join1,!is.na(full_join1[8]))
sum(is.na(full_join1))
找出Income中的 極端值 並濾掉對應行的數據
quantile (hw1_a$Income,c(0.025,0.975))
hw1_a2= filter (hw1_a,Income>14168.81 & Income<173030.92)
#使用dplyr進行數據轉換
arrange()
> arrange (hw1_a,Income) #默認升序
>arrange(hw1_a, desc (Income)) #desc降序,NA排序一般最後
select()
> select (hw1_a, - (Years_at_Address:Income)) #不要變數
> rename (hw1_a, In_come=Income) #改名
>select(hw1_a,Income, exerything ()) #把Income放在前面
拓例題1:
library(nycflights13)
view(flights)
#counts
(1)
not_cancelled <- flights %>%
filter(! is.na(dep_delay), !is.na(arr_delay))
(2)
not_cancelled %>%
group_by (year,month,day) %>%
summarize (mean=mean(dep_delay))
(3)
delays <- not_cancelled %>%
group_by (tailnum) %>%
summarize (delay=mean(arr_delay))
ggplot (data=delays,mapping=aes(x= delay))+
geom_freqpoly (binwidth=10) #freqpoly
(4)
delays <- not_cancelled %>%
group_by(tailnum) %>%
summarize(delay=mean(arr_delay,na.rm=TRUE), n=n() ) #tailnum的次數
ggplot(data=delays,mapping=aes(x= n, y=delay))+
geom_point(alpha=1/10)
拓例題2:
#請按照價格的均值,產生新的變數price_new, 低於均值為「低價格」,高於均值為「高價格」。 同樣對市場份額也是,產生變數marketshare_new, 數值為「低市場份額」和「高市場份額」
price=data1$price
pricebar=mean(price)
price_new= ifelse (price>pricebar,「高價格」,」低價格」)
marketshare=data1$marketshare
marketsharebar=mean(marketshare)
marketshare_new=ifelse(marketshare>marketsharebar ,「高市場份額」,」低市場份額」)
data1= mutate (data1,price_new,marketshare_new)
#可視化
#將Income 對數化
lninc<- log (hw1_a$Income)
#畫出直方圖和 density curve密度曲線
hist (lninc,prob=T)
lines ( density (lninc),col="blue")
# 添加額外變數 的辦法,在 aes()中添加 樣式 (color、size、alpha、shape)
ggplot(data=inner_join)+
geom_point(mapping = aes(x=Years_at_Employer,y= Income, alpha= Is_Default))
# 按照Is_Default 增加一個維度,使用明暗程度作為區分方式
ggplot(data=inner_join)+
geom_point(mapping = aes(x=Years_at_Employer,y= Income,
alpha=factor( Is_Default ) ))
#使用形狀作為另外一種區分方式
ggplot(data=inner_join)+
geom_point(mapping = aes(x=Years_at_Employer,y= Income,
shape=factor( Is_Default)))
可視化-R
拓展:
#將 flight1 表和 weather1 表根據共同變數進行內連接,隨機抽取 100000 行數據, 將生產的結果保存為 flight_weather。 (提示:sample_n()函數,不用重復抽取)
flight_weather <- inner_join(flight1, weather1) %>% sample_n(100000)
# 從 flight_weather表中對三個出發機場按照平均出發延誤時間排降序,並將結果保留在 longest_delay表中。把結果展示出來
longest_delay<- flight_weather %>%
group_by(origin) %>%
summarize(delay=mean(dep_delay, na.rm=TRUE )) %>%
arrange(desc(delay))
#根據不同出發地(origin)在平行的 3 個圖中畫出風速 wind_speed(x 軸)和出發 延誤時間 dep_delay(y 軸)的散點圖。
ggplot(data= flight_weather) +
geom_point(mapping=aes(x=wind_speed,y=dep_delay))+
facet_grid(.~origin, nrow = 3 ) # 按照class分類,分成3行
#根據 flight_weather 表,畫出每個月航班數的直方分布圖,x 軸為月份,y 軸是每個 月份航班數所佔的比例。
ggplot(data=flight_weather)+
geom_bar(mapping=aes(x=month, y=..prop .., group=1))
#根據 flight_weather 表,畫出每個月航班距離的 boxplot 圖,x 軸為月份,y 軸為 航行距離, 根據的航行距離的中位數從低到高對 x 軸的月份進行重新排序
ggplot(data=flight_weather)+
geom_boxplot(mapping=aes(x= reorder (month,distance,FUN=median),y=distance))
線性回歸
# 以Income作為因變數,Years at Employer作為自變數,進行 OLS回歸
m1<- lm (Income ~ Years_at_Employer,data=hw1_a)
#通過***判斷顯著性
summary (m1)
#畫出擬合直線
ggplot(data= hw1_a)+
geom_point(aes(x=Income,y=Years_at_Employer))+
geom_abline(data= m1,col= "blue")
#證明擬合直線是最優的
b0=runif(20000,-5,5)
b1=runif(20000,-5,5)
d<-NA
sum<-NA
n<-1
while(n<=20000){
for(i in 1:24){
d[i]<-(hw1_a $ Income[i]-b0[n]-b1[n]*hw2$ Years_at_Employer[i])^2}
sum[n]<-sum(d)
n<-n+1
}
resi=m1$resials
resi2=sum(resi^2)
check=sum(as.numeric(sum<resi2))
check
❼ 怎麼設置r語言中library的路徑
sapply函數和Lapply函數類似,也是對List進行處理,只是在返回結果上,sapply會根據結果的數據類型和結構,重新構建一個合理的數據類型返回。調用格式如下: sapply(數據,運算函數,函數的參數,simplify = TRUE, USE.NAMES = TRUE) > sapply
❽ macr語言的包是裝在哪個目錄下
得看什麼軟體了,像一般的應用程序,都在./Applications/,格式是*****.app。(./ 根目錄)
如果是系統偏好設置之類的,在./Library/PreferencePanes/下面。
如果是Dashboard軟體,在./Library/Widgets/下面。
如果是屏保程序,在./Library/Screen Savers/下面。
其他如flash player插件,在./Library/Internet Plug-Ins/下面。
以上沒有,推薦一個軟體EasyFind搜索,或者打開該應用,右鍵--選項--在Finder中顯示。
❾ r語言如何看到values中的數據
1、數據的獲取
1.1從excel中讀取數據
需要載入包,通常有兩種包
library(readxl)
library(readxl) # 讀取數據,返回值是data.frame() mydata <- read_xlsx("D:/test/testdata.xlsx",sheet = 1) print(mydata$ID) class(mydata)
library(openxlsx)
library(openxlsx) mydata <- read.xlsx("D:/test/testdata.xlsx",sheet = 1)
1.2從CSV文件中獲取
什麼是CSV文件 ?:Comma-Separated Values,中文叫,逗號分隔值或者字元分割值,其文件 以純文本的形式存儲表格數據 。該文件是一個字元序列,可以由任意數目的記錄組成,記錄間以某種換行符分割。每條記錄由欄位組成,欄位間的分隔符是其他字元或者字元串。所有的記錄都有完全相同的欄位序列,相當於一個結構化表的純文本形式。
個人更加偏好csv格式的文件。
用文本文件、excel等軟體都可以打開CSV文件。
讀取csv中的數據
❿ R語言install.packages()和library()函數
1. 聯網,在線安裝:
install.packages('package_name') //直接填寫包的名字即可
2. 本地安裝:
install.packages('path_to_packages') //需要填寫第三方包的本地路徑
1. library(my_package)
2. library(my_package, character.only=True)
第二種載入方式與第一種不同的地方在於,它只接受字元串值,它可以接受一個字元串變數;但是第一種不能識別字元串變數,它會直接載入'my_package'。
舉個例子,如下:
library(randomForest) //直接載入randomForest
library('randomForest') //與上面效果相同,直接載入randomForest
p<-'randomForest'
library(p) //不接受字元串變數,報錯
library(p,character.only=T) //正常載入randomForest