1 簡介

2 下載 R Commander

install.packages("Rcmdr")
install

install

3 啟動 R Commander

library(Rcmdr)

4 功能瀏覽

5 資料輸入

5.1 開新資料集

  • 資料 > 新資料集

5.2 匯入資料

  • 資料 > 匯入資料 > 匯入文字檔

  • 調整匯入參數

  • 匯入成功

5.3 顯示package的資料檔

  • R 的packages 中含有許多資料集可供測試.
  • 資料 > R套件中的附帶資料集 > R套件中的附帶資料集列表
  • 尚未載入之套件資料,不會列出,須事先載入
  • 顯示所有可用資料集

    • 其中datasets package 有許多資料可供測試。

5.4 載入套件方式

  • 如果須使用的資料沒有在預設的資料集中,則可先載入package。
  • 工具 > 載入R套件 > 選取欲載入之套件 > 按ok,訊息區會有載入package 內容。

5.5 匯入套件的資料檔

  • 匯入R package 的資料集
  • 資料 > R套件中的附帶資料集 > 讀取指定套件中附帶的資料集…

5.5.1 檢視資料集

TRY ! 匯入 datasets package的 trees 資料集

5.6 使用中的資料集功能表

5.6.1 (4)查看資料集說明文件

5.6.2 選擇資料

  • 選擇前面載入的文字檔iris.csv資料,物件名稱為dataset

6 資料摘要

6.1 資料理解

  • 檢視資料集

  • 什麼是鳶尾花(iris)?

  • 花萼?花瓣?種類?

6.2 摘要統計功能列表

6.2.1 (1)使用中的資料集

Sepal.Length Sepal.Width Petal.Length Petal.Width Species
Min. :4.300 Min. :2.000 Min. :1.000 Min. :0.100 setosa :50
1st Qu.:5.100 1st Qu.:2.800 1st Qu.:1.600 1st Qu.:0.300 versicolor:50
Median :5.800 Median :3.000 Median :4.350 Median :1.300 virginica :50
Mean :5.843 Mean :3.057 Mean :3.758 Mean :1.199 NA
3rd Qu.:6.400 3rd Qu.:3.300 3rd Qu.:5.100 3rd Qu.:1.800 NA
Max. :7.900 Max. :4.400 Max. :6.900 Max. :2.500 NA

6.2.2 (2)數據摘要

##                  mean        sd IQR  0% 25%  50% 75% 100%   n
## Petal.Length 3.758000 1.7652982 3.5 1.0 1.6 4.35 5.1  6.9 150
## Sepal.Length 5.843333 0.8280661 1.3 4.3 5.1 5.80 6.4  7.9 150

6.2.3 (3)次數分配

## 
## counts:
## Species
##     setosa versicolor  virginica 
##         50         50         50 
## 
## percentages:
## Species
##     setosa versicolor  virginica 
##      33.33      33.33      33.33

6.2.4 (6)相關矩陣

Petal.Length Petal.Width Sepal.Length Sepal.Width
Petal.Length 1.0000000 0.9628654 0.8717538 -0.4284401
Petal.Width 0.9628654 1.0000000 0.8179411 -0.3661259
Sepal.Length 0.8717538 0.8179411 1.0000000 -0.1175698
Sepal.Width -0.4284401 -0.3661259 -0.1175698 1.0000000

6.2.5 7 相關性檢定

## 
##  Pearson's product-moment correlation
## 
## data:  Petal.Length and Petal.Width
## t = 43.387, df = 148, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.9490525 0.9729853
## sample estimates:
##       cor 
## 0.9628654

7 相關操作

7.1 執行語法

7.2 清除程式碼與結果

7.3 設定小數點位數

  • options(digits=3)
  • 設定整數+小數點的顯示位數為3位,預設值為7。
options(digits = 7)
sqrt(2)
## [1] 1.414214
sqrt(2)*10
## [1] 14.14214
sqrt(2)*100
## [1] 141.4214
options(digits = 3)
sqrt(2)
## [1] 1.41
options(digits = 7)

8 圖形

8.1 繪製直方圖(histograms)

  • 使用dataset資料 (iris)

練習 ! 使用flower資料集繪直方圖

  • 為何只有V7, V8可以選擇?
str(flower)
## 'data.frame':    18 obs. of  8 variables:
##  $ V1: Factor w/ 2 levels "0","1": 1 2 1 1 1 1 1 1 2 2 ...
##  $ V2: Factor w/ 2 levels "0","1": 2 1 2 1 2 2 1 1 2 2 ...
##  $ V3: Factor w/ 2 levels "0","1": 2 1 1 2 1 1 1 2 1 1 ...
##  $ V4: Factor w/ 5 levels "1","2","3","4",..: 4 2 3 4 5 4 4 2 3 5 ...
##  $ V5: Ord.factor w/ 3 levels "1"<"2"<"3": 3 1 3 2 2 3 3 2 1 2 ...
##  $ V6: Ord.factor w/ 18 levels "1"<"2"<"3"<"4"<..: 15 3 1 16 2 12 13 7 4 14 ...
##  $ V7: num  25 150 150 125 20 50 40 100 25 100 ...
##  $ V8: num  15 50 50 50 15 40 20 15 15 60 ...

8.2 繪製長條圖(barplot)

8.3 繪製散佈圖(scatter plot)

  • (9)散佈圖
car::scatterplot(Petal.Width~Petal.Length, reg.line=FALSE, smooth=FALSE, 
  spread=FALSE, boxplots=FALSE, span=0.5, ellipse=FALSE, levels=c(.5, .9), 
  data=iris)

8.4 繪製3D圖

  • 載入套件datasets中的trees資料

  • 選取繪圖功能選單中的17-3D立體繪圖

練習 ! 繪製上述圖形並試著繪製其他圖形

9 機率分配

9.1 機率分配- d, p, q, r

  • The standard distributions:
    • d:機率密度函數(Probability Density Functions, pdf or p.d.f.)
    • p:累積分配函數 (Cumulative distribution function, CDF)
      • \(F(x)=P(X \leq x)\)
    • q:百分比函數 (Quantile function)
    • r:隨機產生分配的資料
  • x, q: vector of quantiles.
  • p: vector of probabilities.
  • n: number of observations.
  • mean: vector of means.
  • sd: vector of standard deviations.
  • log, log.p logical: if TRUE, probabilities p are given as - log(p).
  • lower.tail logical: if TRUE (default), probabilities are P[X <= - x],otherwise, P[X > x].

9.1.1 範例: dnorm(), pnorm(), qnorm(), rnorm()

dnorm(1.96, 0,1)
## [1] 0.05844094
pnorm(1.96, 0,1)
## [1] 0.9750021
qnorm(0.975, 0,1)
## [1] 1.959964
rnorm(5, 0,1)
## [1]  0.3615716 -0.2371644  0.6970924  0.9885503 -1.8198194

9.2 隨機產生資料

runif(1,0,2) # time at light
## [1] 0.8203738
runif(5,0,2) # time at 5 lights
## [1] 0.7269433 1.2516983 0.9165962 1.6600087 0.1631111
runif(5) # 5 random numbers in [0,1]
## [1] 0.47642561 0.08267099 0.49543962 0.69747714 0.40823965

9.3 範例:二項分配

  • 已知某產品之不良率為0.1,隨機抽取10個產品檢查,至多有3個產品為不良品的機率為何?

  • 方法1: \(P(X\leq 3)= \sum_{i=0}^{3}f(x)=\sum_{x=0}^{3}C_{x}^{10}(0.1)^x(0.9)^{10-x}\),查表可得0.9872

  • 方法2: R

pbinom(3, 10, 0.1)
## [1] 0.9872048
  • 方法3: R Commander

9.4 範例

  • \(R.V.Z \sim N(0,1)\)求:
    1. \(P(Z\leq 2.5)=?\)
    2. 求常數\(a\)使得\(P(Z\leq a)=0.95\)

9.4.1 1

## [1] 0.9937903

9.4.2 2

## [1] 1.644854
練習:\(P(Z\leq 2.42)=?\)
練習:\(P(-2\leq Z\leq 3)=?\)

10 迴歸分析

10.1 範例:利用最小平方法

  • 找出\(y=ax+b\),y(反應變數)=dist,x(解釋變數)=speed
  • y=3.9324x-17.5791
  • R-squared(\(R^2\)):判定係數,coefficient of determination
names(RegModel.1) # 迴歸模型的物件內容
##  [1] "coefficients"  "residuals"     "effects"       "rank"         
##  [5] "fitted.values" "assign"        "qr"            "df.residual"  
##  [9] "xlevels"       "call"          "terms"         "model"
RegModel.1$coefficients # 迴歸模型的coefficients值
## (Intercept)       speed 
##  -17.579095    3.932409
RegModel.1$fitted.values # 迴歸模型的預測值
##         1         2         3         4         5         6         7 
## -1.849460 -1.849460  9.947766  9.947766 13.880175 17.812584 21.744993 
##         8         9        10        11        12        13        14 
## 21.744993 21.744993 25.677401 25.677401 29.609810 29.609810 29.609810 
##        15        16        17        18        19        20        21 
## 29.609810 33.542219 33.542219 33.542219 33.542219 37.474628 37.474628 
##        22        23        24        25        26        27        28 
## 37.474628 37.474628 41.407036 41.407036 41.407036 45.339445 45.339445 
##        29        30        31        32        33        34        35 
## 49.271854 49.271854 49.271854 53.204263 53.204263 53.204263 53.204263 
##        36        37        38        39        40        41        42 
## 57.136672 57.136672 57.136672 61.069080 61.069080 61.069080 61.069080 
##        43        44        45        46        47        48        49 
## 61.069080 68.933898 72.866307 76.798715 76.798715 76.798715 76.798715 
##        50 
## 80.731124

10.1.1 此迴歸模型是否具有解釋能力

  • 利用ANOVA

  • \(H_0\):此模型不具解釋能力(\(\beta = 0\))
  • \(H_1\):此模型具解釋能力
car::Anova(RegModel.1, type="II")
Sum Sq Df F value Pr(>F)
speed 21185.46 1 89.56711 0
Residuals 11353.52 48 NA NA

11 安裝及掛載增益集(plugin)

12 總複習

13 參考文獻

  1. RWEPA