【001: 鄭喬翊】根據原作者的想傳達的訊息,主要是強調從2012-2017年各大眾交通運輸工具的載客量變化。因此我在此

load("graphData_homework4_001.Rda")
## ----graph, echo=T, eval=T-----------------------------------------------
colorspace::sequential_hcl(n = 7, h = c(140, 138), c = c(50, NA, 62), l = c(20, 86), power = c(0.7, 1.8), register = "Custom-Palette")
library(reshape2)
graphData$traffic %>%
melt(id.vars="年別") %>%
ggplot(aes(x=年別,
y=value)) +
geom_line(aes(color=variable),size=1.2
) +
geom_vline(aes(xintercept=2015),size = 0.01,color="orange")+
geom_hline(aes(yintercept=0),linetype="twodash",size = 0.05,color="gray") +
scale_color_discrete_sequential(palette = "Custom-Palette",guide=guide_legend("運輸工具"))+
labs(title = "2012-2017大眾運輸工具載客變化",
subtitle="(以2012為基期)",
x = "年份",y = "載客量")+
theme(plot.background = element_rect(fill = "#9B4322"),
panel.background = element_rect(fill = "#9B4322"),
axis.ticks.x = element_line(color = "white"),
axis.ticks.y = element_line(color = "white"),
axis.text.x = element_text(color = "white"),
axis.text.y = element_text(color = "white"),
axis.title.x = element_text(color = "white"),
axis.title.y = element_text(color = "white"),
axis.line = element_line(color = "white"),
plot.title = element_text(color = "white",face = "bold"),
plot.subtitle = element_text(color = "white"),
legend.background = element_rect(fill = "#9B4322"),
legend.text=element_text(colour="white"),
legend.title = element_text(color = "white"))
根據原作者的想傳達的訊息,主要是強調從2012-2017年各大眾交通運輸工具的載客量變化。因此我在此將其改成變化量,並以2012年為基期。 在區間列車方面,載客量年年上升,根據原作者判斷是由於對短程交通的需求升高。 根據原作者的訊息,在2015-2016高鐵苗栗、彰化、雲林站的開通,使高鐵載客量有明顯的上升。而莒光號基本上在2013年之後不斷呈現負成長,自強號也在2015年後載客量有下降趨勢。
【003: 彭亦楓】此圖表示各週次因急性上呼吸道感染之健保就診人次(資料由2008年3月統計至2019年10月)

load("graphData_homework4_003.Rda")
## ----graph, echo=T, eval=T-----------------------------------------------
graphData$InfectedPeople%>%
ggplot()+
geom_point(color="purple",alpha=0.2,
aes(x=週次,y=人次)
)+
geom_line(
data = graphData$averagePeople,
mapping =
aes(x=週次,y=平均人次),
color="blue",alpha=0.7,size=1.3
)+ #-------------------------------original^
scale_y_continuous(name = "人次(萬)", breaks = YBreakPeople,labels=YLabel)+
geom_hline(yintercept = MeanPeople,color="brown",linetype="longdash",size=1.5,alpha=0.8
)+ #--------------------A^
geom_rect(
data = graphData$Rect_high,
mapping = aes(
xmin=xstart,
xmax=xend,
ymin=ymin,
ymax=ymax
),fill="red",alpha=0.12
)+
geom_rect(
data = graphData$Rect_Low,
mapping = aes(
xmin=xstart,
xmax=xend,
ymin=ymin,
ymax=ymax
),fill="black",alpha=0.2
)+#--------------------------------B^
geom_text(x=10,y=930000,label="1月~3月",color="red",size=5)+
geom_text(x=33,y=930000,label="6月~9月",color="black",size=5)+
geom_text(x=51,y=930000,label="12月",color="red",size=5)+
geom_text(x=52,y=420000,label="就醫人次趨勢",color="blue")+
geom_text(x=24,y=270000,label="就醫低峰",color="black",size=4.5)+
geom_text(x=10,y=270000,label="就醫高峰",color="red",size=4.5)+
geom_text(x=51,y=270000,label="就醫高峰",color="red",size=4.5
)+ #---------------------C^
scale_x_continuous(breaks = XBreak
)+#-------------D^
labs(
title = "各週次因急性上呼吸道感染之健保就診人次",
subtitle = "資料由2008年3月統計至2019年9月",
caption = "資料來源:疾病管制署資料開放平台網"
)+#------------------------------E^
geom_line(
data = graphData$averagePeople_fixed1,
mapping =
aes(x=週次,y=平均人次),
color="blue",alpha=0.4,size=1.3
)+
geom_line(
data = graphData$averagePeople_fixed2,
mapping =
aes(x=週次,y=平均人次),
color="blue",alpha=0.4,size=1.3
)#---------------------------------F^
此圖表示各週次因急性上呼吸道感染之健保就診人次(資料由2008年3月統計至2019年10月)
深藍色實線為各週次,在不同年份中的人次平均值所連成的軌跡,觀察其將能看出就醫人次趨勢。
由藍色的趨勢線,我們可以發現,週次與就醫人次是有關聯的:
1.第21到37週次,也就是每年的6月到9月時,就醫人次普遍較低,為就醫低峰,
2.每年的第1到13、第49到53週次,也就是12月到隔年3月,就醫人次普遍偏高,為就醫高峰。
由於在就醫高峰之中有幾筆資料不尋常的低,將其刪去後,修正後的趨勢線以較淡的藍色表示
。
另外,觀察各點的分布情形,我們可以得知:
1.在就醫低峰期間,就醫人次較為接近,
2.在就醫高峰期間,各年就醫人次差異較大。
/
設計想法: 原本的設計(折線圖
)能明顯看出就醫人次呈現週期性變化,也能詳細觀察各年的變化,但是其他資訊較為不直觀。而且隨著資料量的增加,圖形將越來越長,屆時一眼能看到的資訊僅有週期性。
把圖形轉成散佈圖
後,即將年份的資訊捨棄,圖形中看不出來各年的詳細變化情況。但散佈圖
有以下優點:
1.圖形不會因為資料量的增加而變長,
2.更能將重點擺在週次與就醫人次的關係,而非各年的詳細變化情況,
3.更直觀看出在相同週次,不同年間的人次差異大小。
因此選擇改用散佈圖
。
【004: 李靜怡】此圖為作業3-005資料,由於計算後發現男女比除了以東部地區數值較為突出外,在各年齡層間和另外三個地

load("graphData_homework4_004.Rda")
## ----graph, echo=T, eval=T-----------------------------------------------
library(ggpubr)
Graphdata$area_count %>%
ggplot(
aes(x = area)
) +
geom_col(
aes(y = percentage),
fill = "#6BA7FD", alpha = Graphdata$area_count$b
, width = 0.5
) +
geom_col(
aes(y = percentage),
fill = "#F76793", alpha = Graphdata$area_count$g
, width = 0.5
) +
geom_col(
aes(y = (`41-60`+`21-40`+`0-20`)*percentage),
width = 0.5, alpha = 0.3
) +
geom_col(
aes(y = (`21-40`+`0-20`)*percentage),
width = 0.5, alpha = 0.3
) +
geom_col(
aes(y = `0-20`*percentage),
width = 0.5, alpha = 0.3
) +
scale_y_continuous(
"占全台登革熱病例總人數百分比",
breaks = c(0.0,0.1,0.2,0.3,0.4),
labels = c("0%","10%","20%","30%","40%")
) +
scale_x_discrete(
"地區"
) +
labs(title = "全台登革熱病例各地區占比") +
annotate(
"text",x=2,y=0.405,size=4,
label = paste("60歲以上"), color = "white"
) +
annotate(
"text",x=2,y=0.335,size=4,
label = paste("41~60歲"), color = "white"
) +
annotate(
"text",x=2,y=0.17,size=4,
label = paste("21~40歲"), color = "white"
) +
annotate(
"text",x=2,y=0.035,size=4,
label = paste("0~20歲"), color = "white"
) -> Graphdata$area_graph
Graphdata$age_count %>%
ggplot(
aes(x = "")
) +
geom_col(
aes(y = population), width = 0.3
) +
geom_col(
aes(y = population),fill = "#6BA7FD"
, alpha = 1-Graphdata$age_count$g, width = 0.3
) +
geom_col(
aes(y = population),fill = "#F76793"
, alpha = Graphdata$age_count$g, width = 0.3
) +
geom_col(
aes(y = `41-60`+`21-40`+`0-20`), alpha = 0.3
, width = 0.3
) +
geom_col(
aes(y = `21-40`+`0-20`), alpha = 0.3
, width = 0.3
) +
geom_col(
aes(y = `0-20`), alpha = 0.3
, width = 0.3
) +
scale_y_continuous(
"占全台登革熱病例總人數百分比",
breaks = c(0,0.25,0.5,0.75,1),
labels = c("0%","25%","50%","75%","100%")
) +
scale_x_discrete(
"全台登革熱病例"
) +
coord_flip() +
theme(
aspect.ratio = 1/5
) +
labs(title = "全台登革熱病例各年齡層占比") +
annotate(
"text",x=1,y=0.07,size=4,
label = paste("0~20歲"), color = "white"
) +
annotate(
"text",x=1,y=0.365,size=4,
label = paste("21~40歲"), color = "white"
) +
annotate(
"text",x=1,y=0.74,size=4,
label = paste("41~60歲"), color = "white"
) +
annotate(
"text",x=1,y=0.933,size=4,
label = paste("60歲以上"), color = "white"
) -> Graphdata$age_graph
ggarrange(
Graphdata$area_graph,Graphdata$age_graph,
ncol = 1, nrow = 2
) -> finalplot
finalplot
此圖為作業3-005資料,由於計算後發現男女比除了以東部地區數值較為突出外,在各年齡層間和另外三個地區間並無顯著差異(男性較多,約落在55~60%左右),故以顏色表示男女比(以全台登革熱病例各年齡層占比為全國平均色,顏色越紅女性比例越高、越藍則是男性比例越高)。
【006: 游筑茵】原本的圖形是透過boxplot和原本圖來分日本hostel價錢與滿意度的關係,但由於將這兩個變數分別
load("graphData_homework4_006.Rda")
## ----graph, echo=T, eval=T-----------------------------------------------
library(ggcorrplot)
graphData<-select(graphData,price,atmosphere,
cleanliness,facilities,location,security,staff,valueformoney)
corr <- round(cor(graphData), 1)
finalplot<-ggcorrplot(corr, hc.order = TRUE, type = "lower",
lab = TRUE)
finalplot
原本的圖形是透過boxplot和原本圖來分日本hostel價錢與滿意度的關係,但由於將這兩個變數分別在不同圖形呈現視覺上較不一理解,因此本次修改進一步將其他變數放進相關係數圖中進行分析。可以更加容易的看出valueformoney 和atmosphere以及 facilities和cleanliness有高度關係;反之,price與valueformoney和 facilities沒有關係。
【008: 簡靖軒】圖為台灣2017年至2018年前五大發生火災原因。將原圖改為瀑布圖,可看出各項目在兩年間的差距,菸蒂

load("graphData_homework4_008.Rda")
## ----graph, echo=T, eval=T-----------------------------------------------
graphData$data %>%
ggplot(aes(Item,
fill = Item))+
geom_rect(aes(x = Item,
xmin = No-0.5,
xmax = No + 0.5,
ymin = cum_val_p,
ymax =cum_values))+
scale_y_continuous("value",
labels = comma)+
theme(text = element_text(size = 15),
axis.text.x=element_text(angle=20,
hjust= 0.8,
size=15),
axis.text.y=element_text(hjust= 0.8,
size=15),
plot.title = element_text(size = 30))+
geom_text(aes(No,
cum_values,
label = comma(value)),
size =5,
vjust = 1)+
ggtitle(label = "2017~2018火災前五原因之變化")+
annotate("text",
x = "菸蒂",
y = 28500,
label = paste("+5%"),
size = 5,
colour="red")+
annotate("text",
x = "敬神掃墓祭祖",
y = 28500,
label = paste("-17%"),
size = 5,
colour="blue")+
annotate("text",
x = "電器因素",
y = 28500,
label = paste("-13%"),
size = 5,
colour="blue")+
annotate("text",
x = "遺留火種",
y = 28500,
label = paste("+9%"),
size = 5,
colour="red")+
annotate("text",
x = "爐火烹調",
y = 28500,
label = paste("-2%"),
size = 5,
colour="blue")+
annotate("text",
x = "2018",
y = 3000,
label = paste("-8%"),
size = 5,
colour="blue")+
geom_hline(aes(yintercept=2292),
colour="red",
linetype="dashed")+
annotate("text",
x = "電器因素",
y = 3000,
label = paste("2292"),
size = 5,
colour="brown")+
geom_hline(aes(yintercept=30214),
colour="red",
linetype="dashed")+
annotate("text",
x = "2018",
y = 29500,
label = paste("30214"),
size = 5,
colour="brown")+
geom_hline(aes(yintercept=0),
colour="red",
linetype="dashed")+
annotate("text",
x = "電器因素",
y = 300,
label = paste("0"),
size = 5,
colour="brown")
圖為台灣2017年至2018年前五大發生火災原因。將原圖改為瀑布圖,可看出各項目在兩年間的差距,菸蒂和遺留火種為增加,其他項目則為減少。在2018的直方圖上以負號輸入其總數,是為了在圖中呈現兩年間總數的差異,也可以看到直方圖底下有空間(2292),其為2018年其他因素(非前五原因)較2017年減少之件數,即2018年火災件數減少大多來自其他因素(共減少2292件),較前五原因(共減少250件)所減少的件數來得多。
【009: 王正評】公投案第10案:你是否同意
民法婚姻規定應限定在一男一女

load("graphData_homework4_009.Rda")
## ----graph, echo=T, eval=T-----------------------------------------------
graphListP <- list()
graphListD$Case_10_result_eV %>%
ggplot(
aes(
x = 六都,
y = `同意比例(同意票/有效票)`
)
) +
geom_col(
aes(
alpha = `同意比例(同意票/有效票)`
),
width = 0.5,
fill = "#FF72C7"
) ->
graphListP$base
graphListP$base +
coord_flip() +
scale_x_discrete(
limits = c("高雄市", "臺南市", "臺中市", "桃園市", "新北市", "臺北市")
) +
scale_y_continuous(
limits = c(0, 0.75),
labels = function(x) x*100
) +
scale_alpha(
range = c(1, 0.2)
) ->
graphListP$adjust_scale
graphListP$adjust_scale +
geom_text(
aes(
label = str_c(
round(`同意比例(同意票/有效票)`*100, 2), #round(四捨五入至小數第一位)
"%"
)
),
size = 5,
hjust = 1.1,
color = "#666666"
) +
labs(
title = "你是否同意民法婚姻規定應限定在一男一女的結合 ?",
y = "同意比例(同意票/有效票)%"
) +
theme_bw() +
#清理軸線
theme(
legend.position = "none",
axis.title.y = element_blank(),
axis.line = element_blank(),
axis.ticks = element_blank()
) +
#清理輔助線
theme(
panel.border = element_blank(),
panel.grid.minor = element_blank(),
panel.grid.major.y = element_blank()
) +
#調整文字
theme(
plot.title = element_text(hjust = 0.5),
axis.text.y = element_text(
size = 10,
hjust = 30,
color = "black"
),
axis.text.x = element_text(color = "#666666"),
axis.title.x = element_text(colour = "#666666")
) +
geom_hline(
aes(yintercept = 0)
) ->
graphListP$end
graphListP$end
公投案第10案:你是否同意
民法婚姻規定應限定在一男一女
的結合?
-
六都的同意比例皆超過5成,顯示台灣社會對於性別的觀念仍趨保守。
-
可看出雙北對於性別的觀念較其他四都開放,臺北市的同意比例甚至掉到7成以下。
-
可看出愈往北部,性別觀念有愈趨成熟的趨勢。
【010: 邱詩涵】臺灣各縣市平均每10,000位老人可使用的長照機構數量:

load("graphData_homework4_010.Rda")
## ----graph, echo=T, eval=T-----------------------------------------------
library(grDevices) # 不同顏色模型代碼的呈現及轉換
library(scales) # show_col()螢幕立即顯示顏色
library(colorspace) # 調色盤選擇及ggplot應用工具
library(shinyjs) # 支援套件
library(statebins)
#choose_palette(gui="shiny")
graphData$sub_2015_city_North %>%
ggplot() +
geom_point(
aes(
x = area,
y = avg_nh
),
shape = 18,
size = 10,
color = "#00BBFF",
alpha = 1
) +
geom_point(
data = graphData$sub_2015_city_Central,
aes(
x = area,
y = avg_nh
),
shape = 18,
size = 10,
color = "#FF7744",
) +
geom_point(
data = graphData$sub_2015_city_South,
aes(
x = area,
y = avg_nh,
),
shape = 18,
size = 10,
color = "#FF8888",
) +
geom_point(
data = graphData$sub_2015_city_East_Islands,
aes(
x = area,
y = avg_nh,
),
shape = 18,
size = 10,
color = "#00AA00",
) +
theme_bw(
base_size = 20, base_family = "",
base_line_size = 20/22, base_rect_size = 20/22
) +
theme(
panel.border = element_rect(fill = NA,color = "gray"),
panel.grid.minor = element_blank()
) +
theme(
axis.ticks = element_blank(),
axis.title = element_blank()
) +
scale_x_discrete(
limits = c("East_Islands","South","Central","North"),
breaks = c("East_Islands","South","Central","North"),
labels = c("東部\n離島","南部","中部","北部")
) +
coord_flip()+
annotate(
"text",
x = 4,
y = 6.29,
label = "宜蘭縣",
vjust = -1.5
) +
annotate(
"text",
x = 3,
y = 3.39,
label = "雲林縣",
vjust = -1.5
) +
annotate(
"text",
x = 2,
y = 4.76,
label = "屏東縣",
vjust = -1.5
) +
annotate(
"text",
x = 1,
y = 8.12,
label = "連江縣",
vjust = -1.5
)+
labs(
title = "臺灣各縣市平均每10,000位老人可使用的長照機構數量",
subtitle = "2015年統計資料"
) +
theme(
plot.title = element_text(face = "bold",hjust = 0.5),
plot.subtitle = element_text(color = "#AAAAAA")
) -> graphData$sub_2015_city_final
graphData$sub_2015_city_final
臺灣各縣市平均每10,000位老人可使用的長照機構數量:
從圖中可發現,北部與東部離島區的數量較分散,中部及南部較集中,各地區平均數量最高的是宜蘭縣(6.29,北)、雲林縣(3.39,中)、屏東縣(4.76,南)、連江縣(8.12,東離)。
【011: 游崇翰】大部分人都知道加總100%,所以想更直接比較各年齡層差距。
load("graphData_homework4_011.Rda")
## ----graph, echo=T, eval=T-----------------------------------------------
graphData$population %>%
ggplot()+
geom_col(aes(x = 區域別,
y = 比例,
fill = 年齡層)) +
labs(title = "2017年底六都各年齡層人口比例")+
facet_grid( 年齡層 ~ .,scales="free_x")+
geom_text(aes(x = 區域別,
y = 比例,label=paste(比例*100,"%")),size=2,nudge_y=-0.05)+
theme(axis.text.x = element_text(size = rel(0.8))) ->graphData_final
graphData_final
傳達訊息:
同作業三007同學所說
設計理念:
大部分人都知道加總100%,所以想更直接比較各年齡層差距。
【012: 林易霆】將原本堆疊的圖形拆開來呈現較方便比較。因為圖名為“六都各年齡層人口比例”,故分組將依據年齡層分為大組
load("graphData_homework4_012.Rda")
## ----graph, echo=T, eval=T-----------------------------------------------
# graphData$population %>% View
graphData$population %>%
ggplot(aes(x = 年齡層, y = 比例, fill = 區域別, group = 區域別)) +
geom_bar(stat = "identity", position = position_dodge(width = 0.9),
width = 0.8) +
geom_text(mapping = aes(label = sprintf("%.1f%%", 比例*100)),
size = 3,
colour = 'black',
vjust = 0.15,
hjust = - 0.075,
position = position_dodge(width = 0.9)) +
geom_text(aes(label = 區域別),
position = position_dodge(width = 0.9),
size = 3, hjust = 1.15,
color = "white") +
labs(title = "2017年底六都各年齡層人口比例") +
ylim(c(0, 0.7)) +
theme(aspect.ratio = 0.85,
legend.position = "none",
plot.title = element_text(hjust = 0.5),
axis.title.y = element_text(angle = 0, vjust = 1,
margin = margin(r = - 35)),
axis.title.x = element_blank(),
axis.text.x = element_blank(),
axis.line.x = element_blank(),
axis.ticks.x = element_blank()) +
coord_flip()
設計想法
將原本堆疊的圖形拆開來呈現較方便比較。因為圖名為“六都各年齡層人口比例”,故分組將依據年齡層分為大組,並在各大組中比較各個直轄市的個別比例。因為圖名已經說明呈現的標的為比例,因此將多餘的X軸直接刪除。
又因原本各bar的配色並不清楚區別,所以將各個bar的間隔拉開,增加辨別度。為更加方便做六都的比較,直接將圖例整個刪除,取而代之,將六都的名稱和比例直接放在bar的屁股。最後再把整張圖翻轉,橫向的長條圖比較適合做視覺上的差異比較。
【013: 王姿文】此圖為2002年至2016亞洲地區來台旅遊人數,橫軸為年分
,縱軸為來台旅遊人數(萬)
load("graphData_homework4_013.Rda")
## ----graph, echo=T, eval=T-----------------------------------------------
graphData$travelerFromAsia %>%
ggplot()+
aes(x = `年分`,
y = `來台旅遊人數`,
fill = 地區) +
geom_col() +
labs(title="亞洲地區來台旅遊人數", x ="年分", y = "來台旅遊人數(萬)") +
theme(axis.text.x = element_text(face="bold", color="Black",
size=6, angle=45),
axis.text.y = element_text(face="bold", color="Black"))
此圖為2002年至2016亞洲地區來台旅遊人數,橫軸為年分
,縱軸為來台旅遊人數(萬)
,類別則為地區
。其中可由不同年分的長條圖看出來台旅遊人數大致呈現逐年上升,並以地區
顏色明顯看出不同年分的不同地區來台人數佔比。可由此圖推論2003年可能出於SARS疾病因素導致旅遊人數下降,以及2009年可能出於金融危機導致旅遊人數下降。而日本、東南亞地區、韓國則一直是亞洲地區來台旅遊人數的主要國家。
此圖來源為2019-10-08的HW1的014同學,選用此圖的原因是因為該同學原始呈現方式為並列式的長條圖,由於年分及地區種類眾多,因此修整為此圖的呈現方式。而原圖並沒有把亞洲地區合計的類別去除,本圖則修改將該種類移除。
【015: 陳盈蓁】各教育程度的2004年到2016年的每日抽驗率分佈
load("graphData_homework4_015.Rda")
## ----graph, echo=T, eval=T-----------------------------------------------
graph<-
ggplot(graphData,aes(x=年,y=比率))+
geom_line(aes(linetype=最高學歷,color=最高學歷,size=最高學歷))+
theme(legend.position = "none")+
annotate("text", x = 2016, y = 31.5,
label = paste("國中"), size = 3)+
annotate("text", x = 2016, y = 17,
label = paste("高中、職"), size = 3) +
annotate("text", x = 2016, y= 12,
label = paste("專科"), size = 3) +
annotate("text", x = 2016, y = 8.7,
label = paste("小學或以下"), size = 3) +
annotate("text", x = 2016, y = 5.3,
label = paste("大學"), size = 3)+
annotate("text", x = 2015.7, y = 3.4,
label = paste("研究所及以上"), size = 3)+
labs(title = "2004至2016年每日抽菸率(以教育程度劃分)",
caption = "資料來源: 臺灣政府資料開放平臺")
graph <-graph+scale_color_manual(values=c("#993300", "#CC9933","#CC6600","#CC9966","#FFCC99","#FFCC66"))
graph <-graph+scale_size_manual(values = c(1.9,0.4,1.2,0.9,0.5,1))
graph
欲傳達訊息: 各教育程度的2004年到2016年的每日抽驗率分佈
設計想法: 為了能讓讀者直接理解,我將各條線表達的教育程度放至其線旁邊, 另外,希望透過顏色使讀者直接聯想到抽煙、吸菸, 特別選用咖啡色,並由深至淺排列,也將線依其比率大小調整, 企圖讓讀者可以藉由線的面積大小來感受其比率的差異。
【016: 林應廷、王童緯】此圖抓取花蓮市附近知名景點,其中以太魯閣為最多人參觀的景點,且以八月為最主要月份,而東大門夜市及七星
load("graphData_homework4_016.Rda")
## ----graph, echo=T, eval=T-----------------------------------------------
colorspace::sequential_hcl(n = 7, h = c(237, 74), c = c(55, NA, 10), l = c(24, 95), power = c(0.7, 2), register = "myPalette")
graphData %>%
ggplot()+
geom_tile(
aes(x=月份,y=reorder(景點,人數,order=T),fill=人數))+
scale_fill_continuous_sequential(palette="myPalette")+
labs(x="月份",
y="景點",
title="花蓮景點參觀人數")
此圖抓取花蓮市附近知名景點,其中以太魯閣為最多人參觀的景點,且以八月為最主要月份,而東大門夜市及七星潭相較於太魯閣就沒有那麼多人,頗為訝異;此圖相對於前次作業圖形更可以看出景點觀光人數及月分差別。
【017: 林奕齊】修改想法:先前的圖形顯示價格與飯店氣氛無太大相關,但價格分布與資料筆數未能呈現,可能有一些資訊被隱藏

load("graphData_homework4_017.Rda")
## ----graph, echo=T, eval=T-----------------------------------------------
colorspace::sequential_hcl(n = 5, h = c(-83, 20), c = c(65, NA, 18), l = c(32, 90), power = c(0.5, 1), register = "mypalette")
ggplot(graphData, aes(x = atmosphere, y = price, colour = rating)) +
geom_jitter() +
geom_boxplot(size = 1, fill = "#F6F4E8", alpha = 0.5) +
facet_wrap(~rating, ncol = 5, nrow = 1) +
labs(title = "飯店氣氛與價格無關", subtitle = "Superb 等級的飯店價格分布廣且氣氛佳") +
theme(
legend.position = "none",
axis.line.y = element_blank(),
plot.title = element_text(hjust = -0.11,vjust = 3, size = 18),
plot.subtitle = element_text(hjust = -0.13, vjust = 3, size = 12),
plot.margin = margin(0.9, 0.9, 0.9, 0.9, "cm"),
axis.title.x = element_text(vjust = -4),
axis.title.y = element_text(vjust = 7),
plot.background = element_rect(fill = "#F6F4E8"),
panel.background = element_rect(fill = "#F6F4E8")
) +
geom_hline(yintercept = c(1600, 2500), color = "#ff3232",linetype = "dashed") +
scale_color_discrete_sequential(palette="mypalette") +
scale_y_continuous(breaks = c(1000,1500,2000,2500,3000,3500,4000))
修改想法:先前的圖形顯示價格與飯店氣氛無太大相關,但價格分布與資料筆數未能呈現,可能有一些資訊被隱藏在迴歸圖形中,故想以合鬚圖更深入探討這筆資料。
傳達訊息:重新詮釋後,結論同之前一樣,價格並未因為氣氛的不同而有落差,除了 Good 等級的飯店外,大多數飯店的價格落在 2500 元左右 (在不同氣氛下),而 Good 等級的價格則落在 1700 元左右,但“資料筆數” 較其他的少,其價格“跨度”大的結論有其偏誤;另外,在同一等級的飯店,價格落差最大的是 Superb 等級的飯店,價格分布也較廣,氣氛也是五者之中最佳的,而 Rating 的是最低的,顯示與氣氛較相關的是飯店等級;還有,價格低未必表示飯店氣氛不佳,但普遍價格高者氛圍較。
設計想法:以 WSJ 簡約風格為基礎,且依舊圖之分割方式、配色 處理,目的與舊圖相同,為了區別不同等級的飯店,並佐以輔助線,以便觀察不同飯店的價格中位數。
【018: 曾雨晴】此圖展現2016年至2018年全台小學生各年級近視總人數變化趨勢,可以看出三到六年級皆有下降的趨勢,
load("graphData_homework4_018.Rda")
## ----graph, echo=T, eval=T-----------------------------------------------
graphData$nearsightedStud%>%
ggplot( )+
geom_line(
aes(
x=graphData[["nearsightedStud"]][["年分"]],
y=graphData[["nearsightedStud"]][["總近視學生人數"]],
group=graphData[["nearsightedStud"]][["級別"]],
linetype=graphData[["nearsightedStud"]][["級別"]])) +
theme(legend.position = "none") +
annotate(
"text",x=2017.5,y=123000,label="國小六年級"
)+
annotate(
"text",x=2017.5,y=110000,label="國小五年級"
)+
annotate(
"text",x=2017.5,y=92000,label="國小四年級"
)+
annotate(
"text",x=2017.5,y=71000,label="國小三年級"
)+
annotate(
"text",x=2017.5,y=55000,label="國小二年級"
)+
annotate(
"text",x=2017.5,y=47000,label="國小一年級"
)+
labs(
title = "臺灣2016年至2018年國小近視學生總數趨勢圖",
tag = "單位(人)",
caption = "資料來源:政府資料開放平台"
)+
xlab("年分")+
ylab("總近視學生人數")
此圖展現2016年至2018年全台小學生各年級近視總人數變化趨勢,可以看出三到六年級皆有下降的趨勢,尤其三年級下降幅度最大;一年級室持續上升,且上升幅度大;二年級則是先下降再上升。
因為想要展現各年級近視人數變化趨勢,所以希望透過折線圖,能較簡單清楚的看出每個年級的變化。