參考資料

資料引入

目前引入三個資料集:

  1. 大學部90-106學年度入學學生圖書借閱明細資料
  2. 大學部90-106學年度指考錄取生個人資料
  3. 大學部90-106學年度學測錄取生個人資料

並且將2、3合成一個學生的個人資料做分析

資料觀察及處理

最後一筆借閱時間為2018/03/20,因為拿到資料時106學年第二學期還未結束。為了分析學生完整四年的借書紀錄,因此將資料中還未畢業的學年學生予以剔除,留下93-102共十年的學生借閱資料。另外此借閱資料中尚包含許多非書籍的借閱資料,例如:iPad、視聽室設備包、視聽區耳機轉接器、白板文具組……,此類用品的借閱並非我們所要探討的借閱習慣,因此也將此類借閱從資料中剔除。資料中的館際借閱雖然不能從中看出學生所借的書籍為何,但也是屬於書籍借閱,因此沒有將館際借閱的資料剔除。

資料分析

  1. 整體借閱狀況
  2. 各系與各院的借閱狀況
  3. 熱門書籍探討
  4. 書籍屬性分析

1 整體借閱狀況

1.1 不同入學年的借閱人數分析

## Joining, by = "入學年"
## Joining, by = "入學年"
表一:不同入學年下,學生的借書人數與借閱次數
入學年 93 94 95 96 97 98 99 100 101 102
系數目 18 18 18 18 18 18 18 18 20 20
學生數 1176 1178 1159 1228 1219 1198 1045 1290 1371 1364
有借閱紀錄的學生數 995 1021 1043 1077 1107 1150 1169 1172 1310 1372
學生借閱比例 0.85 0.87 0.90 0.88 0.91 0.96 1.12 0.91 0.96 1.01
總借閱次不含續借 22430 30145 27534 32833 33037 28152 30270 29165 35162 36591

目前學生數為錯誤的資料

入學年在93到100之間的學生人數大概是1,200人,因為電機工程學系與通訊工程學系在101年才增設,所以101與102這兩年的入學人數增加到1,400人。102年入學的學生數雖然為第二高,但不含續借的總借閱次數最多,達36,591次。從入學到畢業,每一屆大學部學生的「學生借閱比例」皆有百分之八十五以上,也就是85%的大學生在就讀大學期間皆有從學校圖書館借過書。

1.2 各系與各院的借閱人數分析

## Joining, by = "學院"
## Joining, by = "入學系"
## Joining, by = "入學系"
表二:各系的借閱學生數與次數
入學系 不動產與城鄉環境學系 中國文學系 企業管理學系 休閒運動管理學系 公共行政暨政策學系 應用外語學系 會計學系 歷史學系 法律學系 社會學系 社會工作學系 統計學系 經濟學系 財政學系 資訊工程學系 通訊工程學系 金融與合作經營學系 電機工程學系
學院 公共事務學院 人文學院 商學院 商學院 公共事務學院 人文學院 商學院 人文學院 法律學院 社會科學院 社會科學院 商學院 社會科學院 公共事務學院 電機資訊學院 電機資訊學院 商學院 電機資訊學院
學生數 1092 370 958 330 1176 489 1063 344 1852 414 353 626 1307 655 457 79 582 81
有借閱紀錄的學生數 1024 538 960 371 1087 482 914 447 1689 443 417 516 1183 528 387 62 594 54
學生借閱比例 0.94 1.45 1.00 1.12 0.92 0.99 0.86 1.30 0.91 1.07 1.18 0.82 0.91 0.81 0.85 0.78 1.02 0.67
各院借閱比例 0.90 1.21 0.94 0.94 0.90 1.21 0.94 1.21 0.91 0.98 0.98 0.94 0.98 0.90 0.82 0.82 0.94 0.82
總借閱次不含續借 19958 23348 23018 6671 30183 15271 21271 18789 49557 10713 9373 10817 32893 10896 7046 823 14103 589

目前可看出學生借閱比例最高的系分別為中國文學系、歷史學系、社會工作學系,而各院的學生借閱比例由高至低分別是人文學院、社會科學院、商學院、法律學院、公共事務學院、電機資訊學院。

1.3 借閱次數分析

原本預想許多學生從來沒有借過書,但從資料看出學生的借閱比例高達85%以上,所以好奇學生在學期間的借閱次數分配情況。

## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## Warning: Removed 125 rows containing non-finite values (stat_bin).

從圖中可看出這十屆學生中有一百二十五人在學期間的借閱紀錄超過兩百筆資料,而大部分學生的借閱紀錄皆集中在五十筆資料以內,下面想更進一步了解每一學年借閱次數的詳細統計資料。

表三:不同入學年下,有借閱紀錄學生的借閱次數統計資料
入學年 93 94 95 96 97 98 99 100 101 102
平均 23.95 27.51 28.25 24.45 24.89 27.59 27.21 30.55 25.85 26.85
中位數 11 12 14 10 11 13 12 14 12 12
最大值 431 629 285 402 437 401 353 608 562 736

由於借閱次數的中位數皆位於11-14之間,所以我們知道每一屆皆有一半的學生借閱紀錄不超過十筆,也就是大部分學生在學期間的借閱數量皆在0-10筆之間。

1.4 借閱時間分析

在學期間內學生幾乎都有借閱紀錄,而大部分四年下來的借閱紀錄在十筆以內,這裡想進一步了解這些紀錄在在學期間的時間分佈情況。

## Warning: Ignoring unknown parameters: binwidth, bins, pad

從圖中可看出暑假與寒假的借閱次數明顯比上學期與下學期的學期中低,而且暑假又比寒假低、上學期又比下學期低,猜測可能是因為新生上學期不會借書。

## Warning: Ignoring unknown parameters: binwidth, bins, pad

## Warning: Ignoring unknown parameters: binwidth, bins, pad

從圖中可以明顯看出大一到大四的借閱次數是逐漸增加。

2 熱門書籍探討

2.1 各年級的熱門書籍

進一步思考各年級的借書目的可能不同,例如大四比較可能會為了未來的職涯去借書。

2.2 各系的熱門書籍

臺北大學101-105學年的學生「整體」的熱門借閱(不含續借) 排除電子器材與館際合作借閱,由上表可看出臺北大學101-105年的學生熱門借閱書籍前五名分別為天龍八部、總體經濟學、神鵰俠侶、決戰NEW TOEIC閱讀滿分破解、鹿鼎記。

臺北大學101-105學年的學生「大一」的熱門借閱(不含續借) 排除電子器材與館際合作借閱,由上表可看出臺北大學101-105年的學生熱門借閱書籍前五名分別為經濟學原理、民法總則、盜墓筆記=The secret of grave robber、天龍八部、民法概要。

2.3 各院的熱門書籍

TOP5:天龍八部、神雕俠侶、倚天屠龍記、總體經濟學、笑傲江湖 人文學院:(館際合作)、天龍八部、張愛玲典藏全集、笑傲江湖 公共事務學院:天龍八部、決戰NEW TOEIC閱讀滿分破解、統計學、決戰NEW TOEIC聽力滿分破解 商學院:天龍八部、神雕俠侶、統計學、財務管理、倚天屠龍記 法律學院:天龍八部、民法債編各論、民法總則、民事訴訟法、刑事訴訟法、民法學說與判例研究 社會科學院:總體經濟學、天龍八部、個體經濟學=Microeconomics、總體經濟學=Macroeconomics、神鵰俠侶 電機資訊學院:天龍八部、神鵰俠侶、C++程式設計藝術、倚天屠龍記、資料結構:使用C語言、演算法導論

3 書籍屬性分析

3.1 利用索書號分類

臺北大學學生整體的借閱偏好 臺北大學學生借書的類別以語文文學類、社會科學類的書為主,其中世界史地與中國史地合稱的史地類為第三大類。另外館際合作與電子書的借閱無法判別是什麼書籍,NA的部分則是借閱資料中還包含許多圖書館其他物品的借閱ex.視聽區耳機、白板文具……

3.2 定義閒書與參考書

七八月的借閱低落代表為教科書

整理出料集跑固定效果模型,想知道一個學生的借閱活躍性,在同樣年級下 1.扣除掉三個因素(入學年、年級、院)的殘差 2.扣除掉一個因素(入學年)的殘差 此時的特徵才是用來分類學生的借閱狀況

書的特質->分成二十四類的被借閱次數 被借多少次?被大一、二、三、四借多少次?被各學院借的總次數? 索書號、館藏時間

#以基本資料(戶籍地、性別)區分學生
#書籍需要屬性區分(比例、總次數)
#爬博客來的熱門書、天下熱門書或其他有影響力的網站

#每一年中,每一本書先算出被多少不同的學生借,再加總成為類別被借的總機率,得到每一類裡的每一本書,被多少不同的人借出來之加總
#各系一年級的借書人數對照n,了解偏好是否分散,或是加入性別