R語言文字探勘&語意分析applying on MOOC-前言
MOOC(Massive Open Online Course,大規模開放式線上課程),從2012年的美國到2013年的台灣吹起了一股線上學習旋風。經過了4~5年的時間,MOOC還是存在於網路上,只是其使用聲浪比起當初的The Year of the MOOC,稱2012年為慕課元年小了不少。(MOOC,台灣譯為磨課師,中國譯名為慕課,個人偏好使用慕課。)
美國的課程平台有Coursera、Udacity、edX,英國有FutureLearn,中國有學堂在線、中國大學MOOC、MOOC學院。以上這幾個平台就是世界上目前使用人數最多,且頂尖的課程平台。這樣的發展,其中不乏有人抨擊,從站在政治經濟學上提出高等教育資本化(capitalism)、知識社會學上特定課程得以曝光、教育精神上說教育內涵扁平僵化等等。
一個社會新興現象的出現,免不了受到檢視。但這樣MOOC的出現,從2012到2017仍得以存在,先排除特定新創資金投入的炒作,其中的社會需求恐怕是少不了的。也就是說,這樣線上學習的課程需求,其實從MOOC開始之前就早已存在,MOOC透過網路、影音技術的發達、以及特定課程的知識淘金魅力,一堂網路課可以吸引到了數以萬計的使用者。
將高等教育院校的教育資源,開放給社會大眾,這樣的立意是良善的,讓窮盡一生無法接觸到歷史學內涵的計程車司機,或是提早給求知若渴的高中學子知道具體的分子生物學研究進行細節為何,都說不上是壞事一件。但這樣的舉措放諸到真實社會上實行,卻是不折不扣的照妖鏡,反映了這個社會具體真實的想望以及欲求為何。
第一點可以先說的是,各MOOC課程的完成率偏低,說明學習終究還是需要壓力,或者說一個具體的誘因(目標)才得以完成。第二是說,各MOOC平台終究是營利取向(edX除外),開課的課程會以實用性質,也就是目前企業內培訓重視的領域為主,可以讓使用者經過學習後取得的證書(certificate)的價值取得實際上的重視價值。第三是,教育的本質探討。MOOC的開課不乏以高等教育資源為主(不論是與大專院校明星老師合作或是與個別院校合作),那些得以開課的課程,不就說明高等教育院校的功能被取代,亦或是又牽連到以往對於高等教育單位究竟是不是「職業訓練所」,這場無窮無盡的辯論。
作為一個希望教育可以普及化、各知識領域可以獲得平等尊重的研究者,將腦筋動到了近期熱門的R語言上,以及爬蟲、語意分析技術,希望可以從大量的媒體文本裡知道一些MOOC不一樣的東西。下一篇將以我的其中一個研究對象中國的MOOC學院為範例,說明五個操作的R語言分析方法。
