修課心得
課程名稱 | 厚數據與意義探勘 |
---|---|
教授姓名 | 劉正山 |
課群分類 | 方法課群 |
修課同學心得分享
這堂課開在暑假,分別在三個周一進行,在正式入學前算是我的先修課程,雖然只有一學分,但能從中窺探「政治學」跟所謂的數據資料可以如何互動。
課堂一開始,劉老師就講述不同方法論的學理背景,並讓我們練習各種發問方法,藉由「問好問題」進而「找出答案」。
兩天半的課程中,我們除了學習RStudio程式的安裝與操作,並練習運用簡單的R語法進行資料清理和分析。也透過自己設計問卷,和利用劉老師提供的民調數據來進行變數的描述、相關分析及意義挖掘。
這堂課不單僅止於理論,而是手把手的把實務技術交給學生,透過實作累積經驗,若是對大數據分析有興趣或是未來想做量化研究的同學很推薦修這門課當作入門。
課程大綱
「厚數據」(thick data)指的是蘊藏豐富資訊的資料,而「意義探勘」(meaning mining)則是透資料方析與詮釋的方法,萃取出資料中的意義與洞見(insight)。這一學分的課程對於在學生或新生來說,可以作為資料科學的入門小品;對歷經資料科學訓練之後的學生來說,它可以作為一場回顧及自我提升之旅。至於已經要畢業卻還未修習過資料分析的訓練的學生來說,也可以將它視為銜接職場,建立正確心態的工作坊。
面對資料是金的年代,劉老師自2014年起就有一個清楚的立場:人文、社科、管理領域培育出來的學生,最好能夠不怕資料分析,並且能透過資料分析流程,看見有助於決策、有助於理解現實的資訊。學生一旦具備這種解讀資訊、看穿資料、解讀資料的能力,在瞬息變化的職場中將更具競爭力。因此,劉老師不只是將「厚數據」當作某一種類型的資料或數據集,而是將它當作是一種永遠不會退流行的方法論立場,將它介紹給有心挑戰職場的學生。本課程的最重要目標,便是帶領同學建立對數據的正確態度及責任感,在兩天半的訓練中,作好當個「資料偵探」(data detective)的準備。
要當資料科學家不必先成為工程師。寫程式不是資料偵探最優先需要學會的能力。對人社管沒有程式設計基礎的學生來說,R具有短時間上手的優勢。本課程將分為五階段進行,用R及RStudio貫串整門課:認識厚資料方法論、認識資料分析工具、解讀實作資料分析、分組討論展演及講評,以及個人專案展演及講評。在密集的課程中,同學將學會使用簡易的套件,進行數據讀入、分析、視覺化、解讀及分享。你的資料分析作品將用Rmarkdown所編譯出的html來呈現,你會發現你不需要SPSS也能分析民調資料。我們將使用民調數據進行實作,而同學將在第二天下午及晚間,完成指定的專案作品。這門課不需要同學具備資料分析的知識與訓練,但必須具備使用英文軟體或工具的意願。
本課程與本所入門級課程互補,建議與秋季班(上學期)的《資料分析方法入門》或《大數據與選舉》搭配。有興趣接受更完整訓練的同學,則可以考慮本所春季班(下學期)的《民意與政治行為研究》、《政治與資訊》、《社群資料分析》、《政治文本分析》等課程,打造自己成為能與資料和人溝通的資料偵探