修課心得
課程名稱 | 厚數據與意義探勘 |
---|---|
教授姓名 | 劉正山 |
課群分類 | 方法論 |
修課同學心得分享
這門「厚數據與意義探勘」的課程是一門可以帶領同學踏入資料科學大門的課堂。它可以讓參與的同學深入理解資料的本質,學會運用和表達資料的技能,同時培養對資料的敏感度。
對於完全沒有程式語言背景的同學來說,這門課提供了理解程式語言、深入了解其背後邏輯的寶貴機會。課堂上,老師會介紹R及RStudio的基本使用,並透過實際操作,引導同學從數據讀入開始,再一步步進入數據分析、資料視覺化、解讀的過程,最終讓同學與同學之間,分享自己分析出來的結果。
然而,除了程式語言上的操作,課程也涵蓋了知識論和方法論的介紹與解說。這使得同學不僅能夠從實際操作中獲得技能,更能夠從不同的觀點出發觀察和思考事物,進而提出深入的問題,培養出對於問題的敏感性與意識。
課程大綱
「厚數據」(thick data)指的是蘊藏豐富資訊的資料,而「意義探勘」(meaning mining)則是透資料方析與詮釋的方法,萃取出資料中的意義與洞見(insight)。這一學分的課程對於在學生或新生來說,可以作為資料科學的入門小品;對歷經資料科學訓練之後的學生來說,它可以作為一場回顧及自我提升之旅。至於已經要畢業卻還未修習過資料分析的訓練的學生來說,也可以將它視為銜接職場,建立正確心態的工作坊。
面對資料是金的年代,人文、社科、管理領域培育出來的學生,最好能夠不怕資料分析,並且能透過資料分析流程,看見有助於決策、有助於理解現實的資訊。學生一旦具備這種解讀資訊、看穿資料、解讀資料的能力,在瞬息變化的職場中將更具競爭力。因此,「厚數據」不只是某一種類型的資料或數據集,而是一種永遠不會退流行的方法論立場。本課程的最重要目標,便是帶領同學建立對數據的正確態度及責任感,在兩天半的訓練中,作好當個「資料偵探」(data detective)的準備。
要當資料科學家不必先成為工程師。寫程式不是資料偵探最優先需要學會的能力。對人社管沒有程式設計基礎的學生來說,R具有短時間上手的優勢。本課程將分為五階段進行,用R及RStudio貫串整門課:認識厚資料方法論、認識資料分析工具、解讀實作資料分析、分組討論展演及講評,以及個人專案展演及講評。在密集的課程中,同學將學會使用簡易的套件,進行數據讀入、分析、視覺化、解讀及分享。你的資料分析作品將用Rmarkdown所編譯出的html來呈現,你會發現你不需要SPSS也能分析民調資料。我們將使用民調數據進行實作,而同學將在第二天下午及晚間,完成指定的專案作品。這門課不需要同學具備資料分析的知識與訓練,但必須具備使用英文軟體或工具的意願。