延續 Introduction to Big Data with Spark 課程,紀錄 2015/7 月在 edx 的 Scalable Machine Learning 上課心得紀錄。
除了 Machine Learning 之外,有 1/3 的內容在強調跟講解 large scale 的情況跟需求,也就是 distributed algorithm。當資料很大、維度很大時,演算法只能用逼近解,不能用 closed-form 解會太慢。
😆 👨🏻💻 📚 🚀 💰 ✨
延續 Introduction to Big Data with Spark 課程,紀錄 2015/7 月在 edx 的 Scalable Machine Learning 上課心得紀錄。
除了 Machine Learning 之外,有 1/3 的內容在強調跟講解 large scale 的情況跟需求,也就是 distributed algorithm。當資料很大、維度很大時,演算法只能用逼近解,不能用 closed-form 解會太慢。
紀錄 2015/6-7 月間,在 edx 上 Introduction to Big Data with Spark 的上課心得紀錄。(竟然拖了一年才整理到 blog 上… XD)
這堂課著重在 Data Processing 部分,特別是熟悉 map reduce 技能。除了看錄影之外,精華其實在 lab 實作,透過作業走過 Big data 的重要流程。
整理記錄一下在 Coursera 修台大資工林軒田老師的機器學習課程心得,分成兩門課上下兩個學期。
2016年2月9日 21:12 UTC+08
拿到台大機器學習技法的證書啦 t.co/AwlAdFgkj0 #coursera # 努力了半年終於解開 Machine Learning 的成就,在技法課中實作了 SVM、AdaBoost、Decision Tree 和 NNet 演算法。
2015年12月28日 21:33 UTC+08
接連兩個機器學習作業實作出 AdaBoost 和 Decision Tree(CART) 及 Random forest (我用Ruby寫),跟其他模型相比,難得不需要太多數學,感覺簡單多了 XD 另外發現 Python scikit-learn 的 Decision Tree 也是用 CART 演算法,所以也拿來測了一下自己寫的對不對,它還可以把決策樹匯出 Graphviz 圖真是太棒了。 接下來要進入類神經網路了。
2015年11月11日 0:02 UTC+08
交了 Coursera 台大機器學習基石最後一次作業,收穫頗豐,每次作業都寫好久。這堂課比較偏理論,上到第二次作業最理論的時候,差點就要放棄了,好險撐了下來後面講 overfitting 的部分我認為是這堂課最精彩的部分。為什麼做 feature transform 和 regularation,如何用 validation 等等,理論貫穿前後。這些其實之前在修 edX Spark ML 課的時候,也有照著用這些技巧,但是都不知道為什麼,現在知道理論之後超有感覺。 接著就是機器學習技法了,感覺又是一整個超難,SVM 我來了!
今年 2015/8/22-23 去參加了台灣資料科學愛好者年會,這是當時的筆記整理。另外還有 會眾版的 hackpad 筆記
Update(2016/3): 投影片新增第四階段:營運成長
感謝 David Ko 的邀請,在 Agile Tour Hsinchu 給一場分享講軟體開發流程,內容就東拼西湊這幾年在 startup 公司學到和用到的東西,沒想到迴響還不錯,得到的評價是很實用,摘要如下:
RubyConf Taiwan 2015 開放報名啦,時間是 9/11~12,兩天的雙軌議程。詳見以下連結: