120 likes | 726 Views
機器發明與社群網路探勘實驗室. 林守德 副教授 sdlin@csie.ntu.edu.tw. MSLAB 「優秀 Data Miner 培育計畫」 搭一座結合理論與實務的橋樑. 對象:台大資工系大學部同學 目的:訓練優秀的資料處理與探勘專家 時間: 7/2012 ~ 6/2013 總共一年 收費:前三個月免費,後 9 個月月繳負 4000 元 每個學員將加入 1 ~ 2 個小組: 感測網路探勘組( INTEL-NTU 暑期實習計畫) 社群網路探勘組(國科會大專生計畫) 資料探勘方法組(參與 ACM KDDCUP2013 )
E N D
機器發明與社群網路探勘實驗室 林守德 副教授 sdlin@csie.ntu.edu.tw
MSLAB「優秀Data Miner 培育計畫」搭一座結合理論與實務的橋樑 • 對象:台大資工系大學部同學 • 目的:訓練優秀的資料處理與探勘專家 • 時間:7/2012~6/2013總共一年 • 收費:前三個月免費,後9個月月繳負4000元 • 每個學員將加入1~2個小組: • 感測網路探勘組(INTEL-NTU 暑期實習計畫) • 社群網路探勘組(國科會大專生計畫) • 資料探勘方法組(參與ACM KDDCUP2013) • 自然語言與搜尋引擎組(Explore IBMWatson) • 名額:五名
申請資格 太嚴格 • 托福 100分,GRE2000分,書卷獎兩次? • 桌球打贏SD? • 擁有一顆熱情的心? • 正解: • 喜歡思考,對於創造發明有興趣 • 有強烈意願藉著這個專題學到如何對大量資料作智慧型分析與處理 • 不討厭理論/數學,卻不想做純理論/數學;不討厭程式實作,卻不想只是寫程式實作的同學 • 喜歡挑戰且做出很酷的東西的同學 (we are beyond just ideas) 太太太嚴格 太虛幻
感測網路探勘組(INTEL-NTULabProject) • Big data analysis • M2M data analysis • Time-sequence mining • Anomaly detection
Case Study: 災難預測 Local WSN 4 Local WSN 2 Local WSN 1 Local WSN N Local WSN 3 Local distributed server 1 Local distributed server 2 Local distributed server 3 Local distributed server 4 Local distributed server N Central server
專題生有機會參與2012年Intel-臺大創新研究中心學生暑期交流專題生有機會參與2012年Intel-臺大創新研究中心學生暑期交流 • Intel-臺大創新研究中心為一世界級研發機構,乃臺灣大學、英特爾公司以及國科會所共同成立,主要研究主題為機器間(machine-to machine,M2M)自主互連、互動技術,咸認其將繼網路技術,引爆下一波的資通訊產業革命,從而對人類的食、醫、住、行等各方面產生鉅大的影響。為協助國內外優秀學生搶先一窺全世界最尖端的次世代技術,觀摩全世界最頂尖半導公司的研究方式,實際應用所學,擴大國際視野,並增進未來就業競爭力,特邀請 貴系推薦大學生參與「Intel-臺大創新研究中心2012年學生暑期國際交流計劃」。 • Wireless sensor platform • Wireless sensor connectivity • Data security • Big data modeling
社群網路探勘組 • 社群網路如何影響人類的投票行為? • 社群網路上的推薦 • 社群網路上的取樣與族群分析 • 社群為本的逃生模擬 http://mslab.csie.ntu.edu.tw/evaplanner/ • 社群網路上的多人影響最佳化 • 結合地理資訊的社群網路探勘 http://mslab.csie.ntu.edu.tw/memetube/demo/
Information Propagation – in 台灣心跳聲 Measurement of Influence 台灣心跳聲 http://140.112.31.186/~tongtong/analyze_plurk/web_new5/index.php
資料探勘方法組 • 建保資料探勘 • 人際關係預測 • 機器學習與食物 • 參加明年舉辦的KDDCUP • Imbalanced Data Classification(ACM KDDCUP2008, Champion)in medical data • Fast prediction of Customers(ACM KDDCUP2009, 3rd place)in tel-comm data, joint work with Prof. CJLIN and HTLIN • Dependency modeling in(ACM KDDCUP2010, Champion)for education data, joint work with Prof. CJLIN and HTLIN • Music recommendation (ACM KDDCUP 2011, Champion), joint work with Prof. CJLIN and HTLIN • Weber Analysis (ACM KDDCUP2012, ?), with HTLIN • KDDCUP 2013? 實務
自然語言與搜尋引擎組 • 自動出題系統 • 能夠自動從網路上擷取並產生問題,例如 • 為什麼你應該參加MSLAB DataMiner培訓計畫? • 可以讓自己學會別人不會的技術 • 有親切且優秀的碩博士班學長姐 • 可以做出有用而且有挑戰性的東西 • 桌球能力會變強 • 以上皆是 • 瞭解不同主題的訊息如何在Facebook上傳播? • IBM華生的解析:探討電腦如何理解語言
專題型態與模式 • 沒有background?沒關係,我們會開發你的興趣與潛能 • 第一學期以訓練為主,第二學期專注於研究 • 會幫助同學把好的成果發表國際論文 • 會輔導大三專題生申請國科會專題計畫獎 • 鼓勵九月將升三年級或四年級的同學來修(二年級同學最好先修過機率或正在修機率) • 建議修課:Probabilistic Graphical Model, Machine Learning, Optimization • 研究:視學生情況,可以單獨做一個題目,也可以跟研究生同組學習。 • 50%方法(可能會用到機率,線性代數,演算法),50%實作(任何語言皆可) • 每週與指導教授(就是我)meeting一次 • 暑假開始會有每週半天的tutorial訓練各位 • Beprepared,toughtraining are waiting for you.