200 likes | 337 Views
將公司標幟插入此投影片 選取〔插入〕功能表 〔 圖片〕指令 選取〔從檔案〕指令 選取你的標幟圖片檔案 按下〔確定〕 調整標幟圖示大小 於標幟圖示內任意一處按一下.出現在標幟圖示外的白色小方塊即為可調整邊框 運用此法來調整物件大小 如果你在使用調整邊框之前按住 Ctrl 鍵,將維持你想調整之物件比例. RRE (Revolution R Enterprise) vs. R at PC Cluster. Edward Cheng 2.18.2014. PC Cluster. Environment.
E N D
將公司標幟插入此投影片 • 選取〔插入〕功能表 〔圖片〕指令 • 選取〔從檔案〕指令 • 選取你的標幟圖片檔案 • 按下〔確定〕 調整標幟圖示大小 • 於標幟圖示內任意一處按一下.出現在標幟圖示外的白色小方塊即為可調整邊框 • 運用此法來調整物件大小 • 如果你在使用調整邊框之前按住Ctrl 鍵,將維持你想調整之物件比例 RRE (Revolution R Enterprise) vs. R at PC Cluster Edward Cheng 2.18.2014
Environment • Node01~node36,stathpc: RHEL 5 + RRE 6.1 (R-2.14.2) • Node51~node60, himemhpc: RHEL 6 + RRE 7.0 (R-3.0.2)
History • R 起源 • 1993, Professor, Ross Ihaka and Robert Gentleman,University of Aukland, 紐西蘭 • Reolution Analytics 公司 (www.revolutionanalytics.com) • 2008 by Intel Capital 等創投投資 • 董事會成員有:Robert Gentleman 教授 (R founder), Norman H. Nie 顧問 (前 SPSS CEO) • Revolution R Enterprise (企業版 R)
R • R is world’s most widely used statistics programming language. • Free and open source software
Definition • “Big Data” is data whose scale, diversity, and complexity require new architecture, techniques, algorithms, and analytics to manage it and extract value and hidden knowledge from it…
Big Data • 2011 年全球數位資料的使用量約為 1.8 ZB (1 ZB = 2 的 70 次方位元組)。依據 IDC(International Data Corporation)所做的研究報告預測,到 2020 年的總量將是現在的 44 倍,約為 35.2 ZB。
Big Data 2006 累計儲存了850 TB的 網頁資料 2009 每週約有二億二千萬張照片上傳,也就是需要25 TB的空間儲存 2011 每分鐘約有48小時(48GB)的影片上傳 (每天約有70TB) BIGDATA 海嘯來襲
eBay The world’s largest online marketplace • We have over 50 petabytes of data • We have over 400 million items for sale • We process more than 250 million user queries per day • We have over 112 million active users • We sold over US$75 billion in merchandize in 2012
Big Problems • Capacitydata too big to fit into memory • Speedcomputation may be too slow to be useful
RevoScaleR • RevoScaleR PackageRevoScaleR analysis functions such as rxCube, rxLinMod, rxCovCor, rxLogit, and rxGlm will provide significant speed improvements over any alternatives. These algorithms are all optimized for handling big data.
.xdf data format • The XDF file format, a binary file format with an interface that optimizes row and column processing and analysis.