520 likes | 724 Views
結合 RSS 應用與位置感知服務 於行動校園系統之研究 Using RSS Applications and Location-based Service in Mobile Campus System. 指導教授:陳志達 研究生:李奕璋. 南台科技大學資管系碩士班 NADL 實驗室 http://nadlab.mis.stut.edu.tw. Outline. 研究動機 研究目標 文獻探討 系統架構 模組說明 與查詢結果之相關訊息之搜尋策略 M-Campus 結語 未來研究方向 Demo. 研究動機 (1/2).
E N D
結合RSS應用與位置感知服務於行動校園系統之研究Using RSS Applications and Location-based Service in Mobile Campus System 指導教授:陳志達 研究生:李奕璋 南台科技大學資管系碩士班NADL實驗室 http://nadlab.mis.stut.edu.tw
Outline • 研究動機 • 研究目標 • 文獻探討 • 系統架構 • 模組說明 • 與查詢結果之相關訊息之搜尋策略 • M-Campus • 結語 • 未來研究方向 • Demo
研究動機(1/2) • 隨著無線區域網路的發展與普及,所以目前不只是各大校園,愈來愈多的公共場所也都有提供無線上網的服務。 • 在無線區域網路內,使用者又可以任意的走動,因此,依使用者所在的位置提供位置感知服務(Location-Base Services)就成為一個值得研究的問題
研究動機(2/2) • RSS在近年來已被廣泛的應用,例如:線上新聞的提供、論壇…等,這些網站除了提供傳統網頁的瀏覽方式外,也都有提供RSS的訂閱,讓使用者可以使用支援RSS的軟體來訂閱這些資訊,如此一來就可以自動、定時的更新資訊。 • 因此,本研究結合了傳統校務行政系統與RSS,讓校務行政系統所提供的各類資訊依類別成為許多的Channel,讓使用者可以依個人喜好來訂閱。
研究目標(1/2) • 如何在無線區域網路的環境下進行Location-based Service • 結合傳統校園系統與RSS,讓校園資訊方便發佈與訂閱 • 使用Profile來記錄使用者的各種行為,與個人化的設定,來提供個人化的資訊與服務 • 為了擷取其他系統、網站所提供的資訊,因此必須開發一支Robot機器人程式,可以定時且自動化的取得外部資料源的資料
研究目標(2/2) • 為了能同時支援一般電腦或筆記型電腦的使用者和手持式行動裝置的使用者,因此本系統將發展兩組伺服器 • 為了讓手持式行動裝置的使用者方便使用本系統的Mobile Web Service Server,因此必須另外開發一套可安裝於行動裝置上的應用程式 • 結合CKIP來建立與查詢結果之相關訊息之搜尋策略
文獻探討(1/2) • RSS • Really Simple Syndication(RSS 2.0) • 是XML的延伸應用,必須符合XML的規範 • 用來發佈網站提供的資訊的標題或摘要 • 常用於新聞網站、論壇、Blog…等 • CKIP • 中研院詞庫小組開發的中文斷詞系統 • 透過Web Service來使用斷詞服務 • 將文章以詞為單位,切成數個詞,並標記每個詞的詞性
文獻探討(2/2) • Location-based Service • 簡稱LBS,中文可翻譯成「位置感知服務」、「適地性服務」、「位置服務」…等 • 定位方法 • GPS • Cell-ID定位 • RFID定位 • 無線網路AP定位
系統架構-外部資料源(2/3) • 外部資料源資料取得的方式 • 透過Web Service取得其他系統的資訊 • 使用剖析網頁的原始檔HTML資料所取得的資訊 • 擷取其他網站以RSS、ATOM、XML格式所提供的資訊。
系統架構-外部資料源(3/3) • 外部資料源會擷取的資訊種類 • 新聞資訊:中文新聞會以Yahoo新聞頻道會主,而英文新聞則是抓取Yahoo USA的新聞 • 校園資訊:擷取南台科技大學的學校網站、校務系統與學校其他的相關系統所提供的資訊 • 區域資訊:各縣市政府和公家機關的網站,抓取的資料如活動資訊、相關新聞…等 • 綜合資訊,例如:天氣…等
(一)Security管理模組 Security管理模組主要是負責系統的安全防護與資料管制,同時也是使用者客戶端和伺服器端連繫的主要管道,Security管理模組內有五個元件
(二) Profile處理模組(1/3) 1、處理M-Campus行動裝置應用程式傳來伺服器的Profile參數 2、管理伺服器端資料庫的Profile 3、提供雙向更新的功能。 Profile處理模組
(二) Profile處理模組(2/3) • 個人化設定 • 一般設定 • 使用者使用Web時的Location-based Service設定 • Web Parts • RSS設定 • 訂閱的頻道 • M-Campus行動裝置應用程式設定 • 記錄了使用者在使用該程式時的各種參數設定
(二) Profile處理模組(3/3) • 個人行為記錄 • 登入資訊:記錄使用者登入系統的時間、使用者客戶端IP、登出系統的時間。 • 位置記錄:記錄使用者使用系統時的位置。 • 書籤記錄:記錄使用者加入的書籤,書籤是當使用者看到一篇覺得不錯的資訊內容時,可以將該內容加入書籤,這樣日後可以快速的查詢到該篇資訊內容。 • 搜尋記錄:當使用者在Web系統搜尋資訊時,不管是簡易搜尋還是進階搜尋,都會記錄下來,記錄的內容有搜尋的關鍵字、複合條件的交集或聯集、資訊類別、資訊發佈的時間範圍。 • 閱讀記錄:記錄了使用者的資訊瀏覽的狀況,包含瀏覽的資訊標題、類別、頻道、閱讀的時間。 • 推薦記錄:記錄使用者推薦過的資訊內容。 • 評價記錄:記錄使用者評價過的資訊內容,還有使用者給予的分數。 • 討論記錄:記錄使用者討論過的資訊內容。
(三) AP定位模組(1/8) AP定位模組的功能則是當使用者用M-Campus行動裝置應用程式使用本系統時,進行使用者的位置定位,AP定位模組包含四個元件
(三) AP定位模組(2/8) • 三角定位法
(三) AP定位模組(3/8) • Location-based Service-先取得位置 • 當User使用行動裝置時,使用一般定位或三角定位法定位出使用者所在位置。 • 當User非使用行動裝置,而是用瀏覽器使用本系統時,Web有提供簡易的自選位置功能。 • 登入時預設、登入時選擇 • 分析相關位置 • 分析關聯頻道
(三) AP定位模組(4/8) • 相關位置計算 • 位置計算方法有兩種 • 位置從屬關係分析 • 經緯度計算 • 關聯程度 • 高度相關 • 低度相關
(三) AP定位模組(5/8) • 位置從屬關係-高度相關 • 向上或向下推一層 • 範例一:User在南台科大 • 相關位置:南台科大、L、E、S棟 • 範例二:User在L棟 • 相關位置:南台科大、L棟
(三) AP定位模組(6/8) • 位置從屬關係-低度相關 • 推二層 • 範例:User在L棟 • 向上推:南台科大 • 再從南台科大向下推:L、E、S棟 • 相關位置:南台科大、L、E、S棟
(三) AP定位模組(7/8) • 經緯度計算 • 高度相關:距離5公里內位置 • 低度相關:距離20公里內位置 • 經緯度取得方法:系統結合Google Map
(三) AP定位模組(8/8) • 關聯頻道 • 頻道建立時會選擇所屬的位置 • 在計算出相關位置後,就可以取得這些位置的頻道
(四)外部資料擷取模組(1/2) 外部資料擷取模組負責取得其他系統、網站所提供的資訊,主要的方法是透過Robot機器人程式定時向外部資料源擷取資料,這些外部資料源大致可分成HTML、Web Service、XML檔(包含RSS、ATOM)。
(四)外部資料擷取模組(2/2) Robot機器人程式主要實作了五個部分:主控台、計時器、HTML剖析器、XML讀取器、Web Service Client
(五) RSS News過濾模組 功能則是當本系統利用外部資料擷取模組取得其他系統的資料時,RSS News過濾模組會和系統資料庫做比對,判斷是否是重複資料。
(六) UGC Data處理模組 • 負責管理使用者創作、上傳的內容 • 圖片:縮圖、解析度調整…等,以節省儲存空間和增進圖片傳送的效能 • 文字:不雅詞句過濾 • 檔案:檔名重新命名、檔案壓縮
(七) User管理模組 1、負責使用者的管理 2、帳號的管理 3、群組的管理 4、使用者權限的管理
(八) RSS產生模組 將資訊以RSS 2.0格式發佈 將資訊以ATOM 1.0格式發佈 產生OPML(Outline Processor Markup Language)
與查詢結果之相關訊息之搜尋策略(1/8) • 相關訊息是針對某一則資訊來分析出和這一則資訊有關聯性的其他訊息,此功能的功用是當使用者閱讀某一則資訊時,可以快速的瀏覽到與正在閱讀的資訊有關聯的其他訊息。 • 利用CKIP斷詞服務來分析相關訊息
與查詢結果之相關訊息之搜尋策略(2/8) (一)先從資料庫中取得先前Robot機器人透過CKIP斷詞的斷詞結果,以新聞頻道的子頻道教育頻道的新聞「南縣/南台科大啦啦隊 全國大專盃表現優異」為例,其斷詞結果為「南縣(N)/(FW)南台(N)科大(N)啦啦隊(N)全國(N)大專盃(N)表現(N)優異(Vi)」。
與查詢結果之相關訊息之搜尋策略(3/8) (二)擷取名詞:從斷詞結果分擷取出名詞,共有「南縣」、「南台」、「科大」、「啦啦隊」、「全國」、「大專盃」、「表現」七個名詞,利用這七個名詞來搜尋此筆新聞同類別內的其他新聞。
與查詢結果之相關訊息之搜尋策略(4/8) (三)建立候選相關資訊資料集:從資料庫中搜尋資料來建立候選相關資訊資料集,搜尋方法有分精確搜尋與模糊搜尋兩種: 1、精確搜尋:只搜尋資訊標題 2、模糊搜尋:搜尋資訊標題和全文內容
與查詢結果之相關訊息之搜尋策略(5/8) (四)先淘汰較舊資料與詞頻計數分析:不論是精確搜尋或是模糊搜尋,因為都是採用聯集搜尋,所以候選的相關資訊會有很多筆,當候選相關資訊的資料數超過一百筆時,這時系統就會再進一步的過濾,過濾的方法就是先淘汰發佈日期離現在較久遠的,再用詞頻計數分析
與查詢結果之相關訊息之搜尋策略(6/8) • 詞頻計數分析 • 精確搜尋是計算每一筆候選相關資訊的標題包含這七個名詞的次數,包含愈多個代表相關性愈高,假設有一筆候選相關資訊的標題是「南台科大捐24部電腦給菲國小學」,那麼這筆資訊因為包含了「南台」和「科大」兩個名詞,所以詞頻計數就等於2。
與查詢結果之相關訊息之搜尋策略(7/8) • 詞頻計數分析 • 模糊搜尋則是計算每一筆候選相關資訊的標題和內容包含這七個名詞的次數,同一個名詞出現過幾次就算幾次,然而標題有包含這些名詞會比內容有包含這些名詞的關聯性還要大,所以還必須將次數做加權計算,而標題的詞頻計數的權重會比較高,公式如下: • 詞頻加權計數 = (標題的詞頻計數+1)2 -1 + 內容的詞頻計數
與查詢結果之相關訊息之搜尋策略(8/8) (五)產生相關資訊:在計算出候選相關資訊內每一筆資訊的詞頻計數或詞頻加權計數後,取出最高的一百筆做為最終的結果。
M-Campus- WMI • Windows Management Instrumentation • Client裝置附近AP的資訊 • AP的訊號強度 • AP MAC
M-Campus- Cache • 將接收到的資料以XML格式暫存到本機 • Cache的資料除提供快取功能外,並可以離線瀏覽 • 為了離線瀏覽,所以要事先依照User Profile自動下載個人化資料
M-Campus- Data Management • 依照User Profile或User的要求,呼叫遠端Web Service function
M-Campus- Security Management • User身份驗證 • 資料傳遞時的加解密
M-Campus- User Profile • 記錄User個人使用習慣 • 給User設定個人化資訊 • Cache和Data Management會依照User Profile下載資料
結語 • 本研究提供了一個新的架構,將RSS應用和傳統的校務行政系統結合,讓校園系統所提供的資訊以RSS的格式來發佈 • 系統將RSS資訊依類別成為許多的Channel,讓使用者可以依照個人喜好來訂閱。 • 而本系統更結合了Web2.0的精神,User Generated Content和Social Network Service的應用,讓本系統可以訂閱的Channel不只是校務行政的資訊,還有校內社團、個人網誌、生活資訊、和台南區域資訊…等多樣化的資訊內容 • 讓使用者來創作內容,再加上RSS Channel的容易擴充的性質,使本系統所能提供的資訊種類與資訊量都能更為豐富。
未來研究方向(1/2) • 智慧型使用者行為與偏好分析 • 結合本體論與人工智慧技術 • 更精準的分析使用者需要或偏好的資訊 • 更精準的相關訊息之搜尋與分析方法 • 目前資料的相關訊息的分析方法是透過CKIP斷詞後來做詞頻計數分析 • 加入語意網路的概念,為現有的資料定義出語意關係,以實現更具智慧與更準確的搜尋與分析。