600 likes | 946 Views
GVHD: PGS. TS. Dương Tuấn Anh GVPB: TS. Võ Thị Ngọc Châu SVTH1: Trần Thế Sĩ – 50801793 SVTH2: Đinh Kim Ngân - 50801336. Kết hợp mạng Nơron nhân tạo và mô hình ARIMA để dự báo dữ liệu chuỗi thời gian. 12/2012. Nội dung.
E N D
GVHD: PGS. TS. DươngTuấnAnh GVPB: TS. VõThịNgọcChâu SVTH1: TrầnThếSĩ – 50801793 SVTH2: Đinh Kim Ngân - 50801336 KếthợpmạngNơronnhântạovàmôhình ARIMA đểdựbáodữliệuchuỗithờigian 12/2012
Nội dung • Giớithiệuchuỗithờigianvàcáckháiniệmliênquan • Môhình ARIMA • Môhình ANN • Môhìnhkếthợp ARIMA-ANN • Kếtquảthựcnghiệm • Kếtluận • Q&A
Giớithiệuchuỗithờigianvàcáckháiniệmliênquan • Môhình ARIMA • Môhình ANN • Môhìnhkếthợp ARIMA-ANN • Kếtquảthựcnghiệm • Kếtluận • Q&A
Chuỗithờigian • Dữliệuđượcthunhập, lưutrữvàquansáttheosựtăngdầncủathờigian • Chuỗithờigiantuyếntính • Thànhphầnmùa • Thànhphầnchukì • Thànhphầnxuhướng • Thànhphầnbất qui tắc • Chuỗithờigian phi tuyếntính
Thànhphầncủachuỗithờigian • Việcxácđịnhmộtchuỗithờigiancóthànhphầnxuhướnghaythànhphầnmùarấtquantrọngtrongbàitoándựbáochuỗithờigian. Nógiúp ta lựachọnđượcmôhìnhdựbáophùhợphaygiúpcảitiếnmôhìnhđãcóchínhxáchơn. • Có 2 cáchphổbiếngiúpnhận ra cácthànhphầncủachuỗithờigiantuyếntính: • Phươngphápđồthị • Phântíchhệsốtựtươngquan
Thànhphầnxuhướng Hệsốtựtươngquanrấtlớn ở nhữngđộtrễđầutiênvàgiảmdầntheosựtăngcủađộtrễ. Cóthểđượcxấpxỉbằng 1 đườngthẳnghoặcđườngcongtrơn
Chuỗithờigiantĩnh • (1) • (2) • Hệsốtựtươngquancủachuỗithờigiantĩnhgiảmnhanhvề 0, thôngthườngsauđộtrễthứ 2 hoặcthứ 3.
Thànhphầnchukì • Nhữngdao độngdạngsóngquanhxuhướngluônthayđổicảvềbiênđộvàkhoảngthờigianxuấthiện • Xemnhưlà mộtphầncủathànhphầnxuhướng
Thànhphầnmùa • Thànhphầnthểhiệnsựbiếnđổilặpđilặplạitạitừngthờiđiểmcốđịnhtheotừngnămcủachuỗithờigian • Hệsốtựtươngquantạinhữngthờiđiểmcốđịnhtheotừngnămsẽcósựtươngquanlớnvớinhau
Giớithiệuchuỗithờigianvàcáckháiniệmliênquan • Môhình ARIMA • Môhình ANN • Môhìnhkếthợp ARIMA-ANN • Kếtquảthựcnghiệm • Kếtluận • Q&A
Lớpmôhình ARIMA • Môhìnhtrungbình di độngbậc q, MA(q) • Môhìnhtựhồiquybậc p, AR(p) • Môhìnhkếthợptựhồiquyvàtrungbình di động ARMA(p,q) • Môhìnhtựhồiquytíchhợpvớitrungbình di động ARIMA(p,d,q) • Môhình ARIMA cótínhmùa SARIMA(p,q,d)(P,Q,D)s
Môhìnhtrungbình di độngbậc q • Môhình MA(q) • Dấuhiệunhậnbiết • Hệsốtựtươngquanbằng 0 vớiđộtrễlớnhơn q • Hệsốtựtươngquanriêngphầngiảmdầnvề 0 Môhình MA(2)
Môhìnhtựhồiquybậc p • Môhình AR(p) • Dấuhiệunhậnbiết: • Hệsốtươngquangiảmdầnvề 0 • Hệsốtươngquanriêngphầnbằng 0 vớiđộtrễlớnhơnp ACF và PACF củamôhình
Môhìnhkếthợptựhồiquyvàtrungbình di động • Môhình ARMA(p,q) • Dấuhiệunhậnbiết • Hệsốtươngquanbằng0 sauđộtrễ q • Hệsốtươngquanriêngphầnbằng0 sauđộtrễp ACF và PACF củamôhình +
Môhìnhtựhồiquytíchhợpvớitrungbình di động • Môhình ARIMA(p,d,q) • Dấuhiệunhậnbiết • Chuỗithờigiankhôngtĩnh, cóxuhướng • Hệsốtươngquangiảmrấtchậm
Môhìnhtựhồiquytíchhợpvớitrungbình di động • Môhình ARIMA(p,d,q) • Phươngpháplấyhiệuđểkhửtínhxuhướng:cho {Xt} • Lần 1: Yt = Xt+1 – Xt = • Lần 2: Zt = Yt+1 – Yt = ..… • Lần d: Wt =
Môhình ARIMA cótínhmùa- SARIMA • Môhình SARIMA(p,d,q)(P,D,Q)s • Nhậnbiết: Hệsố ACF rấtlớntạicáccậnmùa • Cáchxácđịnhchukìmùa • Xácđịnhcáchệsốtươngquancực trị. • Tínhkhoảngcáchgiữacáchệsốtươngquancực trị. • Nhậndạngkhoảngcáchđượclặplạinhiềunhất, nếutầnsuấtcủakhoảngcáchnàylớnthìđóchínhlàchukìmùa.
Xâydựngmôhình SARIMA • Môđunnhậndạngmôhình • Môđunkhửmùavàxuhướng • Môđunướclượngthamsố • Môđundựbáo
Xâydựngmôhình SARIMAMôđun nhận dạngmôhình • Môhình SARIMA(p,d,q)(P,D,Q)s • Xácđịnhbậclấyhiệudđểloạibỏtínhxuhướng • Loạibỏtínhmùa: chuỗidữliệuđượclấyhiệuDlầnvớikhoảnglấyhiệulàs • Xácđịnhbậcchothànhphầndữliệutĩnh: p, q • Xácđịnhbậcchothànhphầnmùa: P, Q
Xâydựngmôhình SARIMAMôđun nhận dạngmôhình • Xác địnhmôhìnhbằngcáchphântíchtínhchất ACF, PACF Tỉlệthayđổitrungbình: • Nếu > 65% thìkếtluậnmẫucóhệsốtựtươngquanbằng 0 sau 1 vàiđộtrễ. • Nếu > 10% thìkếtluậnmẫucóhệsốtựtươngquangiảmdầnvề 0. • Cáctrườnghợpcònlạithì ta xemmẫucóhệsốtựtươngquanbiếnđổitheohàmmũ.
Xây dựng mô hình SARIMA Môđun khử mùavàxuhướng • Cácchuỗidữliệurấtphứctạpvàthườngmangtínhxuhướnghoặctínhmùa • Cácchuỗidữliệucầnđượcbiếnđổithànhcácquátrìnhtĩnhtrướckhiđưavàothànhphầnnhậndạngmôhình • Lấyhiệulàkĩthuậtđượcsửdụngphổbiếnnhất • Khidựbáo, ta cầnchuyểnđổilạidữliệunhư ban đầu
Kếtluậnvềmôhình ARIMA • MôhìnhSARIMA làmộtmôhìnhtổngquátcóthểsửdụngchonhiềuloạichuỗithờigiantrongthựctế, kểcảnhữngchuỗicóthànhphầnxuhướngvàthànhphầnmùa. • Tuynhiênmôhình SARIMA khôngthểdựđoánthànhphần phi tuyếncủachuỗithờigian. • ĐểxâydựngmôhìnhSARIMA cầnphảicónhiềudữliệu. • Khôngdễcậpnhậpmôhìnhkhicóthêmdữliệumới, thườnglàmôhìnhmớisẽđượcxâydựng
Giớithiệuchuỗithờigianvàcáckháiniệmliênquan • Môhình ARIMA • Môhình ANN • Môhìnhkếthợp ARIMA-ANN • Kếtquảthựcnghiệm • Kếtluận • Q&A
Môhình ANN • Sơlượcvềmạngnơron • Mạngnơronnhântạo • Giảithuậtlantruyềnngược • Giảithuật RPROP • Xâydựngmôhình ANN • Kếtluậnmôhình ANN
Sơlượcvềmạngnơron • Tếbàohìnhcâycónhiệmvụmangtínhiệuđiệnsinhhọctớitếbàothân • Tếbàothânsẽthựchiệntínhtổngvàphânngưỡng (thresholds) cáctínhiệuđến • Sợitrụcthầnkinhcónhiệmvụđưatínhiệutừtếbàothânrangoài • Khớpthầnkinh (synapse) làđiểmtiếpxúcgiữasợitrụcthầnkinhnàyvớitếbàohìnhcâycủanơronkia
MạngnơronnhântạoHìnhdạngmạng Mạnghồiquy Mạngtruyềnthẳng
Giảithuậtlantruyềnngược • Tìmtậpcáctrọngsốthíchhợpchomộtmạngnơrontruyềnthẳngnhiềulớp • Ápdụngphươngphápgiảmđộdốcđểtốithiểuhóabìnhphươngsaisố • Giátrịlỗisẽđượclantruyềnngượctừtầngxuấtvềtầngnhậpđểtính
GiảithuậtlantruyềnngượcƯuđiểm – nhượcđiểm • Ưuđiểm: • Đơngiảnnêndễápdụng • Nhượcđiểm: • Khókhăntrongviệclựachọnthamsốđầuvào • Phụthuộcvàođộlớnđạohàmlỗi • Quátrìnhhọckhôngổnđịnh
Giảithuật RPROP • Resilient Propagation • Lantruyềnđànhồilàmộtphươngphápthíchnghicụcbộ • Cậpnhậpcáctrọngsốdựavàothông tin vềdấucủacácđạohàmriêngphần • Thựchiệntheomôhìnhhọctheoepoch nghĩalàcậpnhậthệsốdựavàothông tin củatổngđộdốcchotoànbộtậpdữliệu
GiảithuậtRPROPƯuđiểm • Việckhởitạogiátrị ban đầuchocácthamsốítảnhhưởngđếntốcđộhộitụ • Việccậpnhậtdựavàodấucủađạohàmriêngphầnnênviệccậpnhậtsẽtrảiđềuchotoànmạngchứkhôngthiênvịnhưmôhìnhlantruyềnngược
Xâydựngmôhình ANN • Lựachọncácbiến • Thu thậpdữliệu • Tiềnxửlýdữliệu • Phân chia tậpdữliệu • Xâydựngcấutrúcmạng • Xácđịnhtiêuchuẩnđánhgiá • Huấnluyệnmạng • Dựbáovàcảitiến
XâydựngmôhìnhANNPhân chia tậpdữliệu • Tậphuấnluyện, kiểmtravàkiểmđịnh (ngoàicácmẫu) • Tậphuấnluyệnthườngcókíchthướclớnnhất • Tậpkiểmtrachiếmkhoảng 10% - 30% dữliệutậphuấnluyện • Tậpkiểmđịnhphụthuộcvàokíchthướcmẫu, baogồmcácgiátrịdựđoánmớinhất • Phươngpháp walk-forward
XâydựngmôhìnhANNXâydựngcấutrúcmạng • Xácđịnhsựliênkếtgiữacácnơron • Xácđịnhsốlớpẩn: thôngthườngcácmạngnơronđượckhởitạovớimộthoặchailớpẩn. • Xácđịnhsốnơrontrongtừnglớp: • Tạoramộtsốmôhìnhmẫu, huấnluyệnvàchọnmôhìnhcólỗitốiưunhất • Thayđổicấutrúcngaytronggiaiđoạnhuấnluyện (phứctạp)
XâydựngmôhìnhANNXácđịnhtiêuchuẩnđánhgiá • Thườngdùngtổngbìnhphươnglỗi • Trongđó: • nlàsốđiểmtrongtậpdữliệukiểmtra • tkvàoklầnlượtlàgiátrịmongmuốntrongbộdữliệuvàgiátrịxuấtcủamạngnơron
XâydựngmôhìnhANNHuấnluyệnmạng • Mụctiêucủaviệchuấnluyệnmạngđólàtìmratậpcáctrọngsốcho ta giátrịnhỏnhấttoàncụccủachỉsốhiệunăng hay hàmlỗi • Cóbacáchthườngdùngđểdừngmộtquátrìnhhuấnluyện: • điểmhộitụ • sốlầnlặptốiđa • sửdụngtậpdữliệukiểmđịnh (validation set)
Kếtluậnvềmôhình ANN • Dựđoántốtthànhphần phi tuyếncủachuỗithờigian • Phụthuộcnhiềuvàocấuhìnhcủamạng (sốlớp, sốđơnvịmỗilớp) vàcácthamsốcủagiảithuậthuấnluyện • Đốivớinhữngchuỗithờigiancóxuhướngvàtínhmùachươngtrìnhsửdụngmạngnơrondựđoánvớiđộchínhxácchưacao
Giớithiệuchuỗithờigianvàcáckháiniệmliênquan • Môhình ARIMA • Môhình ANN • Môhìnhkếthợp ARIMA-ANN • Kếtquảthựcnghiệm • Kếtluận • Q&A
Môhìnhkếthợp ARIMA vàANN • Môhình ARIMA khônggiảiquyếtđượcchuỗi phi tuyến • Môhình ANN khônggiảiquyếttốtchuỗituyếntính • Khóxácđịnhđượcmộtchuỗithờigianthuần phi tuyến hay tuyếntính • Mộtchuỗithờigianthườngbaogồmcả 2 thànhphần phi tuyến, tuyếntính
Hiệnthựcmôhìnhkếthợp ARIMA và ANN • Môhình • L: biểudiễnthànhphầntuyếntínhcủachuỗithờigianđượcướclượngbởimôhình SARIMA • N: biểudiễnthànhphần phi tuyếncủachuỗithờigianđượcướclượngbởimôhình ANN • Dựđoán
Giớithiệuchuỗithờigianvàcáckháiniệmliênquan • Môhình ARIMA • Môhình ANN • Môhìnhkếthợp ARIMA-ANN • Kếtquảthựcnghiệm • Kếtluận • Q&A
Tiêuchuẩnđánhgiá • SaisốtuyệtđốitrungbìnhlỗiMAE (mean absolute error) tínhtheocôngthức: • SaisốtrungbìnhbìnhphươnglỗiMSE (mean squared error) tínhtheocôngthức: • SaisốtuyệtđốiphầntrămlỗiMAPE (mean absolute percentage error) đượctínhtheocôngthức:
Kếtquảthựcnghiệm Chuỗidữliệucótínhmùavàxuhướng
Kếtquảthựcnghiệm Dữliệu phi tuyếntính
Giớithiệuchuỗithờigianvàcáckháiniệmliênquan • Môhình ARIMA • Môhình ANN • Môhìnhkếthợp ARIMA-ANN • Kếtquảthựcnghiệm • Kếtluận • Q&A