150 likes | 576 Views
Veri Madenciliğinde Regresyon Yöntemleri İle Doğalgaz Sektöründe Talep – Tüketim Analizi. Servet ÖZMEN Karabük Üniversitesi , Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Ana Bilim Dalı, Karabük Dr. Baha ŞEN
E N D
Veri Madenciliğinde Regresyon Yöntemleri İle Doğalgaz Sektöründe Talep – Tüketim Analizi Servet ÖZMEN Karabük Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Ana Bilim Dalı, Karabük Dr. Baha ŞEN Yıldırım BeyazıtÜniversitesi, Mühendislik ve Doğa Bilimleri Fakültesi, Bilgisayar Mühendisliği Bölümü, Ankara
Sunum İçeriği • Veri Madenciliği Hakkında • Regresyon Yöntemine Genel Bakış • Doğalgaz Sektörü • Doğalgaz Sektöründe Talep – Tüketim Tahminlemenin Önemi • Doğalgaz Tahmininde Veri Sözlüğü • Verilerin Kullanılabilirliği • Sonuç
Veri Madenciliği • Veri madenciliği bilginin keşfine giden yol olarak tanımlanabilir. • Farklı kaynaklardan verilerin toplanması • Verilerin düzenlenmesi • Algoritmaların uygulanması • Sonuç • Ortak hedef eldeki veriler ile gerçeğe en yakın bulgu veya tahminlemedir.
Regresyon Yöntemine Genel Bakış • Regresyon Analizi esas olarak değişkenler arasında ilişkinin niteliğini saptamayı amaçlar. • Bir yada birden daha çok değişkenin başka değişkenler cinsinden tahminleme olanağıdır.
Doğalgaz Sektörü • Hızla tüketimi artan sektör • Günümüzde değerli ve stratejik bir enerji kaynağı olarak sıklıkla evlerde ve endüstride kullanılmaktadır. • Diğer kaynaklara göre uygun
Doğalgaz Sektöründe Talep – Tüketim Tahminlemenin Önemi • ≈ %95 oranında dışa bağımlılık • Enerji verimliliği • Denetleme organları (EPDK) • Cezai uygulamalar
Doğalgaz Tahmininde Veri Sözlüğü Tahminlemesürecinde RMS-A bazındafarklıtüketimdeğerlerivetüketimalışkanlıklarıgözönünealınarak veri sözlüğü oluşturulmuştur. Bunedenleverihazırlığıaşamasındakendiiçindehomojentahminlerinüretilmesiprojeninbaşarılıbirşekildesonuçlandırılmasıadınaönemlibirroloynamaktadır.
Doğalgaz Tahmininde Veri Sözlüğü • Meteorolojik Veriler
Verilerin Kullanılabilirliği • HavaDurumID: Benzersiz tablo anahtarıdır. • HavaGelisTarih:Xml formatındaki veride, verinin alındığı tarih ve saattir. Geçmiş verilerde (31.12.2010 ve öncesi) bu tarih yoktur. • HavaTarih: Hava durum tarihi ve saatini gösterir. Buradaki saat değeri UTC değeridir. Türkiye saati değildir. • RuzgarHizi: Geçmiş veride ve xml verisinde rüzgar hızı verisi bulunmaktadır. Bu veri rüzgarın m/s değeridir. • RuzgarYonu: Geçmiş veri ve xml verisinde rüzgar yönü verisi bulunmaktadır. Geçmiş veride rüzgar yönü pusula değerleriyle bağlantılı verilen değerler, xml formatında gelen verilere eş değer şekle getirilmiş, geçmiş veri xml ile uyumlaştırılmıştır. Buradaki yön kavramında +Y ekseni 0° gösterirken, +X ekseni 90° göstermektedir. –Y ekseni 180° gösterirken, -X ekseni 270° göstermektedir.
Doğalgaz Tahmininde Veri Sözlüğü • Etkili veriler
Verilerin Kullanılabilirliği • Bu veri setinde 01.01.2006 ile 31.12.2021 tarihi arasındaki abone türlerine göre iş günü olup olmadığı, tatil ise tatil nedeni belirtmiştir. • Buradaki veriler; • IsGunleriID: Takvimin benzersiz anahtarıdır. • IsGunleriTarihi: Takvim günlerini göstermektedir. • AboneTuru: “AboneTuru” tablosununa bağlı olarak gelen benzersiz tanımlardır. • IsGunuMu: Takvim gününün iş günü olup olmadığını gösterir. Buradaki “0” değeri tatil olduğunu, “1” değeri iş günü olduğu, “2” değeri ise yarım iş günü olduğunu göstermektedir. Dini bayram tatilleri 2015 yılına kadar bulunabildiği için, bu tarihe kadar girilmiştir. • TatilNedeni: Bu alan tatil varsa nedenini göstermektedir. Buradaki değer “Tatiller” tablosundaki TatillerID ile eşleşmektedir.
Verilerin Kullanılabilirliği • Veriler ile ilk çalışmayı SAS programı ile yapılmıştır. Fakat ücretli bir program olduğundan projenin devamında Weka ortamında opensource kaynak kodlu program ile devam edilecektir.
Sonuç • Sonuç olarak, günlük tahmin sonuçları oluşmaktadır. Tahmin sonuçları, yarın ve sonra ki haftayı tahmin etmektedir. • Regresyon analiziyle talep – tüketim analizleri hata oranı düşük olarak tahminlemeleri çok yüksek derecede tutmaktadır. • Hata payı oran ortalaması ilk çalışmamızda %9,4 oranında çıkmıştır. • Bu oran verilerin kalitesi arttıkça düşmektedir. • Raporlar 3 kırılımda alınabilmektedir.