500 likes | 1.3k Views
Verteidigung der Diplomarbeit. Towards a reliable Architecture for Crowdsourcing in Context of the MapBiquitous Project Bearbeitet von: Tenshi C. Hara (hara@inf.tu-dresden.de) Betreut durch: Dr.-Ing. Thomas Springer Bearbeitungsbeginn: 1. Juni 2012 Abgabefrist: 30. November 2012
E N D
Verteidigung der Diplomarbeit Towards a reliable Architecture for Crowdsourcing in Context of the MapBiquitousProject Bearbeitet von: Tenshi C. Hara (hara@inf.tu-dresden.de) Betreut durch: Dr.-Ing. Thomas Springer Bearbeitungsbeginn: 1. Juni 2012 Abgabefrist: 30. November 2012 Abgabe: 25. Oktober 2012 Dresden, 29.10.2012
Motivation Agenda • Motivation • Verwandte Arbeiten • Erstes Ergebnis • Entwickeltes Konzept (Zweites Ergebnis) • Implementierung (Drittes Ergebnis) • Evaluation (Viertes Ergebnis) • Fortsetzungsmöglichkeiten Verteidigung der Diplomarbeit Folie Nr. 2 von 32
Motivation (Beispiele) • Verbesserung der Navigation in Gebäuden • Wartung von Daten • Korrektur von Daten • Entfernen obsoleter/falscher Daten • Hinzufügen von Daten • GSM-Informationen • WLAN-Accesspoints • Gebäude ohne Gebäudeplan • Für den technisch nicht versierten Gebäude-eigentümer nicht machbar • Crowdsourcing kann helfen Verteidigung der Diplomarbeit Folie Nr. 3 von 32
Motivation • Zusammenarbeit mit Gerd Bombach→ Belegarbeit • Aufteilung entlang Awareness-Diskriminator(folgt in Ergebnis 1) • Gerd Bombach: Explizites Crowdsourcing→ Client-Seite • Ich: Implizites Crowdsourcing→ Server-Seite • Zusammenarbeit und Nutzung gemeinsamer Ergebnisse Verteidigung der Diplomarbeit Folie Nr. 4 von 32
Agenda • Motivation • Verwandte Arbeiten • Erstes Ergebnis • Entwickeltes Konzept (Zweites Ergebnis) • Implementierung (Drittes Ergebnis) • Evaluation (Viertes Ergebnis) • Fortsetzungsmöglichkeiten Verteidigung der Diplomarbeit Folie Nr. 5 von 32
Verwandte Arbeiten – Crowdsourcing • (Ergebnisse von Gerd Bombach beigesteuert!) • GeoWiki→ CS: Erstellung von Outdoor-Karten • Otsason/Varshavsky:“Accurate GSM Indoor Localization” • Google IndoorMaps→ CS: Erstellung von Indoor-Karten • Stauvorhersage→ CS: Fahrzeuge senden Verkehrsdaten Verteidigung der Diplomarbeit Folie Nr. 6 von 32
Verwandte Arbeiten – CS-Architektur • Viele Paper und Projekte • enden i.d.R. an der Schnittstelle zum Server • Eine einzige gut dokumentierte CS-Architektur inklusive detaillierter Beschreibung der Server-Seite: • Berkeley Open Infrastructure for Network Computing (BOINC) • Zum Glück als „verwandte Arbeit“ brauchbar, da (begrenzte) Ähnlichkeit zum DA-Thema Verteidigung der Diplomarbeit Folie Nr. 7 von 32
Folie Nr. 8 von 32 Verwandte Arbeiten – BOINC austauschbar HTTP HTTP HTTP HTTP HTTP austauschbar
Verwandte Arbeiten – BOINC – Zsfs. • Entwickelt für Crowdworking(Distributed Processing) • HTTP-basierte Kommunikation • Lediglich Architektur • Anwendungen austauschbar Verteidigung der Diplomarbeit Folie Nr. 9 von 32
Agenda • Motivation • Verwandte Arbeiten • Erstes Ergebnis • Entwickeltes Konzept (Zweites Ergebnis) • Implementierung (Drittes Ergebnis) • Evaluation (Viertes Ergebnis) • Fortsetzungsmöglichkeiten Verteidigung der Diplomarbeit Folie Nr. 10 von 32
Erstes Ergebnis • Es gibt viele Ideen davon, was Crowdsourcing ist… • …ebenso viele Definitionen von CS! • Wird noch komplizierter, sobald die Begriffe „implizites ~“ und „explizites ~“ ins Spiel gebracht werden • Es existieren akzeptierte Vorstellungen von Crowdsourcing-Derivaten • Aber es existiert keine CS-Taxonomie • Erstes Ergebnis der Diplomarbeit: • Definition einer Crowdsourcing-Taxonomie Verteidigung der Diplomarbeit Folie Nr. 11 von 32
Immediacy UDC UnawareDirectCrowdsourcing ADC AwareDirectCrowdsourcing Erstes Ergebnis – Crowdsourcing-Taxonomie explicit/direct UIC UnawareIndirectCrowdsourcing AIC AwareIndirectCrowdsourcing implicit/indirect Awereness implicit/unaware explicit/aware Verteidigung der Diplomarbeit Folie Nr. 12 von 32
Agenda • Motivation • Verwandte Arbeiten • Erstes Ergebnis • Entwickeltes Konzept (Zweites Ergebnis) • Implementierung (Drittes Ergebnis) • Evaluation (Viertes Ergebnis) • Fortsetzungsmöglichkeiten Verteidigung der Diplomarbeit Folie Nr. 13 von 32
Entwickeltes Konzept • Austauschbare Anwendungslogik • Von eigentlicher Crowdsourcing-Klasse unabhängig • Unterstützt theoretisch alle allgemein anerkannten CS-Derivate: • Crowdwisdom • Crowdvoting • Crowdpurchasing • Crowdfunding • Crowdworking Verteidigung der Diplomarbeit Folie Nr. 14 von 32
Entwickeltes Konzept • Hinzufügen einer neuen Komponente zur Architektur: • Indoor Navigation Server Access Network Entity (INSANE) • Proxy für alle Crowdsouring-Zugriffe • Wenig Änderungen am vorhandenen Building Server notwendig • Nur Hinzufügungen am Client notwendig • Single-Point ofFailure! Verteidigung der Diplomarbeit Folie Nr. 15 von 32
Folie Nr. 16 von 32 Entwickeltes Konzept Verteidigung der Diplomarbeit
Hilft, den Single Point ofFailure zu vermeiden! Entwickeltes Konzept Verteidigung der Diplomarbeit Folie Nr. 17 von 32
Entwickeltes Konzept – Ein einzelnes Detail Verteidigung der Diplomarbeit Folie Nr. 18 von 32
Agenda • Motivation • Verwandte Arbeiten • Erstes Ergebnis • Entwickeltes Konzept (Zweites Ergebnis) • Implementierung (Drittes Ergebnis) • Evaluation (Viertes Ergebnis) • Fortsetzungsmöglichkeiten Verteidigung der Diplomarbeit Folie Nr. 19 von 32
Implementierung • PHP-basiert auf Apache httpd • Optimiert auf Speicherverbrauch, um möglichst viele parallele, konkurrierende Anfragen bedienen zu können • “imperative structured programming with modularisedincludes” • KeineObjekte • Modularisiert • AlleAufgabenerledigt in 1 Anfrage und 1 Antwort • Lebenszeit von Variablen, Strukturen, etc. begrenzt auf ZeitzwischenAnfrage und Antwort Verteidigung der Diplomarbeit Folie Nr. 20 von 32
Implementierung Folie Nr. 21 von 32
Agenda • Motivation • Verwandte Arbeiten • Erstes Ergebnis • Entwickeltes Konzept (Zweites Ergebnis) • Implementierung (Drittes Ergebnis) • Evaluation (Viertes Ergebnis) • Fortsetzungsmöglichkeiten Verteidigung der Diplomarbeit Folie Nr. 22 von 32
Vergleich BOINC vs. eigenes Konzept BOINC Entwickelt für Crowdworking(Distributed Processing) HTTP-basierte Kommunikation Lediglich Architektur Anwendungen austauschbar(Client-seitig) Konzept Entwickelt für Crowdsourcing(prinzipiell alle Derivate) HTTP-basierte Kommunikation Architektur mit integrierter, austauschbarer Anwendungslogik Anwendungen austauschbar(Server-seitig; auch Client-seitig) Verwandte Arbeiten – BOINC – Zsfs. • Entwickelt für Crowdworking(Distributed Processing) • HTTP-basierte Kommunikation • Lediglich Architektur • Anwendungen austauschbar Ähnlichkeiten mehr als deutlich… Eigenes Konzept ist aber universeller Verteidigung der Diplomarbeit Folie Nr. 23 von 32
Evaluation • INSANE und Crowdsourcing-Modul teilen sich etwa 85% des Codes • Beide laufen auf einem normalen Apache httpd Webserver • Vermutung liegt nahe, dass implementierter Code sich wie eine Standard-Webseite verhält • Gleiche Vorteile/Einschränkungen in Bezug auf Performance • Gleiche Vorteile/Einschränkungen in Bezug auf Skalierbarkeit Verteidigung der Diplomarbeit Folie Nr. 24 von 32
Evaluation Folie Nr. 25 von 32
Evaluation • INSANE agiert als Kommunikations-Proxy • Vermutung liegt nahe, dass Overhead entsteht • über den gesamten Kommunikationskanal von 100% • auf einzelnes Paket von 0% Verteidigung der Diplomarbeit Folie Nr. 26 von 32
Folie Nr. 27 von 32 Auch super, denn auf 2kB Daten nurwenig Overhead! Evaluation – WFS-Overhead Super Ergebnis!
Evaluation – Positioning-Overhead 150%-195% 25%-45% Folie Nr. 28 von 32
Evaluation • Overheads • Vermutete Overheads gelten für große Pakete bzw. viele Samples • Beim Positioning (und Fingerprinting) für gängigen Sample-Mengen ( 6): • Overhead hoch(ca. 145% (total) bzw. 30% (ClientINSANE)) • Komprimierung (GZIP) über den gesamten Kommunikationspfad sollte aktiviert werden, um die Datenmenge zu reduzieren(ändert vrsl. nicht den qualitat. Overhead!) • Performance und Skalierbarkeit: SUPER! Verteidigung der Diplomarbeit Folie Nr. 29 von 32
Agenda • Motivation • Verwandte Arbeiten • Erstes Ergebnis • Entwickeltes Konzept (Zweites Ergebnis) • Implementierung (Drittes Ergebnis) • Evaluation (Viertes Ergebnis) • Fortsetzungsmöglichkeiten Verteidigung der Diplomarbeit Folie Nr. 30 von 32
Fortsetzungsmöglichkeiten • Implementierung einiger Crowdsourcing-Anwendungen (GSM, Korrektur von Rauminformationen, …) • Erweiterung um Community-Aspekte, insbesondere um Crowd-Motivation aufrecht zu erhalten • Tatsächliche Implementierung der DHT • Tatsächliche Implementierung der Signaturen • Unterstützung von IPv6 (Country-API!) Verteidigung der Diplomarbeit Folie Nr. 31 von 32
Vielen Dank für die Aufmerksamkeit! • Quellen, Abbildungen, etc. können in der Diplomarbeit nachgeschlagen oder per E-Mail angefordert werden. Verteidigung der Diplomarbeit Folie Nr. 32 von 32