560 likes | 825 Views
Fehlersuche im lokalen Netzwerk. Netzfort 11.12.2001. joachim.peeck@urz.uni-heidelberg.de. Themen des Vortrages. Erste Feststellungen / Erste Hilfe Systematische Fehlersuche Werkzeuge zur Fehlersuche Fehlerbehebung Zum Schluss. 1 Erste Feststellungen / Erste Hilfe.
E N D
Fehlersuche im lokalen Netzwerk Netzfort 11.12.2001 joachim.peeck@urz.uni-heidelberg.de
Themen des Vortrages • Erste Feststellungen / Erste Hilfe • Systematische Fehlersuche • Werkzeuge zur Fehlersuche • Fehlerbehebung • Zum Schluss
1 Erste Feststellungen / Erste Hilfe Wer hatte schon Fehler im Netz zu lösen? Was war das Symptom? Was war die Lösung/Ursache?
1 Erste Feststellungen / Erste Hilfe Erste Hilfe: Wenn das defekte Segment bzw. das defekte Teil lokalisiert ist, kann dieses vom Netz getrennt und an den anderen Stationen weitergearbeitet werden.
1 Erste Feststellungen / Erste Hilfe • Letzte Änderungen? • Wieviele und welche Rechner im Subnetz sind betroffen? • Ist ein Link zum Rechner und zum Ziel vorhanden? • Kollisionen / Koinzidenzen • Welche Anwendungen / Protokolle sind betroffen? • Angekündigte Störungen?
1 Letzte Änderungen • Wurde heute / in den letzten Tagen an dem Rechner / im Subnetz / im Stromnetz gearbeitet, und was? • Beispiele: • Gestern hat einer einen neuen Rechner angeschlossen • Vorhin hat der Hausmeister in der Besenkammer einen neue Lampe angeschlssen, und dazu die Sicherung herausgenommen... • früher: BNC-Netz und Gewitter
Themen des Vortrages • Erste Feststellungen / Erste Hilfe • Systematische Fehlersuche • Einige typische Probleme • Werkzeuge zur Fehlersuche • Fehlerbehebung • Zum Schluss
2 Systematische Fehlersuche • Systematisch: alle beteiligten Komponenten schrittweise verfolgen. • Vorteile einer systematischen Herangehensweise: • Der Fehler kann in der Regel mit endlichem Aufwand gefunden werden • Man kann auch „neuartige“ Fehler damit finden, zumindest den Verursacher erkennen
2 Wieviele und welche Rechner im Subnetz sind betroffen? • Nur ein Rechner • Mehrere Rechner • ein Stockwerk (bei BNC: ein Strang?) • ein Modul an der aktiven Komponente • ein VLAN • alle Rechner, die auf den xy-Server zugreifen müssen • "Alle" Rechner • alle am "floor"-Konzentrator • alle am Gebäude-Konzentrator • auch die im Nachbargebäude am selben Routerport/Router
2 Welche Anwendungen / Protokolle sind betroffen? • Mein Netscape/Browser geht nicht mehr, aber Telnet und EMail gehen noch (mit/ohne Proxy?) • Email geht nicht mehr, aber Netscape... Bitte beachten: Mail rein (POP3, IMAP) <> Mail raus (SMTP) • Mein PMail geht nicht mehr :-) • ping nach aussen geht nicht mehr • es werden keine Novell-Server mehr angezeigt bzw. nur noch wenige • Appletalk-Zone ist leer Dies ist meist der Zugang der Endnutzer, aber hilft auch bei der Analyse
Themen des Vortrages • Erste Feststellungen / Erste Hilfe • Systematische Fehlersuche • Einige typische Probleme • Werkzeuge zur Fehlersuche • Fehlerbehebung • Zum Schluss
3 Einige typische Probleme • Endrechner-Konfigurationsprobleme • Logische/Konfigurationsprobleme im lokalen Netz • Physikalische Fehler im Netz • (Theorie: Routing/Wegefindung für Datenpakete) • Netzdienste
3.1 Endrechner-Konfigurationsprobleme • Treiber, Interrupt, I/O-Adressen • IP-Adresse falsch / doppelt • Gateway / DNS / Subnetzmaske falsch • WinNT: nach Neuinstallation Service-Pack vergessen? WinNT: ipconfig • unix/linux: /etc/resolv.conf, ifconfig bzw. cardctl(pcmcia)
3.1 Endrechner-Konfigurationsprobleme (2) • Rechner nicht im DNS • Mail-Client falsch konfiguriert • Browser falsch konfiguriert / www-proxy • MSWin/SMB: Verschlüsselte Authentifizierung bei SMB • IPX: Falscher Novell-Server (der andere war schneller): kein preferred Server eingetragen
3.2 Logische/ Konfigurationsprobleme im lokalen Netz • Rechner benötigt DHCP- oder BootP-Server, und dieser ist nicht erreichbar (selbst down oder Netzwerk dorthin gestört) • Novell-IPX-Server meldet „falsches Netzwerk“ • IPX-Frametyp (IPX-Server muss Routen) • Routing • geänderter Gateway
3.3 Physikalische Fehler im Netz • Netzwerkkarten/Komponenten • BNC-Netz • TP-Netze: Kabel • Ethernet: Komponenten • Ethernet: Kollisionen • LWL-Verbindungen
3.3.1 Netzwerkkarten • NIC: Network Interface Card • defekte frames: short/runts, long/jabber, fcs/frame check sequence, collisions • früher auch TCP/IP-Stack / Netzbetriebssystem • Link auf beiden Seiten vorhanden? • Einstellung passt zum Netz / zur Gegenstelle? • im Zweifel: Halbduplex, 10 MBit/s fest einstellen • an einem Hub nur Halbduplex • an einem Medienkonverter keine Autonegotioation • Stromausfall • z. B. der Sicherung für den Raum mit der aktiven Komponente • haben wirklich ALLE beteiligten Komponenten Strom?
3.3.2 BNC-Netz • Fehlende Terminierung / kein Endwiderstand am Strangende • Y-Bildung statt „Strang“ / versucht, den Rechneranschluss zu „verlängern“ • Kabelbruch / defekte Isolation • Kurzschluss am Stecker / Kontaktproblem an EDA/EAD-Dose (evtl. wandseitig) • Überlänge ( > 185 m) / EDA/EAD-Kabel zählt doppelt • zu viele Stationen im Segment ( > 30)
3.3.2 BNC-Widerstandswerte • Wie messe ich: • Am Beginn des Stranges, oder mittendrin? • Mit angeschlossenen aktiven Stationen, oder leerem Netz? • Was messe ich? • Gleichstromwiderstand (25 Ohm an T-Stück, 50 Ohm am Strangende, unendlich für Längenfeststellung via TDR) • Spannung • Ströme: gegen Masse (Erdungsprobleme)
3.3.4 TP-Netze: Kabel • Richtiges Patchkabel? Benötigt wird: • Patchkabel Kat.5 UTP/STP/SSTP • Verbindungen 1/T+, 2/T-, 3/R+, 6/R- • kein „flaches“ (ISDN-) Kabel • Bei Hub-Hub-Verbindungen Crossover-Kabel oder MDI (parallel)-Port statt MID-X-Port einstellen • Überlänge (Gesamtlänge 100 Meter, 90 m Wand) • Wandkabel: • evtl. Kabelpaar vertauscht? (die meisten Komponenten kompensieren das, aber manche nicht...) • 10 MBit tut, 100/1000 nicht: Schirmung/ Twist/ Biegeradien • ungleiche Inserts
3.3.4 Ethernet: Komponenten • bei Hubs nur Halbduplex erlaubt • insbesondere bei Laptops beachten • Features im Hub/Switch aktiviert? • z.B. Security, Feste Linkparameter • Auto-Negotiation tut nicht immer • vor allem im Zusammenhang mit Medienkonvertern • Netz“karten“ der aktiven Komponente • Link auf beiden Seiten ok? nur benötigte Ports patchen! • mindestens 1 Port zum Testen unbeschaltet lassen • Switches: • beim Portwechsel „von innen“ her testen • oder arp-cache löschen / aging-time abwarten / Switch rebooten • IPX-Auto-Rahmentyp stellt evtl. keine Broadcasts durch
3.4.5 Ethernet: Kollisionen • eigentlich normal (bis ca. 30%) • wenn zu viele, auf „Koinzidenz“ mit Aktivität achten • z. B. Netzkarte defekt (bei BNC wird das ganze Segment gestört) • z. B. bei Vollduplex im ge-shared-ten Netz • z. B. bei Verletzung der 5-4-3-Regel (nicht zu viele Hubs hintereinander, Vorsicht bei kleinen Raumverteilern) • z. B. „Schleife“ im Hub (oder bei Switch ohne spanning tree)
3.3.6 LWL-Verbindungen • je eine separate Faser für • Senden/Transmit/Tx (Leuchtdiode/Laser) und für • Empfangen/Receive/Rx (Lichtempfänger) • Bei Neuanschluss: • Tx/Rx - Leitungen vertauschen • richtige Kabelsorte • Gradientenfaser/Multimode 50/125 oder • Monomodefaser/Singlemode 9/125 • Link-Kontrolle auf beiden Seiten • Kabel „verdreckt“? / geknickt? • evtl. Sender oder Empfänger defekt • Medienkonverter
Zum Schluss für heute: • Das eigene Netz kennenlernen: • gibt es einen Plan? • sind die wichtigsten Anschlüsse (Server, Poweruser) beschriftet? • Die Anfragen und Fehlermeldungen lokal konzentrieren, damit Fehler kompetent vor Ort gefunden bzw. zumindest beschrieben werden können • Hausaufgabe: welche Lämpchen haben meine Komponenten? wie sieht der Normalfall aus? • Nächstes Mal: • 15. Januar: Fortsetzung(Traditionell: 2. Dienstag im Monat)
ENDE der ersten Teils Danke für das Interesse! Bitte füllen Sie den Fragebogen aus. joachim.peeck@urz.uni-heidelberg.de
Fehlersuche im / aus dem lokalen Netzwerk Netzfort 15.01.2002 joachim.peeck@urz.uni-heidelberg.de
Themen des Vortrages • Erste Feststellungen / Erste Hilfe • Systematische Fehlersuche • Einige typische Probleme • Werkzeuge zur Fehlersuche • Fehlerbehebung • Zum Schluss
3 Einige typische Probleme • Endrechner-Konfigurationsprobleme • Logische/Konfigurationsprobleme im lokalen Netz • Physikalische Fehler im Netz • Netzdienste
3.4 Netz-Dienste • Was sind Netzdienste • Aufruf einer URL im Browser • Weg durch das Internet • URZ-Netzdienste
3.4 OSI-7-Schichten-Modell Layer8: Benutzer Layer7: Application } Verbindung (Datenaustausch) zwischen (Netz-) Diensten Anwendungsschichten (ftp, telnet, smtp, http, smb, ...) Layer6: Presentation Layer5: Session Layer4: Transport } Verbindung zum Netzdienst Protokollschichten (TCP/IP, IPX/SPX, Netbios...) Layer3: Network Verbindung zwischen Netzen Layer2: Data Link } Verbindung im lokalen Netz Physikalische Schichten (Ethernet, FDDI, Token Ring) Layer1: Physical Verbindung mit dem Netz Layer0: Mechanik Zusätzliche Schichten(zur Fehlersuche)
3.4.1 Was sind „Netz-Dienste“? • Netztransport: kommt ein Paket zum Ziel? kann die Antwort ankommen? • Layer 1, 2, 3 • Routing? DNS? Mail-Relay? „Firewall“? (L 3-7) • Netzbetriebssystem: via Netz erreichbare Dienste auf Servern (L 4-7): • Drucker, zentrale Dateiablage, Datenbank, Compute-Services (LAN-Dienste) • Proxy-Dienste (WAN-Entlastung) • Web-Server, Mail-Server, FTP, News • Netzanwendungen: Endnutzer, die einen Server-Dienst via Netzwerk in Anspruch nehmen wollen • Netscape & Co, Mailclienten, FTP-“Interfaces“ (WS-FTP) etc. • Netzwerkumgebung, „installierte“ Netzdrucker
3.4.2 Aufruf einer URL im Browser • Beteiligte Rechner: • eigener PC • fremder Webserver • aber auch: eigener DNS, fremder DNS, DNS-Hierarchie • eventuell auch (explizite oder transparente) Proxy-Server • Beteiligte Netze: • Hausnetz, Campusnetz/Backbone, URZ-Service-Netze, • Internet / Netze der ISP, Zielnetze • Beteiligte Netzkomponenten: • Router an allen Knoten/Netzübergängen • Switches/Hubs in den Netzen, in denen beteiligte Rechner stehen
3.4.3 Weg einer Anfrage durch das Internet = viele Datenpakete Aufruf einer Webseite im Browser impliziert: • Ziel-IP-Adresse lokal bekannt? wenn nein, dann • ARP-Anfrage nach DNS via Hub/Switch in der Regel zum Router, da DNS im Servicenetz • Entsprechende weitere ARP-Anfragen entlang des Wegs • Entsprechende Routing-Protokolle müssen funktionieren • Name-Caching oder weitere Anfragen durch DNS • Antwort des DNS zurück durch Hubs, Switches, Router
3.4.3 Weg durch das Internet (2) • TCP-Anfragepaket an www-server schicken: • ARPen durch den Routing-Weg • Filterung der Anfrage? • Verbindungsaufnahme auf Port 80 wird an httpd-Prozess weitergeleitet • Server belegt (maximale Anzahl Verbindungen), .htaccess??? • Datenantwort auf „gleichem“ Weg zurück • evtl. Paketfragmentierung, - Filterung Fazit: viele hintereinandergeschaltete Client-Server-(host-to-host)-Beziehungen auf Layer 7, alles muss funktionieren, damit eine Antwort kommt.
3.4.4 URZ-Netzdienste • www-proxy.uni-heidelberg.de (8080) • Mail, URZ-Nutzer: POP3(110, 995) / IMAP(143, 993) / SMTP(25) popix.urz, Institute: SMTP-Relay relay.uni-heidelberg.de (25), instmail • Nameservice/DNS 129.206.100.126 und .127 (53) • Fileserver, AFS, login (aixterm1-11, aixserv0) • Datenbank Oracle, Datensicherung ADSM • TCP/UDP-Paketfilter (uniweit oder für Institut) • Angekündigte Störung (URZInfo bzw. Netzfort), Aktuelle Probleme , Operating (Tel. 54-4519) • Der Netzbeauftragte ist der Ansprechpartner für die Nutzer im Haus!
Themen des Vortrages • Erste Feststellungen / Erste Hilfe • Systematische Fehlersuche • Einige typische Probleme • Werkzeuge zur Fehlersuche • Fehlerbehebung • Zum Schluss
4 Werkzeuge zur Fehlersuche • Dokumentation: proaktiv!!! • Fehlersuche „Am Rechner“: ping &Cie. • Netzwerk-Komponenten: Kontroll-Lampen • Meßgeräte: LanCat, Fluke oneTouch, Fluke netTool
4.1 Dokumentation • Proaktive Methode: wirkt am besten, wenn man vor dem Fehlerfall damit beginnt... • Werkzeuge: Papier, Stift, Klebeband • Beschriftung jedes Rechners mit Namen (Rechner/Domain) und IP-Adresse • Liste der Rechner und ihrer IP-/MAC-Adressen
4.1 Dokumentation • Welche Rechner hängen am gleichen Kabelstrang/Modul? • Welcher Kabelstrang hängt an welchem Konzentratorport? • Wo steht eigentlich der Konzentrator? • Welcher Router ist für uns zuständig? • Wer am Institut erhält URZ-Störungsmeldungen (URZInfo)? • Wer weiss das alles / wo kann das jemand finden, wenn ich in Urlaub bin?
4.2 Fehlersuche am Rechner • ping-"Hierarchie“ • traceroute/tracert • host/dig/nslookup • weitere Tools
4.2.1 ping • Packet INternet Groper (spray bei sun)to grope (engl.): herumtasten • ICMP (neben TCP und UDP auf Layer 4, Internet Control Message Protocol), Nachrichtentyp Echo Request (8/0) und Echo Reply (0/0) • TTL-Problematik • Zusatznutzen implementierungsabhängig: • Netzping, Fluten, große Pakete, Dauerping • Abbruch mit Ctrl-C :-)
4.2.1 Die ping-Hierarchie • eigener Rechner (tut die lokale Netzinstallation?)per „localhost“ (127.0.0.1) und per eigener IP-Adresse (a.b.c.x) • ein Rechner im lokalen Netz-Segment per IP-Adresse (a.b.c.y) • Hubs/Switches auf dem „Weg nach draussen“ (niedrige Ping-Priorität, keine Q-Aussage) (z.B. a.b.c.5) • Router per IP-Adresse (z.B. a.b.c.1) • Nameserver per IP-Adresse (129.206.100.126) • Nameserver per Name (sun0.urz.uni-heidelberg.de)
4.2.2 traceroute • trace route: zeigt eine Spur des von einem Paket zurückzulegenden Weges auf, gibt auch Aussage über das Zeitverhalten der Pakete • Hinweg: UDP-Pakete (z.B. 33434) mit anwachsender TTL (beginnend mit 1) • Rückweg: Routerantwort: ICMP 11/0 (time exceeded, weil TTL an jedem Router um 1 vermindert wird), sofern Router anworten darf/sollEndgerät: ICMP 3/3 (port unreachable), weil hier kein Dienst „lauscht“ • z.B. traceroute www.cern.ch • www.traceroute.org , um traceroute „von außen“ zu sehen
4.2.3 host/dig/nslookup • Nameserver-Abfragen: • A / PTR: FullyQualifiedHostName zu IP-Adresse • SOA: wer ist authorisierter Nameserver für die Domain, wer verwaltet diese • MX: wer ist SMTP-Mailserver für die Domain • CNAME: Namensalias (kein Allheilmittel) • (SRV: Bekanntgabe weiterer Services via DNS) • nslookup (WINNT und unix): • interaktiv: alle Namen des eigenen Subnetzes anzeigennslookup, ls -a urz.uni-heidelberg.de • Kommandozeile: nslookup -querytype=SOA urz.uni-heidelberg.de
4.2.4 ftp • große Datenmengen werden am besten mit ftp transferiert (Window-size-Anpassung etc.) • die meisten ftp-Clients geben Transferstatistik in kBytes/s an • damit ist ein Test der effektiven Transfer-Bandbreite möglich • gleiche Bedingungen: große Datei, Binärmodus (keine CR/LF-Wandlung) • z. B. ftp at11, cd /u/fphys/jpeeck, bin, get t1m
4.2.5 weitere Tools • telnet: Dienste auf Protokollebene testen, z.B. Mail/smtp (tcp 25) • netstat / (WIN:) nbtstat / route print • ifconfig / (WIN:) ipconfig / winipcfg / net config workstation • keine „gültigen“ Tools: • Web-Browser • Email-Client • Windows-“Netzwerkumgebung“
4.3 Netzkomponenten • Was bedeuten die Kontroll-Leuchten? • Link • Activity / traffic • Collision • Partition / disabled • Koinzidenz von Aktivität und Collision? • (Fehlermeldungen und Statistiken)
4.4 Messgeräte • Mess-PC mit Linux-Tools: tcpdump, etherreal u. a. • LanCat (für BNC-Netze): Kurzschlusses / Y (Ohmmeter tut auch), Gesamtlänge des Segmentes, Segmentlast • Fluke OneTouch: ping, top talker, Fehleranalyse, TP-Kabeltester • Fluke netTool: top talker, Fehleranalysator, TP-Kabeltester, Endgeräte am Switchport • können z. T. am URZ ausgeliehen werden
4.5 Wie das URZ helfen kann • ARP-cache des Routers: welche Rechner sind noch "sichtbar"?(sinnvoll wäre eine Tabelle der MAC-Adressen bei IPX und AT-Protokoll) • ping ins Subnetz: was dort kann erreicht werden? welcher Teil des Subnetzes ist ausgefallen? (Kenntnis der Backbone-Strukur) • Routerinterface-Reset • snmp/telnet/http-Abfragen der Netzkomponenten, Fehlerstatistiken im Netz • Switchport auf Monitoring schalten • Vor-Ort-Hilfe bei reproduzierbaren Fehlern...