Troubleshooting:
Symptome:
IPv4 zwischen Client und GW funktioniert manchmal.
Verbindung zum Internet mittels IPv4 gar nicht.
GWs scheinen den Weg zum Client nicht zu finden, batctl tr findet die dann nicht, arp funktioniert nicht, Pakete vom Client gehen aber zum/durch das Gateway
batctl td auf node/gw bringt ab und an "Warning - packet contains unknown ether type: 0x890d", scheinbar vermehrt wenn es nicht geht. frrr: Fast Roaming Remote Request (type 0x890D).
batctl td: Warning - dropping received ARP packet as it is smaller than expected (28): 14
Ideen für Ursachen:
batman-adv
DNS (war auch involviert, auf GW09 gab es hier unabhängig davon Probleme, wurde aber bereits vorher gefixt)
doppelte MAC
openvswitch durch UDP Pakete überlastet? Paketverlust auf localhost?
IPv6 funktioniert => Eventuell kein batman Problem?
logread: daemon.notice netifd: client (1727): cat: write error: Broken pipe
Lösungsansätze:
batman-adv auf GWs aktualisieren auf Protokoll Version 15 (wir haben schon immer version 15 in der Firmware... wenn dann sollte da seit je her was krumm sein. https://github.com/freifunk-stuttgart/site-ffs/commit/fd7e0e7f489743309d6c8aaa79a351e42b804990#diff-ee66465f633623903a102ce0983dd48d). Jedenfalls sind jetzt mehr aktuelle Module im Spiel, auch wenn das Protokoll schon dasselbe war.
Ping zwischen GWs um Paketverlust ausschließen zu können.
Neuen Key vom Dienstag in segment 01 verschoben => Node aus dem Netz entfernt um Problemursache einzugrenzen. (Es waren massen an gleichen adressen 00:a0:bc:22:a0:6e in der distributed ARP Table zu sehen.)
verschobener Node von oben darf nun auf gw10, gw10 ist isoliert. Aber:
root@gw10:/etc/check_mk# batctl -m bat00 o
- [B.A.T.M.A.N. adv 2015.2, MainIF/MAC: vpn00/02:00:0a:38:00:10 (bat00 BATMAN_IV)]
- Originator last-seen (#/255) Nexthop [outgoingIF]: Potential nexthops ...
- a2:f6:c3:8c:21:12 0.100s (255) a2:f7:c1:8c:21:12 [ vpn00]: a2:f7:c1:8c:21:12 (255)
- a2:f7:c1:8c:21:12 3.208s (255) a2:f7:c1:8c:21:12 [ vpn00]: a2:f7:c1:8c:21:12 (255)
- 32:b9:c2:bd:71:e4 1.792s (255) 32:b9:c2:bd:71:e4 [ vpn00]: 32:b9:c2:bd:71:e4 (255)
- a2:f7:c1:8c:21:12 ist lihas01, der steht hier
- 32:b9:c2:bd:71:e4 ist der verschobene Node von oben
in dem moment wo gw10 die 10.192.0.1 bekam
- root@gw10:/etc/fastd/ffs-vpn/peers/vpn00/peers# ip a a 10.192.0.1 dev br00
- root@gw10:/etc/fastd/ffs-vpn/peers/vpn00/peers# tcpdump -n -i br00
- tcpdump: verbose output suppressed, use -v or -vv for full protocol decode
- listening on br00, link-type EN10MB (Ethernet), capture size 262144 bytes
- 23:31:28.818075 ARP, Request who-has 10.192.0.1 tell 10.192.168.215, length 46
- 23:31:28.818102 ARP, Reply 10.192.0.1 is-at 02:00:0a:38:00:10, length 28
- 23:31:28.897597 IP 10.192.168.215.44935 > 10.255.255.10.1182: Flags [S], seq 3849896481, win 5840, options [mss 1460,sackOK,TS val 7750960 ecr 0,nop,wscale 7], length 0
- 23:31:28.897667 IP 10.192.168.215.44935 > 10.255.255.10.1182: Flags [S], seq 3849896481, win 5840, options [mss 1460,sackOK,TS val 7750960 ecr 0,nop,wscale 7], length 0
- 23:31:31.815479 IP 10.192.168.215.44935 > 10.255.255.10.1182: Flags [S], seq 3849896481, win 5840, options [mss 1460,sackOK,TS val 7754032 ecr 0,nop,wscale 7], length 0
- 23:31:31.815536 IP 10.192.168.215.44935 > 10.255.255.10.1182: Flags [S], seq 3849896481, win 5840, options [mss 1460,sackOK,TS val 7754032 ecr 0,nop,wscale 7], length 0
- 23:31:32.980769 ARP, Reply 0.0.0.0 is-at 43:05:43:05:e8:80, length 28
- 23:31:33.908707 ARP, Request who-has 172.21.16.1 tell 172.21.40.1, length 28
- 23:31:33.990941 ARP, Reply 0.0.0.0 is-at 02:00:0a:38:00:10, length 28
- 23:31:33.990934 ARP, Reply 172.21.16.1 is-at 00:a0:bc:22:a0:6e, length 46
- 23:31:34.012020 ARP, Reply 172.21.16.1 is-at 00:a0:bc:22:a0:6e, length 46
- 23:31:34.033195 ARP, Reply 172.21.16.1 is-at 00:a0:bc:22:a0:6e, length 46
- 23:31:34.249794 IP6 fd21:b4dc:4b1e:0:a2f3:c1ff:fe8c:2112 > ff02::1:ff38:1: ICMP6, neighbor solicitation, who has fd21:b4dc:4b1e::a38:1, length 32
- 23:31:34.908706 ARP, Request who-has 172.21.16.1 tell 172.21.40.1, length 28
- 23:31:34.908718 ARP, Reply 172.21.16.1 is-at 00:a0:bc:22:a0:6e, length 28
- root@gw10:~# ip r a 172.21.5.0/24 dev br00
- root@gw10:~# ping 172.21.5.2
- 23:37:10.169119 ARP, Request who-has 172.21.5.2 tell 172.21.40.1, length 28
- 23:37:10.250331 ARP, Reply 172.21.5.2 is-at 00:a0:bc:22:a0:6e, length 46
- Dagegen funktioniert ein 10.1.1.0/24 nicht, da wird arp nicht beantwortet
- -> sowas wie Proxy-ARP fuer die Adressen des Freifunk-Netzes, kann eine Fehlkonfiguration sein, z.B. lokal wird was aus 172.16.0.0/12 verwendet und proxy-arp ist auf dem Interface an, das wirkt allerdings nur, wenn auf dem betreffenden Client die einzelnen Netze mit kleinerer Netzmaske als der /18 des Freifunknetzes gesetzt sind
- nmap -sP 172.21.0.0/18
- wird alles mit ARP beantwortet, aber keine Antwort auf das -sP -> hinweis auf ARP-Proxy oder Firewall
- in 172.21.15.0/24 gibt es Antworten:
- MAC Address: 00:A0:BC:22:A0:6E (Viasat, Incorporated)
- Nmap scan report for 172.21.15.254
- Host is up (0.010s latency).
- MAC Address: 00:A0:BC:22:A0:6E (Viasat, Incorporated)
- Nmap scan report for 172.21.15.255
- Host is up (0.14s latency).
- MAC Address: 00:A0:BC:22:A0:6E (Viasat, Incorporated)
- Auch 172.21.31.0/24:
- Nmap scan report for 172.21.31.252
- Host is up (0.093s latency).
- MAC Address: 00:A0:BC:22:A0:6E (Viasat, Incorporated)
- Nmap scan report for 172.21.31.253
- Host is up (0.15s latency).
- MAC Address: 00:A0:BC:22:A0:6E (Viasat, Incorporated)
- Nmap scan report for 172.21.31.254
- Host is up (-0.077s latency).
- MAC Address: 00:A0:BC:22:A0:6E (Viasat, Incorporated)
- Nmap scan report for 172.21.31.255
- Host is up (0.010s latency).
- MAC Address: 00:A0:BC:22:A0:6E (Viasat, Incorporated)
- War wohl eine Falschannahme, -sP laeuft immer noch und alle 4096 Hosts wird die Liste der ARP-replies ausgegeben, das sind dann obige Antworten
- Nmap done: 16384 IP addresses (16377 hosts up) scanned in 1061.11 seconds
- root@gw10:~# ip r a 172.16.0.0/12 dev br00
- root@gw10:~# nmap -sP 172.16.0.1
- Starting Nmap 6.47 ( http://nmap.org ) at 2016-03-06 00:14 CET
- mass_dns: warning: Unable to determine any DNS servers. Reverse DNS is disabled. Try using --system-dns or specify valid servers with --dns-servers
- Nmap scan report for 172.16.0.1
- Host is up (0.080s latency).
- MAC Address: 00:A0:BC:22:A0:6E (Viasat, Incorporated)
- Nmap done: 1 IP address (1 host up) scanned in 0.31 seconds
- root@gw10:~# nmap -sP 172.31.255.255
- Starting Nmap 6.47 ( http://nmap.org ) at 2016-03-06 00:14 CET
- mass_dns: warning: Unable to determine any DNS servers. Reverse DNS is disabled. Try using --system-dns or specify valid servers with --dns-servers
- Nmap scan report for 172.31.255.255
- Host is up (0.093s latency).
- MAC Address: 00:A0:BC:22:A0:6E (Viasat, Incorporated)
- Nmap done: 1 IP address (1 host up) scanned in 0.34 seconds
- -> ganz 172.12.0.0/12 ist betroffen
- Auch 10.0.0.0/8
- root@gw10:~# ip r a 1.0.0.0/24 dev br00
- -> selbiges fuer irgend eine Adresse, riecht sehr nach Proxy ARP