Nätverkskort går ned
Jag fick problem med att interfacet på nätverkskortet började gå ned. Krävde omstart av Proxmox-medlem eller shut/no shut i switchporten för att lösa det. Följande loggar fanns i journalctl:
Aug 13 17:13:47 proxmox kernel: e1000e 0000:00:1f.6 eno2: Detected Hardware Unit Hang:
TDH <e>
TDT <68>
next_to_use <68>
next_to_clean <d>
buffer_info[next_to_clean]:
time_stamp <ffff7d08>
next_to_watch <e>
jiffies <1000225c0>
next_to_watch.status <0>
MAC Status <40080083>
PHY Status <796d>
PHY 1000BASE-T Status <3800>
PHY Extended Status <3000>
PCI Status <10>
Lösningen hittades i vanlig ordning här på reddit. Nedan fick läggas till:
root@proxmox:~# cat /etc/network/interfaces
iface eno2 inet manual
post-up ethtool -K eno2 tso off gso off
Men problemen återvände för mig. Det verkar vara när mycket data är inblandad, i mitt fall mina VM:ar för PBS och filserver (NFS/sshfs). I den här tråden på Proxmox-forumet rekommenderas följande kommando.
ethtool -K eno2 tx off rx off
Kommandot stänger av checksum offloading, vilket innebär att mjukvara/CPU börjar hantera det istället för hårdvara. Kan vara en nackdel, men om det löser mina problem blir jag glad. Verifiering med ethtool -a eno2.
Meeen problemen återkom. Provar nu den här varianten från Proxmox-forumet:
ethtool -K eth0 gso off gro off tso off tx off rx off rxvlan off txvlan off sg off
Den ska gå att göra permanent genom:
auto eth0
iface eth0 inet static
offload-gso off
offload-gro off
offload-tso off
offload-rx off
offload-tx off
offload-rxvlan off
offload-txvlan off
offload-sg off
offload-ufo off
offload-lro off
address x.x.x.x
netmask a.a.a.a
gateway z.z.z.z