Skip to main content

Nätverkskort går ned

Jag fick problem med att interfacet på nätverkskortet började gå ned. Krävde omstart av Proxmox-medlem eller shut/no shut i switchporten för att lösa det. Följande loggar fanns i journalctl:

Aug 13 17:13:47 proxmox kernel: e1000e 0000:00:1f.6 eno2: Detected Hardware Unit Hang:
                                  TDH                  <e>
                                  TDT                  <68>
                                  next_to_use          <68>
                                  next_to_clean        <d>
                                buffer_info[next_to_clean]:
                                  time_stamp           <ffff7d08>
                                  next_to_watch        <e>
                                  jiffies              <1000225c0>
                                  next_to_watch.status <0>
                                MAC Status             <40080083>
                                PHY Status             <796d>
                                PHY 1000BASE-T Status  <3800>
                                PHY Extended Status    <3000>
                                PCI Status             <10>

Lösningen hittades i vanlig ordning här på reddit. Nedan fick läggas till:

root@proxmox:~# cat /etc/network/interfaces
iface eno2 inet manual
	post-up ethtool -K eno2 tso off gso off

Men problemen återvände för mig. Det verkar vara när mycket data är inblandad, i mitt fall mina VM:ar för PBS och filserver (NFS/sshfs). I den här tråden på Proxmox-forumet rekommenderas följande kommando.

ethtool -K eno2 tx off rx off

Kommandot stänger av checksum offloading, vilket innebär att mjukvara/CPU börjar hantera det istället för hårdvara. Kan vara en nackdel, men om det löser mina problem blir jag glad. Verifiering med ethtool -a eno2.