2023年1月22日日曜日

ホームサーバーの環境移行(2) (GPE-2500T/RTL8125Bが切断される)

有線LANにする

結局、データの転送に思いの外、時間がかかるので、有線LANに変更することにした。
せっかくなので、2.5Gにしたいと思う。

あまり予算もないので、PlanexのGPE-2500TとFX2G-05EMを選んだ。
RTL8125Bというチップを使っており、Linuxでの実績もありそうだ。


 

有線LANが切れる

メインPCの方は安定して動いているけど、ホームサーバーの方はしばらくすると通信ができない状態になってしまう。
その時のシステムログはこんな感じ。

[  940.182815] ------------[ cut here ]------------
[  940.182826] NETDEV WATCHDOG: enp1s0 (r8169): transmit queue 0 timed out
[  940.182875] WARNING: CPU: 6 PID: 0 at net/sched/sch_generic.c:477 dev_watchdog+0x277/0x280
[  940.182890] Modules linked in: ccm rfcomm cmac algif_hash algif_skcipher af_alg ip6t_REJECT nf_reject_ipv6 xt_hl ip6_tables ip6t_rt ipt_REJECT nf_reject_ipv4 xt_LOG nf_log_syslog xt_multiport nft_limit bnep xt_limit xt_addrtype xt_tcpudp xt_conntrack nf_conntrack nf_defrag_ipv6 nf_defrag_ipv4 nft_compat nft_counter nf_tables nfnetlink zfs(PO) zunicode(PO) zzstd(O) zlua(O) zavl(PO) icp(PO) zcommon(PO) znvpair(PO) spl(O) intel_rapl_msr intel_rapl_common snd_hda_codec_realtek snd_hda_codec_generic ledtrig_audio snd_hda_codec_hdmi snd_hda_intel snd_intel_dspcfg edac_mce_amd snd_intel_sdw_acpi kvm_amd snd_hda_codec snd_hda_core snd_hwdep kvm snd_pcm iwlmvm snd_seq_midi snd_seq_midi_event btusb nls_iso8859_1 mac80211 rapl input_leds joydev snd_rawmidi btrtl libarc4 btbcm snd_seq btintel bluetooth iwlwifi snd_seq_device wmi_bmof k10temp snd_timer ecdh_generic cfg80211 snd ecc ccp soundcore mac_hid sch_fq_codel nct6775 hwmon_vid msr parport_pc ppdev lp parport ramoops pstore_blk reed_solomon
[  940.183202]  pstore_zone efi_pstore ip_tables x_tables autofs4 btrfs blake2b_generic zstd_compress raid10 raid456 async_raid6_recov async_memcpy async_pq async_xor async_tx xor raid6_pq libcrc32c raid0 multipath linear dm_mirror dm_region_hash dm_log raid1 amdgpu hid_generic iommu_v2 gpu_sched i2c_algo_bit drm_ttm_helper ttm drm_kms_helper syscopyarea sysfillrect sysimgblt usbhid fb_sys_fops hid crct10dif_pclmul crc32_pclmul ghash_clmulni_intel cec aesni_intel r8169 gpio_amdpt xhci_pci crypto_simd ahci rc_core i2c_piix4 nvme cryptd drm nvme_core libahci xhci_pci_renesas realtek wmi video gpio_generic
[  940.183390] CPU: 6 PID: 0 Comm: swapper/6 Tainted: P           O      5.15.0-58-generic #64-Ubuntu
[  940.183395] Hardware name: To Be Filled By O.E.M. A520M-ITX/ac/A520M-ITX/ac, BIOS P2.20 12/27/2022
[  940.183399] RIP: 0010:dev_watchdog+0x277/0x280
[  940.183405] Code: eb 97 48 8b 5d d0 c6 05 67 17 69 01 01 48 89 df e8 ce 64 f9 ff 44 89 e1 48 89 de 48 c7 c7 50 62 ed b8 48 89 c2 e8 ef d3 19 00 <0f> 0b eb 80 e9 de 3d 23 00 0f 1f 44 00 00 55 48 89 e5 41 57 41 56
[  940.183410] RSP: 0018:ffffa1a0c0314e70 EFLAGS: 00010282
[  940.183417] RAX: 0000000000000000 RBX: ffff8d1ddbd18000 RCX: 0000000000000000
[  940.183421] RDX: ffff8d24de3ac240 RSI: ffff8d24de3a0580 RDI: 0000000000000300
[  940.183425] RBP: ffffa1a0c0314ea8 R08: 0000000000000003 R09: fffffffffffd7cd0
[  940.183429] R10: 0000000000ffff0a R11: 0000000000000001 R12: 0000000000000000
[  940.183433] R13: ffff8d1ddb1f1e80 R14: 0000000000000001 R15: ffff8d1ddbd184c0
[  940.183436] FS:  0000000000000000(0000) GS:ffff8d24de380000(0000) knlGS:0000000000000000
[  940.183441] CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
[  940.183446] CR2: 000055733bccb020 CR3: 0000000110410000 CR4: 0000000000750ee0
[  940.183450] PKRU: 55555554
[  940.183453] Call Trace:
[  940.183457]  <IRQ>
[  940.183462]  ? pfifo_fast_enqueue+0x160/0x160
[  940.183471]  call_timer_fn+0x2c/0x120
[  940.183479]  __run_timers.part.0+0x1e3/0x270
[  940.183485]  ? ktime_get+0x46/0xc0
[  940.183493]  ? native_x2apic_icr_read+0x20/0x20
[  940.183501]  ? lapic_next_event+0x20/0x30
[  940.183508]  ? clockevents_program_event+0xad/0x130
[  940.183517]  run_timer_softirq+0x2a/0x60
[  940.183522]  __do_softirq+0xd9/0x2e7
[  940.183530]  irq_exit_rcu+0x94/0xc0
[  940.183539]  sysvec_apic_timer_interrupt+0x80/0x90
[  940.183547]  </IRQ>
[  940.183549]  <TASK>
[  940.183552]  asm_sysvec_apic_timer_interrupt+0x1b/0x20
[  940.183558] RIP: 0010:native_safe_halt+0xb/0x10
[  940.183566] Code: 2c ff 5b 41 5c 41 5d 5d c3 cc cc cc cc 4c 89 ee 48 c7 c7 80 43 65 b9 e8 23 91 8d ff eb ca cc eb 07 0f 00 2d d9 e0 45 00 fb f4 <c3> cc cc cc cc eb 07 0f 00 2d c9 e0 45 00 f4 c3 cc cc cc cc cc 0f
[  940.183570] RSP: 0018:ffffa1a0c010be78 EFLAGS: 00000202
[  940.183577] RAX: ffffffffb85afc40 RBX: ffff8d1dc0373280 RCX: 7fffff251d8fda07
[  940.183582] RDX: 00000000000235a1 RSI: 0000000000000006 RDI: 00000000000235a2
[  940.183586] RBP: ffffa1a0c010be80 R08: 000000cd42eda501 R09: 0000000000000000
[  940.183590] R10: 0000000000000001 R11: 0000000000000000 R12: 0000000000000000
[  940.183593] R13: 0000000000000000 R14: 0000000000000000 R15: 0000000000000000
[  940.183598]  ? __cpuidle_text_start+0x8/0x8
[  940.183606]  ? default_idle+0xe/0x20
[  940.183611]  arch_cpu_idle+0x15/0x20
[  940.183620]  default_idle_call+0x3e/0xd0
[  940.183625]  cpuidle_idle_call+0x179/0x1e0
[  940.183633]  do_idle+0x83/0xf0
[  940.183640]  cpu_startup_entry+0x20/0x30
[  940.183644]  start_secondary+0x12a/0x180
[  940.183649]  secondary_startup_64_no_verify+0xc2/0xcb
[  940.183658]  </TASK>
[  940.183661] ---[ end trace 32949fbdb853d046 ]---
[ 1106.094315] r8169 0000:01:00.0 enp1s0: rtl_chipcmd_cond == 1 (loop: 100, delay: 100).
[ 1106.095552] r8169 0000:01:00.0 enp1s0: rtl_ephyar_cond == 1 (loop: 100, delay: 10).
[ 1106.096672] r8169 0000:01:00.0 enp1s0: rtl_ephyar_cond == 1 (loop: 100, delay: 10).
[ 1106.097791] r8169 0000:01:00.0 enp1s0: rtl_ephyar_cond == 1 (loop: 100, delay: 10).
[ 1106.098915] r8169 0000:01:00.0 enp1s0: rtl_ephyar_cond == 1 (loop: 100, delay: 10).
[ 1106.100034] r8169 0000:01:00.0 enp1s0: rtl_ephyar_cond == 1 (loop: 100, delay: 10).
[ 1106.101153] r8169 0000:01:00.0 enp1s0: rtl_ephyar_cond == 1 (loop: 100, delay: 10).
[ 1106.121214] r8169 0000:01:00.0 enp1s0: rtl_mac_ocp_e00e_cond == 1 (loop: 10, delay: 1000).

以降、[rtl_chipcmd_cond][rtl_ephyar_cond][rtl_mac_ocp_e00e_cond]の繰り返し。

  • インターフェースのLANコネクタのACTは点滅を繰り返している
  • 再起動(reboot)では復旧しない
  • シャットダウンで復旧する
  • BIOSは最新
  • Xログインしていても、していなくても発生する
  • ping打ち続けても発生する

メインPCとの比較

項目 メインPC サーバー
uname -a 5.15.0-57-generic #63-Ubuntu 5.15.0-58-generic #64-Ubuntu
lsb_release Linux Mint 21 (vanessa) Linux Mint 21.1 (vera)
ドライバ r8169 ※ r8169 ※

※マザーボードに搭載されているLANと同じドライバを使用しているみたい。

[    0.896998] r8169 0000:01:00.0 eth0: RTL8125B, **:**:**:**:**:**, XID 641, IRQ 39
[    0.897002] r8169 0000:01:00.0 eth0: jumbo features [frames: 9194 bytes, tx checksumming: ko]

[    0.912515] r8169 0000:04:00.0 eth1: RTL8168h/8111h, **:**:**:**:**:**, XID 541, IRQ 48
[    0.912518] r8169 0000:04:00.0 eth1: jumbo features [frames: 9194 bytes, tx checksumming: ko]|

OSバージョンの違いがあるくらいか・・・。

ドライバを最新にしてみる

https://www.realtek.com/ja/component/zoo/category/network-interface-controllers-10-100-1000m-gigabit-ethernet-pci-express-software

r8169からr8125に変わった。

[    0.882838] r8125: loading out-of-tree module taints kernel.
[    0.882928] r8125: module verification failed: signature and/or required key missing - tainting kernel
[    0.883378] r8125 2.5Gigabit Ethernet driver 9.011.00-NAPI loaded
[    0.902733] r8125: This product is covered by one or more of the following patents: US6,570,884, US6,115,776, and US6,327,625.
[    0.904748] r8125  Copyright (C) 2022 Realtek NIC software team <nicfae@realtek.com> 
[    2.653915] r8125 0000:01:00.0 enp1s0: renamed from eth0
[   10.077752] r8125: enp1s0: link up

しばらく様子見
使っていたら

enp1s0: cmd = 0xff, should be 0x07

となって通信断してしまった。
たぶんapt upgradeで大きの通信をしたタイミングのようだ。

Linux Mint 21 (vanessa)

メインPCと同じ Mint 21をライブUSBにて起動して試してみる。
スピードテストやapt upgradeでは切れないようだ。
1時間様子見でも切れない。

Linux Mint 21.1 (vera)

この状態でまた21.1を起動してみる
スピードテストやapt upgradeでは切れないようだ。
1時間様子見でも切れない。

iperf(ライブUSB)

サーバー <ー メインPC
adeno@drakorange:~$ iperf -c 192.168.1.34 -t 30 
------------------------------------------------------------
Client connecting to 192.168.1.34, TCP port 5001
TCP window size: 85.0 KByte (default)
------------------------------------------------------------
[  1] local 192.168.1.29 port 53526 connected with 192.168.1.34 port 5001
[ ID] Interval       Transfer     Bandwidth
[  1] 0.0000-30.0242 sec  8.22 GBytes  2.35 Gbits/sec
サーバー ー> メインPC
iperf -c 192.168.1.34 -R -t 30 
------------------------------------------------------------
Client connecting to 192.168.1.34, TCP port 5001
TCP window size: 85.0 KByte (default)
------------------------------------------------------------
[  1] local 192.168.1.29 port 34464 connected with 192.168.1.34 port 5001 (reverse)
[ ID] Interval       Transfer     Bandwidth
[ *1] 0.0000-45.7757 sec   108 MBytes  19.8 Mbits/sec

サーバーPCがリブートしたOrz

iperf(通常起動)

サーバー <ー メインPC
adeno@drakorange:~$ iperf -c 192.168.1.34 -t 30 
------------------------------------------------------------
Client connecting to 192.168.1.34, TCP port 5001
TCP window size: 85.0 KByte (default)
------------------------------------------------------------
[  1] local 192.168.1.29 port 32992 connected with 192.168.1.34 port 5001
[ ID] Interval       Transfer     Bandwidth
[  1] 0.0000-30.0178 sec  8.22 GBytes  2.35 Gbits/sec

サーバー ー> メインPC

adeno@drakorange:~$ iperf -c 192.168.1.34 -R -t 30 
------------------------------------------------------------
Client connecting to 192.168.1.34, TCP port 5001
TCP window size: 85.0 KByte (default)
------------------------------------------------------------
[  1] local 192.168.1.29 port 51360 connected with 192.168.1.34 port 5001 (reverse)
[ ID] Interval       Transfer     Bandwidth
[ *1] 0.0000-30.0122 sec  8.22 GBytes  2.35 Gbits/sec

が、上記10回くらい繰り返したり、パラメータを変えたりしていると

iperf -c 192.168.1.34 -R -t 60 -b 200M
enp1s0: cmd = 0xff, should be 0x07

が発生した。
メインPCの方は大丈夫。

Linux Mint 21 (vanessa)

再度、21で試してみる

iperf -c 192.168.1.34 -t 30
iperf -c 192.168.1.34 -R -t 30 

を10セット

iperf -c 192.168.1.34 -R -t 60 -b 200M

大丈夫だ。
いやだめだ。

NETDEV WATCHDOG: enp1s0 (r8169): transmit queue 0 timed out

でもその後も通信できている
いやだめだ。

もしかして、個体差?

個体を入れ替えてみる

メインPCとサーバーのGPE-2500Tを入れ替えてみた
するとすぐに切断された状態になってしまった。
もしかして、個体差?

まとめると

今までの検証内容をまとめると

ハード GPE-2500T OS ドライバ 長期ping スピードテスト apt upgrade iperf 総合
メインPC A Linux Mint 21 (vanessa) r8169
サーバー B Linux Mint 21.1 (vera) r8169 × ×
サーバー B Linux Mint 21.1 (vera) r8125 × ×
サーバー B Linux Mint 21.1 (vera) r8169 × ×
サーバー B Linux Mint 21 (vanessa) r8169 ×
メインPC B Linux Mint 21 (vanessa) r8169 ? ? × × ×
サーバー A Linux Mint 21 (vanessa) r8169

交換

仕方がないのでもう1つGPE-2500Tを入手した。
これで収束すると良いのだけど。
あと、サポセンに連絡したら返品とか交換とかしてもらえるのかな・・・。

sambaの転送速度

晴れて、有線LANになったことで、転送速度は
14MB/s(112Mbps)→190MB/s(1,520Mbps)となった。
HDDでソフトウェアRAIDということもあり、ワイヤースピートに迫ることはなかったけど、満足感のある結果となった。

0 件のコメント:

コメントを投稿