OSDN Git Service

mlxsw: core: Use variable timeout for EMAD retries
authorIdo Schimmel <idosch@nvidia.com>
Tue, 17 Nov 2020 17:33:52 +0000 (19:33 +0200)
committerJakub Kicinski <kuba@kernel.org>
Wed, 18 Nov 2020 19:07:00 +0000 (11:07 -0800)
commit1f492eab67bced119a0ac7db75ef2047e29a30c6
tree1bbd0f3e23b03326453d93ba3d00f7dd5e8442f7
parentfb738b99ef229bd3d25f1b3e5503925dba9b1a7c
mlxsw: core: Use variable timeout for EMAD retries

The driver sends Ethernet Management Datagram (EMAD) packets to the
device for configuration purposes and waits for up to 200ms for a reply.
A request is retried up to 5 times.

When the system is under heavy load, replies are not always processed in
time and EMAD transactions fail.

Make the process more robust to such delays by using exponential
backoff. First wait for up to 200ms, then retransmit and wait for up to
400ms and so on.

Fixes: caf7297e7ab5 ("mlxsw: core: Introduce support for asynchronous EMAD register access")
Reported-by: Denis Yulevich <denisyu@nvidia.com>
Tested-by: Denis Yulevich <denisyu@nvidia.com>
Signed-off-by: Ido Schimmel <idosch@nvidia.com>
Reviewed-by: Jiri Pirko <jiri@nvidia.com>
Signed-off-by: Jakub Kicinski <kuba@kernel.org>
drivers/net/ethernet/mellanox/mlxsw/core.c