net: hns3: Add PCIe AER error recovery
authorShiju Jose <shiju.jose@huawei.com>
Fri, 19 Oct 2018 19:15:27 +0000 (20:15 +0100)
committerDavid S. Miller <davem@davemloft.net>
Tue, 23 Oct 2018 02:31:13 +0000 (19:31 -0700)
This patch adds the error recovery for the HNS hw errors.

Signed-off-by: Shiju Jose <shiju.jose@huawei.com>
Signed-off-by: Salil Mehta <salil.mehta@huawei.com>
Signed-off-by: David S. Miller <davem@davemloft.net>
drivers/net/ethernet/hisilicon/hns3/hnae3.h
drivers/net/ethernet/hisilicon/hns3/hns3_enet.c
drivers/net/ethernet/hisilicon/hns3/hns3pf/hclge_main.c
drivers/net/ethernet/hisilicon/hns3/hns3vf/hclgevf_main.c

index 2af3a2dc72b22193d9bda308686a32b7b41ca740..e82e4ca206205da6562fa3449802869a975a86d3 100644 (file)
@@ -402,7 +402,7 @@ struct hnae3_ae_ops {
        int (*set_vf_vlan_filter)(struct hnae3_handle *handle, int vfid,
                                  u16 vlan, u8 qos, __be16 proto);
        int (*enable_hw_strip_rxvtag)(struct hnae3_handle *handle, bool enable);
        int (*set_vf_vlan_filter)(struct hnae3_handle *handle, int vfid,
                                  u16 vlan, u8 qos, __be16 proto);
        int (*enable_hw_strip_rxvtag)(struct hnae3_handle *handle, bool enable);
-       void (*reset_event)(struct hnae3_handle *handle);
+       void (*reset_event)(struct pci_dev *pdev, struct hnae3_handle *handle);
        void (*get_channels)(struct hnae3_handle *handle,
                             struct ethtool_channels *ch);
        void (*get_tqps_and_rss_info)(struct hnae3_handle *h,
        void (*get_channels)(struct hnae3_handle *handle,
                             struct ethtool_channels *ch);
        void (*get_tqps_and_rss_info)(struct hnae3_handle *h,
index 3c6fa39831e3068a49c82706657068644df13603..32f3aca814e78b530495956d7cafcb9017139176 100644 (file)
@@ -9,6 +9,7 @@
 #include <linux/ipv6.h>
 #include <linux/module.h>
 #include <linux/pci.h>
 #include <linux/ipv6.h>
 #include <linux/module.h>
 #include <linux/pci.h>
+#include <linux/aer.h>
 #include <linux/skbuff.h>
 #include <linux/sctp.h>
 #include <linux/vermagic.h>
 #include <linux/skbuff.h>
 #include <linux/sctp.h>
 #include <linux/vermagic.h>
@@ -1613,7 +1614,7 @@ static void hns3_nic_net_timeout(struct net_device *ndev)
 
        /* request the reset */
        if (h->ae_algo->ops->reset_event)
 
        /* request the reset */
        if (h->ae_algo->ops->reset_event)
-               h->ae_algo->ops->reset_event(h);
+               h->ae_algo->ops->reset_event(h->pdev, h);
 }
 
 static const struct net_device_ops hns3_nic_netdev_ops = {
 }
 
 static const struct net_device_ops hns3_nic_netdev_ops = {
@@ -1796,8 +1797,25 @@ static pci_ers_result_t hns3_error_detected(struct pci_dev *pdev,
        return ret;
 }
 
        return ret;
 }
 
+static pci_ers_result_t hns3_slot_reset(struct pci_dev *pdev)
+{
+       struct hnae3_ae_dev *ae_dev = pci_get_drvdata(pdev);
+       struct device *dev = &pdev->dev;
+
+       dev_info(dev, "requesting reset due to PCI error\n");
+
+       /* request the reset */
+       if (ae_dev->ops->reset_event) {
+               ae_dev->ops->reset_event(pdev, NULL);
+               return PCI_ERS_RESULT_RECOVERED;
+       }
+
+       return PCI_ERS_RESULT_DISCONNECT;
+}
+
 static const struct pci_error_handlers hns3_err_handler = {
        .error_detected = hns3_error_detected,
 static const struct pci_error_handlers hns3_err_handler = {
        .error_detected = hns3_error_detected,
+       .slot_reset     = hns3_slot_reset,
 };
 
 static struct pci_driver hns3_driver = {
 };
 
 static struct pci_driver hns3_driver = {
index 94d36787b4c9543e5c7ed3895dea37fac92005ca..50753658b8d7327eaa5212aac5b1ead825a4aa74 100644 (file)
@@ -2489,12 +2489,18 @@ static void hclge_reset(struct hclge_dev *hdev)
        ae_dev->reset_type = HNAE3_NONE_RESET;
 }
 
        ae_dev->reset_type = HNAE3_NONE_RESET;
 }
 
-static void hclge_reset_event(struct hnae3_handle *handle)
+static void hclge_reset_event(struct pci_dev *pdev, struct hnae3_handle *handle)
 {
 {
-       struct hclge_vport *vport = hclge_get_vport(handle);
-       struct hclge_dev *hdev = vport->back;
+       struct hnae3_ae_dev *ae_dev = pci_get_drvdata(pdev);
+       struct hclge_dev *hdev = ae_dev->priv;
 
 
-       /* check if this is a new reset request and we are not here just because
+       /* We might end up getting called broadly because of 2 below cases:
+        * 1. Recoverable error was conveyed through APEI and only way to bring
+        *    normalcy is to reset.
+        * 2. A new reset request from the stack due to timeout
+        *
+        * For the first case,error event might not have ae handle available.
+        * check if this is a new reset request and we are not here just because
         * last reset attempt did not succeed and watchdog hit us again. We will
         * know this if last reset request did not occur very recently (watchdog
         * timer = 5*HZ, let us check after sufficiently large time, say 4*5*Hz)
         * last reset attempt did not succeed and watchdog hit us again. We will
         * know this if last reset request did not occur very recently (watchdog
         * timer = 5*HZ, let us check after sufficiently large time, say 4*5*Hz)
@@ -2503,6 +2509,9 @@ static void hclge_reset_event(struct hnae3_handle *handle)
         * want to make sure we throttle the reset request. Therefore, we will
         * not allow it again before 3*HZ times.
         */
         * want to make sure we throttle the reset request. Therefore, we will
         * not allow it again before 3*HZ times.
         */
+       if (!handle)
+               handle = &hdev->vport[0].nic;
+
        if (time_before(jiffies, (handle->last_reset_time + 3 * HZ)))
                return;
        else if (time_after(jiffies, (handle->last_reset_time + 4 * 5 * HZ)))
        if (time_before(jiffies, (handle->last_reset_time + 3 * HZ)))
                return;
        else if (time_after(jiffies, (handle->last_reset_time + 4 * 5 * HZ)))
index ac67fecb9408119705cc90c744974421f58f4dcf..e0a86a58342c28dab0a6e044895f9c4635f46207 100644 (file)
@@ -1214,7 +1214,8 @@ static int hclgevf_do_reset(struct hclgevf_dev *hdev)
        return status;
 }
 
        return status;
 }
 
-static void hclgevf_reset_event(struct hnae3_handle *handle)
+static void hclgevf_reset_event(struct pci_dev *pdev,
+                               struct hnae3_handle *handle)
 {
        struct hclgevf_dev *hdev = hclgevf_ae_get_hdev(handle);
 
 {
        struct hclgevf_dev *hdev = hclgevf_ae_get_hdev(handle);