天天看点

转:Linux PHY几个状态的跟踪MAC驱动和PHY驱动PHY状态机PHY状态

MAC驱动和PHY驱动

PHY一般和具体的MAC控制驱动联系一起,这里以TI的MAC驱动为例,由它切入到PHY驱动。Linux内核通过mdio总线访问、控制PHY,源码实现在driver/net/phy/mdio_bus.c中。下面是mdio扫描、找到并注册phy的过程:

[cpp] view plain copy print?

转:Linux PHY几个状态的跟踪MAC驱动和PHY驱动PHY状态机PHY状态
转:Linux PHY几个状态的跟踪MAC驱动和PHY驱动PHY状态机PHY状态
  1. davinci_mdio_probe  
  2.  ->mdiobus_register  
  3.     -> device_register  
  4.     -> mdiobus_scan  
  5.          -> get_phy_device  
  6.               -> get_phy_id // 读寄存器  
  7.               -> phy_device_create  
  8.                    -> INIT_DELAYED_WORK(&dev->state_queue, phy_state_machine); // !!!!!!初始化状态机函数  
  9.          -> phy_device_register  

在phy_device_create中做了大量的初始化工作,比如默认就是使能自动协商,另外调用 INIT_DELAYED_WORK(&dev->state_queue, phy_state_machine)创建phy的状态机,——实际上它是一个延时工作队列。

cpsw驱动在net_device_ops的ndo_open函数,亦即cpsw_ndo_open中调用cpsw_slave_open,通过 phy_connect与phy连接,同时将cpsw_adjust_link赋值给phy的状态调整函数指针adjust_link。在些过程将将 PHY状态机开启。

这个过程主要的函数如下:

[cpp] view plain copy print?

转:Linux PHY几个状态的跟踪MAC驱动和PHY驱动PHY状态机PHY状态
转:Linux PHY几个状态的跟踪MAC驱动和PHY驱动PHY状态机PHY状态
  1. cpsw_ndo_open  
  2. -> cpsw_slave_open  
  3.    -> phy_connect (传递cpsw_adjust_link)  
  4.       -> phy_connect_direct (PHY_READY)  
  5.       ->  phy_prepare_link (赋值cpsw_adjust_link为adjust_link)  
  6.       -> phy_start_machine  
  7.    -> phy_start (PHY_READY变成PHY_UP)  

当系统启动时,经过上述的步骤,一切已经准备妥当。就等着迎接PHY的状态变更了。在这里,需要提及的函数是cpsw_adjust_link,它 调用了_cpsw_adjust_link,之后通知内核其它网络模块当前的状态。这个函数将在phy状态机函数中时时被调用,所以要关注一下。代码如 下:

[cpp] view plain copy print?

转:Linux PHY几个状态的跟踪MAC驱动和PHY驱动PHY状态机PHY状态
转:Linux PHY几个状态的跟踪MAC驱动和PHY驱动PHY状态机PHY状态
  1. static void cpsw_adjust_link(struct net_device *ndev)  
  2. {  
  3.     struct cpsw_priv    *priv = netdev_priv(ndev);  
  4.     bool            link = false;  
  5.     for_each_slave(priv, _cpsw_adjust_link, priv, &link);  
  6.     if (link) {  
  7.         netif_carrier_on(ndev); // 通知内核子系统网络,当前链接是OK的  
  8.         if (netif_running(ndev))  
  9.             netif_wake_queue(ndev);  
  10.     } else {  
  11.         netif_carrier_off(ndev); // 通知内核子系统网络,当前链接断开了  
  12.         netif_stop_queue(ndev);  
  13.     }  
  14. }  

真正干活(设置)的是这个函数:

[cpp] view plain copy print?

转:Linux PHY几个状态的跟踪MAC驱动和PHY驱动PHY状态机PHY状态
转:Linux PHY几个状态的跟踪MAC驱动和PHY驱动PHY状态机PHY状态
  1. static void _cpsw_adjust_link(struct cpsw_slave *slave,  
  2.                   struct cpsw_priv *priv, bool *link)  
  3. {  
  4.     struct phy_device   *phy = slave->phy;  
  5.     u32         mac_control = 0;  
  6.     u32         slave_port;  
  7.     if (!phy)  
  8.         return;  
  9.     slave_port = cpsw_get_slave_port(priv, slave->slave_num);  
  10.     if (phy->link) {  
  11.         mac_control = priv->data.mac_control;  
  12.         cpsw_ale_control_set(priv->ale, slave_port,  
  13.                      ALE_PORT_STATE, ALE_PORT_STATE_FORWARD);  
  14.         if (phy->speed == 1000) // 千兆  
  15.             mac_control |= BIT(7);    
  16.         if (phy->duplex)  
  17.             mac_control |= BIT(0);    
  18.         if (phy->speed == 100) // 百兆  
  19.             mac_control |= BIT(15);  
  20.         else if (phy->speed == 10) // 十兆  
  21.             mac_control |= BIT(18);   
  22.         *link = true;  
  23.     } else {  
  24.         mac_control = 0;  
  25.         cpsw_ale_control_set(priv->ale, slave_port,  
  26.                      ALE_PORT_STATE, ALE_PORT_STATE_DISABLE);  
  27.     }  
  28.     if (mac_control != slave->mac_control) {  
  29.         phy_print_status(phy); // 当状态不同时,需要写寄存器时,才打印网络状态  
  30.         __raw_writel(mac_control, &slave->sliver->mac_control);  
  31.     }  
  32.     slave->mac_control = mac_control;  
  33. }  

它实际上写mac_control寄存器,这个寄存器控制着速率(千兆、百兆、十兆)和双工。之前不太理解,问了高手,才知道不单单要设置PHY寄 存器,还要设置mac控制模块的寄存器。phy_print_status是phy驱动的通用函数,用以打印网络状态(初步查了下,像Intel的网络驱 动,不调用此函数,等有空再研究研究)。

[cpp] view plain copy print?

转:Linux PHY几个状态的跟踪MAC驱动和PHY驱动PHY状态机PHY状态
转:Linux PHY几个状态的跟踪MAC驱动和PHY驱动PHY状态机PHY状态
  1. void phy_print_status(struct phy_device *phydev)  
  2. {  
  3.     if (phydev->link) {  
  4.         netdev_info(phydev->attached_dev,  
  5.             "Link is Up - %s/%s - flow control %s\n",  
  6.             phy_speed_to_str(phydev->speed),  
  7.             DUPLEX_FULL == phydev->duplex ? "Full" : "Half",  
  8.             phydev->pause ? "rx/tx" : "off");  
  9.     } else  {  
  10.         netdev_info(phydev->attached_dev, "Link is Down\n");  
  11.     }  
  12. }  

其中的phy_speed_to_str函数是将网速转化成字符串,在内核的旧版本上是没有的。

当网络连接时,会打印如下信息:

PHY: 2:50 - Link is Up - 100Mbps/Full - flow control off

当网络断开时,会打印:

PHY: 2:50 - Link is Down

PHY状态机

先看看PHY有的状态定义:

[cpp] view plain copy print?

转:Linux PHY几个状态的跟踪MAC驱动和PHY驱动PHY状态机PHY状态
转:Linux PHY几个状态的跟踪MAC驱动和PHY驱动PHY状态机PHY状态
  1. enum phy_state {  
  2.     PHY_DOWN = 0, // PHY芯片和驱动没准备好,一般情况下少发生  
  3.     PHY_STARTING, // PHY芯片OK了,但驱动还没有准备好  
  4.     PHY_READY,    // 准备好了,在probe中赋值,接下来会切到PHY_UP  
  5.     PHY_PENDING,  
  6.     PHY_UP,       // phy启动了,可以工作了,接下来会到PHY_AN  
  7.     PHY_AN,       // 自动协商  
  8.     PHY_RUNNING,  // 正在运行中,在网络连接(插上网线)时会到这个状态  
  9.     PHY_NOLINK,   // 断网了  
  10.     PHY_FORCING,  // 强制,当自动协商不使能时,就会进行此状态(实际上会读PHY寄存器进行设置速率、双工,等)  
  11.     PHY_CHANGELINK, // 变化,这个状态很重要,当连接时,会换到PHY_RUNNING,当断网时,会切到PHY_NOLINK  
  12.     PHY_HALTED,  
  13.     PHY_RESUMING  
  14. };  

phy状态变化主要在phy_state_machine函数,该函数一直在运行(每隔一秒检测一次网络状态),该函数判断不同的网络状态作出不同 的动作。其中CHANGELINK是会根据网络连、断来判断是RUNNING还是NOLINK。这样,就知道网络是连接上还是断开。当连接上网络后(注: 不断开情况),状态为RUNNING时,之后重新赋值CHANGELINK,到了CHANGELINK又赋值RUNNING,这两种状态之间不断切换。完 整代码如下:

[cpp] view plain copy print?

转:Linux PHY几个状态的跟踪MAC驱动和PHY驱动PHY状态机PHY状态
转:Linux PHY几个状态的跟踪MAC驱动和PHY驱动PHY状态机PHY状态
  1. void phy_state_machine(struct work_struct *work)  
  2. {  
  3.     struct delayed_work *dwork = to_delayed_work(work);  
  4.     struct phy_device *phydev =  
  5.             container_of(dwork, struct phy_device, state_queue);  
  6.     bool needs_aneg = false, do_suspend = false, do_resume = false;  
  7.     int err = 0;  
  8.     mutex_lock(&phydev->lock);  
  9.     if (phydev->drv->link_change_notify)  
  10.         phydev->drv->link_change_notify(phydev);  
  11.     switch (phydev->state) {  
  12.     case PHY_DOWN:  
  13.     case PHY_STARTING:  
  14.     case PHY_READY:  
  15.     case PHY_PENDING:  
  16.         break;  
  17.     case PHY_UP:  
  18.         needs_aneg = true;  
  19.         phydev->link_timeout = PHY_AN_TIMEOUT; // 超时,自动协商不成功时,则会在超时后强制设置速率等参数  
  20.         break;  
  21.     case PHY_AN:  
  22.         err = phy_read_status(phydev); // 读phy状态,包括link,速率、双工,等等  
  23.         if (err < 0)  
  24.             break;  
  25.         if (!phydev->link) {  
  26.             phydev->state = PHY_NOLINK; // 没有连接,则状态变成PHY_NOLINK  
  27.             netif_carrier_off(phydev->attached_dev); // 通知内核其它网络模块(phy是最底一层)断网了。  
  28.             phydev->adjust_link(phydev->attached_dev); // 调整参数(速率、双工)  
  29.             break;  
  30.         }  
  31.         err = phy_aneg_done(phydev); // 检测是否完成自动协商  
  32.         if (err < 0)  
  33.             break;  
  34.         if (err > 0) {  
  35.             phydev->state = PHY_RUNNING; // 完成后,变成PHY_RUNNING状态  
  36.             netif_carrier_on(phydev->attached_dev); // 发通知,连接OK  
  37.             phydev->adjust_link(phydev->attached_dev); // 打印、调用参数  
  38.         } else if (0 == phydev->link_timeout--)  
  39.             needs_aneg = true;  
  40.         break;  
  41.     case PHY_NOLINK:  
  42.         err = phy_read_status(phydev); // 读phy状态,包括link,速率、双工,等等  
  43.         if (err)  
  44.             break;  
  45.         if (phydev->link) { // 在断开网络再连接(即拨掉再插上网线),就进入此语句  
  46.             if (AUTONEG_ENABLE == phydev->autoneg) {  
  47.                 err = phy_aneg_done(phydev); // 如果是自动协商使能,就进行自动协商  
  48.                 if (err < 0)  
  49.                     break;  
  50.                 if (!err) {  
  51.                     phydev->state = PHY_AN;  
  52.                     phydev->link_timeout = PHY_AN_TIMEOUT;  
  53.                     break;  
  54.                 }  
  55.             }  
  56.             phydev->state = PHY_RUNNING; // 运行时。。。。。  
  57.             netif_carrier_on(phydev->attached_dev);  
  58.             phydev->adjust_link(phydev->attached_dev);  
  59.         }  
  60.         break;  
  61.     case PHY_FORCING:  
  62.         err = genphy_update_link(phydev); // 先更新状态  
  63.         if (err)  
  64.             break;  
  65.         if (phydev->link) {  
  66.             phydev->state = PHY_RUNNING; // 运行。。。  
  67.             netif_carrier_on(phydev->attached_dev);  
  68.         } else {  
  69.             if (0 == phydev->link_timeout--)  
  70.                 needs_aneg = true;  
  71.         }  
  72.         phydev->adjust_link(phydev->attached_dev);  
  73.         break;  
  74.     case PHY_RUNNING:  
  75.         if (!phy_interrupt_is_valid(phydev))  
  76.             phydev->state = PHY_CHANGELINK; // 如果是RUNNING,则改变为CHANGELINK。  
  77.         break;  
  78.     case PHY_CHANGELINK:  
  79.         err = phy_read_status(phydev); // 读phy状态,包括link,速率、双工,等等  
  80.         if (err)  
  81.             break;  
  82.         if (phydev->link) {  
  83.             phydev->state = PHY_RUNNING; // 连接网络时,则变成RUNNING  
  84.             netif_carrier_on(phydev->attached_dev);  
  85.         } else {  
  86.             phydev->state = PHY_NOLINK;  // 不连网时,变成NOLINK  
  87.             netif_carrier_off(phydev->attached_dev);  
  88.         }  
  89.         phydev->adjust_link(phydev->attached_dev);  
  90.         if (phy_interrupt_is_valid(phydev))  
  91.             err = phy_config_interrupt(phydev,  
  92.                            PHY_INTERRUPT_ENABLED);  
  93.         break;  
  94.     case PHY_HALTED:  
  95.         if (phydev->link) {  
  96.             phydev->link = 0;  
  97.             netif_carrier_off(phydev->attached_dev);  
  98.             phydev->adjust_link(phydev->attached_dev);  
  99.             do_suspend = true;  
  100.         }  
  101.         break;  
  102.     case PHY_RESUMING:  
  103.         err = phy_clear_interrupt(phydev);  
  104.         if (err)  
  105.             break;  
  106.         err = phy_config_interrupt(phydev, PHY_INTERRUPT_ENABLED);  
  107.         if (err)  
  108.             break;  
  109.         if (AUTONEG_ENABLE == phydev->autoneg) {  
  110.             err = phy_aneg_done(phydev);  
  111.             if (err < 0)  
  112.                 break;  
  113.             if (err > 0) {  
  114.                 err = phy_read_status(phydev);  
  115.                 if (err)  
  116.                     break;  
  117.                 if (phydev->link) {  
  118.                     phydev->state = PHY_RUNNING;  
  119.                     netif_carrier_on(phydev->attached_dev);  
  120.                 } else  {  
  121.                     phydev->state = PHY_NOLINK;  
  122.                 }  
  123.                 phydev->adjust_link(phydev->attached_dev);  
  124.             } else {  
  125.                 phydev->state = PHY_AN;  
  126.                 phydev->link_timeout = PHY_AN_TIMEOUT;  
  127.             }  
  128.         } else {  
  129.             err = phy_read_status(phydev); // 读phy状态,包括link,速率、双工,等等  
  130.             if (err)  
  131.                 break;  
  132.             if (phydev->link) {  
  133.                 phydev->state = PHY_RUNNING;  
  134.                 netif_carrier_on(phydev->attached_dev);  
  135.             } else  {  
  136.                 phydev->state = PHY_NOLINK;  
  137.             }  
  138.             phydev->adjust_link(phydev->attached_dev);  
  139.         }  
  140.         do_resume = true;  
  141.         break;  
  142.     }  
  143.     mutex_unlock(&phydev->lock);  
  144.     if (needs_aneg)  
  145.         err = phy_start_aneg(phydev);  
  146.     else if (do_suspend)  
  147.         phy_suspend(phydev);  
  148.     else if (do_resume)  
  149.         phy_resume(phydev);  
  150.     if (err < 0)  
  151.         phy_error(phydev);  
  152.     queue_delayed_work(system_power_efficient_wq, &phydev->state_queue,  
  153.                PHY_STATE_TIME * HZ);  
  154. }  

经过一大段的分析研究后,当网络发生变化时,就十分清晰了。

PHY状态

上电时状态变化:

PHY_READY -> PHY_UP -> PHY_AN -> PHY_RUNNING

拨出网线时状态变化:

PHY_RUNNING ->PHY_NOLINK

插上网线时状态变化:

PHY_NOLINK -> PHY_RUNNING

自动协商过程:

cpsw_ndo_open->cpsw_slave_open -> PHY_UP -> phy_start_aneg -> genphy_config_aneg -> genphy_config_advert -> genphy_restart_aneg -> PHY_AN -> PHY_NOLINK(串口打印Down) -> phy_aneg_done -> PHY_RUNNING(串口打印Up)

注:在AN后出现NOLINK状态,我猜是因为自动协商需要时间,此时间大于1秒,然后执行到状态机判断成NOLINK,然后判断是否完成自动协商,然后再到RUNNING状态。

本文源码分析基于3.17版本内核,地址:http://lxr.oss.org.cn/source/drivers/net/ethernet/ti/?v=3.17