《Linux Device Drivers》 第十七章 网络驱动程序——note
- 简介
- 网络接口是第三类标准Linux设备,本章将描述网络接口是如何与内核其余的部分交互的
- 网络接口必须使用特定的内核数据结构注册自身,以备与外界进行数据线包交换时调用
- 对网络接口的常用文件操作是没有意义的,因此在它们身上无法体现Unix的“一切都是文件”的思想
- 网络驱动程序异步自外部世界的数据包
- 网络设备向内核请求把外部获得的数据包发送给内核
- Linux内核中的网络子系统被设计成完全与协议无关
- 在网络世界中使用术语“octet”指一组8个的数据位,它是能为网络设备和协议所能理解的最小单位
- 协议头(header)是在数据包中的一系列字节,它将通过网络子系统的不同层
- 连接到内核
- loopback.c、plip.c和e100.c
- 设备注册
- 驱动程序对每个新检测到的接口,向全局的网络设备链表中插入一个数据结构
- <linux/netdevice.h>
- struct net_device
- struct net_device *alloc_netdev(int sizeof_priv, const char *name, void (*setup) (struct net_device *));
- name是接口的名字,这个名字可以使用类似printf中%d的格式,内核将用下一个可用的接口号替代%d
- <linux/etherdevie.h>
- struct net_device *alloc_etherdev(int sizeof_priv);
- 光纤通道设备使用alloc_fcdev(<linux/fcdevice.h>)
- FDDI设备使用alloc_fddidev(<linux/fddidevice.h>)
- 令牌环设备使用alloc_trdev(<linux/trdevice.h>)
- register_netdev函数
- 初始化每个设备
- example
- ether_setup(dev);
- dev->open = open_function;
- dev->stop = release_function;
- dev->set_config = config_function;
- dev->hard_start_xmid = tx_function;
- dev->do_ioctl = ioctl_function;
- dev->get_stats = stats_function;
- dev->rebuild_header = rebuild_header_function;
- dev->hard_header = header_function;
- dev->tx_timeout = tx_timeout_function;
- dev->watchdog_timo = timeout;
- dev->flags |= IFF_NOARP;
- dev->features |= NETIF_F_NO_CSUM;
- dev->hard_header_cache = NULL;
- priv = netdev_priv(dev);
- example
- 模块的卸载
- unregister_netdev函数从系统中删除接口
- free_netdev函数将net_device结构返回给系统
- net_device结构细节
- 全局信息
- char name[IFNAMSIZ];
- unsigned long state;
- struct net_device *next;
- int (*init) (struct net_device *dev);
- 硬件信息
- unsigned long rmem_end;
- unsigned long rmem_start;
- unsigned long mem_end;
- unsigned long mem_start;
- unsigned long base_addr;
- unsigned char irq;
- unsigned char if_port;
- unsigned char dma;
- 接口信息
- drivers/net/net_init.c
- void ltalk_setup(struct net_device *dev);
- void fs_setup(struct net_device *dev);
- void fddi_setup(struct net_device *dev);
- void hippi_setup(struct net_device *dev);
- void tr_setup(struct net_device *dev);
- unsigned short hard_header_len;
- 对以太网接口,该值是14
- unsigned mtu;
- 最大传输单元,以太网的MTU是1500个octet
- unsigned long tx_queue_len;
- unsigned short type;
- ARP使用type成员判断接口所支持的硬件地址类型
- <linux/if_arp.h>
- unsigned char addr_len;
- unsigned char broadcast[MAX_ADDR_LEN];
- unsigned char dev_addr[MAX_ADDR_LEN];
- unsigned short flags;
- int features;
- 该标志成员是一个位掩码
- IFF_前缀表示“接口标志”,有效的标志定义在<linux/if.h>
- 设备方法
- 网络接口的设备方法可划分为两个类型:基本的和可选的
- 基本方法
- int (*open) (struct net_device *dev);
- int (*stop) (struct net_device *dev);
- int (*hard_start_xmit) (struct sk_buff *skb, struct net_device *dev);
- int (*hard_header) (struct sk_buff *skb, struct net_device *dev, unsigned short type, void *daddr, void *saddr, unsigned len);
- int (*rebuild_header) (struct sk_buff *skb);
- void (*tx_timeout) (struct net_device *dev);
- struct net_device_stats *(*get_stats) (struct net_device *dev);
- int (*set_config) (struct net_device *dev, struct ifmap *map);
- 可选方法
- int (*poll) (struct net_device *dev, int *quota);
- void (*poll_controller) (struct net_device *dev);
- int (*do_ioctl) (struct net_device *dev, struct ifreq *ifr, int cmd);
- void (*set_multicast_list) (struct net_device *dev);
- int (*set_mac_address) (struct net_device *dev, void *addr);
- int (*change_mtu) (struct net_device *dev, int net_mtu);
- int (*header_cache) (struct neighbour *neigh, struct hh_cache *hh);
- int (*header_cache_update) (struct hh_cache *hh, struct net_device *dev, unsigned char *haddr);
- int (*hard_header_parse) (struct sk_buff *skb, unsigned char *haddr);
- 工具成员
- unsigned long trans_start;
- unsigned long last_rx;
- int watchdog_timeo;
- void *priv;
- struct dev_mc_list *mc_list;
- int mc_count;
- spinlock_t xmit_lock;
- int xmit_lock_owner;
- 全局信息
- 打开和关闭
- 在使用ifconfig向接口赋予地址时,要执行两个任务
- 首先,通过ioctl(SIOCSIFADDR)赋予地址
- 然后,通过ioctl(SIOCSIFFLAGS)设置dev->flag中的IFF_UP标志以打开接口
- 对设备而言,无需对ioctl(SIOCSIFADDR)做任何工作,后一个命令会调用设备的open方法
- 在接口被关闭时,ifconfig使用ioctl(SIOSIFFLAGS)来清除IFF_UP标志,然后调用stop函数
- 此外,还要执行其他一些步骤
- 首先,在接口有够和外界通讯之前,要将硬件地址(MAC)从硬件设备复制到dev->dev_addr
- 应该启动接口的传输队列
- void netif_start_queue(struct net_device *dev);
- 在使用ifconfig向接口赋予地址时,要执行两个任务
- 数据包传输
- 无论何时内核要传输一个数据包,它都会调用驱动程序的hard_start_transmit函数将数据放入外发队列
- 内核处理的每个数据包位于一个套接字缓冲区结构(sk_buff)中,该结构定义在<linux/skbuff.h>中
- 传递经全hard_start_xmit的套接字缓冲区包含了物理数据包,并拥有完整的传输层数据包头
- 该传输函数只执行了对数据包的一致性检查,然后通过硬件相关的函数传输数据
- 如果执行成功,则hard_start_xmit返回0
- 控制并发传输
- 通过net_device结构中的一个自旋锁获得并发调用时的保护
- 实际的硬件接口是异步传输数据包的,而且可用来保存外发数据包的存储空间非常有限
- void netif_wake_queu(struct net_device *dev);
- 通知网络系统可再次开始传输数据包
- void netif_tx_disable(struct net_device *dev);
- 禁止数据包的传送
- 传输超时
- 如果当前的系统时间超过设备的trans_start时间至少一个超时周期,网络层将最终调用驱动程序的tx_timeout函数
- Scatter/Gather I/O
- 在网络上为传输工作创建数据包的过程,包括了组装多个数据片段的过程
- 如果负责发送数据包的网络接口实现了分散/聚焦I/O,则数据包就不用组装成一个大的数据包
- 分散/聚焦I/O还能用“零拷贝”的方法,把网络数据直接从用户缓冲区内传输出来
- 如果在device结构中的feature成员内设置了NETIF_F_SG标志位,内核才将分散的数据包传递给hard_start_xmit函数
- struct skb_frag_struct
- struct page *page;
- __u16 page_offset;
- __u16 size;
- 数据包的接收
- 从网络上接收数据要比传输数据复杂一点,因为必须在原子上下文中分配一个sk_buff并传递给上层处理
- 网络驱动程序实现了两种模式接收数据包:中断驱动方式和轮询方式
- 过程
- 第一步是分配一个保存数据包的缓冲区
- dev_alloc_skb
- 检查dev_alloc_skb函数的返回值
- 一旦拥有一个合法的skb指针,则调用memcpy将数据包数据拷贝到缓冲区内
- 最后,驱动程序更新其统计计数器
- 第一步是分配一个保存数据包的缓冲区
- 接收数据包过程中的最后一个步骤由netif_rx执行
- 中断处理例程
- 接口在两种可能的事件下中断处理器
- 新数据包到达
- 外发数据包的传输已经完成
- 通常中断例程通过检查物理设备中的状态寄存器,以区分新数据包到达中断和数据传输完毕中断
- 传输结束时,统计信息要被更新,而且要将套接字缓冲区返回全系统
- dev_kfree_skb(struct sk_buff *skb);
- dev_kfree_skb_irq(struct sk_buff *skb);
- dev_kfree_skb_any(struct sk_buff *skb);
- 接口在两种可能的事件下中断处理器
- 不使用接收中断
- 为了能提高Linux在宽带系统上的性能,网络子系统开发者创建了另外一种基于轮询方法的接口(称之为NAPI)
- 停止使用中断会减轻处理器的负荷
- struct net_device的poll成员必须设置为驱动程序的轮询函数
- 当接口通知数据到达的时候,中断程序不能处理该数据包,相反它还要禁止接收中断,并且告诉内核,从现在开始启动轮询接口
- 用netif_receive_skb函数将数据包传递给内核,而不是使用netif_rx
- 调用netif_rx_complete关闭轮询函数
- 链路状态的改变
- 大多数涉及实际的物理连接的网络技术提供载波状态信息,载波的存在意味着硬件功能是正常的
- void netif_carrier_off(struct net_device *dev);
- void netif_carrier_on(struct net_device *dev);
- int netif_carrier_ok(struct net_device *dev);
- 用来检测当前的载波状态
- 套接字缓冲区
- <linux/skbuff.h>
- 重要的成员
- struct net_device *dev
- union { /* … */ } h;
- union { /* … */ } nh;
- union { /* … */ } mac;
- unsigned char *head;
- unsigned char *data;
- unsigned char *tail;
- unsigned char *end;
- unsigned int len;
- unsigned int data_len;
- unsigned char ip_summed;
- unsigned char pkt_type;
- shinfo (struct sk_buff *skb);
- unsigned int shinfo(skb)->nr_frags;
- skb_frag_t shinfo(skb)->frags;
- 操作套接字缓冲区的函数
- struct sk_buff *alloc_skb(unsigned int len, int priority);
- struct sk_buff *dev_alloc_skb(unsigned int len);
- void kfree_skb(struct sk_buff *skb);
- void dev_kfree_skb(struct sk_buff *skb);
- void dev_kfree_skb_irq(struct sk_buff *skb);
- void dev_kfree_skb_any(struct sk_buff *skb);
- unsigned char *skb_put(struct sk_buff *skb, int len);
- unsigned char *__skb_put(struct sk_buff *skb, int len);
- unsigned char *skb_push(struct sk_buff *skb, int len);
- unsigned char *__skb_push(struct sk_buff *skb, int len);
- int skb_tailroom(struct sk_buff *skb);
- int skb_headroom(struct sk_buff *skb);
- void skb_reserve(struct sk_buff *skb, int len);
- unsigned char *skb_pull(struct sk_buff *skb, int len);
- int skb_is_nonlinear(struct sk_buff *skb);
- int skb_headlen(struct sk_buff *skb);
- void *kmap_skb_frag(skb_frag_t *frag);
- void kunmap_skb_frag(void *vaddr);
- MAC地址解析
- 在以太网中使用ARP
- ARP由内核维护,而以太网接口不需要做任何特殊工作就能支持ARP
- 重载ARP
- 如果设备希望使用常用的硬件头,而不运行ARP,则需要重载默认的dev->hard_header函数
- 非以太网头
- 硬件头中除目标地址之外,还包含其他一些信息,其中最重要的是通信协议
- drivers/net/appletalk/cops.c
- drivers/net/irda/smc_ircc.c
- drivers/net/pp_generic.c
- 在以太网中使用ARP
- 定制ioctl命令
- 当为某个套接字使用ioctl系统调用时,命令号是定义在<linux/sockios.h>中的某个符号
- 函数sock_ioctl直接调用一个协议相关的函数
- 任何协议层不能识别的ioctl命令都会传递到设备层
- 这些设备相关的ioctl命令从用户空间接受第三个参数,即一个struct ifreq *指针
- <linux/if.h>
- 统计信息
- 驱动程序需要的最后一个函数是get_stats,这个函数返回设备统计结构的指针
- struct net_device_stats
- unsigned long rx_packets;
- unsigned long tx_packets;
- unsigned long rx_bytes;
- unsigned long tx_bytes;
- unsigned long rx_errors;
- unsigned long tx_errors;
- unsigned long rx_dropped;
- unsigned long tx_dropped;
- unsigned long collisions;
- unsigned long multicast;
- 组播
- 对以太网而言,组播地址在目标地址的第一个octet的最低位设置为1,而所有设备板卡将自己的硬件地址的相应位清零
- 内核在任意给定时刻均要跟踪组播地址
- 驱动程序实现组播清单的方法,在某种程序上依赖于底层硬件的工作方式
- 通常来说,考虑组播时,硬件可划分为三类
- 不有处理组播的接口
- 能够区分组播数据包和其他数据包的接口
- 能够为组播地址进行硬件检测的接口
- 对组播的内核支持
- 对组播数据包的支持由如下几项组成:一个设备函数、一个数据结构以及若干设备标志
- void (*dev_set_multicast_list) (struct net_device *dev);
- struct dev_mc_list *dev->mc_list;
- int dev->mc_count;
- <linux/netdevice.h>
- struct dev_mc_list
- struct dev_mc_list *next
- __u8 dmi_addr[MAX_ADDR_LEN];
- unsigned char dmi_addrlen;
- int dmi_users;
- int dmi_gusers;
- 其他知识点详解
- 对介质无关接口的支持
- 介质无关接口(Media Independent Interface, MII)是一个IEEE802.3标准,它描述了以太网收发器是如何与网络控制器连接的
- <linux/mii.h>
- int (*mdio_read) (struct net_device *dev, int phy_id, int location);
- void (*mdio_write) (struct net_device *dev, int phy_id, int location, int val);
- drivers/net/mii.c
- ethtool支持
- ethtool是为系统管理员提供的用于控制网络接口的工具
- 只有当驱动程序支持ethtool时,使用ethtool才能控制包括速度、介质类型、双工操作、DMA设置、硬件检验、LAN唤醒操作在内的许多接口参数
- http://sf.net/projects/gkernel/
- <linux/ethtool.h>
- struct ethtool_ops
- Netpoll
- 它出现的目的是让内核在网络和I/O子系统尚不能完整可用时,依然能发送和接收数据包
- 用于网络控制台和远程内核调试
- 实现netpoll的驱动程序需要实现poll_controller函数,作用是在缺少设备中断时,还能对控制器做出响应
- 对介质无关接口的支持
郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。