STM32 入门开发 LWIP 网络协议栈移植 (网卡采用 DM9000)
一、环境介绍
MCU: STM32F103ZET6
代码开发工具: Keil5
TCP/IP 协议栈: LWIP
网卡: DM9000
本篇文章主要讲解如何在 STM32F103 工程里添加移植 LWIP 协议,最终完成 TCP 服务器、TCP 客户端的通信测试。 网卡采用的是 DM9000,工程代码中,采用 STM32 的 FSMC 接口来驱动 DM900 网卡,DM9000 是并口网卡,引脚多,但是速度快,也可以采用其他网卡,SPI 协议的、UART 协议的等。 比如:ENC28J60。 因为主要是讲 LWIP 协议栈的移植,所以网卡相关的代码就没有细说(需要准备一个网卡可以正常通信的工程,再移植)。
资料包里的内容如下:
二、D9000 网卡
2.1 DM9000 简介
DM9000 是一款完全集成的、性价比高、引脚数少、带有通用处理器接口的单芯片快速以太网控制器。 自带一个 10/100M PHY 和 4K 双字的 SRAM ,DM9000A 为适应各种处理器提供了 8 位、16 位数据接口访问内部存储器,DM9000 拥有自动协商功能,DM9000 特性如下:
1、集成自适应 10/100M 收发器。
2、内置 16k 字节的 SRAM。
3、支持硬件帧校验。
4、兼容 3.3V 和 5.0V 输入输出电压。
DM9000 有多种型号,有 100 引脚和 48 引脚的, 开发板选择的是 48 引脚的 DM9000,型号为 DM9000CEP。
2.2 DM9000 中断引脚电平设置
DM9000 的 34(INT)引脚为中断输出引脚,默认情况下该引脚高电平有效。可以通过设置 DM9000 的 20(EECK)引脚来改变 INT 的有效电平,当 EECK 拉高以后, INT 低电平有效,否则的话 INT 是高电平有效的。开发板上 R66 电阻为 EECK 的上拉电阻,因此开发板上 DM9000 的 INT 引脚是低电平有效的。
2.3 DM9000 数据位宽设置
前面我们提了一下 DM9000 支持 8 位和 16 位两种数据位宽,可以通过 DM9000 的 21(EECS)引脚设置其数据位宽,当 EECS 上拉的时候 DM9000 选择 8 位数据位宽,否则的话选择 16 位数据位宽。开发板上的 R65 电阻为 EECS 的上拉电阻,但是此电阻并未焊接! DM9000 芯片的数据位宽为 16 位。
2.4 DM9000 寄存器表
2.5 DM9000 常用寄存器介绍
NCR、 NSR、 TCR、 RCR、 FCTR、 BPTR、 TCR2、 ISR、 IMR。
NCR(网络控制寄存器)寄存器
FCOL:强制冲突模式,用于检测。
FDX:内部 PHY 全双工模式。
LBK:回环模式(LoopBack)
00 正常;
01 MAC 内部回环;
10 内部 PHY100M 模式数字回环;
11 保留;
RST:置 1 软件复位, 10us 后自动清零。
NSR 寄存器(网络状态寄存器)
SPEED:网络速度,在使用内部 PHY 情况下,0 表示 100Mbps,1 表示 100Mbps,当 LINKST=0 时,此位无意义。
LINKST:连接状态, 0 为连接失败, 1 位已连接。
TX2END: TX(发送)数据包 2 完成标志,读取或写 1 将清零该位。
TX1END: TX(发送)数据包 1 完成标志,读取或写 1 将清零该位。
RXOV: RX(接收)FIFO 溢出标志。
TCR 寄存器(发送控制寄存器)
TJDIS: Jabber 传输禁止。
1,禁止 Jabber 传输定时器(2048 字节)。
0,使能。
EXCECM:严重冲突模式控制
0,当冲突计数多于 15 则终止本次数据包。
1,始终尝试发送本次数据包。
PAD_DIS2:禁止为数据包 II 添加填充。
CRC_DIS2:禁止为数据包 II 添加 CRC 校验。
PAD_DIS1:禁止为数据包 I 添加填充。
CRC_DIS1:禁止为数据包 I 添加 CRC 校验。
TXREQ: TX(发送)请求,发送完成后自动清零该位
RCR 寄存器(发送控制寄存器)
WTDIS:看门狗定时器(2048 字节)禁止。
1,进制
0,使能
DIS_LONG:丢弃长数据包, 1,丢弃数据包长度超过 1522 字节的数据包。
DIS_CRC:丢弃 CRC 校验错误数据包。
ALL:允许广播。
RUNT:允许小于最小长度的数据包。
PRMSC:各种模式。
RXEN:接收使能。
FCTR 寄存器(流控制阈值寄存器)
HWOT:RX FIFO 缓存高位溢出门限
当 RX SRAM 空闲空间小于该门限值时则发送一个暂停时间为 FFFFH 的暂停包,若该值为 0,则无接收控件。 1=1k 字节,默认值为 3H,即 3K 字节空闲空间,不要超过 S RAM 大小。
LWOT:RX FIFO 缓存低位溢出门限当 RX SRAM 空闲空间大于该门限值时则发送一个暂停时间为 0000H 的暂停包。
当溢出门限最高值的暂停包发送之后,溢出门限最低值的暂停包才有效,默认值为 8K,不要超过 SRAM 大小。
BPTR 寄存器(背压阈值寄存器)
BPHW:背压阈值最高值当接收 SRAM 空闲空间低于该阈值,则 MAC 将产生一个拥挤状态, 1=1k 字节。默认值为 3H,即 3K 字节空闲空间,不要超过 SRAM 大小。
JPT:拥挤状态时间,模式为 200us, JPT 值与其对应的拥挤状态时间表
TCR2 寄存器(发送控制寄存器 2)
LED: LED 模式
1,设置 LED 引脚为模式 1
0,设置 LED 引脚为模式 0 或根据 EEPROM 的设定。
RLCP:重试冲突延时数据包, 1 重新发送有冲突延迟的数据包。
DTU: 1 禁止重新发送“underruned”数据包。
ONEPM:单包模式。
1,发送完成前发送一个数据包的命令能被执行。
0,发送完成前发送最多两个数据包的命令能被执行。
IFGS:帧间间隔设置。
0XXX 为 96bit, 1000 为 64bit, 1001 为 72bit
1010 为 80bit, 1011 为 88bit, 1100 为 96bit
1101 为 104bit, 1110 位 112bit, 1111 为 120bit
ISR 寄存器(中断状态寄存器)
IOMODE: 0,16 位模式; 1,8 位模式。
LNKCHG:连接状态改变。
UDRUN:发送“Underrun”
ROO:接收溢出计数器溢出
ROS:接收溢出。
PT:数据包发送。
PR:数据包接收。
IMR 寄存器(中断状态寄存器)
PAR:使能 SRAM 的读/写指针在指针地址超过 SRAM 的大小时自动跳回起始位置。需要驱动程序设置该位,若设置该位, REG_F5 将自动置为 0XH。
LNKCHGI:使能连接状态改变中断。
UDRUNI:使能发送“Underrun”中断。
ROOI:使能接收溢出计数器溢出中断。
ROI:使能接收溢出中断。
PTI:使能数据包发送中断。
PRI:使能数据包接收中断。
2.6 DM9000 直接内存访问控制(DMAC)
DM9000 直接内存访问控制(DMAC)
DM9000 支持 DMA 方式简化对内部存储器的访问。在我们编程写好内部存储器地址后,就可以用一个读/写命令伪指令把当前数据加载到内部数据缓冲区,这样,内部存储器指定位置就可以被读/写命令寄存器访问。存储器地址将会自动增加,增加的大小与当前总线操作模式相同(比如:8-bit、 16-bit 或 32-bit),接着下一个地址数据将会自动加载到内部数据缓冲区。要注意的是在连续突发式第一次访问的数据应该被忽略,因为,这个数据是最后一次读写命令的内容。内部存储器空间大小 16K 字节。前 3K 字节单元用作发送包的缓冲区,其他 13K 字节用作接收包的缓冲区。所以在写存储器操作时,如果地址越界(即超出 3K 空间),在 IMR 寄存器 bit7 置位的情况下,地址指针将会返回到存储器 0 地址处。同样,在读存储器操作时,如果地址越界(即超出 16K 空间),在 IMR 寄存器 bit7 置位的情况下,地址指针将会返回到存储器 0x0C00 地址处。
DM9000 数据包发送
DM9000 有两个发送数据包: index1 和 index2,同时存储在 TX SRAM 中。发送控制寄存器(02h)控制循环冗余校验码(CRC)和填充(pads)的插入,其状态分别记录在发送状态寄存器 I(03H)和发送状态寄存器 II(04H)中。发送器的起始地址为 0x00H,在软件或硬件复位后,默认的数据发送包为 index1。首先,使用 DMA 端口将数据写 TX SRAM 中,然后,在发送数据包长度寄存器中把数据字节数写入字节计数寄存器。置位发送控制寄存器的 bit0 位,则 DM9000 开始发送 index1 数据包。在 index1 数据包发送结束之前,数据发送包 index2 被移入 TX SRAM 中。在 index1 数据包发送结束后,将 index2 数据字节数写入字节计数寄存器中,然后,置位发送控制寄存器的 bit0 位,则 index2 数据包开始发送。以此类推,后面的数据包都以此方式进行发送。
DM9000 数据包接收
RX SRAM 是一个环形数据结构。在软件或硬件复位后, RX SRAM 的起始地址为 0X0C00。每个接收数据包都包含有 CRC 校验域,数据域,以及紧跟其后的 4 字节包头域。 4 字节包头格式为: 01h、状态、 BYTE_COUNT 低、 BYTE_COUNT 高。请注意:每个接收包的起始地址处在适当的地址边界,这取决于当前总线操作模式(8bit 或者 16bit)
2.7 DM9000 原理图介绍
各信号线描述如下:
PWRST: DM9000 复位信号。
CS: DM9000 的片选信号。
WR(IOW): 处理器写命令。
RD(IOR): 处理器读命令。
CMD: 命令/数据标志, 0,读写命令; 1,读写数据。
SD0~SD15: 16 位双向数据线。
信号线对应的 GPIO 口对应关系
FSMC 接口框图
DM9000 网卡接在 FSMC 的第 2 块上,数据线地址: 0x64000000
PA7 地址线作为命令与数据线切换引脚。
外接 16 位宽度存储器:HADDR[25:1] FSMC_A[24:0]
外接 8 位宽度存储器: HADDR[25:0] FSMC_A[25:0]
0x64000000 基地址:01100100000000000000000000000000 0x64000000 写数据:01100100000000000000000000000000 0x64000100 写命令:01100100000000000000000100000000
2.8 DM9000 时序图介绍
IOR 和 IOW 是 DM9000 的读写选择引脚,低电平有效,即低电平时进行读(IOR)写(IOW)操作;AEN 是芯片选通引脚,低电平有效,该引脚为低时才能进行读写操作;CMD 的命令/数据切换引脚,低电平时读写命令操作,高电平时读写数据操作。
读时序:
写时序:
三、LWIP(TCP/IP)网络协议栈介绍
根据以太网帧头携带的上层协议类型值传递数据。
以太网帧格式定义:
目的 MAC 地址 源 MAC 地址 类型/长度 数据 校验
6 字节 6 字节 2 字节 46-1500 字节 4 字节
ip:0x0800
ARP:0x0806
最大帧长 1518* 字节* 最小字节 64* 字节*
3.1 LWIP 介绍
lwip 是瑞典计算机科学院网络嵌入式系统小组(SICS)的 Adam Dunkels(亚当·邓克尔) 开发的一个小型开源的 TCP/IP 协议栈。实现的重点是在保持 TCP 协议主要功能的基础上减少对 RAM 的占用。
LwIP 是 Light Weight (轻型)IP 协议,有无操作系统的支持都可以运行。LwIP 实现的重点是在保持 TCP 协议主要功能的基础上减少对 RAM 的占用,它只需十几 KB 的 RAM 和 40K 左右的 ROM 就可以运行,这使 LwIP 协议栈适合在低端的嵌入式系统中使用。lwip 提供三种 API:1)RAW API 2)(NETCONN)lwip API 3)BSD API。
RAW 编程接口使得程序效率高,但是需要对 LWIP 有深入的了解,而且不适合大数据量等场合。 NETCONN 编程接口,使用 NETCONN API 时需要有操作系统的支持。
RAW API 把协议栈和应用程序放到一个进程里边,该接口基于函数回调技术,使用该接口的应用程序可以不用进行连续操作。不过,这会使应用程序编写难度加大且代 码不易被理解。为了接收数据,应用程序会向协议栈注册一个回调函数。该回调函数与特定的连接相关联,当该关联的连接到达一个信息包,该回调函数就会被协议 栈调用。这既有优点也有缺点。优点是既然应用程序和 TCP/IP 协议栈驻留在同一个进程中,那么发送和接收数据就不再产生进程切换。主要缺点是应用程序不 能使自己陷入长期的连续运算中,这样会导致通讯性能下降,原因是 TCP/IP 处理与连续运算是不能并行发生的。这个缺点可以通过把应用程序分为两部分来克 服,一部分处理通讯,一部分处理运算。
lwip API 把接收与处理放在一个线程里面。这样只要处理流程稍微被延迟,接收就会被阻塞,直接造成频繁丢包、响应不及时等严重问题。因此,接收与协议处理必须 分开。LwIP 的作者显然已经考虑到了这一点,他为我们提供了 tcpip_input() 函数来处理这个问题, 虽然他并没有在 rawapi 一文中说明。 讲到这里,读者应该知道 tcpip_input()函数投递的消息从哪里来的答案了吧,没错,它们来自于由底层网络驱动组成的接收线程。我们在编写网络驱动时, 其接收部分以任务的形式创建。 数据包到达后, 去掉以太网包头得到 IP 包, 然后直接调用 tcpip_input()函数将其 投递到 mbox 邮箱。投递结束,接收任务继续下一个数据包的接收,而被投递得 IP 包将由 TCPIP 线程继续处理。这样,即使某个 IP 包的处理时间过长也不 会造成频繁丢包现象的发生。这就是 lwip API。
BSD API 提供了基于 open-read-write-close 模型的 UNIX 标准 API,它的最大特点是使应用程序移植到其它系统时比较容易,但用在嵌入式系统中效率比较低,占用资源多。这对于我们的嵌入式应用有时是不能容忍的
lwIP 协议栈主要关注的是怎么样减少内存的使用和代码的大小,这样就可以让 lwIP 适用于资源有限的小型平台例如嵌入式系统。为了简化处理过程和内存要求,lwIP 对 API 进行了裁减,可以不需要复制一些数据。
其主要特性如下:
(1)支持多网络接口下的 IP 转发;
(2)支持 ICMP 协议;
(3)包括实验性扩展的 UDP(用户数据报协议);
(4)包括阻塞控制、RTT 估算、快速恢复和快速转发的 TCP(传输控制协议);
(5)提供专门的内部回调接口(Raw API),用于提高应用程序性能;
(6)可选择的 Berkeley 接口 API (在多线程情况下使用) 。
(7)在最新的版本中支持 ppp
(8) 新版本中增加了的 IP fragment(IP 分片)的支持.
(9) 支持 DHCP 协议,动态分配 ip 地址.
3.2 几种开源 TCPIP 协议概述
1、BSD TCP/IP 协议栈
BSD 栈历史上是商业栈的起点,大多数专业 TCP/IP 栈(VxWorks 内嵌的 TCP/IP 栈)是 BSD 栈派生的。这是因为 BSD 栈在 BSD 许可协议下提供了这些专业栈的雏形,BSD 许用证允许 BSD 栈以修改或未修改的形式结合这些专业栈的代码而无须向创建者付版税。同时,BSD 也是许多 TCP/IP 协议中的创新(如广域网中饿拥塞控制和避免)的点。
2、uC/IP
uC/IP 是由 Guy Lancaster 编写的一套基于 uC/OS 且开放源码的 TCP/IP 协议栈,亦可移植到操作系统,是一套完全免费的、可供研究的 TCP/IP 协议栈,uC/IP 大部分源码是从公开源码 BSD 发布站点和 KA9Q(一个基于 DOS 单任务环境运行的 TCP/IP 协议栈)移植过来。uC/IP 具有如下一些特点:带身份验证和报头压缩支持的 PPP 协议,优化的单一请求/回复交互过程,支持 IP/TCP/UDP 协议,可实现的网络功能较为强大,并可裁减。UCIP 协议栈被为一个带最小化用户接口及可应用串行链路网络模块。根据采用 CPU、编译器和系统所需实现协议的多少,协议栈需要的代码容量空间在 30-60KB 之间。http://ucip.sourceforge.net
3、LwIP
LwIP 是瑞士计算机科学院(Swedish Institute of Computer Science)的 Adam Dunkels 等开发的一套用于嵌入式系统的开放源代码 TCP/IP 协议栈。LwIP 的含义是 Light Weight(轻型)IP 协议,相对于 uip。LwIP 可以移植到操作系统上,也可以在无操作系统的情况下独立运行。LwIP TCP/IP 实现的重点是在保持 TCP 协议主要功能的基础上减少对 RAM 的占用,一般它只需要几十 K 的 RAM 和 40K 左右的 ROM 就可以运行,这使 LwIP 协议栈适合在低端嵌入式系统中使用。LwIP 的特性如下:支持多网络接口下的 IP 转发,支持 ICMP 协议 ,包括实验性扩展的的 UDP(用户数据报协议),包括阻塞控制,RTT 估算和快速恢复和快速转发的 TCP(传输控制协议),提供专门的内部回调接口(Raw API)用于提高应用程序性能,并提供了可选择的 Berkeley 接口 API。Svensk forskning för hållbar tillväxt| RISE或lwIP - A Lightweight TCP/IP stack - Summary [Savannah]
4、uIP
uIP 是专门为 8 位和 16 位控制器设计的一个非常小的 TCP/IP 栈。完全用 C 编写,因此可移植到各种不同的结构和操作系统上,一个编译过的栈可以在几 KB ROM 或几百字节 RAM 中运行。uIP 中还包括一个 HTTP 服务器作为服务内容。许可:BSD 许用证Svensk forskning för hållbar tillväxt| RISE
uIP* 是一个完全由 C**语言编写的开源软件,** 它的文档和源代码可用于商业和非商业用途, 它已经移植到了大部分的 8 位微控制器,* 而且已在很多的嵌入式产品和项目中使用.
5、TinyTcp
TinyTcp 栈是 TCP/IP 的一个非常小和简单的实现,它包括一个 FTP 客户。TinyTcp 是为了烧入 ROM 设计的并且现在开始对大端结构似乎是有用的(初始目标是 68000 芯片)。TinyTcp 也包括一个简单的以太网驱动器用于 3COM 多总线卡http://ftp.ecs.soton.ac.uk/pub/elks/utils/tiny-tcp.txt
选择一个开源协议栈可以从四个方面来考虑:
是否提供易用的底层硬件 API* ,即与硬件平台的无关性;*
协议栈需要调用的系统函数接口是否容易构造,另一个对于应用支持程度。
最关键的是占用的系统资源是否在可接受范围内,有裁减优化的空间否? 其中,
BSD 栈可完整实现 TCP/IP 协议,但代码庞大,70KB-150KB 之间,裁减优化有难度,
uIP 和 TinyTcp 代码容量小巧,实现功能精简,限制了在一些较高要求场合下的应用,如可靠性与大容量数据传输。
LwIP 和 uC/IP 是同量级别的两个开源协议栈,两者代码容量和实现功能相似,LwIP 没有操作系统针对性,它将协议栈与平台相关的代码抽象出来,用户如果要移植到自己的系统,需要完成该部分代码的封装,并为网络应用支持提供了 API 接口的可选性。
uC/IP 协议最初是针对 uC/OS 设计,为方便用户移植实现,同样也抽象了协议栈与平台相关代码,但是协议栈所需调用的系统函数大多参照 uC/OS 内核函数原型设计,并提供了协议栈的函数,方便用户参考,其不足在于该协议栈对网络应用支持不足。
根据以上分析,从应用和开发的角度看,似乎 LWIP 更得到了网上很多朋友使用的青睐;uC/IP 在文档支持与软件升级管理上有很多不足,但是它最初是针对 UC/OS 而设计,如果选用 UC/OS 作为软件基础的话,在系统函数构造方面有优势。当然你选择其他操作系统的话,可参照 OS_NULL 文件夹下的文件修改。 以上的这些开源协议栈也并非免费,拿来就可以用,据我所知,UC/OS 的母公司推出 UC/OS-TCP/IP 花了 6 人 2 年的工作量,国内某公司使用 LWIP 作为移植的参照,花了 4-5 人 2 年的工作量来测试与优化协议,使用商用 TCP/IP 栈的高费用就不足为奇了。 作为广大的爱好者学习而言,如果只是跑跑原型,实验一下效果,以上的几种开源协议栈都提供了测试的例子,应该是不错的选择。
终上所述:LWIP* 可优先考虑,参考的资料较多*
四、LWIP 协议栈移植
4.1 LWIP 源码下载
源码下载地址: http://ftp.yzu.edu.tw/nongnu/lwip/
下载 LWIP1.4.1 版本、并下载 contrib-1.4.1 版本。
4.2 将 LWIP 源码加入到工程目录
4.3 配置 lwipopts.h 文件
4.4 修改 ethernetif.c 文件
ethernetif.c 文件默认是不编译的,该文件是网卡底层接口的模板文件,需要根据修改网卡发送接口和接收接口。
4.5 修改 sys_arch.c 文件
修改 sys_arch.c 只是留下 sys_now()函数,其他代码全部删除掉。删除 windows.h 头文件。
sys_now()函数用于返回一个 32 位的系统时钟,单位是 ms。没有操作系统的情况下,使用定时器提供时间即可。
4.6 新建 lwip_config.c 文件
在 LWIP/app 目录下新建一个 lwip_config.c/lwip_config.h 文件。用于编写动态 IP 地址分配处理代码,和 LWIP 事物轮询、初始化代码。
编写一个 LWIP* 初始化配置函数,向 LWIP***协议栈添加一个新的网卡设备**
编写 LWIP 事物轮询函数与 DHCP 处理函数
4.7 配置一个定时器提供时间基准
4.8 初始化 lwip 动态获取 IP 地址
4.9 LWIP 内存配置选择
LWIP 可以选择使用系统库自带的函数 malloc/free 进行管理空间,也可以使用 lwip 自己的内存管理函数进行管理,源码默认就是使用 lwip 自己的内存管理方法,就是在初始化内存的时候定义一个数组,数组的大小在 lwipopts.h 文件 MEM_SIZE 宏定义的。
五、LWIP 函数使用(RAW 编程接口)
5.1 LWIP 初始化配置
5.2 LWIP 轮询函数处理
LWIP 轮询期间:
\1. 推荐每 250ms 周期性调用一次 tcp_tmr()函数,处理 TCP 协议请求。
超时时间 LWIP 使用 TCP_TMR_INTERVAL 宏进行了定义。
\2. 推荐每 5s 周期性调用一次 etharp_tmr()函数,清除 ARP 表中过期的数据。
超时时间 LWIP 使用 ARP_TMR_INTERVAL 宏进行了定义。
\3. (如果开启了动态 IP 分配功能)推荐每 500ms 周期性调用一次 dhcp_fine_tmr()函数,处理 DHCP 动态 IP 地址分配请求。 如果 IP 地址获取成功,将会放在初始化时注册的网络设备结构体里(struct netif)。
超时时间 LWIP 使用 DHCP_FINE_TIMER_MSECS 宏进行了定义。
\4. (如果开启了动态 IP 分配功能)推荐每 60s 调用一次 dhcp_coarse_tmr()函数,用于检查 DHCP 租约时间,并进行重新绑定。
超时时间 LWIP 使用 DHCP_COARSE_TIMER_MSECS 宏进行了定义。
\5. 在 LWIP 运行期间,当网卡收到数据时,还需要调用 ethernetif_input 函数读取网卡数据。
在函数 ethernetif_input()主要完成两个工作
1、调用* low_level_input();* 读取网卡实际数据。
2、调用 netif->input();
所以,为了能够实时的读取数据,需要最快的速度轮询调用 ethernetif_input 函数。
5.3 LWIP 编程 RAW 接口函数
5.4 创建 TCP 服务器示例
下面演示了 TCP 服务器创建步骤,测试服务器是否正常。
5.5 创建 TCP 客户端示例
版权声明: 本文为 InfoQ 作者【DS小龙哥】的原创文章。
原文链接:【http://xie.infoq.cn/article/29110ce061176979d5d61959b】。文章转载请联系作者。
评论