采用流水线技术实现8位加法器

 

说明

     本文基于FPGA和CPLD器件,采用非流水线和流水线技术实现8位加法器,并对比其Quartus II仿真结果和波形时序。

     器件选择:

     Stratix:EP1S40F1020C5(FPGA)

     MAX7000S:EPM7064SLC44-5(CPLD)

 

实验一  FPGA实现8位加法器

     程序清单:

 1 /*******************8位加法器(非流水线)***********************/
 2 module adder_nonpipe(cout, sum, ina, inb, cin, enable);
 3 
 4 output cout;
 5 output [7:0] sum;
 6 input [7:0] ina, inb;
 7 input cin, enable;
 8 
 9 reg cout;
10 reg [7:0] sum;
11 reg [7:0] tempa, tempb;
12 reg tempc;
13 
14 always @(posedge enable)
15 begin
16     tempa = ina;
17     tempb = inb;
18     tempc = cin;
19 end
20 
21 always @(posedge enable)
22 begin
23     {cout,sum} = tempa + tempb + tempc;
24 end
25 
26 endmodule

     Compilation编译报告如图1所示:

 

图1  8位加法器(非流水线/FPGA)编译结果

     RTL Viewer 提供设计的逻辑门级原理图和层次结构列表,列出整个设计网表的实例、基本单元、引脚和网络。可过滤显示在视图上的信息,浏览设计视图的不同页面来检查设计并确定应当作的更改。实验一的RTL原理图如图2所示:

图2  8位加法器(非流水线/FPGA)RTL Viewer

     Technology Map Viewer 提供设计的底层或基元级特定技术原理表征。它包括一个原理视图,以及一个层次列表,列出整个设计网表的实例、基本单元、引脚和网络。实验一的Techology Map Viewer结果如图3所示:

图3  8位加法器(非流水线/FPGA)Techology Map Viewer

     Simulation仿真波形如图4所示:

图4  8位加法器(非流水线/FPGA)仿真图

 

 

实验二  FPGA实现8位加法器(采用2级流水线)

     程序清单:

 1 /*******************8位2级流水加法器*************************/
 2 module adder_pipeline(cout, sum, ina, inb, cin, enable);
 3 
 4 output cout;
 5 output [7:0] sum;
 6 input [7:0] ina, inb;
 7 input cin, enable;
 8 
 9 reg cout;
10 reg [7:0] sum;
11 
12 reg [3:0] tempa, tempb, firsts;
13 reg firstc;
14 always @(posedge enable)
15 begin
16     {firstc,firsts} = ina[3:0] + inb[3:0] + cin;
17     tempa = ina[7:4];        //高4位输入寄存,使其与sum低4位在下级流水线同步输入。
tempb = inb[7:4];
//否则sum的高4位,与低四位分两个时钟周期输出 18 end 19 20 always @(posedge enable) 21 begin 22 {cout,sum[7:4]} = tempa + tempb + firstc; 23 sum[3:0] = firsts; //不能合并为{cout, sum} = {tempa + tempb + firstc, firsts}; 位宽不匹配 24 end 25 26 endmodule

     另一个可用版本主体代码如下:

 1 reg [4:0] tempa,tempb;
 2 reg [3:0] firsts;
 3 reg firstc;
 4 
 5 always @(posedge enable) begin     //低4 位相加; 
 6       { firstc, firsts} = {ina[3], ina[3:0]} + {inb[3], inb[3:0]} + cin ; 
 7       tempa = {ina[7], ina[7:4]};  //似乎应该高位补零即{1’b0, ina[7:4]};才对
 8       tempb = {inb[7], inb[7:4]};
 9 end 
10 
11 always @(posedge enable) begin     //高4 位相加,并连成8位 
12       {cout, sum} = {tempa + tempb + firstc, firsts} ;  
13 end

     注:设ina为Mbit,inb为Nbit,则{cout, sum}=a+b为M+N+1位,其中cout占1位,sum为M+N位。

     编译后Total Logic Element为24个。

     RTL原理图如图5所示:

图5  8位加法器(2级流水线/FPGA)RTL Viewer

     Techology Map Viewer结果如图6所示:

图6  8位加法器(2级流水线/FPGA)Techology Map Viewer

     Simulation仿真波形如图7所示:

图7  8位加法器(2级流水线/FPGA)仿真图

 

 

实验三  CPLD实现8位加法器

     程序清单(单always):

 1 /*******************8位加法器(非流水线)***********************/
 2 module adder_nonpipe(cout, sum, ina, inb, cin, enable);
 3 
 4 output cout;
 5 output [7:0] sum;
 6 input [7:0] ina, inb;
 7 input cin, enable;
 8 
 9 reg cout;
10 reg [7:0] sum;
11 
12 always @(posedge enable)
13 begin
14     {cout,sum} = ina + inb + cin;
15 end
16 
17 endmodule

     将Device替换为CPLD器件。在Project Navigator->Hierarchy窗口器件处右键->Device,即可打开器件选择框,选择所需的器件确定即可。此处选择"MAX7000S:EPM7064SLC44-5"。

     Compilation编译报告如图8所示:

 

图8  8位加法器(非流水线/CPLD)编译结果

     Simulation仿真波形如图9所示:

图9  8位加法器(非流水线/CPLD)仿真图-1

     接着考虑双always形式的加法器(程序同实验一,仅器件不同):

     Compile编译后,Total Macrocell为42个。

     仍采用周期为10ns的时钟enable,仿真结果如图10所示:

图10  8位加法器(非流水线/CPLD)仿真图-2

     显然sum值不正确。

     展开Compilation Report下面的Timing Analyzer,多了一项Clock Setup ‘enable’。从右侧报告窗口可观察到最长(最差时序)路径需要13.5ns,对应fmax为74.07MHz,也就是最高工作频率。

图11  8位加法器(非流水线/CPLD)时序分析结果

     将时钟周期改为13.5ns,重新运行仿真,结果如图12所示:

图12  8位加法器(非流水线/CPLD)仿真图-3

     注意:

  1. 单always程序中时钟周期10ns,结果也正确。同时Timing Analysis下不存在Clock Setup ‘enable’,Timing Analysis Tool也无法激活。
  2. 单always程序中,{cout,sum} = tempa + tempb + tempc;的阻塞赋值改为非阻塞赋值,结果并无变化。
  3. 若用FPGA器件实现单always程序,则波形完全正确,如图13所示:

图13  8位加法器(非流水线/CPLD)仿真图-4

          这也符合通常习惯,即一个时钟沿周期采样,下一个时钟沿输出。

 

 

实验四  CPLD实现8位加法器(采用2级流水线)

     程序同实验二,器件选择同实验三。

     编译后Total Macrocell为32个。

     在Timing Analyzer详细报告窗口可观察到那些影响周期恶化的最差时序路径,根据这些信息可找出关键路径并进行时序分析。图14显示Clock Period为9.700ns,Frequency为103.09MHz。

图14  8位加法器(非流水线/CPLD)时序分析结果

     观察第一条路径的时序报告,如图15所示:

 

图15  8位加法器(2级流水线/CPLD)时序报告(局部)

     时钟周期为10ns时,仿真波形如图16所示:

图16  8位加法器(2级流水线/CPLD)仿真图

     该波形与实验三单always程序波形最主要的差别在于,sum=01001010之后一个周期的值是否正确。

     当时钟周期取10ns时,仿真波形与实验三双always程序波形相同,但最高工作频率却由74.07 MHz提高到103.09MHz。可见最高工作频率(系统工作速度)不能单纯由仿真波形判断。

 

 

总结

     1. FPGA中1个逻辑单元(Logic Element )相当于CPLD中0.78个宏单元(MacroCell).

     2. Quartus II中FPGA器件编译速度比CPLD慢得多。

     3. Stratix的最高工作频率大于MAX7000S的的最高工作频率。如实验一二中Timing Analysis Tool均显示Frequency为Restricted to 422.12 MHz(这时不易比较采用流水线和非流水线的最高频率)。

     4. 比较实验一(非流水线)和实验二(流水线)的RTL原理图及工艺映射图,可清楚地看到,流水线技术的本质是在组合逻辑之间插入寄存器,暂存前面的运算结果或输入数据,并在下一个时钟到来时将寄存值作为后一级运算的输入。将流水线规则应用于FPGA中,只需要很少或根本不需要额外的成本。这是因为每个逻辑单元都包含两个触发器,大多数情况下这两个触发器或者没有用到,或者用于存储布线资源,那么就可利用其来实现流水线结构。若采用流水线后,加法器速度仍不能满足需要,可采用串并转换来进一步提高计算的并行度。

 

 

posted @ 2014-06-12 16:48  clover_toeic  阅读(6197)  评论(0编辑  收藏  举报