为了达到满意的合格率,几乎所有产品在出厂前都要先藉由老化。制造商如何才能够在不缩减老化时间的条件下提高其效率?本文介绍在老化过程中进行功能测试的新方案,以降低和缩短老化过程所带来的成本和时间问题。
在半导体业界,器件的老化问题一直存在各种争论。像其它产品一样,半导体随时可能因为各种原因而出现故障,老化就是藉由让半导体进行超负荷工作而使缺陷在短时间内出现,避免在使用早期发生故障。如果不藉由老化,很多半导体成品由于器件和制造制程复杂性等原因在使用中会产生很多问题。
在开始使用后的几小时到几天之内出现的缺陷 ( 取决于制造制程的成熟程度和器件总体结构 ) 称为早期故障,老化之后的器件基本上要求 100% 藉由这段时间。准确确定老化时间的唯一方法是参照以前收集到的老化故障及故障分析统计数据,而大多数生产厂商则希望减少或者取消老化。
老化制程必须要确保工厂的产品满足用户对可靠性的要求,除此之外,它还必须能提供工程数据以便用来改进器件的性能。 $Page_Split$
一般来讲,老化制程藉由工作环境和电气性能两方面对半导体器件进行苛刻的试验使故障尽早出现,典型的半导体寿命曲线如图 1 。由图可见,主要故障都出现在器件寿命周期开始和最后的十分之一阶段。老化就是加快器件在其寿命前 10% 部份的运行过程,迫使早期故障在更短的时间内出现,通常是几小时而不用几月或几年。
不是所有的半导体生产厂商对所有器件都需要进行老化。普通器件制造由于对生产制程比较了解,因此可以预先掌握藉由统计得出的失效预计值。如果实际故障率高于预期值,就需要再作老化,提高实际可靠性以满足用户的要求。
本文介绍的老化方法与 10 年前几乎一样,不同之处仅仅在于如何更好地利用老化时间。提高温度、增加动态信号输入以及把工作电压提高到正常值以上等等,这些都是加快故障出现的通常做法;但如果在老化过程中进行测试,则老化成本可以分摊一部份到功能测试上,而且藉由对故障点的监测还能收集到一些有用信息,从总体上节省生产成本,另外,这些信息经统计后还可证明找出某个器件所有早期故障所需的时间是否合适。
过去的老化系统
进行老化的第一个原因是为了提高半导体器件的可靠性,目前为止还没有其它的替代方法。老化依然是在高温室 ( 通常 125 ℃ 左右 ) 内进行,给器件加上电子偏压,大部份时候还使用动态驱动信号。
很多公司想减少或者全部取消老化,但是他们又找不到其它可靠的替代方法能够在产品到达客户之前把有早期故障的剔除掉,所以看来老化还会长久存在下去。半导体生产厂商另外也希望藉由老化做更多的事,而不是浪费宝贵时间被动地等待组件送来做老化。
过去的老化系统设计比较简单。 10 年以前,老化就是把一个器件插入老化板,再把老化板放入老化室,给老化板加上直流偏压 ( 静态老化 ) 并升高温度, 168 个小时之后将器件取出进行测试。如果经 100% 测试后仍然性能完好,就可以保证器件质量可靠并将其发送给用户。
如果器件在老化时出现故障,则会被送去故障分析实验室进行分析,这可能会需要几周的时间。实验室提供的数据将用来对设计和生产制程进行细微调节,但这也表明对可能出现的严重故障采取补救措施之前生产已进行了几个星期。目前工程师们找了一些方法,对器件进行长时间错误覆盖率很高的老化,甚至还对器件作一些测试。但遗憾的是没有人能解决老化的根本问题,即减少成本与时间。于是半导体制造商们采用了另一种老化方式:在老化中进行功能测试。 $Page_Split$
为什么要在老化时进行测试
在老化阶段进行半导体测试之所以有意义有多种原因,在探讨这些原因之前,我们首先要明确“测试”的真正含义。
一般半导体测试要用到昂贵的高速自动测试设备,在一个电性能条件可调的测试台上对半导体作测试。它还可以在标称性能范围之外进行,完成功能 ( 逻辑 ) 和参数 ( 速度 ) 方面的测试,像信号升降时间之类的参数可精确到皮秒级。也许是因为可控测试环境只有一个器件作为电性负载,所以信号转换很快,能够进行真实的器件响应参数测量。
但在老化的时候,为提高产品的产量最好是能够同时对尽可能多的器件作老化。为满足这一要求,可把多个器件装在一个大的印刷线路板上,这个板称为老化板,它上面的所有器件都并联在一起。大型老化板的物理电气特性不能和只测试一个器件的小测试台相比,因为老化板上的容性和感性负载会给速度测试带来麻烦。所以我们通常无法用老化进行所有功能测试。不过在某些情况下,运用特殊的系统设计技术在老化环境下进行速度测试也是可能的。
老化系统中的“测试”可以指任何方面,从对每一器件每一管脚进行基本信号测试,到对老化板上的所有器件作几乎 100% 功能测试,这一切均视器件复杂性及所选用的老化测试系统而定。可以说对任何器件进行 100% 功能测试都是可以做得到的,但是这样采用的方法可能会减少老化板上的器件密度,从而增加整体成本并降低产量。
在老化中进行测试的好处有:
1 . 将耗时的功能测试移到老化中可以节约昂贵的高速测试仪器的时间。如果老化后只进行参数测试及很少的功能测试,那么用现有设备可测试更多器件,仅此一点即可抵消因采用老化测试方案而发生的费用。
2 . 达到预期故障率的实际老化时间相对更短。过去器件进行首批老化时都要先藉由 168 小时,这是人们期望发现所有早期故障的标准起始时间,而这完全是因为手头没有新器件数据所致。在随后的半年期间,这个时间会不断缩短,直到用实验和误差分析方法得到实际所需的老化时间为止。在老化同时进行测试则可以藉由检查老化系统生成的实时记录及时发现产生的故障。尽快掌握老化时间可提高产量,降低器件成本。
3 . 及时对生产制程作出反馈。器件故障有时直接对应于某个制造制程或者某生产设备,在故障发生时及时了解信息可立刻解决可能存在的制程缺陷,避免制造出大量不合格产品。
4 . 确保老化的运行情况与期望相符。藉由监测老化板上的每个器件,可在老化一开始时就先更换已经坏了的器件,这样使用者可确保老化板和老化系统按预先设想的状况运行,没有产能上的浪费。 $Page_Split$
老化测试系统类型
目前市面上有多种老化测试系统实现方法,除了老化系统生产厂商制造的通用型产品外,半导体厂商也在内部开发了一些供他们自己使用的此类系统。大多数系统都采用计算机作主机,用于数据采集和电路基本控制,而一些非计算机系统只能用 LED 作为状态指示器,需要人工来收集数据。
为了能对老化板上的每一器件作独立测试,必须要在老化系统控制下将每个器件与其它器件进行电性隔离。内存件非常适合于这种场合,因为它们被设计成按簇方式使用并带有多路选通讯号,而逻辑器件则可能无法使用选通讯号,这使得在老化系统中设计通用逻辑测试会更难一些。因此针对不同器件类型存在不同的逻辑老化系统是很正常的。
老化测试系统可归为两大类:逻辑器件和内存。逻辑器件测试系统又可分为两类:平行和串行;同样,内存测试系统也可分为两类:非易失性和易失性。$Page_Split$
逻辑器件老化测试
逻辑器件老化测试是两类系统中难度最大的,这是因为逻辑产品具有多功能特性,而且器件上可能还没有选通讯号引脚。为使一种老化测试系统适应所有类型的逻辑器件,必须要有大量的输入输出引线,这样系统才能生成多引脚器件通常所需的多种不同信号。老化系统还要有一个驱动板,作为每个信号通路的引脚驱动器,它一般采用较大的驱动电流以克服老化板的负载特性。
输出信号要确保能够对需作老化的任何器件类型进行处理。如果老化板加载有问题,可以将其分隔成两个或更多的信号区,但是这需要将驱动板上的信号线数量增加一倍。大多数平行输出信号利用专用逻辑、预编程 EPROM 、或可重编程及可下载 SRAM 产生,用 SRAM 的好处是可利用计算机重复编程而使老化系统适用于多种产品。
逻辑器件老化测试主要有两种实现方法:平行和串行,这指的是系统的输入或监测方式。一般来说所有逻辑器件测试系统都用平行方式把大量信号传给器件,但用这种方式进行监测却不能将老化板上的每一个器件分离出来。
‧ 平行测试法
平行测试是在老化过程中进行器件测试最快的方法,这是因为有多条信号线连在器件的输入输出端,使数据传输量达到最大, I/O 线的输入端由系统测试部份控制。平行测试有三种基本方式:各器件单选、单引脚信号返回和多引脚信号返回。
‧ 各器件单选 如果老化板上的器件可以和其它器件分离开,系统就可藉由选择方法分别连到每一个器件上,如使用片选引脚,所有器件都并联起来,一次只选中一个器件生成返回信号 ( 图 2) 。系统提供专门的器件选择信号,在测试过程中一次选中一个,老化时所有器件也可同时被选并接收同样的数据。 $Page_Split$
用这种方法每个器件会轮流被选到,器件和老化系统之间的大量数据藉由并行总线传输。该方法的局限是选中的器件必须克服老化板及其它非选中器件的容性和感性负载影响,这可能会使器件在总线上的数据传输速度下降。
‧ 单引脚信号返回 这个方法里所有器件都并联在一起,但每个器件有一个信号返回引脚除外,所有器件同时进入工作状态,由系统选择所监测的器件并读取相应的信号返回线。该方法类似于串行测试法,但信号引脚一般检测的是逻辑电平,或者是可以和预留值比较的脉冲模式。检测到的信号通常表示器件内部自检状态,它存在器件内以供测试之用,如果器件没有自检而只是单纯由系统监测它的一个引脚,那么测试可信度将会大大降低。
‧ 多引脚信号返回 该方法和单引脚信号返回类似,但是从每个器件返回的信号更多。由于每个器件有更多信号返回线,所以这种方法要用到多个返回监测线路。而又因为必须要有大量返回线路为该方法专用,因此会使系统总体成本急剧增加。没有内部自检而且又非常复杂的器件可能就需要用这种方法。
‧ 串行测试法
串行测试比平行测试作业容易一些,但是速度要慢很多。除了每个器件的串行信号返回线,老化板上的每个器件通常都并联在一起。该方法用于有一定处理功能并可藉由一条信号返回线反映各种状态的器件。测试时传送的数据必须进行译码,因此老化板上应有数据处理系统。
‧ RS -232C 或同等协议 一种串行监测方法是在老化板上采用全双工 RS -232C 通讯协议,所有器件的其它支持信号 ( 如时钟和复位 ) 都并联在一起 ( 图 3) 。 RS -232C 发送端 (TxD) 通常也连到所有器件上,但同时也支持老化板区域分隔以进行多路再使用传输。$Page_Split$
每个器件都将信号返回到驱动板上的一个 RS -232C 接收端 (RxD) ,该端口在驱动板上可以多路再使用。驱动电路向所有器件传送信号,然后对器件的 RxD 线路进行监控,每个器件都会被选到,系统则将得到的数据与预留值进行比较。这种测试系统通常要在驱动板上使用微处理器,以便能进行 RS -232C 通讯及作为故障数据缓冲。
‧ 边界扫描 (JTAG): 逻辑器件老化的最新趋势是采用 IEEE 1149.1 规定的方法。该方法也称为 JTAG 或边界扫描测试,它采用五线制 (TCK 、 TDO 、 TDI 、 TMS 及 TRST) 电子协议,可以和平行测试法相媲美。
采用这种方法时, JTAG 测试端口和整个系统必须要设计到器件的内部。器件上用于 JTAG 测试的电路属于专用测试口,用来对器件进行测试,即使器件装在用户终端系统上并已开始工作以后,该测试口还可以使用。一般而言, JTAG 埠采用很长的串联缓存器链,可以访问到所有的内部节点。每个缓存器映像器件的某一功能或特性,于是,访问器件的某种状态只需将该缓存器的状态数据串行移位至输出端即可。
采用同样技术可完成对器件的编程,只不过数据是藉由 JTAG 端口串行移位到器件内部。 IEEE 1149.1 的说明里详细阐述了 JTAG 端口的作业。$Page_Split$
内存老化
内存老化和测试的线路实现起来相对简单一些,所有器件藉由统一方式写入,然后单独选中每个器件,将其存入的数据读出并与原来的值对照。由于具有控制和数据采集软件以及故障数据评估报告算法,所以内存老化测试对生产商非常有用。
大多数内存件支持多个选通引脚,因而老化测试系统采用簇方式读回数据。某些系统具有很宽的数据总线,每一簇可同时读取多个器件,再由计算机主机或类似的机器对器件进行划分。增加老化板上的平行信号数量可提高速度,减少同一条平行信号线所连器件数,并且降低板子和器件的负载特性。
‧ 易失性内存 (DRAM 和 SRAM)
易失性内存测试起来是最简单的,因为它无需特殊算法或时序就可进行多次擦写。一般是所有器件先同时写入,然后轮流选中每个器件,读回数据并进行比较。
由于在老化时可重复进行慢速的刷新测试,因此 DRAM 老化测试能够为后测制程节省大量时间。刷新测试要求先将数据写入内存,再等待一段时间使有缺陷的储存单元放电,然后从内存中读回数据,找出有缺陷的储存单元。将这部份测试放入老化意味着老化后的测试制程不必再进行这种很费时的检测,从而节省了时间。
‧ 非易失性内存 (EPROM 和 EEPROM)
非易失性内存测试起来比较困难,这是因为在写入之前必须先将里面的内容擦除,这样使得系统算法更困难一些,通常还必须使用特殊电压来进行擦除。不过其测试方法基本上是相同的:把数据写入内存再用更复杂的算法将其读回。
老化测试系统性能
有许多因素会影响老化测试系统的整体性能,下面是一些主要方面:
1 .首先是测试方法的选择。理想的情况是器件在老化制程上花费的时间最少,这样可以提高总体产量。恶劣的电性能条件有助于故障加速出现,因此能快速进行反复测试的系统可减少总体老化时间。每单位时间里内部节点切换次数越多,器件受到的考验就越大,故障也就出现得更快。
2 .老化板互连性、 PCB 设计以及偏置电路的复杂性。老化测试系统可能被有些人称为高速测试,但是,如果机械连接或老化板本身特性会削弱信号质量,那么测试速度将会是一个问题。如像过多机电性连接会增大整个系统的总电容和电感、老化板设计不良会产生噪声和串扰、而很差的引脚驱动器设计则会使快速信号沿所需的驱动电流大小受到限制等等,这些都仅是一部份影响速度的瓶颈,另外由于负载过大并存在阻抗、电路偏置以及保护组件值的选择等也会使老化的性能受到影响。
3 .计算机接口与数据采集方式。有些老化测试系统采用分区方法,一个数据采集主机控制多个老化板,另外有些系统则是单板式采集。从实际情况来看,单板式方法可以采集到更多数据,而且可能还具有更大的测试产量。
4 .对高速测试仪程序的下载及转换能力。有些老化测试系统有自己的测试语言,对需要做 100% 节点切换的被测器件不用再开发程序;而有些系统能够把高速测试仪程序直接转换到老化应用上,可以在老化过程中进行更准确的测试。
5 .系统提供参数测试的能力。如果老化测试系统能进行一些速度测试,那么还可得到其它一些相关失效数据以进行可靠性研究,这也有助于精简老化后测试制程。
6 .根据时间动态改变测试参数的能力,如电压与频率。如果老化测试系统能够实时改变参数,则可以加快通常属于产品寿命后期阶段故障的出现。对于某些器件结构,直流电压偏置及动态信号的功率变动都可加速出现晚期寿命故障。
7 .计算机主机与测试系统之间的通讯。由于功能测试程序非常长,因此测试硬件的设计应尽可能提高速度。一些系统使用较慢的串行通讯,如 RS -232C 或者类似协议,而另一些系统则使用双向并行总线系统,大大提高了数据流通率。$Page_Split$
结束语
在老化过程中进行测试会带来一些成本问题,但最困难的是找出一个测试方法完成器件所有可能的测试项目。
对逻辑产品而言, JTAG 法是一种最通用的老化测试方式,因为器件上的测试埠是一致的,这样老化硬件线路就可保持不变。
对内存而言,在小批量情况下,最好是能有一种对易失性和非易失性内存都能进行处理的测试系统;而在大批量情况下,则最好是采用不同的系统以降低成本。