编者按:晶圆厂商们希望简化半导体设计和制造的流程,但创新的分析工具会提供他们需要的解决方案吗?由麦肯锡带来的这篇商业分析,可能会带给我们答案。在本文中,麦肯锡采访了高级分析公司Motivo的首席执行官Bharath Rangarajan,为我们带来了一些深刻的见解。
高级分析、机器学习和人工智能的应用,正在使传统的制造和运营方法遭受冲击。虽然半导体制造公司在应用这些技术方面有些限制,但可能很快就会有所改变——并且它们也有很好的理由去改变。现在,要想将一款新的集成电路推向市场,所需要的时间在每个节点上都在逐渐上升。新的设计和制造技术,是造成这个问题的一个原因。但是,更复杂的检查、测试和验证程序,也是产生延误的原因。
(相关资料图)
半导体产业链的现状表明,晶圆厂需要多个领域的共同协助。在过去几年的设计过程中,测试和验证时间增加了50%。新产品引进和升级,现在通常需要12到18个月的调试和调整。类似地,组装和测试过程中30%的资本支出,都是不给产品增加任何价值的测试。芯片进入市场后,问题也不会停止:客户可能会遇到意想不到的性能问题,并要求半导体公司帮助解决这些问题 ——这是一项艰巨的任务,因为厂商们没有办法追踪芯片从生产到使用的所有过程。 此外,许多晶圆厂没有有效地记录生产过程中遇到的问题,也没有采取措施来尝试解决这些问题。
在许多情况下,出现问题的原因,是因为尽管有一定程度的自动化,重要任务仍然需要频繁的手动操作干预。为了改进这一流程,许多技术公司正在创建分析工具。这些工具,可以帮助晶圆厂用基于事实的知识、模式识别和结构学习,来代替猜测和人类的直觉。除了减少错误、精简生产和降低成本之外,这些工具甚至可以帮助晶圆厂发现新的业务模型,并获取额外的价值。
尽管这些分析工具才刚刚开始获得晶圆厂的关注,但半导体制造商已经有很多选项可供选择。因为,许多技术人员最近已经开发出专门的解决方案,来简化芯片制造过程。我们从大量创新者中选出了三家公司,作为新生搅局者的代表性例子。我们访问了他们的业务部门和技术部门的领导,以进一步了解其能力。我们的目标不是选择性地认可某一家公司,而是为可能不熟悉新产品的半导体公司,提供不同的新兴解决方案。
主动防止错误,进而优化产量
高级数据分析,可以在虚拟或数字设计文件中,测试和标记出可能的故障点,为晶圆厂提供了极大的方便。不需要测试成品,半导体公司就可以提前纠正物理设计中的错误,提高产量和可靠性。 晶圆厂商还可以使用相同的技术,来生成和运行虚拟芯片进行测试 ,从而允许他们识别和消除边际效应的同时,进行流程优化。最后,高级数据分析可以让晶圆厂将来自传感器的数据大量输入,与广泛的流程级信息相结合,创建丰富的多变量数据集。然后,它们可以快速诊断芯片或设备故障的可能来源,从而为潜在的问题提供早期警告。这些工具,可以从先前的设计中进行初步学习,并随时间增强检测故障的能力。为了更多地了解这些防范错误的新工具,我们与Motivo首席执行官Bharath Rangarajan进行了访谈。Motivo是一家高级分析公司,通过使用专有算法、机器学习和人工智能,来增强预测分析能力,从而提供更多的有洞察力的诊断,防止复杂的芯片故障产生。
麦肯锡:你能谈谈我们看到的芯片生产中的一些问题,特别是错误检测问题吗?
Bharath Rangarajan:每个工厂都有数千个工艺步骤,而这些步骤又有数千个参数可以用于不同的组合。因为有这么多的因素,所以才导致了很多芯片故障或缺陷。但是每个误差的频率往往非常低,因为在设计和生产过程中,参数很少会是一样的。这使得,即使是最强的工程团队,也难以预测发生问题的地点和时间。
由于晶圆厂传统上几乎没有分析工具,所以他们试图通过制作模型、运行测试晶片和执行基本分析来发现出现较多的问题。换句话说,他们会改变一个设计或过程,看看是否消除了一个常见的错误。在仅需要改变几个参数的情况下,这种方法会降低一些高频问题,但这并不能帮助晶圆厂识别出更广泛存在的、更难发现的低频和中频误差。它也不能识别只能通过改变许多参数来解决的高频误差,而这些错误,很多时候是产量降低的原因。
传统的纠错方法,还存在另外一个问题,那就是很难从过去的经验中进行学习。正如我所说,晶圆厂已经能够通过调整多个参数来消除缺陷,但这仅仅有助于他们处理当前批次的产品。他们的测试方法,并不能让他们了解导致问题的内在原因。我的意思是,他们没有显示出改进的确切变化,所以可能会在将来重复同样的错误。许多设计团队和负责流程的工程师之间存在沟通问题,他们在描述问题、甚至共享过去故障信息的方式上并不相同。我可以理解为什么会发生这种情况 —— 很多时候,设计和流程人员甚至都不在同一个地点办公。他们使用不同的语言,有些甚至可能不知道已经存在一些问题。
麦肯锡:你的工具如何工作?
Bharath Rangarajan:首先,我们分析客户的物理设计 —— 通常是图形数据库系统II(graphic-database system Ⅱ)或开放艺术品交换系统标准文件(Open Artwork System Interchange Standard File) —— 这些文件类型,是当前集成电路分布系统的数据交换的行业标准。我们的工具从简单的几何图案和复杂的结构图案中,提取出所有的特征和组合。然后我们再确定这些之间是如何相互链接的。
处理完这些信息后,我们可以在拓扑网络映射中,识别出导致故障的单点或节点。例如,我们的图例中,将显示故障节点是如何连接到普通节点的,进而找出问题所在。我们的图例还帮助客户确定要测量和测试的特征和节点,这有助于优化产量。现在的测试都是随机选择节点来进行分析,而我们在这个基础上做了优化,有助于提高产品的产量和测试的效力。最终,厂商会得到很好的统计数据。
一些较旧的基于物理的模型,在找到错误方面仍然存在一定的作用。但还没有任何一个老旧的模型,可以预测在先进的制造过程产生的所有可能的结果。而且由于芯片复杂度的增加,它们所能做的还不够。
麦肯锡:晶圆厂在这个领域可以期待什么样的结果?
Bharath Rangarajan:通过先进的数据分析,我们有潜力大幅改变现有的范式。现在,晶圆厂所制造的多批晶圆,经历了多次昂贵的迭代循环,以消除问题。由于处理硅晶片所需的长周期,该方法也是非常耗时的。如果公司在芯片设计方面更加开放一些,那么它们可以缩短产量上升的爬坡期,并将大幅缩减流程问题所需的迭代次数,将新产品的流程效率提高十倍。这将对产品生产时间表和硅片消耗产生重大影响。在测试中,两家半导体公司都发现了故障和相关故障的模式,用时从几个季度缩短到了几个星期。
加强晶圆检查
半导体设计和制造的检测工具越来越专业化,每个工具的使用场景都都只是工艺流程中的一小部分。 晶圆厂可能需要十几个的大型、昂贵的机器,来完成在晶片生产过程中的的数百个步骤。这使得资本预算和用地条件都十分捉襟见肘。但最值得注意的,是工具本身的技术限制:设备之间的数据传输、增加工艺流程、上新设备来检测问题,可能都很困难。在许多步骤中,人工的检查员必须经常审查工具中的数据—— 这可能需要将数百或数千个晶圆运送到检测室和实验室,但这增加了损坏的风险,并且无法实时进行过程控制和获取产出数据。Nanotronics公司负责构建包含人工智能的自动显微镜。为了了解晶圆检测的新技术,我们与Nanotronics的两名官员进行了交谈,:首席营收官Justin Stanwix和首席技术官Julie Orlando。
麦肯锡:请告诉我们,贵公司的技术如何在芯片检测中使用呢?
Julie Orlando:我们的显微镜将纳米级、微观和宏观成像与机器学习、人工智能相结合。他们可以自动发现新的缺陷,并通过网络共享这些信息。这使得像图像标记一样的——通常必须手动完成、容易出错的流程不再必要。我们的显微镜还有一个便利因素,那就是晶圆厂可以将它们用于晶体生长、光刻、蚀刻和其他工艺,而不是像原来一样,使用很多不同的工具来完成这些检测。另一个变化是显微镜可以检查透明、半透明和不透明的芯片,以及微处理器单元、MEMS(微机电系统)器件和封装的晶片。
麦肯锡:你可以在一些细节上描述手工检查的差异吗?
Julie Orlando:我们的显微镜可以在几分钟内分析100,000个芯片,而手动检查员可能需要30分钟才能查看50个芯片。如果使用我们的显微镜,晶圆厂也可以检查到更多的芯片层,而不是手动检查。我们与一家公司合作,之前他们人工可以检查25层,但用显微镜将其增加到了300层。然后,晶圆厂从人工检测转向显微镜时,处理量和产量也都会增加。
麦肯锡:您的软件如何让显微镜共享数据?
Justin Stanwix:我们的软件,可以连接晶圆厂或晶圆厂网络中的所有显微镜。因此,工程师可以开发新的算法,来找出那些问题的识别数据,和工具里过程参数之间的相关性。然后,他们可以通过更新软件立即将新算法纳入显微镜网络。我们的开放式软件平台和API接口使这一切成为可能,因为它们允许我们的显微镜连接到其他工具,包括晶圆厂可能已经拥有的工具。
连接半导体和电子供应链
想要提高质量的产品工程师,通常会遇到一个严重的阻碍:难以从产业链上的其他厂商那里获取数据。他们经常收集存在于系统或应用程序芯片中的不完整信息,但找不到解决问题的重要部分。我们与Optimal Plus(一家专门从事大数据分析软件的公司)讨论了分享信息的更好策略。下面是对Optimal Plus的首席技术官Michael Schuldenfrei和业务发展副总裁Yitzhak Ohayon的采访。
麦肯锡:告诉我们一些贵公司的技术。
Michael Schuldenfrei:我们创建了一个跨行业的平台,用于将原始设备制造商(OEM)与供应链中的半导体公司相连接。它可以跟踪单个产品的所有数据,包括制造的地点和时间、功能和电气测试的每条信息、制造设备的数据以及使用条件 、 湿度水平或操作阈值等因素。因此,基本上,工程师可以查看全套有关产品及其组件的信息,从而更容易发现问题。我们的平台还允许工程师配对和匹配来自特定制造环境的设备。这可以真正提高许多用户端应用可靠性的方法。
麦肯锡:你能告诉我们你的平台如何工作吗?
Yizhak Ohayon:第一步,我们清理和规范化数据。它必须在所有地点和产品中完整、准确和一致。然后,我们将数据输入平台,帮助客户克服最重要的数据断开之一:芯片制造商和电子OEM之间的信息交流不足。芯片制造商负责晶圆的分类测试,电子OEM中又分为主板用户和系统用户,负责最后的测试。在通过我们的平台比较来自这些测试的数据后,同意交换数据的电子产品销售商和半导体供应商,可以确定结果是否与特定芯片高度相关 —— 结果可能是该芯片运行良好,或者该芯片存在差异。例如,芯片制造商可以使用其电子产品客户的数据,来确定哪些测试信号预测了下游存在的故障、哪些信号不影响最终产品。这意味着芯片制造商可以调整其筛选参数,进而优化产量。换句话说,改进筛选条件之后,会减少那些潜在具有问题的设备的数量。
麦肯锡:你们的平台有什么样的结果?
Yayhak Ohayon:在2016年,我们分析了超过500亿台芯片。我们已经看到测试所需时间、运营效率、产量和测试结果都有所改善。
有一次,我们与一家电子设备OEM合作,希望将一款主板级设计迅速推向市场。该公司遇到了很多芯片问题,并提供给供应商所有的相关数据,以换取有限的芯片信息。将这些测试数据与原始组件供应商的芯片数据相关联后,我们找到了出问题的地方。这些发现减少了客户分析故障所花费的时间。结果是该产品的产量有了显著的提高,上市时间提前。
一家电子产品OEM报告说,使用这一技术,它们已经将量产所需的时间减少了一半。该厂家也减少了“错误”芯片的数量,在重新测试中将错误率降低了百分之五十。这些芯片是客户报告存在问题的批次,通常是与其他芯片组合使用中存在问题。但是当制造商自行重新测试时,这些芯片工作正常。了解产品故障所需的时间,从三个月下降到了一周。新技术也提高了测试效率,因为OEM们少了很多不得不进行大量测试的芯片。
麦肯锡:你看到使用技术或类似技术有任何障碍吗?
Michael Schuldenfrei:信息交流上有一些障碍。从我们技术的角度出发,我们需要半导体公司及其客户将比现在更自由地分享信息。说服供应商分享信息可能很难,因为他们可能会怀疑客户是否会在谈判中使用他们的产品数据。希望我们的平台,可以通过作为供应商和客户之间的第三方中介,来减少一些担忧。他们不必直接交换信息,当我们共享数据时,它们都是非常受控制的。当问题出现时,我们只会发布信息 —— 通常是质量问题 —— 并且将数据交换降至最低。我们还看到一些情况,电子产品制造商通过反向整个过程,向其供应商提供测试数据来解决问题。这是另一种可能的解决方案。
向前迈进将需要什么
愿景是明确的:将产品和流程更快地转换到晶圆厂的生产环境中,缩短新芯片设计的上市时间,降低由更高、更可预测的产量带来的总体成本,以及通过供应链的可追溯性用于预测单个芯片。想要使这些成为现实,将需要在我们的能力范围之内进行技术创新。但是在我们看来,半导体行业至少要在四个维度上进行实际的工作。
天赋
我们正在经历半导体行业的人才干旱。只有少数具有数据分析功能的新毕业生,将半导体作为为他们所选择的领域。而他们之中,只有更少的人仍然相信这是一个难以置信的、会取得重大创新进展的机会。放眼整个北美,只有不到1万名认证的数据科学家。其中绝大多数人,只针对有限的领域进行研究,其中大部分涉及改善广告或营销内容的个性化。这种扭曲的分布,对于希望将机器学习和高级分析应用于其操作的半导体公司而言,是一个问题。为了吸引和保留合适的人才,半导体公司必须创造出令人信服的工作环境。数据科学需要被认可、奖励和给予与其他技术人员相同的尊重。
组织
功能和组织边界会带来更清晰的前景,但这也是掣肘很多公司的原因。例如,许多晶圆厂正在努力优化芯片设计和工艺技术,但是它们缺乏整个流程的制造工艺,难以发现问题并支持更快的产量爬坡。他们需要通过让设计者和开发者组织在共同领导下更紧密地结合起来,朝着同一个目标努力,进而打破边界。否则,即使是最有吸引力的高级分析方法,可能也无法提供需要的结果。
投资
工程是晶圆厂和芯片设计组织的核心,而不是数据科学。这就是为什么晶圆厂只能对高级分析进行有限的投资,尽管有数十亿美元之多。当半导体公司创建数据分析组时,他们倾向将其归入信息技术或制造技术的领域,很少将其视为一大功能领域。这需要改变。如果半导体公司,没有对包括机器学习和人工智能的应用在内的分析领域进行大量投资,那这一产业就将要落后。
合作与伙伴关系
分析和机器学习供应商,往往对进入半导体市场很犹豫。除了担心客户群体正在固化,许多人认为半导体公司喜欢内部开发解决方案。这种看法可能会持续存在,因为很少的软件或分析公司正在与半导体厂商合作,特别是在设计和运营方面。未来,半导体厂商必须与技术研究公司建立积极的伙伴关系,以提出新的想法、应用和思维方式。过去,半导体行业通过合作伙伴关系加强了制造和加工技术,如与国际研究中心SEMATECH和IMEC的合作伙伴关系。现在是我们为高级分析、机器学习和人工智能做同样事情的时候了。
半导体行业提供了创新和实验高级分析的独特机会,因为没有其他产业能够创造出如此多的、可以为整个产业链带来改进的过程数据。许多新公司,包括本文中讨论的新公司,已经认识到这一个机会,并将真正的数据科学带入半导体领域。使用这些工具,加上在领导层面对数据分析的重视增加,可能会使半导体公司成为数据分析行业领导者。
翻译来自:虫洞翻翻 译者ID: Salvabivc 编辑:郝鹏程