研究人员使用大型语言模型来标记复杂系统中的问题
识别风电场中一台故障涡轮机可能需要查看数百个信号和数百万个数据点,这无异于大海捞针。
工程师通常使用深度学习模型来简化这个复杂问题,该模型可以检测每个涡轮机在一段时间内重复进行的测量中的异常,即时间序列数据。
但是,由于数百台风力涡轮机每小时记录数十个信号,训练深度学习模型来分析时间序列数据成本高昂且繁琐。此外,模型在部署后可能需要重新训练,而风电场运营商可能缺乏必要的机器学习专业知识。
在一项新研究中,麻省理工学院的研究人员发现,大型语言模型(LLM)有可能成为更高效的时间序列数据异常检测器。重要的是,这些预训练模型可以立即部署。
研究人员开发了一个名为SigLLM的框架,其中包括一个组件,可将时间序列数据转换为LLM可以处理的基于文本的输入。用户可以将这些准备好的数据输入到模型中,并要求模型开始识别异常。LLM还可用于预测未来的时间序列数据点,作为异常检测管道的一部分。
虽然LLM在异常检测方面无法超越最先进的深度学习模型,但它们的表现确实与其他一些AI方法一样好。如果研究人员能够提高LLM的性能,那么这个框架可以帮助技术人员在重型机械或卫星等设备出现问题之前就标记出它们,而无需训练昂贵的深度学习模型。
“由于这只是第一次迭代,我们并没有期望一开始就能取得成功,但这些结果表明,我们有机会利用LLM来完成复杂的异常检测任务,”电气工程与计算机科学(EE)研究生、SigLLM论文的主要作者SarahAlnegheimish说道。
她的合著者包括EE研究生LinhNguyen、法国国家可持续发展研究所研究主任LaureBerti-Equille以及信息与决策系统实验室首席研究科学家、资深作者KalyanVeeramachaneni。该论文发表在arXiv预印本服务器上,研究成果将在IEEE数据科学与高级分析会议上发表。
现成的解决方案
大型语言模型是自回归的,这意味着它们可以理解序列数据中的最新值取决于先前的值。例如,GPT-4等模型可以使用句子前面的单词来预测句子中的下一个单词。
由于时间序列数据是连续的,研究人员认为LLM的自回归特性可能使其非常适合检测此类数据中的异常。
然而,他们想要开发一种避免微调的技术,微调是指工程师使用少量特定任务数据重新训练通用LLM,使其成为某项任务的专家。相反,研究人员部署了现成的LLM,无需额外的训练步骤。
但在部署之前,他们必须将时间序列数据转换为语言模型可以处理的基于文本的输入。
他们通过一系列转换实现了这一点,这些转换捕获了时间序列中最重要的部分,同时用最少的标记表示数据。标记是LLM的基本输入,标记越多,计算量也就越大。
“如果你不非常小心地处理这些步骤,你最终可能会砍掉一些重要的数据,从而丢失这些信息,”Alnegheimish说。
在弄清楚如何转换时间序列数据后,研究人员开发了两种异常检测方法。
异常检测方法
对于第一个系统,他们称之为Prompter,他们将准备好的数据输入模型并提示它定位异常值。
“我们必须反复迭代多次才能找出一个特定时间序列的正确提示。要理解这些LLM如何提取和处理数据并不容易,”Alnegheimish补充道。
对于第二种方法,称为Detector,他们使用LLM作为预测器来预测时间序列中的下一个值。研究人员将预测值与实际值进行了比较。较大的差异表明实际值可能是一个异常值。
有了Detector,LLM将成为异常检测流程的一部分,而Prompter将自行完成任务。在实践中,Detector的表现优于Prompter,后者产生了许多误报。
“我认为,采用Prompter方法,我们要求法学硕士克服太多困难。我们给它设置了一个更难解决的问题,”Veeramachaneni说道。
当他们将这两种方法与当前技术进行比较时,尽管LLM不需要训练或微调,但Detector在他们评估的11个数据集中的7个上的表现优于基于Transformer的AI模型。
将来,LLM还可以通过其预测提供通俗易懂的语言解释,这样操作员就可以更好地理解为什么LLM将某个数据点识别为异常。
然而,最先进的深度学习模型的表现远远优于LLM,这表明在LLM用于异常检测之前仍有工作要做。
“要达到与这些最先进的模型一样好的水平,需要做些什么?这是目前摆在我们面前的百万美元问题。基于法学硕士的异常检测器需要成为游戏规则的改变者,才能证明这种努力是合理的,”Veeramachaneni说。
展望未来,研究人员希望看看微调是否可以提高性能,尽管这需要额外的时间、成本和专业知识进行培训。
他们的LLM方法也需要30分钟到2小时才能产生结果,因此提高速度是未来研究的一个关键领域。研究人员还希望探究LLM,了解它们如何进行异常检测,希望找到提高其性能的方法。
“当涉及到时间序列异常检测等复杂任务时,法学硕士确实是一个有力的竞争者。也许其他复杂任务也可以用法学硕士来解决?”Alnegheimish说。
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
风行T5 EVO是东风风行推出的一款紧凑型SUV,凭借其时尚的外观设计、丰富的配置以及相对亲民的价格,在市场上...浏览全文>>
-
关于2022款迈腾GTE的具体价格,不同地区和经销商可能会有不同的优惠政策。一般来说,迈腾GTE的官方指导价大约...浏览全文>>
-
英菲尼迪QX60 2024款作为一款豪华中大型SUV,凭借其精致的设计、宽敞的空间以及丰富的配置,吸引了不少消费者...浏览全文>>
-
如果您正在寻找一款高性价比、配置丰富的车型,理想MEGA 2025款确实是一个值得考虑的选择。以下是一些关于这...浏览全文>>
-
好的,我明白了!您提到的是关于2025款星际新车的报价信息,最低售价为 8 28万元起,并且现车供应充足。如果...浏览全文>>
-
根据您提供的信息,帝豪L HiP(插电混动版)的最低售价为8 98万元起。目前该车型现车充足,适合有意向购买插...浏览全文>>
-
根据目前的市场反馈和行业动态,启腾EX80的价格走势表现出一定的下行趋势。近期,各大经销商纷纷加大了优惠力...浏览全文>>
-
抱歉,我无法提供2025款捷途X95的具体价格信息,因为这款车尚未发布,而且价格通常取决于地区、配置和市场情况...浏览全文>>
-
在山东济南购买大众CC的价格会因车型、配置、市场活动以及经销商的不同而有所差异。以下是一些关于大众CC的购...浏览全文>>
-
东风风神E60是一款性价比非常高的纯电动车型,其在价格与配置之间找到了一个较为理想的平衡点。以下从价格、配...浏览全文>>
- 风行T5 EVO多少钱?购车攻略全解析
- 广东东莞迈腾GTE多少钱 2022款落地价实惠,配置丰富,不容错过
- 英菲尼迪QX60 2024新款价格大公开,买车不花冤枉钱
- 帝豪L HiP价格,最低售价8.98万起,现车充足
- 山东济南大众CC多少钱?买车攻略一网打尽
- 卫士价格,最低售价60.80万起现在该入手吗?
- 济南ID.4 X多少钱?购车攻略助你轻松入手
- 宝马i5最新价格2025款实惠,配置丰富,不容错过
- 雷克萨斯NX新车报价2025款大揭秘,买车前必看
- 风行S50EV落地价限时特惠,最低售价15.29万起,错过不再有
- 远程FX 2021新款价格,各配置车型售价全展示,超值机会
- 山东济南大众ID.3新车报价2025款,换代前的购车良机,不容错过
- SRM鑫源新能源T3L EV落地价实惠,配置丰富,不容错过
- 江豚E5最新价格2025款,最低售价5.69万起,价格再创新低
- 河南郑州T-ROC探歌落地价大起底,买车超详细
- 示界06落地价实惠,配置丰富,不容错过
- 郑州威然新车报价2024款大公开,买车不花冤枉钱
- 奇骏多少钱?如何挑选性价比高的车
- 跨越星V7 EV新款价格2025款多少钱?选车秘籍全攻略
- 新海狮落地价,最低售价9.18万起现在该入手吗?