首页 >> 生活 >

研究展示了数据分析中更好分组的新方法

2024-07-29 16:20:07 来源: 用户: 

卡内基梅隆大学和加州大学伯克利分校的研究人员开发了一种新方法来改进计算机组织和分析大型数据集的方式。这一进步提高了从知识图谱中提取信息的能力,影响了分析社交网络和客户行为的能力。

卡内基梅隆大学泰珀商学院卡内基博世运筹学副教授莫斯利(BenjaminMoseley)领导的一项研究中解释了新方法,该方法可以更有效地将相似的物品归为一组,同时将不同的物品分开。

该论文将发表在2024年7月举行的国际自动机、语言和编程研讨会ICALP上。

莫斯利说:“我们的新算法可以显著增强我们分析大型数据集的方式,无论是通过准确检测用户社区来改善社交媒体平台,还是通过更好地理解基因相互作用来推进医学研究。”

他指出,商业分析的一个关键趋势是能够使用知识图谱,知识图谱可以显示客户行为或业务流程等信息。本文重点介绍聚类,这是一种从这些图谱中提取信息的常用方法。本研究中的新方法可以更有效地将相似的项目分组,同时将不同的项目区分开来。

由于不一致和信息量巨大,正确地组织大量数据是一项挑战。莫斯利和他的团队专注于创建一种可以快速准确地对数据点进行分组的算法。他们使用了由节点(代表数据点)和边(代表节点之间的连接)组成的数学结构。该算法通过评估这些连接并确定对相似节点进行分组的最佳方式来工作。

结果表明,他们的算法比以前的方法更快、更准确。它可以更有效地处理大型数据集,使其适用于实际应用。

加州大学伯克利分校理论计算机科学研究科学家萨米·戴维斯表示:“我们的新方法比以往任何方法都更能减少数据分组时的错误。我们的方法也更加灵活,因为我们可以以一种同时适用于许多不同目标的方式对数据进行分组。”

研究人员计划继续完善他们的方法并探索其在不同领域的应用。这项正在进行的工作可能会带来更准确、更有洞察力的数据分析。

泰珀商学院算法、组合学和优化博士项目博士生HeatherNewman也是本文合著者之一。

  免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!

 
分享:
最新文章
  • 【木地板材料】木地板是一种广泛应用于家居和商业空间的地面装饰材料,因其自然美观、耐用性强、环保性好等特...浏览全文>>
  • 【木地板安装】木地板安装是一项需要细致规划和专业操作的工程,无论是新房装修还是旧房翻新,选择合适的木地...浏览全文>>
  • 【木的组词怎么写】在汉语学习中,词语的积累和运用是非常重要的部分。对于“木”这个字来说,它不仅是常见的...浏览全文>>
  • 【木的象形字有哪些字】在汉字的发展过程中,许多字最初都是通过象形的方式创造出来的,用来表示具体的事物。...浏览全文>>
  • 【木岛法子介绍】木岛法子(Kazuko Kikuchi)是日本著名演员、模特及艺人,以其在影视作品中的出色表现和独特...浏览全文>>
  • 【木代尔是什么面料】“木代尔是什么面料”是许多消费者在选购衣物时常常会提出的问题。木代尔是一种天然纤维...浏览全文>>
  • 【木代尔和莫代尔哪种面料好】在选择衣物面料时,很多人会遇到“木代尔”和“莫代尔”这两个名称,容易混淆它...浏览全文>>
  • 【萝卜的营养价值】萝卜是一种常见的根茎类蔬菜,不仅味道清脆爽口,还具有丰富的营养价值。无论是生吃、炒食...浏览全文>>
  • 【萝卜的药用功效和作用】萝卜,作为日常生活中常见的蔬菜之一,不仅味道清脆、营养丰富,还具有多种药用价值...浏览全文>>
  • 【萝卜的家常做法】萝卜是一种非常常见的蔬菜,不仅价格实惠,而且营养丰富,适合多种烹饪方式。无论是炖、炒...浏览全文>>