首页 生活 > 内容

使计算机科学研究更容易获得

时间:2023-02-01 15:45:29 来源:
导读 想象一下,您正在为一个小村庄的孩子们教授一门技术课程。他们渴望学习,但你面临一个问题:用母语教育他们的资源很少。这在印度很常见,用

想象一下,您正在为一个小村庄的孩子们教授一门技术课程。他们渴望学习,但你面临一个问题:用母语教育他们的资源很少。

这在印度很常见,用许多当地语言编写的教科书的质量与用英语编写的教科书相比相形见绌。为解决教育不平等问题,印度政府于2020年发起了一项计划,旨在为数亿人改善这些资源的质量,但其实施仍然是一项艰巨的任务。

麻省理工学院博士SiddharthaJayanti麻省理工学院计算机科学与人工智能实验室(CSAIL)和GoogleResearch的附属机构电气工程与计算机科学(EECS)学生在向印度学生教授数学、科学和英语时遇到了这个问题。在普林斯顿大学读完本科一年级后的那个夏天,Jayanti参观了Bhimavaram镇,在一个为期五周的教育营中自愿担任组织者、教师和导师。他与来自该地区各个村庄的经济困难儿童一起工作。他们会说Jayanti的母语泰卢固语,但由于在学术工作中使用复杂的英语,他们面临着语言障碍。

根据世界经济论坛和美国人口普查数据,泰卢固语是美国发展最快的语言,而Ethnologue估计全球使用人数超过9500万,这进一步强调了对更多本地语言学术材料的需求。

作为具有共同文化背景的分布式计算和AI研究人员,Jayanti处于独特的位置可以提供帮助。考虑到数以百万计的泰卢固语使用者,Jayanti于2018年撰写了第一篇完全用泰卢固语撰写的计算机科学原创论文。该研究随后于2022年在arXiv上公开访问,重点是设计简单、快速、可扩展且可靠的多处理器算法和分析处理器之间的基本通信和协调任务。

处理器是执行计算机程序的电子电路,这使得它们以其许多活动部件而臭名昭著。“将处理器视为完成任务的人,”Jayanti说。“如果你有一个处理器,就像一个人在做一项任务。如果你有200个人,那么理想情况下你的团队会更快地解决问题,但情况并非总是如此。协调多个处理器以实现加速需要巧妙的算法设计,并且有时存在基本的沟通障碍,限制了我们解决问题的速度。”

为了解决计算问题,多核系统中的每个进程都遵循严格的程序,也称为多处理器算法。尽管如此,处理器相互交互以计算解决方案的速度仍然存在一定的限制。Jayanti的论文强调了这些算法的一个关键通信瓶颈,称为通用唤醒(GWU),处理器在执行第一行代码时“唤醒”。

但问题仍然存在:每个处理器能否确定其他处理器已经醒来?Jayanti表示答案是肯定的,但由于每个解决方案都需要进行工作,因此GWU的求解速度存在一定的数学限制。

这个问题是一个更大趋势的一部分:多核革命,许多芯片制造商不再优先考虑更快的处理速度。相反,芯片现在通常设计有多个内核,或在较大的CPU中包含较小的处理器。多核芯片现在在许多手机和笔记本电脑中都很常见。

“现代技术需要简单、快速和可靠的多处理器算法,”Jayanti说。“巨大的加速和更好的协调是目标,但即使使用多处理器算法,我们也可以证明通信问题只能如此快速地解决。”

Jayanti克服了用泰卢固语交流最新研究成果的重大语言障碍,使用对泰卢固语产生重大影响的印度古典语言梵语为论文发明了新的技术词汇。例如,泰卢固语中没有“共享内存多处理器”这样的技术术语。Jayanti改变了这一点,创造了saṁvibhakta-smr̥tibahusaṁsādhakamu(సంవిభక్తస్మృతిబహుసంసాధకము)这个词。

虽然乍一看这个词可能令人生畏和复杂,但Jayanti的过程很简单:使用梵语词根词在泰卢固语中创造新词。例如,梵语词根“vibhaj”的意思是“划分”,而“smr̥”的意思是“记住、回忆或记住”。用前缀和后缀修改这些词后,结果是“saṁvibhakta”(“共享”)和“smr̥ti”(“内存”),或泰卢固语中的“saṁvibhakta-smr̥ti”(“共享内存”)。

Jayanti热衷于在印度创造教育机会,他参观了几个邦的学校,包括特伦甘纳邦、安得拉邦和卡纳塔克邦。他每年都会去印度旅行,偶尔会在国际理论科学中心和印度理工学院等大学停留。

通过创造新的技术词汇,Jayanti将他的工作视为一个机会,让更多的人能够追求他们的科学梦想。他的泰卢固语论文为数以百万计的母语人士打开了访问STEM研究的大门。

Jayanti说:“知识是普遍的,它能带来快乐,为新机遇打开大门,并有能力启发和拉近不同背景的人们的距离,共同追求更美好的世界。”“我的科学学习和发现让我接触到了世界各地的伟大思想家,我希望我的一些工作可以为全世界更多的人打开一扇大门。”

作为他的博士学位的一部分。在论文中,Jayanti提出了SamskrtamTechnicalLexicon项目,该项目将通过为当地印度语言和学者开发STEM现代技术术语词典来弥合进一步的教育差距。Jayanti表示:“该项目旨在加强STEM、梵语和其他方言学者之间的密切合作,以扩大跨越10亿人口的语言社区的科学可用性。”

Jayanti的研究还推动了对多核处理速度的进一步研究。2019年,他与普林斯顿大学计算机科学教授、图灵奖获得者RobertTarjan以及麻省理工学院博士EnricBoix-Adserà合作。EECS的学生演示联合查找等数据结构的下限速度限制,其中算法可以在不相交的数据集之间创建“联合”,同时“查找”两个项目当前是否在同一集合中。

该团队利用Jayanti对GWU的研究来证明算法速度的某些限制,甚至可以利用多核的力量。Jayanti和Tarjan已经为并发联合查找问题设计了一些最快的算法,使得对互联网和道路网络等大型图的分析更加高效。事实上,这些算法已经接近解决union-find的数学速度障碍。

Jayanti2018年的泰卢固语研究论文连同梵文摘要一起作为他去年论文的14章之一发表,他的团队2019年的论文在分布式计算原理研讨会上发表。他的研究生学习得到了美国国防部通过国防科学与工程研究生奖学金的支持。

标签:
最新文章