保存此搜索
研究论文 2024年2月 共享微服务的优化资源管理:一种可扩展的系统设计 提高数据中心资源利用率的一种常见方法是根据实际工作负载自适应地调配资源。 然而,在微服务管理框架中实现这一点的一个基本挑战是。。。 研究论文 2024年2月 面向高通量计算的组件可区分协同与资源回收 云服务提供商通过将延迟关键型(LC)工作负载与尽力而为的批处理(BE)作业共存于数据中心来提高资源利用率。 然而,他们通常将多组分液晶视为单片应用,将BE视为“二级……”。。。 研究论文 2024年1月 利用仿射关系建模编译器优化中循环平铺与融合的相互作用 循环平铺和融合是优化编译器以增强程序数据局部性的两个基本转换。 现有的启发式算法要么以特定的顺序执行循环平铺和融合,而忽略了它们的一些有利可图的组成,要么。。。 研究论文 2023年12月 交响乐:用层次异质处理协调稀疏和稠密张量 迈克尔·佩劳尔 , 杰森·克莱蒙斯 , 维格内什·巴拉吉 , 尼尔·克拉戈 , 阿默·贾勒尔 , 李东赫 , 迈克·奥康纳 , Anghsuman Parashar公司 , 肖恩·特里克勒 , 蔡波安(Po-An Tsai) , 斯蒂芬·凯克勒 , 乔尔·埃默
稀疏张量算法正变得越来越普遍,特别是在深度学习、图形和数据分析以及科学计算领域。 当前的高性能广域体系结构(如GPU)经常会影响内存系统。。。 研究论文 2023年12月 夏洛特:将区块链重组为跨域应用程序的可组合认证数据结构网络 跨域应用程序正在迅速采用区块链技术以实现不变性、可用性、完整性和互操作性。 然而,对于大多数应用程序,全球共识是不必要的,甚至可能无法提供足够的保障。 我们。。。 -
研究论文 2023年12月 部分网络分区 我们对部分网络划分进行了广泛的研究。 部分网络分区会中断集群中某些节点(但不是所有节点)之间的通信。 首先,我们对13个。。。 研究论文 2022年11月 基于实时负载延迟跟踪的高效指令调度 发布时间预测处理器使用数据流相关性和预定义的指令延迟来预测重复指令的发布时间。 在这项工作中,我们做了两个关键观察:(1)内存访问通常比。。。 研究论文 2022年7月 利用体系结构支持促进进程间通信 IPC(进程间通信)是现代操作系统的关键机制,不仅包括seL4、QNX和Fuchsia等微内核,其中系统功能部署在用户级进程中,还包括Android等单片内核,其中。。。 研究论文 2022年7月 H-Container:支持边缘计算中的异构ISA容器迁移 边缘计算是一种最新的计算范式,它使云服务更接近客户端。 在其他功能中,边缘计算提供极低的客户端/服务器延迟。 为了持续提供这种低延迟,服务应该在边缘节点上运行。。。 研究论文 2022年7月 跨缓存非相干异构节点透明工作共享的OpenMP运行时 在这项工作中,我们提出了libHetMP,这是一个OpenMP运行时,用于在异构节点之间自动透明地分布并行计算。 libHetMP的目标平台由CPU组成,CPU具有不同的指令集体系结构(ISA)。。。 研究论文 2022年1月 解决服务器前端瓶颈 前端瓶颈是服务器工作负载中一个公认的问题,因为它们有很深的软件堆栈和很大的指令占用空间。 尽管对有效的L1-I和BTB预取进行了多年的研究,但最先进的技术迫使进行权衡。。。 研究论文 2021年10月 Apache Nemo:优化分布式数据处理的框架 Wook Song获胜 , 杨修克(Youngseok Yang) , Jeongyoon Eo公司 , 张浩(Jangho Seo) , Joo Yeon Kim先生 , 桑哈·李 , Gyewon Lee公司 , Taegeon Um公司 , 赵海云(Haeyoon Cho) , Byung-Gon Chun先生
针对资源和数据特性优化分布式数据处理的调度和通信对于实现高性能至关重要。 现有的此类优化方法主要分为两类。 首先,分布式运行时。。。 研究论文 2021年7月 用Graspan系统化大系统代码的过程间静态分析 使用静态分析来查找Linux等系统中的错误已有十多年的历史。 为这些系统开发的大多数现有静态分析都是基于模式匹配查找错误的简单检查程序。 尽管存在。。。 研究论文 2021年7月 智能IO :通过PCIe网络进行零开销设备共享 大量计算量大和数据驱动的应用程序加速了对分布式I/O解决方案的需求,该解决方案能够在网络主机之间经济高效地扩展资源。 例如,在集群系统中,不同的机器可能具有。。。 研究论文 2021年7月 多核SoC的模块化和分布式管理 多核片上系统越来越需要资源的动态多目标管理(DMOM)。 DMOM对目标和资源使用不同的管理组件,实现全面、自适应的系统资源管理。 DMOM。。。 研究论文 2021年3月 UNIQ公司 :神经网络非均匀量化的均匀噪声注入 我们提出了一种新的神经网络量化方法。 我们的方法,命名为 UNIQ公司 ,模拟非均匀 k个 -分位数量化器,并通过在训练时向权重注入噪声,使模型在量化权重下表现良好。 作为-。。。 研究论文 2021年1月 GPU的高并发容延迟注册文件 穆罕默德·萨德罗萨达蒂 , 阿米罗申·米洛塞尼 , 阿里·哈加巴迪 , 赛义德·博尔纳·埃萨尼 , 哈贾尔·法拉哈蒂 , 哈米德·萨巴齐·阿扎德 , 马里奥·德鲁蒙德 , 巴巴克·法尔萨菲 , 拉查塔·奥萨瓦隆尼伦 , Onur Mutlu公司
图形处理单元(GPU)使用大型寄存器文件来容纳所有活动线程并加速上下文切换。 不幸的是,由于长访问延迟、高功耗……,寄存器文件是未来GPU的可扩展性瓶颈。。。 研究论文 2019年4月 利用机架级内存池缓解分布式数据服务中的负载不平衡 为了提供低延迟和高吞吐量的保证,大多数大型键值存储将数据保存在许多服务器的内存中。 尽管查找之间具有自然的并行性,但由于流行度分布中的严重偏斜而导致的负载不平衡。。。 研究论文 2019年3月 威尼斯 :数据中心服务器的有效资源共享体系结构 整合的服务器机架正在迅速成为工程、商业、医疗和科学领域的标准基础设施。 这些服务器的设计方式仍然与它们作为独立的分布式系统组织时的方式相同。 考虑到这么多。。。 研究论文 2018年12月 使用不一致复制构建一致事务 应用程序程序员越来越喜欢具有强一致性和分布式事务的分布式存储系统(例如,谷歌的扳手),因为它们具有强大的保证和易用性。 不幸的是,现有的事务存储系统。。。