保存此搜索
短纸 2024年6月 OFA-NAS ResNet拓扑跨不同硬件计算单元的性能分析 网络体系结构搜索(NAS)是一个繁琐的过程,因此训练大型超参数化网络的不同方法,以及针对硬件平台最佳效率模型的逐步缩小算法是。。。 摘要 2024年6月 轻尾M/G/1中的强尾优化调度 SIGMETRICS/PERFORMANCE’24:2024年ACM SIGMETLICS/IFIP PERFORMANCE计算机系统测量和建模联合国际会议摘要 2024年6月, 第5-6页 https://doi.org/10.1145/3652963.3655084 我们研究了排队系统中的作业调度问题,特别是具有轻尾作业大小的M/G/1,以渐近优化响应时间尾。 这意味着调度要使\mathbfP[T>T],作业的响应时间有可能超过T,。。。 另发布于: ACM SIGMETRICS性能评估审查:第52卷,2024年6月1日发行 摘要 2024年6月 内核与用户级网络:不要因为中断而丢弃堆栈 SIGMETRICS/PERFORMANCE’24:2024年ACM SIGMETLICS/IFIP PERFORMANCE计算机系统测量和建模联合国际会议摘要 2024年6月, 第43–44页 https://doi.org/10.1145/3652963.3655061 本文回顾了通信密集型服务器应用程序的网络堆栈处理的性能特征。 最近的文献经常将内核级和用户级网络描述为获得显著性能的银弹。。。 另发布于: ACM SIGMETRICS性能评估审查:第52卷,2024年6月1日发行 摘要 2024年6月 大流量最优规模和状态感知调度 SIGMETRICS/PERFORMANCE’24:2024年ACM SIGMETLICS/IFIP PERFORMANCE计算机系统测量和建模联合国际会议摘要 2024年6月, 第7-8页 https://doi.org/10.1145/3652963.3655059 我们研究了将作业分派到多个FCFS(First-Come,First-Served)队列的问题。 我们考虑这样一种情况,即调度器是大小软件,这意味着它在到达时了解每个作业的大小(即服务时间); 和国家意识,这意味着。。。 另发布于: ACM SIGMETRICS性能评估审查:第52卷,2024年6月1日发行 摘要 2024年6月 冗余系统中服务纪律影响的近似研究 SIGMETRICS/PERFORMANCE’24:2024年ACM SIGMETLICS/IFIP PERFORMANCE计算机系统测量和建模联合国际会议摘要 2024年6月, 第1-2页 https://doi.org/10.1145/3652963.3655045 在本文中,我们发展了第一种方法来近似具有冗余的排队系统在各种服务规则下的队列长度分布。 我们重点关注具有指数级作业大小、i.i.d.副本和大量服务器的系统。。。 另发布于: ACM SIGMETRICS性能评估审查:第52卷,2024年6月1日发行 -
摘要 2024年6月 自主代理:现代硬件机器人的系统研究 SIGMETRICS/PERFORMANCE’24:2024年ACM SIGMETLICS/IFIP PERFORMANCE计算机系统测量和建模联合国际会议摘要 2024年6月, 第25-26页 https://doi.org/10.1145/3652963.3655043 随着机器人日益渗透到现代社会,系统和硬件研究界弥合与机器人之间长期存在的差距至关重要。 由于缺乏(i)机器人系统性能评估,这种分歧一直存在。。。 另发布于: ACM SIGMETRICS性能评估审查:第52卷,2024年6月1日发行 研究论文 2024年6月 GPU计算内核上的低开销跟踪收集和分析 虽然GPU可以为计算密集型任务带来显著的加速,但它们的编程非常困难。 从编程模型到微体系结构的特殊性,程序员可能会遇到许多陷阱,这些陷阱可能会妨碍性能。。。 研究论文 2024年6月 TLPGNN:一种用于单个和多个GPU上的图神经网络计算的轻量级两级并行性范式 图形神经网络(GNN)是专门为图形结构数据设计的一类新兴深度学习模型。 它们已被有效地应用于各种实际应用中,包括推荐系统、药物开发。。。 研究论文 2024年6月 使用SYCL在CPU、GPU和FPGA上实现浅水方程的性能可移植性 为了在当前和未来的高性能计算机中充分利用各种硬件架构,科学仿真代码的开发人员和维护人员努力实现性能可移植性。 目标是达到。。。 研究论文 2024年6月 gZCCL:GPU集群的压缩加速集体通信框架 随着GPU计算能力的迅速提升,支持GPU的集体通信已成为现代计算平台的主要瓶颈。 传统的方法是将有损压缩直接集成到GPU感知的集合中,这可能会导致严重的。。。 研究论文 2024年6月 Snoopie:一种多GPU通信分析器和可视化工具 随着数据移动成为计算中最昂贵的瓶颈之一,对分析通信的分析工具的需求成为有效扩展多GPU应用程序的关键。 虽然现有的分析工具包括第一方。。。 研究论文 2024年6月 FASTEN:异构图形神经网络的快速GPU加速分段矩阵乘法 本文介绍了FASTEN,一个为解决异构图形神经网络(HGNN)固有的计算挑战而开发的前沿库。 FASTEN的重点是分段矩阵乘法的优化,这是一个关键的问题。。。 研究论文 2024年6月 考虑行人情绪异质性影响下的安全风险预测与防控 密集复杂的人群在通过狭窄的高速公路时容易发生拥挤和踩踏事故,研究在情感影响下的狭窄高速公路人群疏散模拟具有现实意义。 在…中。。。 研究论文 2024年5月 选择平均碳强度与边际碳强度信号对碳制品优化的影响 电网供电的碳强度取决于用于满足其需求的发电源的组合,并且随着时间和地点的变化而变化很大。 有两种类型的碳强度信号:平均值和边际值。 两个信号。。。 研究论文 2024年5月 轻尾M/G/1的强尾最优调度 我们研究了排队系统中的作业调度问题,特别是具有轻尾作业大小的M/G/1,以渐近优化响应时间尾。 这意味着调度使\mathbfP[T>T],作业的响应时间超过T的几率,。。。 研究论文 2024年5月 利用基于适配器的细分对象精细调整模型增强农业疾病细分:农业疾病细分中的适配器精细调整 最近,Segment Anything Model(SAM)在众多可视化基准测试中表现出了卓越的性能。 它是一个非常有影响力的基础视觉模型,能够通过零快照方法在图像分割中获得良好的分割结果。。。 研究论文 2024年5月 刚刚接受 CARIn:针对单个和多个DNN工作负载的异构设备的约束感知和响应推断 近年来,深度学习(DL)应用程序的不断扩展,推动了向设备执行的关键转变,这是由实时处理的迫切需求、隐私问题的加剧以及各种延迟的减少……推动的。。。 海报 2024年5月 测量和优化Android虚拟化框架的性能 谷歌最近发布了Android虚拟化框架(AVF),以支持移动设备的机密计算。 这项工作首次在谷歌像素设备上评估了Android AVF的性能。 我们的结果表明,pVM。。。 演示 2024年5月 演示文件:卷积神经网络优化异构部署的异构-Vis框架 卷积神经网络(CNN)通常包含不同计算要求的多层。 另一方面,许多硬件加速器可以作为部署选项使用,它们在计算体系结构和。。。 研究论文 2024年5月 zns-tools:NVMe zns SSD的eBPF驱动的跨层存储剖析工具 由于闪存固态硬盘内部结构复杂且封闭,因此了解其操作特性一直是一项具有挑战性的任务。 最近出现的具有开放接口的区域命名空间(ZNS)SSD允许主机软件堆栈显式地。。。