Papers

401 papers found

NanoFlow: Towards Optimal Large Language Model Serving Throughput

Kan Zhu, Yufei Gao, Yilong Zhao et al.

2025 OSDI

Neutrino: Fine-grained GPU Kernel Profiling via Programmable Probing

Songlin Huang, Chenshu Wu

2025 OSDI

Okapi: Decoupling Data Striping and Redundancy Grouping in Cluster File Systems

Sanjith Athlur, Timothy Kim, Saurabh Kadekodi et al.

2025 OSDI

Paralegal: Practical Static Analysis for Privacy Bugs

Justus Adam, Carolyn Zech, Livia Zhu et al.

2025 OSDI

Picsou: Enabling Replicated State Machines to Communicate Efficiently

Reginald Frank, Micah Murray, Chawinphat Tankuranand et al.

2025 OSDI

PipeThreader: Software-Defined Pipelining for Efficient DNN Execution

Yu Cheng, Lei Wang, Yining Shi et al.

2025 OSDI

PoWER Never Corrupts: Tool-Agnostic Verification of Crash Consistency and Corruption Detection

Hayley LeBlanc, Jacob R. Lorch, Chris Hawblitzel et al.

2025 OSDI

Principles and Methodologies for Serial Performance Optimization

Sujin Park, Mingyu Guan, Xiang Cheng et al.

2025 OSDI

QiMeng-Xpiler: Transcompiling Tensor Programs for Deep Learning Systems with a Neural-Symbolic Approach

Shouyang Dong, Yuanbo Wen, Jun Bi et al.

2025 OSDI

QOS: Quantum Operating System

Emmanouil Giortamis, Francisco Romão, Nathaniel Tornow et al.

2025 OSDI

Quake: Adaptive Indexing for Vector Search

Jason Mohoney, Devesh Sarda, Mengze Tang et al.

2025 OSDI

Quantum Virtual Machines

Runzhou Tao, Hongzheng Zhu, Jason Nieh et al.

2025 OSDI

Scalio: Scaling up DPU-based JBOF Key-value Store with NVMe-oF Target Offload

Xun Sun, Mingxing Zhang, Yingdi Shan et al.

2025 OSDI

Skybridge: Bounded Staleness for Distributed Caches

Robert Lyerly, Scott Pruett, Kevin Doherty et al.

2025 OSDI

Söze: One Network Telemetry Is All You Need for Per-flow Weighted Bandwidth Allocation at Scale

Weitao Wang, T. S. Eugene Ng

2025 OSDI

Stripeless Data Placement for Erasure-Coded In-Memory Storage

Jian Gao, Jiwu Shu, Bin Yan et al.

2025 OSDI

Tiered Memory Management Beyond Hotness

Jinshu Liu, Hamid Hadian, Hanchen Xu et al.

2025 OSDI

Tigon: A Distributed Database for a CXL Pod

Yibo Huang, Haowei Chen, Newton Ni et al.

2025 OSDI

Tintin: A Unified Hardware Performance Profiling Infrastructure to Uncover and Manage Uncertainty

Ao Li, Marion Sudvarg, Zihan Li et al.

2025 OSDI

To PRI or Not To PRI, That's the question

Yun Wang, Liang Chen, Jie Ji et al.

2025 OSDI

Training with Confidence: Catching Silent Errors in Deep Learning Training with Automated Proactive Checks

Yuxuan Jiang, Ziming Zhou, Boyu Xu et al.

2025 OSDI

Understanding Stragglers in Large Model Training Using What-if Analysis

Jinkun Lin, Ziheng Jiang, Zuquan Song et al.

2025 OSDI

WaferLLM: Large Language Model Inference at Wafer Scale

Congjie He, Yeqi Huang, Pei Mu et al.

2025 OSDI

Weave: Efficient and Expressive Oblivious Analytics at Scale

Mahdi Soleimani, Grace Jia, Anurag Khandelwal

2025 OSDI

WLB-LLM: Workload-Balanced 4D Parallelism for Large Language Model Training

Zheng Wang, Anna Cai, Xinfeng Xie et al.

2025 OSDI