Anderson de Andrade

Papers
Talks
Software

Parallelization

An architecture for accelerated large-scale inference of transformer-based language models

Unified batch and online transformer inference.

February 2021 · Amir Ganiev, Colton Chapin, Anderson de Andrade, Chen Liu

© 2026 Anderson de Andrade · Made with hugo, papermod, & hugo-website.