quantize - a rlaxogus99 Collection

rlaxogus99 's Collections

CV

peft

agent

rag

coding

video

quantize

updated Dec 7, 2024

BitNet a4.8: 4-bit Activations for 1-bit LLMs

Paper • 2411.04965 • Published Nov 7, 2024 • 69
"Give Me BF16 or Give Me Death"? Accuracy-Performance Trade-Offs in LLM Quantization

Paper • 2411.02355 • Published Nov 4, 2024 • 52
Ultra-Sparse Memory Network

Paper • 2411.12364 • Published Nov 19, 2024 • 24
VisionZip: Longer is Better but Not Necessary in Vision Language Models

Paper • 2412.04467 • Published Dec 5, 2024 • 117
Efficient Vision-Language Models by Summarizing Visual Tokens into Compact Registers

Paper • 2410.14072 • Published Oct 17, 2024
FoPru: Focal Pruning for Efficient Large Vision-Language Models

Paper • 2411.14164 • Published Nov 21, 2024
NVILA: Efficient Frontier Visual Language Models

Paper • 2412.04468 • Published Dec 5, 2024 • 60