Google нашла способ сократить потребление памяти ИИ в шесть раз
Компания Google анонсировала на днях TurboQuant — алгоритм, который позволяет сократить потребление большими языковыми моделями (LLM) потребление памяти в шесть раз. Технология при этом не влияет на производительность и эффективность работы ИИ-моделей, сохраняя точность.
