Экспериментальная площадка по оптимизации и запуску локальных языковых моделей на маломощном железе. Без облаков, приватно, на грани возможного.
Квантование, offloading на GPU/Vulkan, настройка тредов под ARM Cortex.
Raspberry Pi 4/5, Armbian, Ubuntu 24.04, Docker-контейнеры.
Все данные остаются на устройстве. Никаких API-ключей и телеметрии.
Используем llama.cpp, Ollama, HuggingFace и собственные скрипты автоматизации.