Тег

#llm-инференс

2 новостей с этим тегом.

Память·23 мая 2026

Энтузиаст запустил триллионопараметровую LLM на одном GPU с помощью 768GB Optane

Пользователь Reddit собрал рабочую станцию с процессором Xeon и видеокартой RTX 3060, где вместо обычной оперативной памяти использовал 768GB снятых с производства Intel Optane DCPMM. Система справляется с локальным запуском модели Kimi K2.5 на скорости 4 токена в секунду.

AI-железо·11 мая 2026

Тайваньский стартап создал ИИ-ускоритель на старых чипах с 384 ГБ памяти

Skymizer представила необычную PCIe-карту HTX301, которая запускает модели на 700 млрд параметров, потребляя всего 240 Вт. Вместо современных HBM и нанометровых техпроцессов используются 28-нм чипы и LPDDR4/LPDDR5.