Энтузиаст запустил триллионопараметровую LLM на одном GPU с помощью 768GB Optane
Пользователь Reddit собрал рабочую станцию с процессором Xeon и видеокартой RTX 3060, где вместо обычной оперативной памяти использовал 768GB снятых с производства Intel Optane DCPMM. Система справляется с локальным запуском модели Kimi K2.5 на скорости 4 токена в секунду.