llm-gemini 0.31
Краткая заметка Саймона Уиллисона о том, что модель gemini-3.1-flash-lite вышла из статуса preview и теперь общедоступна. Автор отсылает к своему мартовскому разбору превью-версии Gemini 3.1 Flash-Lit
Краткая заметка Саймона Уиллисона о том, что модель gemini-3.1-flash-lite вышла из статуса preview и теперь общедоступна. Автор отсылает к своему мартовскому разбору превью-версии Gemini 3.1 Flash-Lit
Автор размышляет о центральной дискуссии в AI-инженерии — споре между сторонниками «Big Model» (мощь сосредоточена в самой модели) и «Big Harness» (ценность создаёт обвязка вокруг модели). Команды Cla
Anthropic сообщает о значительном прогрессе в понимании внутренней работы LLM: исследователи извлекли миллионы признаков (features) из среднего слоя Claude 3.0 Sonnet, получив первую детальную карту к
Обзор того, как индустриальные рекомендательные системы и поиск эволюционировали за последний год под влиянием больших языковых моделей. Автор разбирает четыре направления: архитектуры с LLM/мультимод
Итан Моллик описывает впечатления от нового поколения ИИ-моделей — Claude 3.7 и Grok 3 — отмечая резкий скачок в сложных задачах, математике и программировании. Автор объясняет два закона масштабирова
Юджин Ян рассказывает, как за 18 месяцев Latent Space Paper Club без единого пропуска проводил еженедельные разборы статей — суммарно более 80 работ по ключевым компонентам, моделям, обучению, инферен