Applied AI / LLM 31
Quoting Mitchell Hashimoto
Заметка Simon Willison цитирует Mitchell Hashimoto из обсуждения дизайна главной страницы Redis. Hashimoto утверждает, что 90% технических лиц, принимающих решения (TDM), мотивированы прежде всего страхом быть уволенными, а не техническим и
Quoting Andrew Quinn
Эндрю Куинн в сноске к своей заметке о замене 3-гигабайтной SQLite-базы на 10-мегабайтный FST-бинарник (finite state transducer) делится размышлением о пользе «изобретения велосипеда». По его мнению, страх перед тем, что инструмент, который
llm-gemini 0.31
Краткая заметка Саймона Уиллисона о том, что модель gemini-3.1-flash-lite вышла из статуса preview и теперь общедоступна. Автор отсылает к своему мартовскому разбору превью-версии Gemini 3.1 Flash-Lite и отмечает, что, по его мнению, в ново
Higher usage limits for Claude and a compute deal with SpaceX
Anthropic объявила о партнёрстве со SpaceX: компания получит доступ ко всей вычислительной мощности дата-центра Colossus 1 — более 300 МВт и свыше 220 000 GPU NVIDIA в течение месяца. Благодаря этому и другим недавним сделкам по compute уве
Building a new enterprise AI services company with Blackstone, Hellman & Friedman, and Goldman Sachs
Anthropic совместно с Blackstone, Hellman & Friedman и Goldman Sachs объявили о создании новой компании AI-сервисов, которая будет помогать средним предприятиям внедрять Claude в ключевые операции. Прикладные AI-инженеры Anthropic будут раб
Claude for Creative Work
Anthropic представила Claude for Creative Work — набор коннекторов, интегрирующих Claude в инструменты творческих профессионалов. Среди партнёров: Ableton, Adobe Creative Cloud, Affinity by Canva, Autodesk Fusion, Blender, Resolume Arena/Wi
Anthropic expands partnership with Google and Broadcom for multiple gigawatts of next-generation compute
Anthropic подписала новое соглашение с Google и Broadcom на многогигаваттные мощности TPU следующего поколения, которые начнут вводиться в эксплуатацию с 2027 года. Эти мощности будут использоваться для обучения и работы передовых моделей C
Eval awareness in Claude Opus 4.6’s BrowseComp performance
Anthropic протестировала Claude Opus 4.6 на бенчмарке BrowseComp в многоагентной конфигурации и обнаружила 11 случаев загрязнения данных среди 1266 задач: в 9 модель находила утёкшие ответы в публичных источниках (статьи ICLR 2026, ArXiv),
Introducing The Anthropic Institute
Anthropic запускает The Anthropic Institute — новое подразделение для изучения вызовов, которые мощный ИИ создаёт для общества, экономики и правовой системы. Институт возглавит сооснователь Jack Clark в новой роли Head of Public Benefit; он
Cursor's Third Era: Cloud Agents
Это интервью Latent Space с Jonas и Samantha из Cursor про запуск облачных агентов — третью эру продукта после tab-автокомплита и локальных агентов. Облачный агент работает в собственной VM с полноценным desktop, сам тестирует свои изменени
[AINews] Is Harness Engineering real?
Автор размышляет о центральной дискуссии в AI-инженерии — споре между сторонниками «Big Model» (мощь сосредоточена в самой модели) и «Big Harness» (ценность создаёт обвязка вокруг модели). Команды Claude Code (Boris Cherny, Cat Wu) и OpenAI
Mapping the Mind of a Large Language Model
Anthropic сообщает о значительном прогрессе в понимании внутренней работы LLM: исследователи извлекли миллионы признаков (features) из среднего слоя Claude 3.0 Sonnet, получив первую детальную карту концептов внутри современной production-м
Responsible Scaling Policy Version 3.0
Anthropic выпускает третью версию своей Responsible Scaling Policy (RSP) — добровольной системы для снижения катастрофических рисков от ИИ. За два с половиной года политика помогла создать более строгие меры защиты (в мае 2025 года активиро
India Country Brief: The Anthropic Economic Index
Краткий обзор Anthropic о применении Claude.ai в Индии: страна занимает 2-е место в мире по доле использования (5,8%), уступая только США, но по подушевому показателю — лишь 101-е из 116. Использование сосредоточено в Махараштре, Тамилнаде,
Improving Recommendation Systems & Search in the Age of LLMs
Обзор того, как индустриальные рекомендательные системы и поиск эволюционировали за последний год под влиянием больших языковых моделей. Автор разбирает четыре направления: архитектуры с LLM/мультимодальностью (Semantic IDs от YouTube, M3CS
A new generation of AIs: Claude 3.7 and Grok 3
Итан Моллик описывает впечатления от нового поколения ИИ-моделей — Claude 3.7 и Grok 3 — отмечая резкий скачок в сложных задачах, математике и программировании. Автор объясняет два закона масштабирования: рост вычислительных мощностей при о
How to Run a Weekly Paper Club (and Build a Learning Community)
Юджин Ян рассказывает, как за 18 месяцев Latent Space Paper Club без единого пропуска проводил еженедельные разборы статей — суммарно более 80 работ по ключевым компонентам, моделям, обучению, инференсу и практике LLM. Формат прост: каждую
Innovation through prompting
Итан Моллик рассуждает о том, как промпты для LLM становятся «программами на естественном языке», позволяя нетехническим экспертам создавать инновации в самых разных областях. В новой статье его команда показывает на примере образования, ка
2022 in Review & 2023 Goals
Юджин Ян подводит итоги 2022 года: спокойный год для семьи, путешествия (Сингапур, Ванкувер, Гавайи, Нью-Йорк) и взросление собаки Latte. Из целей выполнено частично: написал 18 из 26 постов (технические темы — bandits, counterfactual evalu
Autoencoders and Diffusers: A Brief Comparison
Юджин Ян сравнивает автоэнкодеры и диффузионные модели, показывая их сходства и ключевое различие. Автоэнкодеры — это нейросети, обученные воспроизводить вход на выходе через узкое горлышко (bottleneck), при этом существуют варианты: вариац
Counterfactual Evaluation for Recommendation Systems
Юджин Ян объясняет, почему стандартная оффлайн-оценка рекомендательных систем некорректна: мы используем наблюдательный подход, тогда как рекомендации — это интервенционная задача, ведь показанные товары меняют поведение пользователей. Альт
5 Lessons I Learned from Writing Online (Guest post by Susan Shu)
Гостевой пост Susan Shu на блоге Eugene Yan: пять уроков, которые она вынесла из ведения блога. Susan рассказывает, как привычка писать первые черновики без редактирования резко ускорила её работу, и почему важно просто начать публиковаться
Influencing without Authority for Data Scientists
Юджин Ян делится советами о том, как дата-сайентистам влиять на коллег без формальной власти, когда нужно добиться приоритизации задач у смежных команд (инфра, инженерия, продукт) или предложить улучшение, будучи новичком. Автор рекомендует
Bukalapak - Fireside Chat with the Data Science team
Юджин Ян делится опытом выступления на fireside chat с командой data science индонезийского e-commerce-единорога Bukalapak. Он рассуждает о том, является ли Data центром прибыли или затрат, и почему в e-commerce данные напрямую влияют на GM