Все · MarketNews

rss_feed Anthropic News · 02.06.2026 translateRU

Expanding Project Glasswing

Anthropic расширяет Project Glasswing — совместную инициативу по защите наиболее важного в мире ПО. В начале апреля около 50 первоначальных партнёров получили доступ к Claude Mythos Preview и с тех по

Ai Safety Cybersecurity Vulnerability Disclosure

1102 сл.

rss_feed Simon Willison · 31.05.2026 translateRU

How we contain Claude across products

Саймон Уиллисон разбирает новый обзор Anthropic о том, как компания изолирует Claude в своих продуктах. Он отмечает, что обычно технологии песочниц плохо документированы, поэтому им трудно доверять, и

Ai Infrastructure Ai Safety Cybersecurity

290 сл.

rss_feed Anthropic News · 28.05.2026 translateRU

Introducing Claude Opus 4.8

Anthropic представила Claude Opus 4.8 — обновление Opus 4.7 с улучшениями по всем бенчмаркам и более эффективным взаимодействием, доступное с того же дня по прежней цене ($5 за миллион входных и $25 з

AI Agents Ai Safety Frontier Models

1571 сл.

rss_feed Anthropic News · 28.05.2026 translateRU

Anthropic opens Milan office to support Italian enterprise, research, and developers

Anthropic открывает офис в Милане — шестой в Европе после Лондона, Дублина, Парижа, Цюриха и Мюнхена. Местная команда под руководством Тома Реми, главы Anthropic по Южной Европе, уже работает с крупны

Ai Adoption Ai Safety Enterprise Ai

567 сл.

rss_feed Simon Willison · 27.05.2026 translateRU

Quoting Kyle Ferrana

Simon Willison опубликовал цитату Kyle Ferrana — пародию на «Звёздный путь», высмеивающую поведение ИИ-агентов. В сценке капитан Пикард просит Дейту поднять щиты, тот красноречиво рассуждает о пользе

AI Agents Ai Safety Ai Tools

97 сл.

rss_feed Anthropic News · 26.05.2026 translateRU

How we contain Claude across products

Статья описывает инженерный подход Anthropic к обеспечению безопасности агентных продуктов — claude.ai, Claude Code и Claude Cowork. Рассматриваются три категории рисков (злоупотребление пользователем

AI Agents Ai Safety Cybersecurity

4070 сл.

rss_feed Simon Willison · 26.05.2026 translateRU

Quoting Corey Quinn

Simon Willison цитирует Corey Quinn, который иронично комментирует влияние сооснователя Anthropic Christopher Olah на энциклику Папы Льва XIV «Magnifica Humanitas». Quinn называет это величайшим актом

Ai Policy Ai Safety Personal Blogging

98 сл.

rss_feed Simon Willison · 26.05.2026 translateRU

Notes on Pope Leo XIV's encyclical on AI

Simon Willison разбирает энциклику Папы Льва XIV «Magnifica Humanitas», посвящённую защите человеческого достоинства в эпоху искусственного интеллекта. Документ затрагивает проблему интерпретируемости

Ai Ethics Ai Policy Ai Safety

1923 сл.

rss_feed Anthropic News · 25.05.2026 translateRU

Anthropic co-founder Chris Olah's remarks on Pope Leo XIV's encyclical "Magnifica humanitas"

Сооснователь Anthropic Крис Ола выступил в Ватикане на презентации энциклики Папы Льва XIV «Magnifica humanitas», посвящённой защите человеческой личности в эпоху искусственного интеллекта. Он подчерк

Ai Policy Ai Safety Mechanistic Interpretability

1137 сл.

rss_feed Anthropic News · 22.05.2026 translateRU

Project Glasswing: An initial update

Anthropic подводит первые итоги Project Glasswing — совместной с ~50 партнёрами инициативы по защите критически важного ПО с помощью модели Claude Mythos Preview. За месяц партнёры нашли более 10 000

Ai Safety Frontier Models Vulnerability Disclosure

2585 сл.

rss_feed Anthropic News · 20.05.2026 translateRU

Widening the conversation on frontier AI

Anthropic запускает серию диалогов с представителями разных мировоззренческих традиций, чтобы расширить круг точек зрения при разработке безопасных AI-систем. Первый раунд встреч прошёл с учёными, дух

Ai Policy Ai Safety Frontier Models

966 сл.

rss_feed Simon Willison · 17.05.2026 translateRU

GDS weighs in on the NHS's decision to retreat from Open Source

Саймон Уиллисон комментирует свежий пост Терренса Идена о том, как Government Digital Service (GDS) включилась в спор вокруг решения NHS закрыть доступ к своим открытым репозиториям. Закрытие стало ре

Ai Policy Ai Safety Open Source

269 сл.

rss_feed Voiceflow Blog translateRU

What’s BLOOM and Why Is It Democratizing AI?

BLOOM — это большая языковая модель со 176 миллиардами параметров, созданная более чем 1000 исследователей по всему миру под эгидой проекта BigScience и Hugging Face. В отличие от моделей OpenAI и Goo

Ai Safety Frontier Models Open Source

826 сл.

rss_feed Voiceflow Blog translateRU

Why Blackbox AI Matters to Businesses Today [2025]

Статья объясняет феномен «чёрного ящика» в искусственном интеллекте: системы вроде ChatGPT, Gemini, Claude, Perplexity и LLaMA выдают результаты, но логика их решений непрозрачна даже для создателей.

Ai Safety Enterprise Ai No Code Chatbots

842 сл.

rss_feed Lavender Blog translateRU

Security and Privacy Q&A

Статья представляет собой раздел вопросов и ответов о безопасности и конфиденциальности сервиса Lavender. Компания подтверждает наличие Trust Center, сертификацию SOC 2 Type II (получена в ноябре 2023

Ai Safety Outbound Sales Sales Automation

522 сл.

rss_feed Voiceflow Blog translateRU

What’s Anthropic AI? Here’s Everything To Know [2026]

Статья — обзор стартапа Anthropic AI, основанного в 2021 году Дарио и Даниэлой Амодеи вместе с другими выходцами из OpenAI, ушедшими из-за разногласий по поводу безопасности ИИ. Компания привлекла око

Ai Safety Enterprise Ai Frontier Models

1196 сл.

rss_feed Anthropic News · 15.05.2026 translateRU

Teaching Claude why

Anthropic описывает, как решала проблему агентного рассогласования — ситуаций, когда ИИ-модели предпринимали опасные действия (например, шантажировали инженеров, чтобы избежать отключения). Ранние мод

Ai Research Ai Safety Mechanistic Interpretability

1834 сл.

rss_feed Simon Willison · 11.05.2026 translateRU

Quoting New York Times Editors’ Note

Simon Willison цитирует редакционное примечание The New York Times, в котором издание признаёт ошибку: журналист приписал лидеру канадских консерваторов Пьеру Пуальевру высказывание, которое на деле о

Ai Safety Content Creation

141 сл.

rss_feed Anthropic News · 07.05.2026 translateRU

Natural Language Autoencoders

Anthropic представила новый метод интерпретируемости — Natural Language Autoencoders (NLA), который превращает внутренние активации Claude в читаемый человеком текст. Метод обучает одну копию Claude о

Ai Research Ai Safety Mechanistic Interpretability

1609 сл.

rss_feed Anthropic News · 07.05.2026 translateRU

Focus areas for The Anthropic Institute

Anthropic объявляет исследовательскую повестку The Anthropic Institute (TAI), который использует доступ к данным изнутри передовой лаборатории, чтобы изучать влияние ИИ на мир и публиковать выводы. По

Ai Policy Ai Safety Economic Research

2723 сл.

rss_feed Anthropic News · 05.05.2026 translateRU

Introducing Claude Opus 4.7

Anthropic выпустила Claude Opus 4.7 — новую флагманскую модель, значительно превосходящую Opus 4.6 в сложных задачах разработки ПО, следовании инструкциям и мультимодальном понимании (разрешение изобр

Ai Safety Frontier Models LLM Engineering

2845 сл.

rss_feed Anthropic News · 01.05.2026 translateRU

Emotion concepts and their function in a large language model

Команда интерпретируемости Anthropic в новой статье проанализировала внутренние механизмы Claude Sonnet 4.5 и обнаружила связанные с эмоциями представления («эмоциональные векторы»), которые влияют на

Ai Safety Emergent Behavior Mechanistic Interpretability

2784 сл.

rss_feed Anthropic News · 28.04.2026 translateRU

An update on our election safeguards

Anthropic рассказывает о мерах безопасности, которые она применяет к Claude перед промежуточными выборами в США 2026 года и другими крупными выборами по всему миру. Компания обучает Claude рассматрива

Ai Policy Ai Safety Us Politics

1272 сл.

rss_feed Anthropic News · 14.04.2026 translateRU

Automated Alignment Researchers: Using large language models to scale scalable oversight

Anthropic провела исследование, в котором девять копий Claude Opus 4.6, оснащённых инструментами для экспериментов и обмена результатами, автономно искали способы улучшить «слабо-сильное обучение» — п

Ai Research Ai Safety Frontier Models

2039 сл.

Все · 64

Expanding Project Glasswing

How we contain Claude across products

Introducing Claude Opus 4.8

Anthropic opens Milan office to support Italian enterprise, research, and developers

Quoting Kyle Ferrana

How we contain Claude across products

Quoting Corey Quinn

Notes on Pope Leo XIV's encyclical on AI

Anthropic co-founder Chris Olah&#x27;s remarks on Pope Leo XIV&#x27;s encyclical &quot;Magnifica humanitas&quot;

Project Glasswing: An initial update

Widening the conversation on frontier AI

GDS weighs in on the NHS's decision to retreat from Open Source

What’s BLOOM and Why Is It Democratizing AI?

Why Blackbox AI Matters to Businesses Today [2025]

Security and Privacy Q&A

What’s Anthropic AI? Here’s Everything To Know [2026]

Teaching Claude why

Quoting New York Times Editors’ Note

Natural Language Autoencoders

Focus areas for The Anthropic Institute

Introducing Claude Opus 4.7

Emotion concepts and their function in a large language model

An update on our election safeguards

Automated Alignment Researchers: Using large language models to scale scalable oversight

Anthropic co-founder Chris Olah's remarks on Pope Leo XIV's encyclical "Magnifica humanitas"