Все 90
How to Run a Weekly Paper Club (and Build a Learning Community)
Юджин Ян рассказывает, как за 18 месяцев Latent Space Paper Club без единого пропуска проводил еженедельные разборы статей — суммарно более 80 работ по ключевым компонентам, моделям, обучению, инференсу и практике LLM. Формат прост: каждую
Innovation through prompting
Итан Моллик рассуждает о том, как промпты для LLM становятся «программами на естественном языке», позволяя нетехническим экспертам создавать инновации в самых разных областях. В новой статье его команда показывает на примере образования, ка
2022 in Review & 2023 Goals
Юджин Ян подводит итоги 2022 года: спокойный год для семьи, путешествия (Сингапур, Ванкувер, Гавайи, Нью-Йорк) и взросление собаки Latte. Из целей выполнено частично: написал 18 из 26 постов (технические темы — bandits, counterfactual evalu
Autoencoders and Diffusers: A Brief Comparison
Юджин Ян сравнивает автоэнкодеры и диффузионные модели, показывая их сходства и ключевое различие. Автоэнкодеры — это нейросети, обученные воспроизводить вход на выходе через узкое горлышко (bottleneck), при этом существуют варианты: вариац
How to create a profitable Freemium startup (spreadsheet model included!) at andrewchen
Эссе Эндрю Чена с прилагаемой Excel-моделью разбирает экономику freemium-стартапов. Ключевое уравнение прибыльности: Lifetime Value > Cost per Acquisition + Cost of Service для платных и бесплатных пользователей. Автор последовательно прохо
Counterfactual Evaluation for Recommendation Systems
Юджин Ян объясняет, почему стандартная оффлайн-оценка рекомендательных систем некорректна: мы используем наблюдательный подход, тогда как рекомендации — это интервенционная задача, ведь показанные товары меняют поведение пользователей. Альт
5 Lessons I Learned from Writing Online (Guest post by Susan Shu)
Гостевой пост Susan Shu на блоге Eugene Yan: пять уроков, которые она вынесла из ведения блога. Susan рассказывает, как привычка писать первые черновики без редактирования резко ускорила её работу, и почему важно просто начать публиковаться
Influencing without Authority for Data Scientists
Юджин Ян делится советами о том, как дата-сайентистам влиять на коллег без формальной власти, когда нужно добиться приоритизации задач у смежных команд (инфра, инженерия, продукт) или предложить улучшение, будучи новичком. Автор рекомендует
Bukalapak - Fireside Chat with the Data Science team
Юджин Ян делится опытом выступления на fireside chat с командой data science индонезийского e-commerce-единорога Bukalapak. Он рассуждает о том, является ли Data центром прибыли или затрат, и почему в e-commerce данные напрямую влияют на GM
Choosing Problems in Data Science and Machine Learning
Юджин Ян разбирает, как выбирать задачи для команды дата-сайентистов: из 20 задач отобрать 3-8 для 8 человек. Основной инструмент — cost-benefit анализ, где выгода измеряется ростом выручки или сокращением затрат, с учётом охвата (extent) и
How Reading Papers Helps You Be a More Effective Data Scientist
Юджин Ян рассказывает, как чтение научных статей делает дата-сайентиста эффективнее. Он приводит пример коллеги, которая, прочитав о подходе LinkedIn (kNN + SVM для очистки меток), помогла команде довести точность классификатора продуктов д
What I Did Not Learn About Writing In School
Юджин Ян рассказывает о том, чему его не научили в школе по поводу нон-фикшн писательства. Главные уроки: писательство — это на 80% подготовка (чтение, заметки, наблюдения) и лишь на 20% сам процесс письма; писательство трудно для всех, вкл
How to Apply Crocker's Law for Feedback and Growth
Юджин Ян рассказывает о Законе Крокера — принципе, при котором человек сам отвечает за свою реакцию на критику и просит давать обратную связь без обёртки. Тоби Лютке, CEO Shopify, называет фидбэк подарком, который двигает дело вперёд. Автор
OMSCS CS6750 (Human Computer Interaction) Review and Tips
Юджин Ян рассказывает о своём опыте прохождения летом 2019 года курса CS6750 (Human-Computer Interaction) в рамках программы OMSCS Georgia Tech у профессора David Joyner. Курс почти не содержит программирования, зато требует много письменно
10 lessons from a serial entrepreneur – Justin Kan, Atrium, YC, and Twitch at andrewchen
Эндрю Чен делится конспектом интервью с Джастином Каном — серийным предпринимателем, сооснователем Kiko, Justin.tv, Twitch (продан Amazon), Socialcam, бывшим партнёром YC, а ныне основателем Atrium, юридической фирмы для стартапов и одной и
DATAx - A Production ML system for SEA's Biggest Hospital Group
Юджин Ян рассказывает о выступлении на конференции DATAx, где представил кейс uCare.ai и Parkway Pantai Group — крупнейшей сети больниц Юго-Восточной Азии. Команда разработала ML-систему, которая прогнозирует итоговую сумму счёта пациента е
The red flags and magic numbers that investors look for in your startup’s metrics – 80 slide deck included! at andrewchen
Эндрю Чен, ставший General Partner в Andreessen Horowitz, делится 80-слайдовой презентацией со своего интервью в фонд — о том, как применять навыки роста для оценки стартапов. Он критикует поверхностное чтение кривых «вверх и вправо» и пред
SMU - What is Data Analytics and How do I get into it?
Юджин Ян рассказывает о своём выступлении в Singapore Management University по приглашению Business Intelligence and Analytics Club. Аудиторию составляли студенты бакалавриата, в основном без технического бэкграунда. Он отвечал на вопросы: