Что такое нейросети простыми словами: полное объяснение

Краткое содержание:

Вы когда-нибудь задумывались, как ваш смартфон узнает ваше лицо, когда вы разблокируете его утром? Или почему «Алиса» и «Сири» вдруг начали понимать странные команды вроде «найди ближайшую шаурмичную, где нет лука»? А может, вы видели в интернете картину, написанную искусственным интеллектом, которая заняла первое место на художественном конкурсе, и подумали: «Это же просто компьютер, откуда у него фантазия?»

За всеми этими чудесами стоят они — нейросети. Звучит сложно, научно и даже немного страшно. Сразу представляются провода, горящие лампочки, «Терминатор» и восстание машин. Но давайте честно: нейросеть — это не магия, не разумное чудовище и даже не программа в классическом понимании. Это просто очень хитрый способ обрабатывать информацию, который подсмотрели у природы.

После прочтения этой статьи вы сможете объяснить пятикласснику, что такое нейросеть, и даже, возможно, придумаете, как применить её на своей работе или дома.

Кухонная аналогия, которая всё расставляет по местам

Представьте себе кухонный комбайн. Обычный, мощный, с кучей насадок. В него можно кинуть морковку, лук, свеклу и картошку, надеть насадку «крупная терка» — и на выходе получить миску ровно натертых овощей для окрошки. Это программа. У неё есть чёткая инструкция: крути ножом, размер куска — 5 миллиметров, не вздумай превращать всё в пюре.

А теперь представьте, что вы впервые учите ребенка готовить. Вы не даёте ему инструкцию «открой кран на 90 градусов, возьми нож под углом 45 градусов». Вы просто показываете ему 100 разных морковок: вот эта порезана правильно, вот эта — слишком толсто, а вот эту перекрутили в кашу. Ребёнок смотрит, пробует, ошибается, вы его поправляете. И в какой-то момент он начинает сам, без правил, понимать: «Ага, так резать хорошо, а так — плохо». И если вы дадите ему не морковку, а, скажем, кабачок — он не растеряется, потому что уловил принцип.

Вот этот «ребёнок», который учится на примерах, а не по жёстким алгоритмам, и есть нейросеть. Только внутри неё не кровь и нейроны, а математика, которую заставили подражать биологическому мозгу.

Маленькая математическая революция: почему «нейро»?

Слово «нейросеть» — это сокращение от «искусственная нейронная сеть». «Искусственная» — потому что наша, рукотворная, кремниевая. А «нейронная» — потому что она скопирована с того, как работают нервные клетки в вашей голове.

В вашем мозгу около 86 миллиардов нейронов. Каждый нейрон — это крошечная клетка, которая умеет получать сигналы от соседей, обрабатывать их и передавать дальше. Один нейрон сам по себе глуп, как муравей. Но когда 86 миллиардов муравьёв начинают одновременно шептаться, рождается мысль, эмоция, воспоминание о запахе пирожков из детства.

Искусственная нейросеть — это миллионы маленьких математических функций, соединённых в гигантскую паутину. У каждого такого «искусственного нейрона» есть входы (туда приходят числа), свои веса (коэффициенты важности) и выход (одно число, которое он отправит дальше).

Сначала эти веса случайные. Нейросеть похожа на новорождённого котёнка: всё делает невпопад. Но когда вы начинаете её тренировать — показываете тысячи примеров и подкручиваете веса так, чтобы ошибка становилась меньше — она постепенно «понимает» закономерности.

А можно ещё проще? Игрушечный пример с арбузами

Допустим, вы хотите научить нейросеть отличать спелый арбуз от зелёного. Для компьютера арбуз — это просто набор чисел: размер, цвет корки (в оттенках RGB), глубина звука при постукивании, наличие жёлтого бока.

Вы даёте нейросети 500 арбузов с подписями: «спелый» и «неспелый». Сначала сеть будет тыкать пальцем в небо. Но после тысяч корректировок её внутренние весы настраиваются так, что, увидев новый, 501-й арбуз, она с вероятностью 95% скажет правду.

Причём вы сами не сможете потом заглянуть в нейросеть и прочитать правило: «если зелёный оттенок меньше 34, а звук ниже 120 Гц — то спелый». Там не будет правил. Там будет клубок из миллионов чисел, который работает, но который человеческий мозг не в состоянии осознать напрямую. Это и есть «чёрный ящик», который одновременно пугает и восхищает.

Три главных типа нейросетей (на пальцах, без формул)

Чтобы окончательно разобраться, нужно знать, что нейросети бывают разными. Как животные: есть собаки, есть рыбы, есть птицы. Все они — животные, но устроены по-разному, потому что живут в разной среде.

1. Прямоточные сети (Feedforward) — «честный конвейер»

Самый простой вид. Информация втекает с одного конца, проходит через несколько слоёв искусственных нейронов (как через сито) и вылетает с другого конца. Никаких петель, возвратов, хитростей.

Аналогия: заводская лента. Вы кладёте деталь — она проезжает через станки сверления, шлифовки, покраски — и на выходе готовый болт.

Где используют: предсказание цен на квартиры (входные данные — метраж, этаж, район; выход — цена), диагностика болезней по анализам, оценка кредитного рейтинга. Всё, где нужно по набору признаков дать один ответ.

2. Свёрточные сети (CNN) — «специалист по картинкам»

Это подвид прямоточных, но с особой архитектурой. У них есть слои, которые умеют выделять края, углы, текстуры, а потом собирать из них осмысленные объекты — усы, колёса, глаза, буквы.

Аналогия: художник-копировщик, который сначала делает общий набросок, потом прорисовывает крупные детали, потом мелкие царапины, и в конце видит всю картину целиком.

Где используют: распознавание лиц, определение породы собаки по фото, поиск дефектов на заводской детали, медицинские снимки (найти опухоль на МРТ). Именно свёрточные сети научились читать рукописный текст и переводить изображения в стиль Ван Гога.

3. Рекуррентные сети (RNN и LSTM) — «памятливые болтуны»

Здесь появляются обратные связи. Нейрон может отправить сигнал не только вперёд, но и… самому себе в прошлое. Благодаря этому сеть обладает чем-то похожим на кратковременную память.

Аналогия: вы читаете книгу. Вы помните, что произошло 5 страниц назад, и это влияет на то, как вы поймёте текущую страницу. Если вы видите слово «он», то знаете, что речь о Петре, потому что помните предыдущие предложения.

Где используют: генерация текста (Яндекс.Новости пишут короткие заметки), переводчики (Google Translate), диалоговые системы, предсказание временных рядов (курс акций, погода на завтра).

Тёмная материя нейросетей: обучение с учителем и без

Самое интересное и самое пугающее для новичка — это то, как нейросеть учится. Тут есть два лагеря, как в педагогике: строгая школа и свободное плавание.

Обучение с учителем (supervised learning)

Вы выступаете в роли строгого преподавателя. У вас есть набор данных, где для каждого примера уже известен правильный ответ. Тысячи фотографий с подписью «кот», тысячи — «не кот». Тысячи писем с пометкой «спам» и «не спам».

Нейросеть делает предположение, вы говорите: «Неправильно, это кот!», сеть чуть-чуть подкручивает свои внутренние веса, пробует снова. Процесс повторяется, пока ошибка не станет крошечной.

Минус: нужна огромная размеченная база. Кто-то должен вручную подписать 10 000 рентгеновских снимков фразой «есть перелом» или «нет перелома».

Плюс: результат обычно очень точный и предсказуемый.

Обучение без учителя (unsupervised learning)

Вы просто скармливаете нейросети кучу данных без всяких подписей. И говорите: «Давай, дружок, найди в этом сам какие-нибудь закономерности, группы, кластеры».

И сеть начинает группировать. Например, скормить ей миллион новостных статей без меток — и она сама разделит их на спортивные, политические, светские хроники. Или дать ей историю покупок в супермаркете — она найдёт, что люди, берущие пиво, часто берут и чипсы. Именно так работают рекомендательные системы Amazon и Netflix: никто не учил сеть, что «любителям триллеров нравятся фильмы с Брэдом Питтом» — она сама это увидела.

Минус: результат может быть странным и неинтуитивным. Нейросеть может объединить статьи про футбол и про политику, если в них часто встречается слово «бюджет» (трансферные бюджеты клубов).

Плюс: не нужна ручная разметка, можно работать с гигантскими объёмами сырых данных.

Обучение с подкреплением (reinforcement learning) — «как дрессировка пса»

Тут всё как в игре. Есть агент (нейросеть), есть среда (например, компьютерная игра), есть награда и наказание. Сеть совершает действия, получает «плюсик» или «минусик» и постепенно учится вести себя так, чтобы набрать максимум очков.

Знаменитый пример: нейросеть DeepMind научилась играть в Atari, просто смотря на пиксели экрана и получая счёт. Она играла лучше любого человека, иногда находя баги в игре, о которых не знали даже разработчики. А потом AlphaGo обыграла чемпиона мира в го — игру, где вариантов ходов больше, чем атомов во Вселенной.

Откуда берутся эти пугающие 99% уникальности? Или что значит «нейросеть пишет сама»

Вы, наверное, слышали фразы: «Нейросеть написала музыку в стиле Баха», «Нейросеть нарисовала портрет, который продали за 400 тысяч долларов». Как это работает, если у сети нет души, чувств и не было детства в Сальсбурге?

Секрет в том, что нейросеть не «творит» в человеческом смысле. Она обобщает и комбинирует. Её кормили тысячами произведений Баха. Она выучила статистические закономерности: какие ноты за какими идут, какие интервалы характерны для фуги, как строится модуляция. А потом просто запускают генератор случайных чисел, подчинённый этим правилам. Получается музыка, которую 99% слушателей не отличат от настоящего Баха.

С текстами то же самое. Нейросеть, обученная на миллионах книг, статей и постов в соцсетях, умеет подбирать слова так, чтобы они были грамматически правильными, стилистически гладкими и даже… эмоциональными? Нет, она не чувствует радость. Просто в её обучающей выборке слова «сияющий» и «день» часто встречались с позитивными отзывами, а «тёмный» и «дождь» — с негативными. Она имитирует эмоцию, как попугай, который говорит «я тебя люблю», но не влюблён.

А что внутри? Билет в один конец под названием «веса и смещения»

Давайте всё же чуть-чуть заглянем под капот, но без интегралов. Представьте, что у вас есть ручка громкости. У каждого входа нейрона есть своя ручка — вес. Вес может быть положительным (усиливает сигнал) или отрицательным (ослабляет). Ещё есть смещение — это как такая базовая громкость фонового шума, которая всегда есть.

Когда на входы нейрона приходят числа, он умножает каждое на соответствующий вес, суммирует, прибавляет смещение. А потом прогоняет полученную сумму через функцию активации — специальную математическую дверь, которая либо пропускает сигнал дальше, либо говорит: «тихо, слишком слабо».

Например, самая популярная функция активации называется ReLU. Она работает по принципу: «если число положительное — пропусти как есть, если отрицательное — преврати в ноль». Грубо, но эффективно.

Тысячи таких нейронов, соединённых слоями, создают сеть. Когда вы тренируете сеть, вы миллиарды раз подкручиваете эти веса на крошечную величину — каждый раз, когда ответ оказался неправильным. Итоговая таблица весов — это и есть «знания» нейросети. Если вы сохраните эту таблицу в файл, у вас будет готовая обученная сеть, которую можно запустить где угодно.

Боль больная: почему нейросеть не думает и никогда не будет

Это самый важный пункт для тех, кто боится Скайнет. Нейросеть — это статистический инструмент, а не мыслящее существо. У неё нет:

Сознания.
Желаний.
Страха смерти.
Понятия «я».

Она просто находит корреляции в данных. Если в обучающей выборке все преступники были с бородой, нейросеть решит, что борода — признак преступника. Она не способна сказать: «Эй, это же несправедливо, корреляция не равна причинности». Она честно выдаст то, чему её научили.

Именно поэтому нейросети могут быть сексистскими, расистскими и глупыми. Не потому, что они злые, а потому, что они отражают предрассудки, которые были в данных, на которых их тренировали. Если кормить сеть фото врачей, где 90% — мужчины, она «запомнит», что врач — это мужская профессия. И это не ошибка сети, это ошибка человека, который собрал такую выборку.

Где нейросети уже незаметно живут в вашей жизни (и вы этого не замечаете)

Вы думаете: «Ну, всё это игрушки, пусть учёные развлекаются». А нет. Каждый день вы используете десятки нейросетей, даже не подозревая об этом.

Смартфон:

Камера, которая размывает фон — это нейросеть, которая нашла на фото лицо и отделила его от заднего плана.
Распознавание лиц для разблокировки — свёрточная сеть, обученная на миллионах лиц.
Автозамена слов в клавиатуре — маленькая рекуррентная сеть, которая предсказывает следующее слово.
Голосовой помощник переводит ваш звук в текст (нейросеть), понимает команду (другая нейросеть), синтезирует ответ (третья).

Интернет:

Лента в Instagram, TikTok, YouTube — сплошная нейросеть, которая предсказывает, какое видео вы досмотрите до конца.
Поиск Google — там тоже нейросети ранжируют страницы и понимают смысл запроса (даже если вы написали с ошибками).
Антиспам в почте — классическая нейросеть, обученная на миллионах писем.

Банковские приложения, которые блокируют подозрительный перевод — сеть заметила, что этот перевод не похож на ваши обычные транзакции.

Медицина:
Нейросети уже сейчас читают МРТ точнее, чем врач-рентгенолог средней руки. Они замечают микро-метастазы, которые человеческий глаз пропускает. Причём сеть не устаёт, не отвлекается и не просит кофе.

Промышленность:
На заводах нейросети смотрят на тысячи болтов, пролетающих по конвейеру, и отбраковывают те, где есть царапина в 0,1 мм — быстрее и точнее любого инспектора.

Как создать свою нейросеть (и не сойти с ума)? Очень краткий ликбез

Вы уже, наверное, захотели попробовать. Хорошая новость: сегодня написать нейросеть может даже школьник. Плохая новость: для серьёзных задач нужно железо и терпение.

Минимальный рецепт:

Выбрать инструмент. Самый популярный — Python с библиотекой TensorFlow или PyTorch. Они бесплатные.
Собрать данные. Если учим сеть отличать кошек от собак — качаем 10 000 фото каждого вида.
Разметить данные. Программа должна знать, на каких фото кто.
Написать архитектуру. Сказать: «У меня будет 3 свёрточных слоя, затем 2 полносвязных».
Запустить обучение. Это может длиться от 10 минут на простом ноутбуке до месяца на кластере из тысячи видеокарт.
Проверить. Дать сети новые фото, которых она не видела, и посчитать процент ошибок.

Звучит как кодинг? Да. Но существуют и визуальные конструкторы (например, Google Colab, Ludwig), где можно собрать нейросеть мышкой, как конструктор LEGO. И даже онлайн-сервисы без программирования: Teachable Machine от Google — вы показываете камере «яблоко» и «апельсин», и через минуту нейросеть готова.

Подводные камни: почему нейросеть может взбесить

Нейросеть — это не серебряная пуля. У неё есть слабые места, о которых молчат маркетологи.

1. Нужны горы данных. Чтобы обучить сеть узнавать редкое заболевание, нужно несколько тысяч снимков этого заболевания. А где их взять, если болезнь встречается у одного человека на миллион?

2. Нейросеть — обжора. Обучение большой сети (как GPT-4) сжигает столько электроэнергии, сколько небольшой город за месяц. И стоят такие тренировки миллионы долларов.

3. Переобучение (overfitting). Самая частая болезнь. Сеть выучила тренировочные примеры наизусть, как зубрила, но как только вы даёте ей новый пример — она в ступоре. Это как ученик, который выучил билеты к экзамену, но не понял предмета.

4. Состязательные атаки. Вы можете обмануть нейросеть. Наклеить на знак «Стоп» специальные полоски-наклейки, и автопилот увидит вместо знака «Ограничение скорости 80». Или подшуметь на фото совы чуть-чуть, и сеть решит, что это — тостер.

5. Невозможность объяснить решение. Нейросеть сказала банку «не давать кредит». Почему? А чёрт её знает. Может, из-за почтового индекса, а может, из-за того, что в анкете было слово «велосипед». Это огромная этическая проблема для судов и медицины.

Будущее, которое уже наступило: генеративные нейросети

Самая горячая тема последних двух лет — генеративные сети. Это те самые, которые рисуют «жирафа в скафандре на фоне Эйфелевой башни» по текстовому запросу (Midjourney, DALL-E, Kandinsky).

Как они работают? Они состоят из двух частей: генератора и дискриминатора. Генератор пытается создать картинку, похожую на настоящую, а дискриминатор пытается отличить подделку от реальных фотографий из обучающей выборки. Они соревнуются, как фальшивомонетчик и полицейский. В итоге генератор учится подделывать так хорошо, что дискриминатор сдаётся.

Эти сети вызвали культурный переворот. Сейчас любой человек с фантазией может создать иллюстрацию, не умея рисовать. Архитектор может сгенерировать 100 вариантов фасада за минуту. Дизайнер одежды — набросать коллекцию. Да, это породило споры о копирайте и авторских правах, но остановить прогресс уже нельзя.

Так нейросеть — это друг или враг?

Самое разумное отношение к нейросетям — как к мощной электродрели. Сама по себе дрель не хорошая и не плохая. В руках стоматолога она лечит зубы, в руках террориста — пытает. Нейросеть — это инструмент усиления интеллекта, как автомобиль — инструмент усиления ног, а телескоп — инструмент усиления глаз.

Она уже помогла расшифровать древние свитки Геркуланума, которые не читали 2000 лет. Она предсказывает трёхмерную структуру белков, что ускорит создание лекарств от рака. Она помогает искать новые планеты, анализируя колебания яркости звёзд.

Но она же может генерировать реалистичные дипфейки, где лицо одного человека подставлено другому. Может писать вирусы, которые мутируют, чтобы избежать антивирусов. Может с высокой вероятностью определять сексуальную ориентацию по фото лица (это уже сделали в Стэнфорде — и сразу убрали результат, потому что этично ли это?).

Поэтому правильный ответ: нейросеть — это просто математика. А вот что с этой математикой сделают люди — вопрос к нам самим.

Подводим черту

Если вы забыли всё, что прочитали выше, запомните эти пять пунктов — и вы будете знать о нейросетях больше, чем 90% населения:

Нейросеть не пишет код, а учится на примерах. Ей не нужны правила «если — то», ей нужны тысячи образцов.
Внутри неё нет магии, а есть веса и слои. Миллионы чисел, которые подкручиваются в процессе обучения.
Нейросеть не думает, а коррелирует. Она находит статистические связи, а не причинно-следственные.
Сеть настолько умна, насколько умны её данные. Мусор на входе — мусор на выходе.
Вы уже пользуетесь нейросетями. Каждый раз, когда набираете текст, ищете картинки или говорите с колонкой.

Вместо послесловия: не бойтесь, а пользуйтесь

Пять лет назад нейросети были уделом академических институтов и Google. Сейчас скрипт из 10 строк на Python с использованием готовой нейросети может сделать то, за что раньше платили команде из 10 дизайнеров неделю. Это демократизация технологий.

Вы можете не писать ни строчки кода, но понимать принцип — уже огромное преимущество. Потому что через пару лет нейросети будут вбиты в каждый офисный пакет, каждый фоторедактор, каждую бухгалтерскую программу. Те, кто поймёт их логику («им нужно много хороших примеров, они не волшебные, они усиливают то, что уже есть»), будут управлять этими инструментами. Те, кто не поймёт, будут считать, что «компьютер опять глючит».

Нейросеть — это не замена человеческому мозгу. Это молоток для ума. А хороший ли вы кузнец — зависит только от вас.

Теперь, когда кто-то спросит вас «Что такое нейросеть?», вы не будете лепетать про «алгоритмы машинного обучения», а скажете просто:

«Это способ научить компьютер делать что-то, показав ему много примеров, а не прописывая правила. Как объяснить ребёнку, что такое кошка, показав 100 кошек, а не прочитав лекцию о генетике Felis catus».