ии-раздеватор: результаты 5 типов фото
Теория — это хорошо, но что по факту? Мы провели серию тестов с разными типами исходных фотографий и фиксируем честные результаты: какие сценарии дают отличный результат, какие — приемлемый, а каких лучше избегать.
Методология тестирования
Для каждого из пяти сценариев было проведено по 10 независимых генераций в режиме HD с настройками по умолчанию (DPM++ 30 шагов, CFG 7.5, авторежим). Оценка производилась по трём критериям: точность сегментации (насколько чисто убрана одежда), анатомическая корректность (пропорции, форма тела) и согласованность стыка (насколько естественно сгенерированная область переходит в незамаскированные части фото). Каждый критерий оценивался по шкале от 1 до 5, итоговая оценка — средняя по трём критериям.
Все тесты проводились на реальных фотографиях с разрешением от 1280×960 до 3024×4032 пикселей. Фото предоставлены совершеннолетними добровольцами, давшими явное согласие на использование в технических испытаниях.
Кейс 1: студийный портрет, облегающая одежда
Это идеальный сценарий для ии-раздеватора, и результаты подтверждают это математически. Фронтальный портрет при студийном мягком освещении, облегающий топ или платье без сложных складок и слоёв — именно для таких условий оптимизирована модель.
Сегментация показала практически безупречный результат: края маски точно совпадали с границами одежды даже на тонких бретельках. Анатомия генерировалась правдоподобно, со сбалансированными пропорциями. Стык в зонах перехода — на плечах, вокруг шеи — был практически незаметен.
Итоговая оценка: 4.7/5. Главный вывод: если у вас есть возможность выбирать фото, выбирайте именно этот сценарий. Результат воспроизводится стабильно от генерации к генерации с минимальными вариациями.
Кейс 2: полный рост, уличное фото
Уличная съёмка в полный рост — это реалистичный сценарий, с которым чаще всего работают пользователи. Здесь условия значительно сложнее: естественное освещение с боковыми тенями, ненулевой шум сенсора смартфона, фон с различными объектами.
Сегментация справилась хорошо в большинстве случаев — 8 из 10 генераций дали чистую маску. В двух случаях алгоритм «захватил» части фона рядом с силуэтом. Анатомия в целом корректная, хотя нижняя часть тела — бёдра, ноги — генерировалась с несколько большими вариациями. Это ожидаемо: при съёмке в полный рост верхняя часть тела занимает меньше пикселей, предоставляя сегментатору меньше деталей для работы.
Итоговая оценка: 4.2/5. Вывод: уличное фото в полный рост работает хорошо, особенно если фигура хорошо видна и не перекрыта объектами на переднем плане. Для наилучшего результата перед загрузкой рекомендуется кадрировать по пояс или по грудь.
Кейс 3: нестандартный ракурс — съёмка сзади и под углом
Именно этот сценарий вызывает наибольший интерес у технически любопытных пользователей: сможет ли модель корректно обработать фото не в анфас? Мы тестировали три варианта: профиль (90 градусов), три четверти (45 градусов) и фото сзади.
Профиль и три четверти NudeKit v3.4 обрабатывает заметно лучше предыдущих версий — именно благодаря интеграции ControlNet. Pose-детектор успешно восстанавливал скелетную карту даже при боковых ракурсах, и анатомия выглядела органично. Проблемы возникали в случае значительного перекрытия — например, когда поднятая рука закрывала часть торса.
Съёмка строго сзади — отдельная история. OpenPose теряет часть ключевых точек при фронтальном отсутствии лица и части скелета. Модель компенсирует это статистической приоритизацией наиболее вероятной позы, но вариабельность результатов заметно выше.
Итоговая оценка: 3.8/5 для профиля и три четверти; 3.1/5 для съёмки строго сзади. Вывод: нестандартные ракурсы работают значительно лучше, чем в 2024–2025 годах, но строго задняя съёмка остаётся проблемной зоной. Рекомендуется делать несколько генераций и выбирать лучшую.
Кейс 4: фото при плохом освещении — вечер, искусственный свет
Это сценарий, который чаще всего приводит к разочарованию новых пользователей. Вечерние фото при тёплом жёлтом освещении, с ресторанной подсветкой, в ночных клубах — всё, где баланс белого нарушен, а шум велик.
Главная проблема здесь не в сегментации (с ней справляется SegFormer даже при шуме), а в определении тона кожи. Жёлтый или красный оттенок от искусственного освещения смещает автоопределение тона, что может приводить к несоответствию между цветом кожи в замаскированных и незамаскированных зонах.
Решение: при загрузке фото с нестандартным освещением рекомендуется вручную задать тон кожи через ручные настройки бота. Это снижает вероятность цветового рассогласования с 40% до примерно 8%.
Итоговая оценка: 3.4/5 в авторежиме, 4.1/5 при ручном задании тона. Вывод: фото при плохом освещении обрабатываемо, но требует ручной коррекции настроек для стабильного результата.
Кейс 5: групповое фото — несколько человек в кадре
Мы намеренно включили этот сценарий, чтобы зафиксировать реальное поведение системы — и честно предупредить пользователей. NudeKit оптимизирован для работы с одной фигурой, и это не просто маркетинговая оговорка.
При загрузке группового фото сегментатор пытается определить «главную» фигуру — обычно ту, что занимает наибольшую площадь в кадре или расположена по центру. Маска строится только для неё. Однако близкое расположение других людей нередко приводит к «подхвату» частей их одежды или тел в маску.
Анатомия при групповом сценарии также страдает: ControlNet получает смешанную скелетную карту из нескольких поз, что дезориентирует генератор. Результаты нестабильны и часто содержат заметные артефакты.
Итоговая оценка: 2.3/5. Вывод: групповые фото категорически не подходят для ии-раздеватора в текущей версии. Если нужно обработать конкретного человека из группы — обрежьте фото до одной фигуры перед загрузкой. Это простое действие поднимет качество до уровня кейса 2.
Сравнительная таблица сценариев
Подведём итоги тестирования в структурированном виде. Студийный портрет в облегающей одежде — оценка 4.7, рекомендован без оговорок. Уличное фото в полный рост — оценка 4.2, рекомендован, лучше кадрировать по пояс. Нестандартный ракурс (профиль, 3/4) — оценка 3.8, работает, делать несколько генераций. Фото при плохом освещении — оценка 3.4 авто / 4.1 с ручным тоном, требует ручной настройки. Групповое фото — оценка 2.3, не рекомендован, сначала обрезать до одной фигуры.
Практические рекомендации по итогам тестов
На основании проведённых тестов можно сформулировать несколько практических правил, которые помогут получить максимальный результат в любом сценарии. Первое: чем ближе ваши условия к кейсу 1 (студийный портрет, облегающая одежда, хорошее освещение), тем лучше будет результат. Второе: для всех нестандартных сценариев делайте не одну, а 2–3 генерации и выбирайте лучшую — вариабельность диффузии работает в вашу пользу. Третье: ручная настройка тона кожи критична при нестандартном освещении. Четвёртое: обрезка фото до одной фигуры перед загрузкой — самое простое улучшение, дающее ощутимый прирост качества. Пятое: режим HD стоит своей цены — разница в детализации между стандартным и HD-режимом значительно заметнее на нестандартных сценариях, чем на идеальных условиях.
Проверьте свой сценарий прямо сейчас
3 бесплатные HD-генерации. Без регистрации, без карты.
Открыть @DreamNeuroPhoto_Botии-раздеватор: как работает diffusion-пайплайн
Полный технический разбор архитектуры от сегментации до декодирования.
ии-раздеватор: полный гайд для новичков
С чего начать и как избежать типичных ошибок при первом использовании.
Нейросеть раздевает девушек без размытия
Как нейросеть справляется с задачей без блюра и артефактов.