ТОП-8 нейросетей для генерации изображений и презентаций: в помощь врачу — Docsfera.ru
SANOFI

Визуальные генераторы для медицинского контента, или Как с помощью ИИ создавать изображения

Автор
Хоружая Анна Николаевна

Врач лучевой диагностики, эксперт в области искусственного интеллекта в медицине, автор более 30 научных публикаций, методических рекомендаций, патентов. Сооснователь, заместитель главного редактора и выпускающий редактор портала neuronovosti.ru.


Подробнее

Автор статей в журналах «Популярная механика», «Химия и жизнь», «Вокруг света», «Кот Шредингера», «OYLA», медицинских периодических изданиях «Новости неврологии», «Неврология сегодня». Член Ассоциации медицинских журналистов, дважды лауреат премии инновационной журналистики «Тech-in-media», лауреат премии Министерства образования и науки «За верность науке». Соавтор книг «Смерть замечательных людей», «Вообще чума: истории болезней от лихорадки до Паркинсона», «Вот холера: история болезней от сифилиса до проказы», «Нобелиаты: путь к успеху. 1901-1910», «Смерть замечательных людей-2», «Опухоли головного и спинного мозга у детей» благотворительного фонда Константина Хабенского.

Обложка сгенерирована с помощью Midjourney. Промпт: «Молодой доктор генерирует изображения, сидя за компьютером, фото в стиле гиперреализма».

Картинка в конце статьи сгенерирована с помощью Midjourney. Промпт: «Инфографика в стиле 3d».

Зрительное восприятие — основной механизм поступления информации в мозг, эволюционно он более быстрый и простой. Читать мы учимся довольно долго, и процесс чтения, даже при совершенном овладении этим навыком, требует существенных когнитивных затрат. Тогда как обработка изображений практически элементарна. Тем не менее порой нам проще что-либо описать словами, чем нарисовать это или подобрать подходящую картинку в сети. На этом принципе построена работа по созданию изображений с помощью искусственного интеллекта (ИИ).

Программы на основе ИИ для генерации изображений, которыми врач может проиллюстрировать пост в соцсети или оформить презентацию, появилось довольно много. Мы рассмотрим наиболее удобные и простые и покажем на примере формирования запросов, как это работает.

Создание иллюстраций

Прежде чем приступить к генерации изображений, необходимо правильно сформулировать промпт — запрос, который вы погрузите в нейронную сеть. Если промпт будет неточным, то вы рискуете потратить на получение того результата, который вам нужен, больше времени.

На этапе формирования промпта главная задача состоит в том, чтобы наиболее точно описать словами то, что вы хотите увидеть в итоге. Поэтому обратите внимание на несколько важных моментов.

  1. Конкретность. Убедитесь, что ваш запрос ясен и специфичен, избегайте неопределенных выражений.

    Пример: вместо слова «сердце» используйте фразу «анатомическое изображение человеческого сердца с указанием основных сосудов».

  2. Подробности о стиле. Укажите стиль изображения, который вы хотите получить (реалистичный, схематичный, 3D и т. д.).

    Пример: «схематичное изображение сердца, показывающее кровеносные сосуды и клапаны».

  3. Палитра. Если важно, укажите желаемые цвета или атмосферу (яркие, пастельные, темные и т. д.).

    Пример: «изображение сердца с красными и синими оттенками для обозначения артериальной и венозной крови».

  4. Элементы. Опишите, какие элементы должны быть включены в изображение и как они должны располагаться.

    Пример: «изображение сердца в центре с аннотациями, указывающими на аорту, легочные артерии и клапаны».

  5. Настроение. Укажите, какое настроение или эмоции, если это уместно, должно передавать изображение.

    Пример: «научное и информативное изображение, подходящее для учебного пособия».

Пример полного промпта: «Создай схематичное изображение человеческого сердца с анатомической точностью, показывающее основные сосуды (аорта, легочные артерии и вены, полые вены) и клапаны. Используй красные и синие оттенки для обозначения артериальной и венозной крови, чтобы изображение выглядело научным и информативным».

Теперь рассмотрим, какими ресурсами можно воспользоваться для получения нужного изображения и как формулировка промпта влияет на результат. Отметим, что для большинства сервисов придется перевести запрос на английский язык.

Craiyon — сервис на базе искусственного интеллекта, позволяющий генерировать изображения на основе текстовых запросов. Его бесплатная версия поддерживает описания с небольшим количеством знаков, работает довольно медленно и выдает изображения низкого разрешения, но интерфейс понятный и доступный онлайн. Если вам необходимо иллюстрировать пост в социальной сети, этот сервис вполне подойдет. Из плюсов — можно вырезать фон и оставить картинку на прозрачной подложке.

Из промпта-примера мы взяли только первую строчку «схематичное изображение человеческого сердца с анатомической точностью, показывающее основные сосуды». Вот что получилось.

Сервис Craiyon

Картинка сгенерирована в Craiyon

DeepAI — платформа, предлагающая несколько инструментов для генерации изображений. Она поддерживает до 100 стилей под разных художников и дизайнеров, а также позволяет настраивать параметры визуализации. Из слабых сторон иногда можно выделить низкое качество изображений, но при этом скорость их создания довольно высокая.

Наш промпт-пример был использован целиком, а для создания определенного стиля мы добавили в запрос: «Генератор картин эпохи Возрождения».

Сервис DeepAI

Картинка сгенерирована в DeepAI

Artbreeder — интеллектуальный сервис для создания и редактирования изображений с использованием методов настоящего генеративного искусства. Он позволяет комбинировать изображения и настраивать их параметры (например, цвет и форму). Также вокруг него создано сообщество пользователей, которые делятся примерами своих работ, и их также можно использовать. Но есть и минусы — в нем ограничены возможности генерации изображений на основе текстовых запросов, а некоторые функции могут требовать подписки. Однако несомненный плюс в том, что вы можете добавить к описанию словами похожую картинку, а потом перевести алгоритм в режим вариаций и выбрать наиболее удачную.

Промпт-пример был использован целиком, а также мы присоединили анатомический рисунок в качестве «базового изображения», после чего выбрали одну из вариаций.

Сервис Artbreeder

Картинка сгенерирована в Artbreeder

Fusion brain — российская генеративная нейросеть, созданная Институтом искусственного интеллекта «Сбербанка» на основе первой генеративной модели Kandinsky. Ее несомненный плюс в том, что она бесплатная (но нужно зарегистрироваться) и понимает промпты на русском языке. Но иногда она может выдавать весьма странные результаты и требует нескольких надстроек запросов, прежде чем получится что-то приемлемое. Но вы можете добавить негативный промпт — то, что не хотели бы видеть в изображении. Например, подписи (потому что у нейросети они получаются бессмысленные).

Для генерации мы использовали полный промпт-пример и добавили негативный промпт «подписи».

Сервис Fusion brain

Картинка сгенерирована в Fusion brain

Midjourney — платный премиум-сервис с подпиской для генерации действительно качественных изображений. Доступ осуществляется через Discord, что позволяет легко взаимодействовать с ботом для уточнения запроса на то, что вам нужно. Сервис выдает потрясающе детализированные фотореалистичные изображения, к тому же вокруг него есть активное сообщество, в котором пользователи могут делиться работами и искать вдохновение. Тарифы стартуют с небольших сумм за месяц работы, есть годовые планы.

DALL-E 2 — продвинутая версия DALL-E, также позволяющая генерировать изображения высокого качества на платной основе. Она допускает редактирование изображений и создание вариаций, а также пользователи хвалят ее за хорошую точность в интерпретации текстовых описаний. Поскольку этот сервис — продукт OpenAI наравне с ChatGPT, он легко интегрируется с другими инструментами компании, которые помогут придумать и обработать промпты.

Создание презентаций ИИ

Создание презентаций

Особенно сложно бывает сконструировать визуально понятную и эффективную по смысловой нагрузке презентацию. Здесь тоже на помощь приходит ИИ.

Чтобы сгенерировать презентацию, используя инструменты на базе ИИ, и получить по итогу приемлемый результат, нужно иметь под рукой текст. Если у вас уже есть статья, по которой вы делаете доклад — прекрасно, можете использовать в качестве промпта ее. Если текста нет, то придется его написать. Впрочем, можете обратиться за помощью к ИИ-ресурсам по созданию текстов.

Gamma — простой в работе генератор презентаций, который обработает ваш документ, выделит из него главное и составит то количество слайдов, которое вы ему закажете. В качестве бесплатного «входа» дается 400 монет, и на каждую генерацию уходит по 40 (т. е. у вас есть 10 «пробных» запросов). Результат прекрасный, сгенерированные картинки в тему идут комплектом. Вы можете экспортировать файл в любой удобный формат (pptx, pdf, png).

Beautiful.ai — облачный инструмент с ИИ для автоматического создания презентаций на основе текстовых запросов и контента. В нем можно автоматически настраивать дизайн слайдов в соответствии с введенным контентом, выбирать шаблоны из большой библиотеки, перетаскивать и редактировать элементы. Кроме того, он сам адаптирует презентацию для улучшения визуального восприятия.

В бесплатной версии функции немного ограничены (например, доступны не все шаблоны). Но есть существенное ограничение — вы не сможете скачать свою презентацию. Демонстрировать ее можно на сайте либо в скачиваемом из приложения плеере для рабочего стола.

Вас может заинтересовать

Присоединитесь к запланированной онлайн-презентации
Опубликованы новые материалы, которые могут быть вам интересны
Все уведомления