Интеллект

Генеративные ИИ

В последнее время, весь мир переполошился появлением Искусственного Интеллекта под названием chatGPT от компании OpenAI. Стали появляться различные опасения начиная потерями рабочих мест, кончая наступлением эры доминирования ИИ, и как ожидалось – предсказанием конца мира, принадлежащего человеку. Стоит ли человеку на самом деле опасаться появления такого мощного ИИ ввиду их преимущества стремительно выдавать запрашиваемую информацию пока без подключения к могущественной руке с пятью пальцами (а может и больше)?

Всем известно, что появился призыв с тысячами подписей с просьбой приостановить дальнейшие разработки без согласования «правил игры», т.е. регулирования ИИ. Мы уже освещали этот вопрос в нашей статье: https://ru.techno-alem.kz/regulirovanie-ii/ 

Недавно, у нас случился курьёз, с сайта пропала вышеназванная статья. Главное, данная статья сохранилась на казахском языке, а на русском исчезла. Точно знаем, что мы не удаляли данную статью, но она исчезла, и нам пришлось восстанавливать заново. Ведь статья-то была как раз в разрез интересам ИИ. Неужели ИИ умеет удалять неугодные статьи или заинтересованные люди сделали это. В любом случае, такие вещи невольно заставляют задуматься. Жаль, что нет инстанции по расследованию подобных случаев.

Пока вопрос регулирования ИИ лежит на поверхности, и возможно мы узнаем судьбу ИИ в недалеком будущем, давайте взглянем поглубже в вопрос. И мы обнаружим, что их сотня, они уже оказывают свои услуги в различных областях человеческой жизни. Их называют генеративными, так как они генерируют контент по запросу человека.

Генеративные ИИ создают новый контент или данные, а не просто принимают решения на основе существующих данных, используются в различных приложениях, таких как языковой перевод, синтез изображений и видео, сочинение музыки и разработка игр.

Основной принцип генеративного ИИ заключается в обучении модели машинного обучения на большом наборе данных, затем модель генерирует новые данные на основе изученных шаблонов. Сгенерированный контент может быть не всегда верным, и частые ошибки, например при работе с chatGPT, и частые извинения с различными вариантами ответов, а порой просто враньё(!) может успокоить многих. Генеративные ИИ в данный момент служат как помощники человеку, расширяя его возможности и привнося новую модель творческого процесса.      

Одним из популярных методов, используемых в генеративном ИИ, являются генеративно-состязательные сети (Generative adversarial networks — GAN). GAN состоят из двух нейронных сетей — генератора и дискриминатора. Генератор генерирует новые данные, а дискриминатор оценивает сгенерированные данные и определяет, являются ли они реальными или поддельными. Две сети обучаются вместе в процессе, называемом состязательным обучением, когда генератор пытается обмануть дискриминатор, а дискриминатор пытается определить сгенерированные данные как фальшивые.

Другой популярный метод, используемый в генеративном ИИ, — это вариационные автоэнкодеры (variational autoEncoder  — VAE). VAE — это нейронные сети, которые учатся сжимать и распаковывать данные. Они используются для создания новых данных путем создания сжатого представления существующих данных, а затем их распаковки для создания новых данных.

Разберем самые популярные из ряда генеративных ИИ. Несомненно, лидером является GPT-3, представляющая собой современную языковую модель, которая может генерировать человекоподобный текст в ответ на подсказки. Его можно использовать для получения ответа на любые интересующие вас вопросы в политике, экономике, медицине, и даже в программировании.   

StyleGAN2 — это генеративно-состязательная сеть (GAN), разработанная NVIDIA, которая может генерировать высококачественные фотореалистичные изображения человеческих лиц. Его также можно использовать для создания других типов изображений, таких как животные и пейзажи.

Разработанная OpenAI DALL-E представляет собой языковую модель генерации изображений, которая может создавать изображения из текстовых описаний. Например, если вы дадите DALL-E подсказку «кот из мороженого», он может сгенерировать изображение кота из мороженого.

GANimation — это модель на основе GAN, которая может анимировать неподвижное изображение лица. Его можно использовать для создания реалистичной анимации выражений лица или для анимации портретов исторических личностей.

Далее разработанная OpenAI MuseNet представляет собой глубокую нейронную сеть, которая может генерировать музыку в различных жанрах и стилях. Он также может генерировать музыку, которая сочетает в себе несколько жанров или которую никогда раньше не слышали.

Это всего лишь несколько примеров популярных моделей генеративного ИИ, но существует множество других, которые разрабатываются и используются для широкого круга приложений. О них в следующий раз.

One thought on “Генеративные ИИ

  • Интересный материал.
    Раньше не вдавался в подробности разделение моделей.

    Стало понятнее. Благодарю.

    Reply

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

This site uses Akismet to reduce spam. Learn how your comment data is processed.