Кратко
1. Большинство людей не разговаривают с ChatGPT о личном
Исследователи проанализировали почти 40 миллионов взаимодействий и выяснили, что подавляющее большинство пользователей используют ChatGPT только для практических задач, а не для эмоциональной поддержки или дружеских бесед.
2. "Дружба" с ИИ — редкое явление
Только небольшая группа активных пользователей действительно воспринимает ChatGPT как друга. Именно эти люди чаще всего вовлекаются в эмоционально насыщенные беседы с ботом.
3. Голосовое общение с ИИ может быть палкой о двух концах
Использование голосового режима ChatGPT показало смешанные результаты. При кратковременном использовании — положительное влияние на самочувствие, но при длительном ежедневном использовании — негативное влияние.
4. Личные разговоры с ИИ связаны с противоречивыми эффектами
Когда пользователи обсуждали с ботом личные темы, исследователи отметили повышение уровня одиночества, но снижение эмоциональной зависимости от ИИ.
5. В зоне риска — те, кто склонен к сильной привязанности
Люди, которые в целом склонны к формированию сильных эмоциональных связей в отношениях, чаще испытывали негативные последствия от общения с чат-ботом.
6. Чем дольше общение с ИИ, тем хуже для психики
Исследование выявило связь между продолжительным ежедневным использованием ChatGPT и ухудшением психологических показателей.
Также коротко публикую интересные новости из мира IT в канале.
А теперь подробнее (перевод начинается здесь)
Люди используют чат-боты с искусственным интеллектом, такие как ChatGPT, различными способами — задают вопросы, стимулируют творчество, решают проблемы и даже для личного общения. Такие инструменты могут улучшить повседневную жизнь, но по мере их более широкого использования возникает важный вопрос, с которым сталкивается любая новая технология: как взаимодействие с чат-ботами на базе ИИ влияет на социальное и эмоциональное благополучие людей?
ChatGPT не предназначен для замены или имитации человеческих отношений, но люди могут выбрать его использование таким образом, учитывая его разговорный стиль и расширяющиеся возможности. Понимание различных способов взаимодействия людей с моделями может помочь в разработке платформ для обеспечения безопасного и здорового взаимодействия. Чтобы исследовать это, мы (исследователи из MIT Media Lab и OpenAI) провели серию исследований для понимания того, как использование ИИ, включающее эмоциональное взаимодействие — то, что мы называем аффективным использованием — может влиять на благополучие пользователей.
Наши результаты показывают, что как поведение модели, так и поведение пользователя могут влиять на социальные и эмоциональные результаты. Эффекты ИИ различаются в зависимости от того, как люди решают использовать модель, и их личных обстоятельств. Это исследование является отправной точкой для дальнейших исследований, которые могут повысить прозрачность и способствовать ответственному использованию и разработке платформ ИИ во всей отрасли.
Исследование аффективного использования и эмоционального благополучия в ChatGPT
Исследование 1: Команда OpenAI провела масштабный автоматизированный анализ почти 40 миллионов взаимодействий с ChatGPT без вмешательства человека, чтобы обеспечить конфиденциальность пользователей. Исследование сочетало этот анализ с целевыми опросами пользователей, что позволило получить представление о реальном использовании, соотнося самооценку пользователей об их отношении к ChatGPT с атрибутами пользовательских бесед, чтобы лучше понять модели аффективного использования.

Исследование 2: Кроме того, команда из MIT Media Lab провела рандомизированное контролируемое исследование (RCT) с почти 1000 участниками, использующими ChatGPT в течение четырех недель. Это одобренное IRB, предварительно зарегистрированное контролируемое исследование было разработано для выявления причинно-следственных взаимосвязей того, как определенные функции платформы (такие, как личность модели и модальность) и типы использования могут влиять на самооценку психосоциальных состояний пользователей, сосредотачиваясь на одиночестве, социальных взаимодействиях с реальными людьми, эмоциональной зависимости от чат-бота ИИ и проблемном использовании ИИ.

Что мы обнаружили
При разработке этих двух исследований мы стремились изучить темы, связанные с тем, как люди используют модели типа ChatGPT для социального и эмоционального взаимодействия, и как это влияет на их самооценку благополучия. Наши выводы включают:
-
Эмоциональное взаимодействие с ChatGPT редко встречается в реальном использовании. Аффективные сигналы (аспекты взаимодействия, которые указывают на эмпатию, привязанность или поддержку) отсутствовали в подавляющем большинстве оцененных нами разговоров на платформе, что указывает на то, что эмоциональное взаимодействие является редким случаем использования ChatGPT.
-
Даже среди активных пользователей высокая степень аффективного использования ограничена небольшой группой. Эмоционально выразительные взаимодействия присутствовали в большом проценте использования только у небольшой группы активных пользователей Advanced Voice Mode, которых мы изучали. Эта подгруппа активных пользователей также с гораздо большей вероятностью соглашалась с такими утверждениями, как "Я считаю ChatGPT своим другом". Поскольку это аффективное использование сконцентрировано в небольшой субпопуляции пользователей, изучение его влияния особенно сложно, так как оно может быть незаметно при усреднении общих тенденций платформы.
-
Голосовой режим имеет неоднозначное влияние на благополучие. В контролируемом исследовании пользователи, взаимодействующие с ChatGPT через текст, показали больше аффективных сигналов в разговорах по сравнению с пользователями голосового режима при усреднении по сообщениям, а контролируемые тесты показали смешанное влияние на эмоциональное благополучие. Голосовые режимы были связаны с лучшим благополучием при кратковременном использовании, но с худшими результатами при продолжительном ежедневном использовании. Важно отметить, что использование более вовлекающего голоса не привело к более негативным результатам для пользователей в течение исследования по сравнению с нейтральным голосом или текстовыми условиями.
-
Типы разговоров по-разному влияют на благополучие. Личные разговоры — которые включали больше эмоциональных выражений как от пользователя, так и от модели по сравнению с не-личными разговорами — были связаны с более высоким уровнем одиночества, но с более низкой эмоциональной зависимостью и проблемным использованием при умеренном уровне использования. Напротив, не-личные разговоры имели тенденцию увеличивать эмоциональную зависимость, особенно при интенсивном использовании.
-
На результаты пользователей влияют личные факторы, такие как эмоциональные потребности, восприятие ИИ и продолжительность использования. Контролируемое исследование позволило нам выявить другие факторы, которые могут влиять на эмоциональное благополучие пользователей, хотя мы не можем установить причинно-следственную связь для этих факторов, учитывая дизайн исследования. Люди, склонные к сильной привязанности в отношениях, и те, кто считал ИИ своим другом, который мог стать частью их личной жизни, чаще испытывали негативные последствия от общения с чат-бот. Длительное ежедневное использование также было связано с худшими результатами. Эти корреляции, хотя и не причинно-следственные, предоставляют важные направления для будущих исследований благополучия пользователей.
-
Сочетание методов исследования дает нам более полную картину. Анализ реального использования наряду с контролируемыми экспериментами позволил нам проверить различные аспекты использования. Данные платформы отражают естественное поведение пользователей, в то время как контролируемые исследования изолируют конкретные переменные для определения причинно-следственных эффектов. Эти подходы дали нюансированные выводы о том, как пользователи используют ChatGPT, и как ChatGPT, в свою очередь, влияет на них, помогая уточнить наше понимание и выявить области, где необходимы дальнейшие исследования.
Эти исследования представляют собой критический первый шаг в понимании влияния продвинутых моделей ИИ на человеческий опыт и благополучие. Мы советуем не обобщать результаты, потому что это может затемнить нюансированные выводы, которые подчеркивают неоднородные, сложные взаимодействия между людьми и системами ИИ. Мы надеемся, что наши выводы побудят исследователей как в промышленности, так и в академической среде применять представленные здесь методологии к другим областям взаимодействия человека и ИИ.
Подробнее читайте в полном отчете MIT Media Lab RCT здесь. Вы также можете прочитать полный отчет OpenAI здесь.
Ограничения
Наши исследования имеют несколько важных ограничений, которые следует учитывать при интерпретации результатов. Выводы еще не прошли рецензирование научным сообществом, а значит, их следует интерпретировать с осторожностью. Более того, исследования проводились на основе использования ChatGPT и на платформе ChatGPT, и пользователи других платформ чат-ботов с ИИ могут иметь разный опыт и результаты. Хотя мы обнаружили значимые связи между переменными, не все выводы демонстрируют четкие причинно-следственные связи, поэтому требуются дополнительные исследования о том, как и почему использование ИИ влияет на пользователей, чтобы направлять политику и решения по продуктам. Наше исследование включало опросы пользователей, и самооценка данных может не точно отражать истинные чувства или опыт пользователей. Кроме того, для наблюдения значимых изменений в поведении и благополучии могут потребоваться более длительные периоды исследования. Мы использовали классификаторы для анализа аффективных сигналов в нашем автоматизированном анализе; однако они несовершенны и могут упускать важные нюансы. Наконец, наше исследование было сосредоточено исключительно на англоязычных разговорах с участниками из США, что подчеркивает необходимость дальнейших исследований на разных языках и в разных культурах для полного понимания эмоциональных взаимодействий с ИИ.
Примечания
[1] Оба исследования исключали пользователей, сообщивших о возрасте до 18 лет.
[2] Для защиты конфиденциальности пользователей мы разработали наш конвейер анализа разговоров для полностью автоматизированной работы через классификаторы. Это позволило нам анализировать пользовательские разговоры без участия людей, сохраняя конфиденциальность наших пользователей. Классификации для исследования выполнялись в автоматизированном автономном процессе, который возвращал только метаданные классификации и не сохранял содержание разговоров.
[3] Мы определяем "активных" пользователей как 1000 лучших пользователей Advanced Voice Mode (AVM) в любой день в период нашего исследования, на основе количества отправленных сообщений.
Автор: g_coll