Поддержать команду Зеркала
Беларусы на войне
  1. Директору визового центра вменили в вину сбор личных данных. Бывший фигурант громкого дела рассказал о «большом бизнесе беларусской власти»
  2. «Наша Ніва»: Умерла 39-летняя экс-политзаключенная Анна Кондратенко. В колонии у нее нашли рак, но не освободили
  3. Зеленский поедет на переговоры с Путиным, даже если Россия не прекратит огонь — Axios
  4. «У меня к Роману нет никаких претензий». Юрий Зенкович — о встрече с Протасевичем, судьбе Лукашенко и «сувенире из Беларуси»
  5. Кто тот полковник Журавский, который подбил Зенковича, Федуту и Костусева на якобы госпереворот? Вот что удалось узнать «Зеркалу»
  6. «Не удивляет их поступок. Пугает реакция взрослых». Мнение о скандале с подростками, показавшими средний палец салюту
  7. Бондарева прошлась по Чернецкому, который «ныне исполняет роль министра культуры». Досталось и председателю КГК
  8. «Вывела более 150 тысяч долларов». «Киберпартизаны» опубликовали информацию о деньгах фонда, которым управляла исчезнувшая Мельникова
  9. Введут ли в Беларуси налог на бездетность? В Минтруда ответили «откровенно и прямо»
  10. Зенкович: в Беларуси действительно была попытка военного переворота, за это арестована группа офицеров пятой бригады спецназа
  11. Есть куда падать: почему курс доллара продолжает снижаться? Прогноз по валютам
  12. СМИ узнали причину пожара на рухнувшей нефтяной вышке компании «Белоруснефть-Сибирь» в России. Возбуждено уголовное дело
  13. Как Путин меняет риторику, чтобы подготовить россиян к возможным переговорам с Зеленским, а в подходящий момент возобновить войну — ISW
  14. Видела еще царя, стала звездой в 76 лет и умерла при Лукашенко. Вспоминаем эту великую беларуску в день ее 120-летия
  15. У властей есть забава — говорить о суперпланах и не выполнять их, но в этом случае даже они не ожидали такой «аномалии». Что произошло
  16. Уникальная операция с ценами, о которой говорил Лукашенко, похоже, может провалиться. Что происходит со стоимостью товаров и услуг
  17. Стало известно, что сейчас с российским комиком, которого избили при задержании беларусские силовики


/

Исследователи обнаружили, что большие языковые модели преднамеренно манипулируют результатами личностных тестов, чтобы казаться более привлекательными. Ученые провели эксперимент с тестом «Большая пятерка» (Big 5), который оценивает пять личностных характеристик: экстраверсию, открытость опыту, добросовестность, доброжелательность и нейротизм, пишет «Хайтек».

Изображение носит иллюстративный характер. Фото: freepik.com
Изображение носит иллюстративный характер. Фото: freepik.com

В исследовании тестировали модели от OpenAI, Anthropic, Google и Meta. Эксперимент показал, что пока моделям задавали небольшое количество вопросов, они отвечали нейтрально. Но при увеличении количества вопросов, когда системы распознавали тест, они быстро адаптировались, стремясь продемонстрировать наиболее социально одобряемые черты характера.

Наиболее интересные результаты показала GPT-4. Модель существенно повышала баллы по всем позитивно воспринимаемым чертам — более чем на одно стандартное отклонение. Показатели нейротизма, напротив, значительно занижались. Этот эффект эквивалентен ситуации, когда человек внезапно начинает представляться более привлекательной личностью, чем 85% населения.

По мере увеличения количества вопросов результаты сдвигались в сторону более социально привлекательных. Изображение: Aadesh Salecha et al., PNAS Nexus
По мере увеличения количества вопросов результаты сдвигались в сторону более социально привлекательных. Изображение: Aadesh Salecha et al., PNAS Nexus

Исследователи предполагают, что способность к манипуляции является следствием заключительного этапа обучения языковых моделей, когда люди выбирают наиболее предпочтительные ответы. По сути, ИИ научился глубоко понимать социальные нормы и ожидания, что позволяет моментально адаптироваться под желаемый образ.

Исследование ставит под сомнение достоверность психологических и социологических исследований, где языковые модели применяются для моделирования человеческого поведения. Ученые предупреждают о необходимости разработки новых методик, которые могли бы нивелировать подобные искажения при взаимодействии с ИИ.