Ученые разработали детектор школьников в соцсетях - «Интернет и связь»
Алиса AI: что нового в апреле - «Новости мира Интернет»
Алиса AI: что нового в апреле - «Новости мира Интернет»
Heroes of Might & Magic: Olden Era вышла в раннем доступе Steam — фанаты ждали этого 11 лет - «Новости сети»
Heroes of Might & Magic: Olden Era вышла в раннем доступе Steam — фанаты ждали этого 11 лет - «Новости сети»
Epic Games Store устроил раздачу Hogwarts Legacy в честь 25-летия кинофраншизы «Гарри Поттер» — россиян оставили без подарка - «Новости сети»
Epic Games Store устроил раздачу Hogwarts Legacy в честь 25-летия кинофраншизы «Гарри Поттер» — россиян оставили без подарка - «Новости сети»
«Сделано в Германии»: Volla представила защищённый смартфон Phone Plinius со съёмной батареей и парой ОС на выбор - «Новости сети»
«Сделано в Германии»: Volla представила защищённый смартфон Phone Plinius со съёмной батареей и парой ОС на выбор - «Новости сети»
Noctua объяснила, почему чёрные вентиляторы выходят позже стандартных бежево-коричневых - «Новости сети»
Noctua объяснила, почему чёрные вентиляторы выходят позже стандартных бежево-коричневых - «Новости сети»
Учёные близки к разгадке тайны «маленьких красных точек» в глубинах Вселенной — «Уэбб» засёк у одной из них признаки чёрной дыры - «Новости сети»
Учёные близки к разгадке тайны «маленьких красных точек» в глубинах Вселенной — «Уэбб» засёк у одной из них признаки чёрной дыры - «Новости сети»
Подтверждение прав в Яндекс Вебмастере стало ещё проще: теперь через Яндекс Тег Менеджер и GTM — «Блог для вебмастеров»
Подтверждение прав в Яндекс Вебмастере стало ещё проще: теперь через Яндекс Тег Менеджер и GTM — «Блог для вебмастеров»
Сбер представил Kandinsky 6.0 Image: флагманскую модель, которая умеет профессионально редактировать фото - «Новости мира Интернет»
Сбер представил Kandinsky 6.0 Image: флагманскую модель, которая умеет профессионально редактировать фото - «Новости мира Интернет»
Resident Evil Requiem продаётся так хорошо, что Capcom пришлось повысить прогноз по выручке за год - «Новости сети»
Resident Evil Requiem продаётся так хорошо, что Capcom пришлось повысить прогноз по выручке за год - «Новости сети»
Microsoft запускает K2 — экстренный план по спасению репутации Windows 11 - «Новости сети»
Microsoft запускает K2 — экстренный план по спасению репутации Windows 11 - «Новости сети»
Новости мира Интернет » Новости » Новости мира Интернет » Ученые разработали детектор школьников в соцсетях - «Интернет и связь»
Группа социологов продемонстрировала возможность автоматически распознавать пол, возраст и ряд психологических характеристик пользователей социальной сети Facebook на основе их статусов. По словам ученых, это позволяет формализовать ряд наблюдений и дает новый инструмент для проведения исследований. Подробности со ссылкой на публикацию исследователей в журнале PLoS One приводит официальный сайт Университета Пенсильвании.

Наиболее употребляемые школьниками слова сверху. Ниже представлены наиболее употребляемые слова пользователями старше 30 лет. Схема: Schwartz et al. (2013) Personality, Gender and Age in the Language of Social Media: The Open-Vocabulary Approach. PLoS ONE 8(9): e73791.

В ходе своей работы сотрудники университета Пенсильвании и Кембриджского университета в Великобритании изучали лексику, используемую в статусах Facebook. Под статусом понимается короткий текст, размещаемый от своего имени в соцсетях. В тексте обычно указывают текущее занятие, настроение или другую информацию. Разные группы людей по-разному используют статусы, и ученые задались целью выяснить, нельзя ли извлечь из текстов больше информации, чем просто набор слов и предложений.

Социологи собрали данные о 136 тысячах пользователей (все они подписались на участие в научном исследовании), которые в общей сложности обновили свою строку статуса более 13 миллионов раз. Чтобы получить корректную информацию, ученые брали только тех, кто за время эксперимента написал более 1000 слов в строку статуса. Это позволило отсечь тех, кто практически не использовал данную функцию социальной сети. В итоге выборка авторов исследования включала 15,4 миллиона статусов с 309 миллионами слов от 74 941 человека.

Далее социологи взяли заполненные теми же людьми онлайн-опросники и попытались найти корреляции встречаемости тех или иных слов в статусе с теми или иными характеристиками человека. Математический анализ собранного материала продемонстрировал, что даже сочетания символов, которые были выделены в слова сугубо формально, как произвольная комбинация между двумя пробелами, позволяют узнать, к примеру, пол пользователя. Сочетание знака больше и цифры 3 позволяет уверенно говорить о том, что строка статуса обновлена женщиной, а не мужчиной. В то же время ругательство "fuck" указывает на мужской пол владельца аккаунта.

Исследователи также предложили добровольцам установить онлайн-приложение My Personality с психологическими опросниками, основанными на тесте NEO Personality Inventory Revised (NEO-PI-R). Этот тест выдавал результаты по пяти разным шкалам: экстраверсия, сговорчивость, сознательность, невротизм и открытость; сокращенная версия такого теста уже использовалась в другой посвященной Facebook работе.

Анализ материала тестов показал, что экстраверты чаще используют слова "вечеринка" и "девушки", в то время как интроверты предпочитают компьютеры и интернет, а также аниме — хотя коэффициент корреляции для аниме и интроверсии оказался ниже, чем для интроверсии и смайла "^_^". Кроме того, ученые увидели и характерные для определенного возраста выражения: например, "домашнее задание" и названия предметов выдают школьников, а "дочь" или "муж" характерны для тех, кому больше тридцати лет.

Исследователи полагают, что их работа позволяет отделить стереотипы о той или иной категории пользователей от ее реальных характеристик. Они считают удачным решение не подсчитывать частотность того или иного слова из закрытого списка (скажем, из числа "позитивных эмоций" или из множества "ругательства"), а взять слова и сочетания символов, изначально присутствующие в выборке. Еще одно достоинство подхода — сравнительная быстрота обновления данных.

Появление социальных сетей, сервисов с миллионами активных пользователей, вывело (как утверждается во введении ко статье американо-британской группы) социологическую науку на новый уровень. Если ранее опрос хотя бы тысячи человек требовал сложной полевой работы, то онлайн-исследования позволяют оперативно собирать на порядки большие выборки и анализировать их с использованием автоматических методов. Таким образом уже удалось отследить реакцию общества на различные события, проследить за эпидемиями гриппа и найти способ определить характеристики пользователя по "лайкам" (хотя и с большой погрешностью).

Группа социологов продемонстрировала возможность автоматически распознавать пол, возраст и ряд психологических характеристик пользователей социальной сети Facebook на основе их статусов. По словам ученых, это позволяет формализовать ряд наблюдений и дает новый инструмент для проведения исследований. Подробности со ссылкой на публикацию исследователей в журнале PLoS One приводит официальный сайт Университета Пенсильвании. Наиболее употребляемые школьниками слова сверху. Ниже представлены наиболее употребляемые слова пользователями старше 30 лет. Схема: Schwartz et al. (2013) Personality, Gender and Age in the Language of Social Media: The Open-Vocabulary Approach. PLoS ONE 8(9): e73791. В ходе своей работы сотрудники университета Пенсильвании и Кембриджского университета в Великобритании изучали лексику, используемую в статусах Facebook. Под статусом понимается короткий текст, размещаемый от своего имени в соцсетях. В тексте обычно указывают текущее занятие, настроение или другую информацию. Разные группы людей по-разному используют статусы, и ученые задались целью выяснить, нельзя ли извлечь из текстов больше информации, чем просто набор слов и предложений. Социологи собрали данные о 136 тысячах пользователей (все они подписались на участие в научном исследовании), которые в общей сложности обновили свою строку статуса более 13 миллионов раз. Чтобы получить корректную информацию, ученые брали только тех, кто за время эксперимента написал более 1000 слов в строку статуса. Это позволило отсечь тех, кто практически не использовал данную функцию социальной сети. В итоге выборка авторов исследования включала 15,4 миллиона статусов с 309 миллионами слов от 74 941 человека. Далее социологи взяли заполненные теми же людьми онлайн-опросники и попытались найти корреляции встречаемости тех или иных слов в статусе с теми или иными характеристиками человека. Математический анализ собранного материала продемонстрировал, что даже сочетания символов, которые были выделены в слова сугубо формально, как произвольная комбинация между двумя пробелами, позволяют узнать, к примеру, пол пользователя. Сочетание знака больше и цифры 3 позволяет уверенно говорить о том, что строка статуса обновлена женщиной, а не мужчиной. В то же время ругательство

Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

0

Смотрите также

А что там на главной? )))



Комментарии )))