Энтузиасты подсчитали число видео на YouTube - «Новости мира Интернет» » Новости мира Интернет
ChatGPT получил новую память – пользователи смогут просматривать и редактировать воспоминания ИИ - «Новости мира Интернет»
ChatGPT получил новую память – пользователи смогут просматривать и редактировать воспоминания ИИ - «Новости мира Интернет»
Apple представила iOS 27 и новую Siri AI: главные анонсы WWDC 2026 - «Новости мира Интернет»
Apple представила iOS 27 и новую Siri AI: главные анонсы WWDC 2026 - «Новости мира Интернет»
Постапокалиптический шутер Metro 2039 выйдет в феврале 2027 года — новый геймплейный трейлер - «Новости сети»
Постапокалиптический шутер Metro 2039 выйдет в феврале 2027 года — новый геймплейный трейлер - «Новости сети»
Первое и последнее сюжетное дополнение к Doom: The Dark Ages вышло из тени — геймплей и дата выхода «Откровений» - «Новости сети»
Первое и последнее сюжетное дополнение к Doom: The Dark Ages вышло из тени — геймплей и дата выхода «Откровений» - «Новости сети»
Суровая средневековая Англия, возвращение к корням и Unreal Engine 5: анонсирована Stronghold 4 - «Новости сети»
Суровая средневековая Англия, возвращение к корням и Unreal Engine 5: анонсирована Stronghold 4 - «Новости сети»
Глава Nvidia призвал не бояться наблюдаемого обвала на рынке акций и покупать их по низким ценам - «Новости сети»
Глава Nvidia призвал не бояться наблюдаемого обвала на рынке акций и покупать их по низким ценам - «Новости сети»
ASML стала самой дорогой компанией в истории Европы — капитализация достигла $674 млрд - «Новости сети»
ASML стала самой дорогой компанией в истории Европы — капитализация достигла $674 млрд - «Новости сети»
NVIDIA представила новый ARM-чип для Windows RTX Spark и настольный ИИ-суперкомпьютер - «Новости мира Интернет»
NVIDIA представила новый ARM-чип для Windows RTX Spark и настольный ИИ-суперкомпьютер - «Новости мира Интернет»
Microsoft представила ИИ-агента Scout для автоматизации рабочих задач - «Новости мира Интернет»
Microsoft представила ИИ-агента Scout для автоматизации рабочих задач - «Новости мира Интернет»
Microsoft выпустила семь ИИ-моделей и рассказала о новой стратегии развития - «Новости мира Интернет»
Microsoft выпустила семь ИИ-моделей и рассказала о новой стратегии развития - «Новости мира Интернет»
Новости мира Интернет » Новости » Энтузиасты подсчитали число видео на YouTube - «Новости мира Интернет»

Эксперты из Массачусетского университета и разработчик сервиса Pushshift подсчитали, что на YouTube выложено 13,3 миллиардов видеороликов – из них лишь 4% просмотрено более десяти тысяч раз. Процесс изучения сервиса оказался непростым.



Несмотря на то, что API YouTube качественно задокументирован, получить выборку, которая бы отражала реальный срез данных, возможности нет. В большей части аналитических статей YouTube изучают через коллекции видеороликов или ролики, найденные в рекомендациях. Оба способа позволяют исследовать сервис, но не дают подсчитать число загруженных публикаций.



В издании Tech News Space отмечают, что ранее для подсчета можно было использовать данные с таких сервисов как Reddit, которые давно собирают статистику при помощи API. По информации подобных платформ реально понять, какие группы пользователей больше интересуется кулинарными советами, какие – мемами, а какие – роликами про путешествия. Но в 2023 году Реддит убрал и эту возможность.



Итан Цукерман, один из группы энтузиастов, обратился к разработчику проекта парсинга Reddit, Джейсону Баумгартнэру, как к специалисту по работе с незадокументированными API. Баумгартнэр посоветовал сервис Inner Tube, который он применял для создания случайных URL и проверки их наличия в сети.



В ходе исследований выяснилось, что всего имеется 264 возможных URL-адресов YouTube. При этом, очевидно, что на платформе не может быть такого числа видео. Дальше эксперты пошли математическим путем. Так, если предположить, что на сервисе выложен один миллиард видео, то случайный подбор URL даст лишь один верный вариант из 18,4 миллиардов попыток.



Методом «слепого набора» было «найдено» порядка тридцати двух тысяч случайных адресов, попадание случалось приблизительно один раз в пятьдесят тысяч наборов. Так эксперты подсчитали, что на YouTube на сегодняшний день выложено 13 325 821 970 видео.



Также ученые выяснили, что ролики с более чем 10 тыс. просмотрами составляют лишь 4%, а за прошедший год на платформе появилось целых 4 миллиарда новых видео. Они определили, что сервис, как правило, рекомендует не самые типичные видео – средний ролик имеет 39 просмотров, а платформа показывает в рекомендациях лишь те, у которых не менее десяти тысяч просмотров.



Недавно специалистам удалось найти более удобный способ исследования YouTube – теперь вместо «слепого набора» проверка последовательно идет по адресному пространству. По информации портала Tech News Space, активисты продолжат изучение видеосервиса.



Статистика будет обновляться раз в несколько недель, ее можно посмотреть на сайте tubestats.org.


Эксперты из Массачусетского университета и разработчик сервиса Pushshift подсчитали, что на YouTube выложено 13,3 миллиардов видеороликов – из них лишь 4% просмотрено более десяти тысяч раз. Процесс изучения сервиса оказался непростым. Несмотря на то, что API YouTube качественно задокументирован, получить выборку, которая бы отражала реальный срез данных, возможности нет. В большей части аналитических статей YouTube изучают через коллекции видеороликов или ролики, найденные в рекомендациях. Оба способа позволяют исследовать сервис, но не дают подсчитать число загруженных публикаций. В издании Tech News Space отмечают, что ранее для подсчета можно было использовать данные с таких сервисов как Reddit, которые давно собирают статистику при помощи API. По информации подобных платформ реально понять, какие группы пользователей больше интересуется кулинарными советами, какие – мемами, а какие – роликами про путешествия. Но в 2023 году Реддит убрал и эту возможность. Итан Цукерман, один из группы энтузиастов, обратился к разработчику проекта парсинга Reddit, Джейсону Баумгартнэру, как к специалисту по работе с незадокументированными API. Баумгартнэр посоветовал сервис Inner Tube, который он применял для создания случайных URL и проверки их наличия в сети. В ходе исследований выяснилось, что всего имеется 264 возможных URL-адресов YouTube. При этом, очевидно, что на платформе не может быть такого числа видео. Дальше эксперты пошли математическим путем. Так, если предположить, что на сервисе выложен один миллиард видео, то случайный подбор URL даст лишь один верный вариант из 18,4 миллиардов попыток. Методом «слепого набора» было «найдено» порядка тридцати двух тысяч случайных адресов, попадание случалось приблизительно один раз в пятьдесят тысяч наборов. Так эксперты подсчитали, что на YouTube на сегодняшний день выложено 13 325 821 970 видео. Также ученые выяснили, что ролики с более чем 10 тыс. просмотрами составляют лишь 4%, а за прошедший год на платформе появилось целых 4 миллиарда новых видео. Они определили, что сервис, как правило, рекомендует не самые типичные видео – средний ролик имеет 39 просмотров, а платформа показывает в рекомендациях лишь те, у которых не менее десяти тысяч просмотров. Недавно специалистам удалось найти более удобный способ исследования YouTube – теперь вместо «слепого набора» проверка последовательно идет по адресному пространству. По информации портала Tech News Space, активисты продолжат изучение видеосервиса. Статистика будет обновляться раз в несколько недель, ее можно посмотреть на сайте tubestats.org.

Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

0

Смотрите также

А что там на главной? )))



Комментарии )))