НОВОСТИ Хабрастатистика: как Хабр пережил самоизоляцию

Alvaros
Онлайн
Регистрация
14.05.16
Сообщения
21.452
Реакции
101
Репутация
204
Привет, Хабр.

Заканчивается первая половина 2020 года, можно подвести некоторые статистические итоги, тем более что по понятным причинам, они обещают быть интересными. Появились новые темы для обсуждения, многие стали работать из дома, любопытно посмотреть, как это сказалось на количестве статей и их популярности.

a8pqauznjb-yts7vvctfm-cdnsm.png


Для тех кому интересно что получилось, продолжение под катом.

Для начала, традиционный disclaimer. Данная статистика, как и рейтинг, являются неофициальными, и не исключаю что я нигде не ошибся. Если кто-то не нашел себя в топе статей, но уверен что должен там быть, пишите в личные сообщения, поправлю. Данные по статьям собирались с помощью парсера на Python, который был запущен в один поток, чтобы не нагружать сервер. Такой сбор данных занимает примерно 8 часов, чтобы не держать ПК включенным, код был запущен на роутере с dd-wrt. Теперь вернемся к статистике.

На первом графике было показано общее количество опубликованным в 2020 году материалов. Тут по сравнению обошлось без особых изменений — для постоянных авторов карантин на производительности не сказался (может они и до него из дома не часто выходили ;). Кстати, как можно видеть, в среднем в день на Хабр выкладывается порядка 60 публикаций. Примерно половина из них это корпоративные блоги, и наверно это хорошо для Хабра с точки зрения прибыли, но грустно с точки зрения читателя — все же материалы от независимых авторов лично мне нравятся больше. Есть конечно интересные корпоративные блоги, но в основном, рекламный материал есть рекламный. Там не будет исходников, каких-то know-how, а текст будет выверен службой безопасности чтобы не дай бог не сболтнуть ничего лишнего. Судя по графику, достаточно регулярно публикуются новости, ну а англоязычный хабр… пока не «взлетел», больше про него ничего нельзя сказать.

Раз уж речь зашла об авторах, отметим тех, чье количество статей за эти полгода превышает 100: (464 статьи), (349 статей), (244 статей), (229 статей), (170 статей), (169), (149) и (107). Это примерно одна статья или новость в день, спасибо что благодаря вам (и остальным авторам конечно тоже), есть что почитать в свободное время.

Однако, вернемся к нашей самоизоляции. Посмотрим на число просмотров, оно уже интереснее:

mymhcptoquepata7pkmfrv0rqpq.png


Для сравнения можно сказать, что ни одна статья 2019 года не набрала и полумиллиона просмотров (даже ), а здесь мне впервые пришлось поменять форматирование чисел по вертикальной оси. И понятное дело, все статьи из топа посвящены, разумеется, коронавирусу. Отдельно стоит отметить первую статью, набравшую рекордные за всю историю Хабра 5млн просмотров.

Итак, топ-10 статей по числу просмотров

  1. , перевод от , 5526000 просмотров, 2067 комментариев
  2. от , 1168000 просмотров, 133 комментария
  3. от , 959000 просмотров, 2162 комментария
  4. от , 669000 просмотров, 1048 комментариев
  5. от , 547000 просмотров, 408 комментариев
  6. от , 358000 просмотров, 61 комментарий
  7. от , 320000 просмотров, 284 комментария
  8. от , 309000 просмотров, 1975 комментариев
  9. от , 289000 просмотров, 220 комментариев
  10. от , 254000 просмотров, 195 комментариев.

Думаю, Хабр и всех авторов вполне можно поздравить с вкладом в борьбе с эпидемией — возможно эти тексты спасли кому-то здоровье, а то и жизнь — суммарно почти 10 млн просмотров, это внушает. Кстати, на Хабре за эти полгода всего было написано 304 статьи, в названии которых встречается «covid»:

tuguexyof0zk87xkuwulie-57ia.png


Можно посмотреть распределение просмотров по хабам. Так было в 2019:

-ju8ikhuhiqpclcdnmfakxk_xvu.png


А так стало в 2020:

1oqkn6dmghqme4p54702bra0c9i.png


Раздел «health» переместился с 10й позиции на первую, потеснив «информационную безопасность», вместе с ним поднялись в рейтинге «popular science» и «biotech», которого в топе просмотров до этого вообще не было.

Впрочем, справедливости ради, если отсортировать статьи по числу комментариев, то Linux все же обошел коронавирус, что даже радует.

Топ-10 самых комментируемых статей

  1. от , 2401 комментарий, 139000 просмотров
  2. от , 2162 комментария, 959000 просмотров
  3. от , 2067 комментариев, 5526000 просмотров
  4. от , 1985 комментариев, 147000 просмотров
  5. от , 1977 комментариев, 66500 просмотров
  6. от , 1975 комментариев, 309000 просмотров
  7. от , 1365 комментариев, 81100 просмотров
  8. от , 1288 комментариев, 41700 просмотров
  9. от , 1245 комментариев, 125000 просмотров
  10. от , 1207 комментариев, 110000 просмотров.

Многим авторам наверно будет интересно посмотреть распределение рейтинга статей:

dawdknlkobtpe3ealyfl1adpkby.png


Тут есть странный момент, который мне непонятен, и не исключаю что я нигде не ошибся. В этом году средний рейтинг, как можно видеть, снизился — пик сместился влево. Ощущение такое, что большинство статей просто не успевают читать, они не набирают даже +10 баллов. Учитывая что гонорар за статью , это довольно грустно — все же, хотелось бы видеть на Хабре больше независимых авторов.

Вернемся к рейтингу. Интересно посмотреть на топ-10 статей по добавлению в закладки. Тут слава богу, про covid уже ни слова:

  1. от , 124000 просмотров, 1355 закладок
  2. от , 143000 просмотров, 1135 закладок
  3. от , 168000 просмотров, 1028 закладок
  4. от , 161000 просмотров, 1010 закладок
  5. от , 163000 просмотров, 949 закладок
  6. от , 80100 просмотров, 908 закладок
  7. от , 57300 просмотров, 894 закладки
  8. от , 94900 просмотров, 857 закладок
  9. от , 50400 просмотров, 703 закладки.

И наконец, последний рейтинг по соотношению добавлений в закладки к числу просмотров.

  1. от , 268 закладок, 11700 просмотров
  2. от , 369 закладок, 17100 просмотров
  3. от , 225 закладок, 11100 просмотров
  4. от , 230 закладок, 11900 просмотров
  5. от , 343 закладки, 18100 просмотров
  6. от , 430 закладок, 23000 просмотров
  7. от , 212 закладок, 11400 просмотров
  8. от , 209 закладок, 11300 просмотров
  9. от , 306 закладок, 17400 просмотров
  10. от , 214 закладок, 12200 просмотров.

Заключение


С уверенностью можно сказать, что наверное как и многие другие ИТ-сервисы, Хабр и его авторы, пережили пандемию без существенных потерь. Всех кто попал в топ поздравляю, следующий рейтинг будет в конце 2020 года. Ну а читателям надеюсь, есть что пересмотреть, если какие-то материалы были пропущены.
 
Сверху Снизу