
Энтузиасты называют это резервным копированием Spotify, дабы сохранить музыку так же, как они уже сохраняют знания и культуру человечества. Ранее они фокусировались на текстовом контенте, но недавно нашли способ масштабного парсинга Spotify.
Способ простой: боты отслеживали показатель популярности трека на Spotify, спускаясь во все большие глубины библиотеки сервиса. По итогу в Annas Archive было добавлено 86 миллионов из 256 миллионов треков, но на них приходилось 99,6% прослушиваний. Попутно собрали много интересной статистики.
Например, у трех самых популярных на Spotify треков количество прослушиваний больше, чем у 100 миллионов песен, занимающих последние места в рейтинге:
- Lady Gaga, Bruno Mars Die With A Smile - 3,075 миллиарда
- Billie Eilish Birds of a Feather - 3,137 миллиарда
- Bad Bunny DtMF - 1,124 миллиарда
Spotify, конечно, пытается противостоять незаконному парсингу, но не очень понятно, что именно является незаконным в самом парсинге. Очевидно, что скачивание треков — это нарушение авторского права, но парсинг данных, их анализ и публикация результатов — это скорее нарушение той стройной картины мира, которую пытается нарисовать Spotify. Коллеги емко охарактеризовали потуги Spotify: это, похоже, тот случай, когда дверь конюшни закрывают после того, как лошадь ускакала в закат с большой коллекцией жёстких дисков в седельных сумках.