Notebookcheck Logo

Yandex släpper Yambda open source-dataset för musikrekommendationer

Det kostnadsfria datasetet Yahdex Yambda gör det möjligt för vem som helst att skapa sin egen musikrekommendationstjänst. (Bildkälla: Yandex)
Det kostnadsfria datasetet Yahdex Yambda gör det möjligt för vem som helst att skapa sin egen musikrekommendationstjänst. (Bildkälla: Yandex)
Yandex har släppt Yambda, världens största öppna dataset för musikrekommendationssystem, som innehåller 4,79 miljarder anonymiserade användarinteraktioner för att hjälpa utvecklare att skapa smarta musiktjänster som bara spelar de låtar som lyssnarna vill höra.

Yandex har släppt sin Yambda-dataset med öppen källkod som innehåller information om musiklyssnarnas preferenser för att användas för att skapa en streamingtjänst som liknar Spotify med AI-driven personalisering av spellistor.

Streamingtjänster som Spotify, Tidal och Qobuz använder mjukvarualgoritmer eller AI-modeller för att skapa spellistor baserade på individuella preferenser. Dessa tjänster släpper vanligtvis inte sin kod eller sina modeller eftersom deras unika förmåga att automatiskt spela låtar som lyssnarna tycker om anses vara en affärshemlighet för deras framgång.

Yandex har samlat in data under tio månader i form av 4,79 miljarder användarinteraktioner med 9,39 miljoner musikspår från sin pool av 28 miljoner månatliga Yandex Music användare. Detta inkluderar viktig feedback från Yandex Music-lyssnare - vad de väljer att lyssna på samt vad de gillar och ogillar. Alla interaktioner är tidsstämplade för ökad precision.

Datasetet kan laddas ner i fem miljarder (1 miljon användare), femhundra miljoner (100 000 användare) och femtio miljoner (10 000 användare) händelsemodellstorlekar, där den maximala kräver minst 85 GB lagringsutrymme. Datasetet lagras i formatet Apache Parquet format, ett kolumnorienterat datafilformat för bekväm analys och forskning.

Läsarna kan ge bort strömmande musik med ett Spotify-presentkort.

Please share our article, every link counts!
Mail Logo
> Bärbara datorer, laptops - tester och nyheter > Nyheter > Nyhetsarkiv > Nyhetsarkiv 2025 05 > Yandex släpper Yambda open source-dataset för musikrekommendationer
David Chien, 2025-05-30 (Update: 2025-05-30)