Yandex har släppt sin Yambda-dataset med öppen källkod som innehåller information om musiklyssnarnas preferenser för att användas för att skapa en streamingtjänst som liknar Spotify med AI-driven personalisering av spellistor.
Streamingtjänster som Spotify, Tidal och Qobuz använder mjukvarualgoritmer eller AI-modeller för att skapa spellistor baserade på individuella preferenser. Dessa tjänster släpper vanligtvis inte sin kod eller sina modeller eftersom deras unika förmåga att automatiskt spela låtar som lyssnarna tycker om anses vara en affärshemlighet för deras framgång.
Yandex har samlat in data under tio månader i form av 4,79 miljarder användarinteraktioner med 9,39 miljoner musikspår från sin pool av 28 miljoner månatliga Yandex Music användare. Detta inkluderar viktig feedback från Yandex Music-lyssnare - vad de väljer att lyssna på samt vad de gillar och ogillar. Alla interaktioner är tidsstämplade för ökad precision.
Datasetet kan laddas ner i fem miljarder (1 miljon användare), femhundra miljoner (100 000 användare) och femtio miljoner (10 000 användare) händelsemodellstorlekar, där den maximala kräver minst 85 GB lagringsutrymme. Datasetet lagras i formatet Apache Parquet format, ett kolumnorienterat datafilformat för bekväm analys och forskning.
Läsarna kan ge bort strömmande musik med ett Spotify-presentkort.
Topp 10...
» Topp 10: Bästa bärbara allround/multimediadatorerna
» Topp 10: Bästa bärbara speldatorerna
» Topp 10: Bärbara budget/kontorsdatorer
» Topp 10: Bästa bärbara kontors/premiumdatorerna
» Topp 10: Bärbara arbetsstationer
» Topp 10: De bästa små/kompakta bärbara datorerna
» Topp 10: Bästa ultrabooks
» Topp 10: Bästa hybriddatorerna
» Topp 10: Bästa surfplattorna
» Topp 10: Marknadens bästa smartphones