Гараж
Як Spotify використовує
AI, ML та Big Data у системах рекомендацій
«Як вони це роблять? Звідки вони знають? Як їм це вдається?» — стандартна реакція на роботу рекомендаційних систем. Зрозуміти алгоритми повністю навряд вдасться, оскільки вони швидко навчаються й покращуються. Проте базові моменти все ж виділити можна.

Наприклад, зараз розповімо про основні елементи в роботі рекомендацій стриміногової платформи Spotify.
Чому рекомендації важливі

Для усіх стримінгових платформ важлива система рекомендацій. Проте для Spotify — це одна з основних конкурентних переваг.

Персональні плейлисти, мікси та рекомендації — одна з важливих
причин росту та популярності сервісу.


Зокрема, персоналізований плейлист «Discover Weekly», який щопонеділка пропонує користувачам 30 нових пісень, що потенційно можуть сподобатися конкретно їм. І це при тому, що частину з цих виконавців слухач міг взагалі не знати до цього.
Як працюють алгоритми

Зі вже зрозумілих причин Spotify велику кількість ресурсів вкладає саме в роботу з рекомендаційними системами. Алгоритми аналізують історію прослуховувань, підписки, особисті плейлисти та пісні, які сподобалися.

Звичайно ж алгоритми не стоять на місці та постійно розвиваються, проте є кілька базових моментів, про які розповімо далі.
Спільна фільтрація

Це основна функція AI, яку Spotify використовує для рекомендації нової музики. До слова, таку ж систему використовує Netflix та інтернет-магазини для пропозицій релевантного контенту на основі попередніх дій користувача.

Перш ніж пропонувати вам нових виконавців і пісні особисто, Spotify створює внутрішній «персональний смаковий профіль», що базується
на ваших звичках прослуховування. А далі алгоритм непомітно вбудовує ваш смак у свою екосистему.

Наприклад, якщо ви прослухаєте Led Zeppelin, то стримінг порекомендує вам кілька плейлистів з класичним роком. А далі детальніше аналізуватиме, вашу взаємодію з піснями в цих плейлистах.
Обробка природної мови (NLP)

По-друге, Spotify використовує Natural Language Processing (NLP) для аналізу музики й класифікації кожної пісні в розрізі музичної індустрії в цілому.

Для цього технологія NLP може сканувати метадані пісні (тобто виконавця, альбом, жанр, дати виходу, тексти пісень тощо). А також
її культурний вплив через блоги, публікації,
згадки й багато іншого в інтернеті.
Згорткові нейронні мережі (CNN) та аудіомоделі

Подібно до технології розпізнавання облич, Spotify, використовуючи лише звукову форму, може вивчати темп кожної пісні, гучність тощо. Після присвоєння математичних значень тону, висоті, настрою та звуковому профілю, Spotify може рекомендувати пісні, які відповідають подібним моделям.

Завдяки цьому маловідомі артисти можуть потрапляти до підбірки «Discover Weekly», якщо краще відповідатимуть схожим до ваших уподобань параметрам, ніж пісні популярних виконавців.
Блокчейн

У 2017 році Spotify придбав блокчейн-стартап Mediachain Labs. Ця покупка допомагає отримувати потрібним людям виплати за кожну прослухану доріжку. Це дійсно важливе завдання, оскільки раніше легше було рахувати заробіток виконавців — кількістю проданих компакт-дисків, а пізніше MP3. Зараз же, в епоху стримінгів завдання ускладнилося й ставатиме ще складнішим з кожним новим користувачем стримінг-платформ.
mediachain.io
Ще одна цінність цієї покупки для музичної індустрії — боротьба за авторські права. Є два типи даних, які дійсно важливі для цього аспекту — хто створив музичний продукт та хто володіє правами на нього. Проте немає єдиної відкритої бази, де була б зібрана ця інформація. Mediachain Labs якраз і намагається це виправити.
Якщо ж хочете й самі навчитися працювати з нейронними мережами, то почніть з курсу — Introduction to Deep Learning.

Автори: Денис Пристай
Гараж
Сподобалась стаття?