Bagaimana Google membuat “Hum untuk Menelusuri”? – Menuju AI – Teknologi, Sains, dan Teknik Terbaik


Penulis: Daksh Trehan

Teknologi

Alat yang sempurna untuk mengusir cacing telinga.

Anda tahu saya teman-teman, saya suka memecahkan kode algoritma yang menarik, pertama itu TikTok, lalu Tinder berikutnya adalah GPT-3 dan sekarang Google Hum!

Daftar Isi:

Bagaimana cara menggunakan fitur Google Hum? Bagaimana Google menggunakan ML dalam fitur “Hum”?

Apakah Anda pernah berada di ruang ujian / ruang konferensi dan yang terpikirkan oleh Anda hanyalah suara musik aneh tadi diputar di disko tadi malam?

Jangan khawatir, kita semua pernah ke sana. Fenomena ini dikenal sebagai cacing telinga. Dan, untuk mengusir cacing telinga dan menenangkan pikiran Anda, satu-satunya trik adalah menyanyi / mendengarkan lagu itu.

Tapi, Anda tidak tahu lagu itu dan hanya suara “senandung” yang berputar di dalam kepala Anda? Jangan khawatir, Google ada di sini.

Google Hum adalah kemajuan sistem pengenalan musik biasa.

Shazam, Penelusuran Suara Pixel semuanya baik-baik saja, tetapi mereka hanya dapat mengenali nada yang tepat dengan adanya nada, rate, dan instrumen. Namun Google membawanya ke level lain dan memperkenalkan “Hum” yang bahkan dapat mengenali nama lagu jika Anda “bersenandung” di Google selama 15 detik dengan nada senandung yang sesuai dengan lagu tertentu.

Lucu dan menakjubkan, betapa segala sesuatu yang aneh yang dapat kita bayangkan sekarang dimungkinkan dengan penggunaan AI dan bahkan ketika manusia dengan selera yang sama seperti milik Anda, tidak dapat memahami Anda tetapi AI yang menakutkan dapat!

Bagaimana cara menggunakan fitur Google Hum? )

Caranya mudah, buka pencarian google anda, tap pada”mic” dan”hum” pada song / lagu tersebut.

Bagaimana Google menggunakan ML dalam fitur”Hum”?

Dalam sistem pengenalan musik yang khas, untuk memproses sound, sampel diubah menjadi spektogram untuk menemukan kecocokan audio yang tepat. Tetapi ini tidak dapat dilakukan dalam kasus suara yang didendangkan, karena suara yang didendangkan tidak menyertakan tambahan apa pun seperti stride, nada, kenyaringan, dll. Yang dimilikinya hanyalah nada acak, yang harus dicocokkan oleh version kami. ke lagu terdekat.

Lagu Dendangkan vs Rekaman Studio, Sumber

Untuk mencapai teknik yang disebutkan di atas, model kita harus sangat kuat dan harus mengabaikan semua yang tepat untuk catatan suara. Untuk membuatnya bekerja, kita perlu membuat perubahan pada version Pengenalan Suara yang sudah ditentukan.

Memodifikasi Sistem Pengenalan Musik yang sudah ditentukan, Sumber

Suara senandung diubah menjadi urutan berbasis angka untuk komputasi yang mudah. Jaringan saraf yang dimodifikasi kemudian dilatih dengan sepasang sound hummed dan studio-recording yang menghasilkan embeddings untuk setiap pasangan enter sehingga menciptakan identitas unik seperti sidik jari. Model tersebut harus cukup kuat untuk membedakan dua lagu berbeda dengan melodi yang sama tetapi musik dan instrumentasi yang berbeda.

Prototipe sidik jari

Model terlatih menghasilkan embedding untuk setiap input dan mencari lagu / song dengan embedding serupa dalam korpus pelatihannya.

Information pelatihan

Information pelatihan membutuhkan versi yang direkam dan dinyanyikan dari setiap lagu. Pitch diekstraksi dari lagu menggunakan SPICE sehingga menghasilkan melodi yang terdiri dari nada sound diskrit.

Menghasilkan Data Pelatihan, Sumber

Model ini selanjutnya dibuat kokoh dengan bereksperimen dengan nada, kenyaringan, bass, energi rekaman studio. Selain itu, mencampur dan mencocokkan dua sound berbeda dari penyanyi yang sama membantu mencapai akurasi yang lebih tinggi.

Saya hanya berharap Google telah berlatih dengan semua versi lagu yang bersenandung buruk dan mencoba sendiri secara pribadi.

Triplet reduction

Pelatihan ini digabungkan dengan Triplet Loss yang mencoba mengabaikan beberapa poin pelatihan sehingga menghindari berbagai kelemahan Jaringan Neural. Saat kita melewatkan pasangan sound dan melodi yang sesuai ke version kita, kehilangan triplet cenderung mengabaikan nilai information pelatihan yang berasal dari melodi yang tidak biasa, yaitu meninggalkan sound instrumen yang menyertainya dan menghasilkan urutan berbasis angka untuk setiap melodi.

Triplet reduction, Gambar oleh Penulis

Kesimpulan

Pada artikel ini, kami mencoba menjelaskan cara kerja Google Hum dan bagaimana Machine Learning menjadi inti dari dunia digital baru.

Referensi:

[1] Website AI Google: Pembelajaran Mesin di Balik Hum untuk Menelusuri

[2] Google menjelaskan cara kerja Hum to Hunt

[3] Hum untuk Menelusuri: ML di Balik Fitur Baru Google

[4] Google sekarang bisa menebak lagu yang Anda senandung! | Oleh Nikita Gawde | Moderate

Jangan ragu untuk terhubung:

Portofolio ~ https://www.dakshtrehan.com

LinkedIn ~ https://www.linkedin.com/in/dakshtrehan

Ikuti untuk site Machine Learning / Deep Learning lebih lanjut.

Sedang ~ https://medium.com/@dakshtrehan

Ingin mempelajari lebih lanjut? )

Apakah Anda Siap Menyembah Dewa AI? )
Mendeteksi COVID-19 Menggunakan Deep Learning
Algoritma AI yang Tak Terelakkan: TikTok
GPT-3 Dijelaskan kepada anak berusia 5 tahun.
Tinder + AI: How Jodoh yang sempurna? )
Panduan orang dalam untuk Kartunisasi menggunakan Machine Learning
Memperkuat Ilmu Dibalik Pembelajaran Penguatan
Ilmu decoding di balik Generative Adversarial Networks
Memahami LSTM dan GRU
Jaringan Neural Berulang untuk Dummies
Convolution Neural Network for Dummies

Bersulang

Bagaimana Google membuat”Hum untuk Menelusuri”? Awalnya diterbitkan di Limit AI on Moderate, di mana orang-orang melanjutkan percakapan dengan menyoroti dan menanggapi cerita ini.

Diterbitkan melalui Towards AI