Pelatihan Terdistribusi Langsung dengan AI Bertekad, Algoritma Terobosan, Bias Berkode… dan Banyak Lagi!

Penulis: Menuju Tim AI

Berita, penelitian, dan pembaruan AI, pertemuan menarik tentang pelatihan langsung yang didistribusikan, dan pilihan editorial bulanan kami!

Jika Anda kesulitan membaca email ini, lihat di browser web.

Selamat datang kembali, Menuju keluarga AI! Sudah lama sejak kami mengirim buletin terakhir kami. Dalam edisi ini, kami menghadirkan beberapa hal menarik yang menurut kami akan Anda nikmati. Untuk memulai, lihat pertemuan luar biasa dan akses gratis ini tentang pelatihan langsung yang didistribusikan yang diselenggarakan oleh teman-teman kita di Determined AI (termasuk makan siang gratis 😊):

Determined AI mengadakan sesi makan siang dan belajar tentang cara mempercepat pelatihan model dan menghemat uang untuk resource GPU dalam prosesnya. Bergabunglah dengan kami pada tanggal 13 April untuk mendapatkan tutorial interaktif langsung tentang pelatihan terdistribusi praktis dan dapatkan makan siang bersama kami!

Delphi Research Group dari Carnegie Mellon, bekerja sama dengan Facebook, merilis temuan survei COVID-19 terbaru. Analisis survei menunjukkan bahwa keraguan vaksin terus berlanjut, ilmu data dan statistik Profesor Alex Reinhart membahas strategi potensial untuk mengatasinya.

Visi komputer memiliki beberapa aplikasi potensial. Namun, apakah pengenalan wajah etis dan akurat? Peneliti MIT Joy Buolamwini menangani paradigma ini, karena ia menemukan bagaimana pengenalan wajah tidak melihat wajah berkulit gelap secara akurat dalam dokumenter Coded Bias, yang baru saja diluncurkan di Netflix.

Apakah Anda ingin mengirimkan makalah Anda ke NeurIPS 2021? Lihat panduan rapi oleh NeurIPS Program Chairs, menyoroti daftar periksa untuk memastikan bahwa makalah Anda sesuai dengan standarnya, mulai dari transparansi, peningkatan integrasi, potensi dampak sosial, tinjauan etis, dan sebagainya.

Jika Anda tertarik dengan pembelajaran penguatan, lihat proyek ini oleh Google AI, yang menunjukkan bagaimana algoritme baru mengajari agen untuk menyelesaikan tugas dengan hanya memberikan contoh keberhasilan. Kebaruannya terletak karena fakta bahwa ia tidak memerlukan fungsi hadiah buatan tangan seperti dengan algoritme pembelajaran penguatan biasa, mengungguli pendekatan pembelajaran sebelumnya.

Conference on Fairness, Accountability, and Transparency (ACM FAccT 2021) menjadi sangat populer karena upayanya untuk meningkatkan keragaman, kesetaraan, dan inklusi dalam penelitian multidisiplin, khususnya dalam ilmu komputer, ilmu sosial, dan humaniora. Pos oleh Nil-Jana Akpinar dari pembelajaran mesin di CMU ini menampilkan beberapa makalah penelitian dan tutorial relevan yang diterima di FAccT 2021 untuk memberi Anda gambaran tentang apa yang dicari konferensi tersebut.

Set data pembelajaran mesin diisi dengan kesalahan pelabelan. Peneliti dari MIT dan Amazon menyelami masalah ini dalam makalah penelitian mereka, menyoroti bagaimana 10 kumpulan data yang dikutip secara luas, termasuk ImageNet mengandung tingkat kesalahan 3,4%. Jika Anda ingin membaca versi yang lebih bersahabat, lihat Kesalahan Label dalam Kumpulan Pengujian ML.

Jika Anda belum memeriksanya, kami baru saja meluncurkan buku kami tentang statistik deskriptif dengan Python. Artikel ini atau PDF ini memberikan contoh dari 36 halaman pertama buku tersebut. Harap jangan lupa bahwa Anda dapat mengakses karya ini, lebih banyak buku, dan pernak-pernik lainnya dengan menjadi anggota.

Sekarang ke dalam pilihan bulanan! Kami memilih artikel ini berdasarkan pembaca, penggemar, dan pandangan yang didapat artikel tertentu. Kami harap Anda menikmati membacanya seperti kami. Juga, kami mulai melakukan sesuatu yang baru! Kami akan memilih artikel berkinerja terbaik, dan editor kami akan memilih beberapa esai yang kinerjanya tidak luar biasa, tetapi karena kualitasnya – mereka lolos untuk bulan itu.

Berbagi adalah peduli. Jangan ragu untuk membagikan buletin atau tautan langganan kami dengan teman, kolega, dan kenalan Anda. Satu email per bulan; berhenti berlangganan kapan saja! Jika Anda memiliki umpan balik tentang bagaimana kami dapat meningkatkan, jangan ragu untuk memberi tahu kami.

📚 Pilihan editor artikel unggulan bulan ini ↓ 📚

Kami Tidak Perlu Khawatir Tentang Overfitting Lagi oleh Sean Benhur J

Dalam Pembelajaran Mendalam, kami menggunakan algoritme pengoptimalan seperti SGD / Adam untuk mencapai konvergensi dalam model kami, yang mengarah pada penemuan minimum global, yaitu titik di mana hilangnya set data pelatihan rendah. Tetapi beberapa jenis penelitian, seperti Zhang et al., Telah menunjukkan bahwa banyak jaringan dapat dengan mudah menghafal data pelatihan dan memiliki kapasitas untuk menyesuaikan secara berlebihan. Untuk mencegah masalah ini dan menambahkan lebih banyak generalisasi, Peneliti di Google telah menerbitkan makalah baru yang disebut Minimisasi Kesadaran Ketajaman, yang memberikan hasil State of the Art pada CIFAR10 dan kumpulan data lainnya.

[ Read More ]

Pelabelan Data Canggih Dengan Platform Manajemen Data Bertenaga AI Sejati oleh Tim Menuju AI

Pelabelan data adalah bagian penting dari alur kerja pembelajaran mesin, terutama pemrosesan awal data, di mana data masukan dan keluaran diberi label untuk klasifikasi guna menyajikan basis pembelajaran untuk pemrosesan data yang direncanakan. Kami menggunakan pelabelan data untuk mengidentifikasi data mentah, seperti objek dalam gambar, video, teks, dan sebagainya. Ini bekerja dengan membubuhkan satu atau lebih label penting dan informatif untuk menghasilkan konteks sehingga model dapat belajar darinya.

[ Read More ]

Metode Ensemble Dijelaskan dalam Bahasa Inggris Biasa: Bagging oleh Claudia Ng

Pada artikel ini, saya akan membahas metode ansambel model homogen yang populer – mengantongi. Ansambel homogen menggabungkan sejumlah besar penduga dasar atau pembelajar lemah dari algoritme yang sama. Prinsip di balik ansambel homogen adalah gagasan tentang “kebijaksanaan orang banyak” – prediksi kolektif dari banyak model yang beragam lebih baik daripada kumpulan prediksi apa pun yang dibuat oleh satu model. Ada tiga persyaratan untuk mencapai ini …

[ Read More ]

GAMs and Smoothing Splines (Part-1) oleh Sai Pradeep Peri

Di dunia saat ini, di mana Deep Learning digunakan untuk sebagian besar aplikasi Machine Learning, Interpretability telah menjadi yang terpenting dalam aplikasi dunia nyata. Interpretabilitas Model sangat penting untuk memahami bagaimana variabel yang berbeda berinteraksi untuk menghasilkan keputusan model. Dalam konteks ini, saya ingin meringkas keluarga model yang dapat ditafsirkan – Generalized Additive Model (GAM) bersama dengan blok penyusunnya – Smoothing Splines.

[ Read More ]

Langkah-Langkah Pemahaman Dasar Jaringan Neural dengan Keras di Python oleh Amit Chauhan

Jaringan saraf sedang booming di industri di seluruh dunia. Ini tentang algoritme pembelajaran mesin tradisional untuk regresi, klasifikasi, pengelompokan, dll. Ketika kami mendapatkan data kompleks yang besar, masalah muncul dengan akurasi, penyesuaian yang berlebihan, dan lebih banyak waktu pengujian dan pelatihan. Pada artikel ini, kita akan membahas tentang jaringan saraf tiruan dan definisinya dengan contoh Keras. Penggunaan jaringan neural dibandingkan pembelajaran mesin tradisional untuk akurasi dan data kompleks yang lebih besar.

[ Read More ]

Menganalisis Puisi dengan Python oleh Curtis Thompson

Seberapa mudah menulis puisi? Menampar beberapa kata di bawah halaman, membuatnya berima, dan Anda akan mendapatkan puisi Anda. Beberapa penyair mungkin meringis setelah membaca kalimat itu. Mungkin Anda telah memutuskan untuk mengikuti bentuk puisi terkenal seperti haikus, limerick, dan soneta – yang pasti akan membuat kata-kata Anda terlihat seperti puisi. Terkadang sulit untuk mengetahui apakah puisi Anda cocok dengan bentuknya. Di sinilah keterampilan pengkodean Anda masuk!

[ Read More ]

Mengapa Python Adalah Bahasa Yang Sempurna Untuk Proyek Pembelajaran Mesin oleh Bipin Biddappa P K

Python selalu berhasil dengan baik karena sifatnya yang stabil dan mudah dipelihara, dan seperti remaja populer yang melewati koridor sekolah menengah, python telah menarik banyak perhatian dalam beberapa tahun terakhir. Indeks TIOBE menamakannya bahasa tahun ini, empat kali lipat sejak didirikan.

[ Read More ]

300 Notebook NLP dan Kebebasan oleh Quantum Stat

Jika ini adalah pertama kalinya Anda mendengar tentang SDNR, ini adalah tempat penyimpanan praktis yang berisi lebih dari 300 buku catatan Colab (dan terus bertambah) yang berfokus pada pemrosesan bahasa alami (NLP). Colab pada dasarnya adalah notebook Jupyter yang dapat digunakan dan dibagikan melalui kernel berbasis web. Bagian terbaik dari notebook ini adalah Anda dapat menggunakan GPU gratis, biasanya K80 atau T4 atau bahkan TPU (jika Anda merasa berbahaya), untuk menyempurnakan model NLP Anda. Jika Anda mencari pengenalan tentang Colab, Anda dapat menonton video ini di sini…

[ Read More ]

Buat Aplikasi Web Untuk Menafsirkan Prediksi ML Anda dalam Hitungan Detik Dengan Shapash oleh Chetan Ambi

Shapash memungkinkan Anda membuat aplikasi web yang indah untuk menafsirkan model pembelajaran mesin Anda dalam hitungan detik segera setelah Anda menyiapkan modelnya. Anda tidak perlu menghabiskan waktu membuat aplikasi web Anda sendiri. Ini menghemat banyak waktu untuk Anda dan tim Anda. Bukankah ini menarik? Jika Anda membaca sampai saat ini, maka saya yakin Anda tertarik dengan ini.

[ Read More ]

Panduan Lengkap untuk Interval Keyakinan, uji-t, dan uji-z di R untuk Ilmuwan Data oleh Rashida Nasrin Sucky

Interval kepercayaan, uji-t, dan uji-z adalah metode yang trendi dan banyak digunakan dalam statistik inferensial. Mereka sangat penting karena kita hanya dapat menggunakan sampel untuk menyimpulkan populasi yang besar untuk penelitian atau analisis data apa pun. Dalam hal ini, metode statistik inferensial ini membantu kami mempertimbangkan kesalahan dan menyimpulkan perkiraan yang lebih baik untuk populasi yang lebih besar dengan menggunakan sampel yang lebih kecil.

[ Read More ]

Ilmuwan Data Harus Merangkul Matematika oleh Benjamin Obi Tayo Ph.D.

Ilmu data adalah bidang interdisipliner yang menggunakan metode, proses, dan algoritme ilmiah untuk mengekstrak pengetahuan dan wawasan dari data. Bidang data science memiliki beberapa subbagian seperti data mining, transformasi data, visualisasi data, machine learning, deep learning, dll. Sebagai disiplin ilmu, tugas data science dapat dibagi menjadi 3 tahapan utama…

[ Read More ]

Bagaimana Microsoft Icebreaker Mengatasi Tantangan Cold-Start dalam Model Pembelajaran Mesin oleh Jesus Rodriguez

Akuisisi dan pelabelan data pelatihan tetap menjadi salah satu tantangan utama untuk adopsi utama solusi pembelajaran mesin. Dalam komunitas penelitian pembelajaran mesin, beberapa upaya seperti pembelajaran yang diawasi dengan lemah atau pembelajaran satu langkah telah dibuat untuk mengatasi masalah ini. Microsoft Research baru-baru ini menginkubasi grup yang disebut AI Data Minimum untuk mengerjakan solusi berbeda untuk model pembelajaran mesin yang dapat beroperasi tanpa memerlukan set data pelatihan yang besar.

[ Read More ]

Mengapa Business Intelligence berguna untuk Data Scientist? oleh Eugenia Anello

Saya sebenarnya bertemu dengan Business Intelligence selama magang Ilmu Data. Tapi ini bukan yang pertama kali. Itu terjadi lagi dalam magang sebelumnya untuk jenis peran lain di perusahaan TIK. Selama kuliah, saya tidak pernah mengikuti kursus tentang topik ini, dan tidak mudah untuk memahaminya ketika ada banyak konsep baru dan tidak banyak sumber daya di Internet. Jadi, apa itu Business Intelligence? Mengapa kami biasanya bertemu saat kami pergi bekerja dan bukan saat studi?

[ Read More ]

Kursus Fastai Bab 1 di Linux oleh David Littlefield

artikelnya adalah panduan lengkap yang dimaksudkan untuk membantu Anda mempelajari apa yang terjadi di sepanjang bab ini. Ini memberikan definisi istilah, perintah, dan kode yang digunakan dalam artikel. Ini juga menyediakan teks yang digarisbawahi yang memiliki tautan ke definisi tambahan dalam glosarium artikel. Bab pertama dari buku teks menunjukkan bagaimana membangun 5 model berbeda dengan sekitar 5 baris kode. Itu membangun model untuk klasifikasi gambar, segmentasi gambar, klasifikasi teks …

[ Read More ]

Membangun Data Lake dengan AWS oleh Magdalena Konkiewicz

Setiap hari, perusahaan besar dan kecil mengumpulkan lebih banyak data. Perusahaan biasanya mengumpulkan data tentang operasi perusahaan, klien, persaingan, produk, dll. Mereka perlu menyimpan, memproses, dan menganalisis semua informasi ini secara efisien. Solusi tradisional dalam menyiapkan gudang dan database tidak cukup untuk memenuhi kebutuhan perusahaan karena mereka menangani data dalam jumlah besar.

[ Read More ]

🙏 Terima kasih telah menjadi pelanggan Towards AI! 🙏

Ikuti kami ↓

[ Facebook ] |[ Twitter ]| [ Instagram ]| [ LinkedIn ] | [ Github ] | [ Google News ]

Pelatihan Terdistribusi Langsung dengan AI Bertekad, Algoritma Terobosan, Bias Berkode… dan Banyak Lagi! awalnya diterbitkan di Towards AI on Medium, di mana orang-orang melanjutkan percakapan dengan menyoroti dan menanggapi cerita ini.

Diterbitkan melalui Towards AI