GNN untuk Augmentasi Data untuk Membangun Aplikasi Terdistribusi pada Skala dengan Open-source – Menuju AI – Teknologi, Sains, dan Teknik Terbaik

Penulis: Menuju Tim AI

Berita, penelitian, dan pembaruan AI, KTT AI yang menarik dan gratis untuk dihadiri, dan pilihan editorial bulanan kami!

Jika Anda kesulitan membaca email ini, lihat di browser web.

Komunitas AI open-source melihat pertumbuhan yang pesat. Proyek sumber terbuka seperti TensorFlow, Theano, Caffe, BERT, MXNet, PyTorch, Gluon, dan PyStanfordNLP termasuk di antara yang membantu membuat AI dapat diakses oleh semua orang. Untuk membuat Anda lebih bersemangat tentang AI yang dapat diskalakan, lihat acara yang luar biasa dan dapat diakses gratis ini, yang disajikan oleh Anyscale:

[Free] Ray Summit 22-24 Juni: Cara terbaik untuk menskalakan AI

Ray Summit menyatukan pengembang, ilmuwan data, arsitek, dan manajer produk untuk membangun AI yang dapat diskalakan menggunakan Ray, kerangka kerja dominan untuk komputasi terdistribusi. Topiknya meliputi tren AI teratas, ML dalam produksi, MLOps, pembelajaran penguatan, komputasi awan, tanpa server & lainnya. Daftar gratis untuk bergabung secara langsung atau sesuai permintaan.

Implementasi GNN yang paling umum digunakan dalam praktiknya menggunakan strategi thresholding node-bijaksana untuk melindungi informasi sensitif (misalnya, email, nomor telepon, alamat jalan, dll.). Pendekatan ini rentan terhadap serangan kebocoran informasi di jejaring sosial. Peneliti dari MIT, Carnegie Mellon, dan UIUC yang dipimpin oleh Peiyuan Liao mengusulkan algoritma graph adversarial network (GAL) baru dengan permainan minimax untuk melindungi informasi sensitif tersebut.

Di bidang Pemrosesan Bahasa Alami (NLP), augmentasi data sangat penting. Meningkatkan kinerja model dengan mengandalkan kumpulan data tambahan adalah taktik yang terbukti di banyak subbidang NLP. Namun, ini bukanlah masalah yang “mudah”. Lihat makalah ini yang dipimpin oleh para peneliti di Google, Carnegie Mellon, dan Mila – Quebec AI yang mengeksplorasi teknik canggih yang digunakan untuk pendekatan augmentasi data (DAA).

Selanjutnya, adalah hal umum dalam literatur pembelajaran mesin yang diawasi untuk mengasumsikan bahwa pembelajaran awal menyiratkan generalisasi: untuk mengembangkan sistem yang berkinerja baik pada bagian awal set pelatihan akan menghasilkan ekstrapolasi ke data yang tidak terlihat atau yang akan datang. Makalah ini dipimpin oleh Saurabh Garg dengan Machine Learning di CMU menyajikan hasil yang menunjukkan hipotesis ini benar untuk berbagai model dan jenis masalah: penelitian menunjukkan bahwa pembelajaran awal adalah kunci untuk memahami generalisasi.

Sekarang, hadapi saja. Sistem AI seringkali buram, aneh, dan sulit digunakan. Di bidang pembelajaran mesin, hal ini benar adanya. Jika kita ingin membuat sistem cerdas yang dapat dipahami dan berinteraksi dengan orang lain – dengan lebih mudah, bagian penting dari solusi ini adalah komunitas tempat orang dapat berkumpul, berbagi ide, dan belajar dari satu sama lain. Itulah mengapa kami membuat komunitas AI kami di Discord – untuk terhubung dan belajar dengan pakar dan penggemar data lainnya.

Jika Anda belum memeriksanya, kami baru saja meluncurkan buku kami tentang statistik deskriptif dengan Python. Artikel ini atau PDF ini memberikan contoh dari 36 halaman pertama buku tersebut. Harap jangan lupa bahwa Anda dapat mengakses karya ini, lebih banyak buku, dan pernak-pernik lainnya dengan menjadi anggota.

Berbagi adalah peduli. Jangan ragu untuk membagikan buletin atau tautan langganan kami dengan teman, kolega, dan kenalan Anda. Satu email per bulan; berhenti berlangganan kapan saja! Jika Anda memiliki umpan balik tentang bagaimana kami dapat meningkatkan, jangan ragu untuk memberi tahu kami.

Sekarang ke dalam pilihan bulanan! Kami memilih artikel ini berdasarkan pembaca, penggemar, dan pandangan yang didapat artikel tertentu. Kami harap Anda menikmati membacanya seperti kami. Juga, kami mulai melakukan sesuatu yang baru! Kami akan memilih artikel berkinerja terbaik, dan editor kami akan memilih beberapa esai yang kinerjanya tidak luar biasa, tetapi karena kualitasnya – mereka lolos untuk bulan itu.

? Pilihan editor artikel unggulan bulan ini ↓ ?

Model Canggih di Setiap Bidang Pembelajaran Mesin 2021 oleh Mostafa Ibrahim

Model-model mutakhir terus berubah sepanjang waktu. Sebagai seseorang yang telah mengikuti kompetisi Kaggle selama hampir setahun sekarang, saya menemukan diri saya menemukan banyak dari mereka, membuat perbandingan, mengevaluasi, dan mengujinya. Saya pikir akan menjadi ide yang baik untuk membuat daftar model terbaik untuk setiap tugas ML sehingga Anda tahu harus mulai dari mana. Tanpa basa-basi lagi, mari kita mulai!

[ Read More ]

Pengertian Pandas Melt – pd.melt () oleh Menuju AI Team

Fungsi Pandas melt () ada dalam banyak metode lain untuk membentuk kembali DataFrames pandas dari format lebar ke format panjang, terutama dalam ilmu data. Namun, fungsi pd.melt () adalah yang paling efisien dan fleksibel di antara mereka. Fungsi pd.melt () membongkar / melelehkan pandas DataFrame dari format lebar ke format panjang.

[ Read More ]

Akankah Transformers Menggantikan CNN di Computer Vision? oleh Louis (What’s AI) Bouchard

Artikel ini kemungkinan besar adalah tentang generasi berikutnya dari jaringan saraf untuk semua aplikasi computer vision: Arsitektur transformator. Anda pasti sudah mendengar tentang arsitektur ini di bidang pemrosesan bahasa alami, atau NLP, terutama dengan GPT3 yang membuat banyak kebisingan di tahun 2020. Transformer dapat digunakan sebagai tulang punggung tujuan umum untuk banyak aplikasi berbeda dan tidak hanya NLP. Dalam beberapa menit, Anda akan mengetahui bagaimana arsitektur transformator dapat diterapkan pada computer vision dengan makalah baru yang disebut Transformer Swin oleh Ze Lio et al. dari Microsoft Research [1].

[ Read More ]

Penyiapan Kode VS Saya Untuk Membuat Prototipe Strategi Perdagangan Algoritmik Secara Lokal Menggunakan LEAN oleh ___

Artikel ini mewakili dokumentasi tentang penyiapan VS Code saya untuk mengembangkan strategi perdagangan algoritmik menggunakan mesin LEAN dari QuantConnect pada mesin lokal. Ini adalah alternatif untuk menggunakan alat QuantConnect Lean CLI. Semua kode dan skrip untuk mereproduksi hasil yang dijelaskan dalam artikel ini dapat ditemukan di repo ini.

[ Read More ]

Plotly Express: Menafsirkan data melalui visualisasi interaktif oleh Eugenia Anello

Ini saat yang tepat untuk beralih ke alat lain untuk memvisualisasikan data Anda. Apakah Anda tahu Matplotlib? Lupakan. Mungkin mudah untuk diterapkan dan tidak menghabiskan banyak memori, tetapi sulit untuk mengamati perubahan fitur dari waktu ke waktu dari grafik statis.

[ Read More ]

Daftar Lengkap Metode Rekayasa Fitur: 40 Teknik, 10 Kategori oleh Michelangiolo Mazzeschi

Pada kenyataannya, rekayasa fitur menjadi penting saat Anda mulai bertransisi ke Big Data. Analitik Big Data selalu dan akan selalu diminati karena, hingga saat ini, hampir tidak ada cara bagi Anda untuk mempelajari cara bekerja pada kumpulan data raksasa sendiri. Satu-satunya cara untuk mulai mendekati data besar adalah dengan tim ahli di tempat kerja. Ini adalah pengalaman ilmu data yang serba bisa.

[ Read More ]

Cara Menggunakan Geometri Analitik untuk Menemukan Rute / Loop Terpendek untuk Masalah Penjual Perjalanan Euclidean Secara Efisien oleh Ashutosh Malgaonkar

“Masalah penjual keliling (disebut juga masalah wiraniaga keliling[1] atau TSP) menanyakan pertanyaan berikut: “Diberikan daftar kota dan jarak antara setiap pasangan kota, apa rute terpendek yang mungkin mengunjungi setiap kota tepat satu kali dan kembali ke kota asal?” Ini adalah masalah NP-hard dalam pengoptimalan kombinatorial, penting dalam ilmu komputer teoretis dan penelitian operasi …

[ Read More ]

DeepMind Menggabungkan Jaringan Logika dan Neural untuk Mengekstrak Aturan dari Data Berisik oleh Jesus Rodriguez

Dalam bukunya “The Master Algorithm,” peneliti kecerdasan buatan Pedro Domingos mengeksplorasi gagasan tentang algoritme tunggal yang dapat menggabungkan aliran pembelajaran mesin yang signifikan. Idenya, tanpa diragukan lagi, sangat ambisius, tetapi kita sudah melihat beberapa pengulangannya. Tahun lalu, Google menerbitkan makalah penelitian dengan judul menarik…

[ Read More ]

Pahami Komponen Rangkaian Waktu dengan Python oleh Amit Chauhan

Pada artikel ini, kita akan membahas konsep deret waktu dengan contoh pembelajaran mesin yang berhubungan dengan komponen waktu dalam data. Peramalan sangat penting di sektor perbankan, cuaca, prediksi populasi, dan banyak lagi yang berhubungan langsung dengan masalah kehidupan nyata.

[ Read More ]

Pembuatan Versi Data untuk Alur Kerja yang Efisien dengan MLFlow dan LakeFS oleh Giorgos Myrianthous

Sistem Kontrol Versi, seperti Git, adalah alat penting untuk pembuatan versi dan pengarsipan kode sumber. Kontrol Versi membantu Anda melacak perubahan dalam kode. Saat perubahan dilakukan, kesalahan juga dapat muncul, tetapi dengan alat kontrol sumber, pengembang dapat memutar kembali ke status kerja dan membandingkannya dengan bagian kode yang tidak berfungsi. Ini meminimalkan gangguan pada anggota tim lain yang mungkin bekerja dengan kode dan membantu mereka berkolaborasi secara efisien.

[ Read More ]

Memahami Teorema Bayes Melalui Visualisasi oleh Satsawat Natakarnkitkul

Saat kita memulai perjalanan pembelajaran mesin, kita sering bertanya pada diri sendiri apakah kita harus mempelajari statistik dan probabilitas atau tidak, terutama probabilitas. Jawabannya tergantung di mana Anda berada dan seberapa dalam Anda ingin membuat diri Anda memahaminya. Namun, ingatlah ini…

[ Read More ]

7 Utilitas Jupyter Luar Biasa Yang Harus Anda Ketahui oleh Yash Prakash

Notebook Jupyter dianggap sebagai tulang punggung eksperimen sains data dan untuk alasan yang bagus. Mereka memungkinkan pemrograman interaktif dan melek yang tidak disediakan platform lain. Pada artikel singkat ini, saya membagikan sedikit tips dan trik yang sering saya gunakan saat melakukan coding proyek data science di notebook.

[ Read More ]

Kursus Fastai Bab 3 Tanya Jawab di Linux oleh David Littlefield

Bab ketiga buku teks memberikan gambaran umum tentang masalah etika yang ada di bidang kecerdasan buatan. Ini memberikan cerita peringatan, konsekuensi yang tidak diinginkan, dan pertimbangan etis. Ini juga mencakup bias yang menyebabkan masalah etika dan beberapa alat yang dapat membantu mengatasinya.

[ Read More ]

Jadikan Dasbor Anda Menonjol – Peta Ubin oleh Memphis Meng

Bagi saya, Tableau adalah satu-satunya alat yang memungkinkan saya melakukan ilmu data sebagai seorang seniman. Namun, tidak akan menyenangkan jika semua orang melakukan visualisasi yang sama persis dengan Tableau. Artikel ini adalah salah satu episode serial saya “Jadikan Dasbor Anda Menonjol”, yang memberi Anda beberapa ide visualisasi yang brilian tetapi bukan default. Jika Anda baru mengenal saya, bacalah artikel berikut…

[ Read More ]

Menghasilkan Alur Cerita Keren Menggunakan Transformer T5 dan Bersenang-senang oleh Vatsal Saglani

Orang-orang di Google AI menerbitkan makalah “Menjelajahi Batas Pembelajaran Transfer dengan Transformator Teks-ke-Teks Terpadu” dan mempresentasikan studi empiris tentang jenis pendekatan pra-pelatihan atau teknik pembelajaran transfer yang paling berhasil dan kemudian menggunakan penelitian itu. untuk membuat model baru, yaitu Text-To-Text Transformer (T5). Model transformator ini telah dilatih sebelumnya pada versi Common Crawl Corpus yang jauh lebih bersih, dan Google menamakannya Colossal Clean Crawled Corpus (C4)…

[ Read More ]

? Terima kasih telah menjadi pelanggan Towards AI! ?

Ikuti kami ↓

[ Facebook ] |[ Twitter ]| [ Instagram ]| [ LinkedIn ] | [ Github ] | [ Google News ]

GNN untuk Augmentasi Data untuk Membangun Aplikasi Terdistribusi pada Skala dengan Open-source awalnya diterbitkan di Towards AI on Medium, di mana orang-orang melanjutkan percakapan dengan menyoroti dan menanggapi cerita ini.

Diterbitkan melalui Towards AI