NLP Cypher | 05.09.21 – Menuju AI – Teknologi, Sains, dan Teknik Terbaik

Penulis: status kuantum

Saturnus dilihat dari Mimas | Chesley Bonestell

PENGOLAHAN BAHASA ALAM (NLP) WEEKLY NEWSLETTER

Lost Tales

Saya kebanyakan tahu dark.fail sebagai situs bawang dengan banyak koleksi url untuk parasailing tor-land (alias darknet). Sejujurnya, saya bahkan tidak tahu dark.fail memiliki situs clearnet. Dan baru-baru ini, clearnet mirror telah di-phishing selama 4–5 hari. ?

Rupanya seorang pelaku ancaman memberikan perintah pengadilan palsu kepada pencatat domain dark.fail. Dan sebagai imbalannya, mereka memperoleh akses ke hosting dark.fail dan mengalihkan lalu lintas ke halaman web cermin aktor jahat itu. Itu phishing URL halaman dengan maksud untuk membodohi orang agar berpikir mereka membeli produk di pasar gelap padahal pelaku jahat mengantongi bitcoin mereka. Ini telah menyebabkan keributan besar di komunitas peretasan mengingat popularitas dark.fail.?

Pemilik anonim dark.fail muncul di podcast peretas akhir pekan lalu untuk membahas pembajakan dan berbicara melalui perangkat lunak text-to-speech untuk melindungi identitas suara mereka. Anda dapat menonton / mendengarkan di sini:

https://medium.com/media/a9c9f8844f55519b5f891ed693e2eb24/href

Dan di berita lainnya…

Sisa ICLR…

Ulasan Grafik Pengetahuan Galkin dari ICLR

Tidak dapat mengadakan konferensi tanpa mendapatkan tinjauan grafik pengetahuan Galkin!

OCD:

Penalaran dalam Grafik Pengetahuan: Lebih sederhana dari yang Anda kira Logika Temporal dan Perspektif NLP KGs: PMI & Relasi, Penjawab Pertanyaan Kompleks yang Berhubungan dengan Entitas: Lebih Banyak Modalities Lookback

Grafik Pengetahuan @ ICLR 2021

Pembaruan Indeks NLP

Sejak minggu lalu, kami telah menambahkan ~ 750 repo baru ke indeks dan saya telah menyertakan bintang GitHub dan bahasa pemrograman untuk setiap repo.

Selain itu, kami juga menambahkan hampir 1.000 video pengantar untuk aset tertentu. Terima kasih kepada Amit Chaudhary atas datanya! ?‍?

Lihat disini:

Indeks NLP

Konstruksi Basis Pengetahuan Akal Sehat

Lihat bagaimana Institut Max Planck untuk Informatika membangun basis pengetahuan akal sehat.

Makalah ini memperkenalkan 3 sistem:

Quasimodo: “basis pengetahuan akal sehat sumber terbuka yang dirancang untuk mendapatkan properti yang relevan tentang entitas.” situs

Dice: “kerangka kerja penalaran untuk memperoleh pengetahuan akal sehat yang halus dan ekspresif dari koleksi CSK yang ada”. situs

Pendakian: “jalur pipa untuk mengumpulkan, mengekstrak, dan mengonsolidasi pengetahuan akal sehat (CSK) secara otomatis dari web”. situs

Kumpulan Data Netflix Besar

“Kumpulan data ini menggabungkan sumber data dari Netflix, Rotten Tomatoes, IMBD, poster, informasi box office, trailer di YouTube, dan lainnya menggunakan berbagai API.” Netflix tidak memiliki API-nya sendiri sehingga para pengembang langsung melakukan triangulasi data Netflix melalui sumber lain. ?

Terakhir diperbarui April 2021 menurut penulis.

Data Netflix terbaru dengan 26+ atribut gabungan

Pembelajaran yang Diawasi Sendiri yang Luar Biasa

Indeks untuk semua hal Self-Supervised Learning di berbagai domain seperti visi, NLP, grafik, dan lainnya.

jason718 / pembelajaran mandiri yang mengagumkan

Untuk pengenalan intuitif tentang pembelajaran mandiri, lihat blog Sergey Ivanov:

GML In-Depth: tiga bentuk pembelajaran mandiri

Repo Cypher ?‍?

Koleksi repo yang baru-baru ini dirilis yang menangkap our kami

Tolok Ukur SUPERB untuk Ucapan

Kumpulan sumber daya tolok ukur untuk mengevaluasi kemampuan representasi bersama universal untuk pemrosesan ucapan. SUPERB terdiri dari:

Tolok ukur sepuluh tugas pemrosesan ucapan yang dibangun di atas kumpulan data publik yang sudah mapan,

TOOLKIT BENCHMARK dirancang untuk mengevaluasi dan menganalisis kinerja model yang dilatih sebelumnya pada berbagai tugas hilir mengikuti protokol evaluasi konvensional dari komunitas pidato,

PAPAN PEMIMPIN publik untuk PENYERAHAN dan pelacakan kinerja pada tolok ukur.

LUAR BIASA: Pemrosesan ucapan Universal PERformance Benchmark

Repo terkait:

s3prl / s3prl

Makalah Terhubung ?

VQA Teks yang Dapat Dijelaskan

Kumpulan data yang berisi penjelasan tekstual kebenaran dasar dan multi-referensi yang dapat dimanfaatkan selama pelatihan dan evaluasi.

Set data belum keluar secara resmi, tetapi pantau terus repo ini untuk pembaruan.

amzn / menjelaskan-teks-vqa

Makalah Terhubung ?

Identifikasi Penyakit Langka

Menggunakan ontologi dan pengawasan yang lemah untuk mengidentifikasi penyakit langka dari catatan klinis.

acadTags / Identifikasi penyakit langka

Makalah Terhubung ?

Suite The Carleton Benchmark (CBench)

Kerangka kerja pembandingan untuk mengevaluasi sistem penjawab pertanyaan melalui grafik pengetahuan.

aorogat / CBench

Makalah Terhubung ?

AMR Parser dengan Action-Pointer Transformer

Penguraian Abstrak Meaning Representation (AMR) adalah tugas prediksi kalimat-ke-grafik di mana node target tidak secara eksplisit disejajarkan dengan token kalimat.

Penulis menggunakan trafo yang menangani pembuatan konstruksi grafik sewenang-wenang.

IBM / transisi-amr-parser

Makalah Terhubung ?

ADAM

ADAM adalah demonstrasi dari “penguasaan bahasa yang membumi,” yang berarti belajar (beberapa jumlah) bahasa dari mengamati bagaimana bahasa digunakan dalam situasi konkret, seperti yang dilakukan bayi (mungkin). ?

Pekerjaan ini berada di bawah program DARPA’s Grounded Artificial Intelligence Language Acquisition (GAILA). ??

isi-vista / adam

Makalah Terhubung ?

Knover | Generasi Dialog Berlandaskan Pengetahuan

Knover adalah toolkit untuk menghasilkan dialog berbasis pengetahuan berdasarkan PaddlePaddle. Knover memungkinkan peneliti dan pengembang untuk melakukan pelatihan / inferensi yang efisien dari model pembuatan dialog skala besar.

PaddlePaddle / Knover

Makalah Terhubung ?

Kumpulan Data Minggu Ini: Pendakian

Apa itu?

Saluran untuk mengumpulkan, mengekstrak, dan mengkonsolidasikan pengetahuan akal sehat (CSK) secara otomatis dari web.

Dimana itu?

AscentKB

Setiap hari Minggu kami melakukan pengumpulan mingguan berita NLP dan penurunan kode dari para peneliti di seluruh dunia.

Untuk liputan lengkap, ikuti Twitter kami: @Quantum_Stat

keadaan kuantum

NLP Cypher | 05.09.21 awalnya diterbitkan di Towards AI on Medium, di mana orang-orang melanjutkan percakapan dengan menyorot dan menanggapi cerita ini.

Diterbitkan melalui Towards AI