Optical Character Recognition (OCR) untuk Pelokalan Teks, Deteksi, dan Lainnya! – Menuju AI – Teknologi, Sains, dan Teknik Terbaik

Penulis: Menuju Tim AI

BERITA, NEWSLETTER

Berita AI, penelitian dan pembaruan, API bahasa alami yang menarik, buku pertama kami tentang statistik deskriptif, dan pilihan editorial bulanan kami!

Jika Anda kesulitan membaca email ini, lihat di browser web.

Selamat Selasa, Menuju keluarga AI! Sudah lama sejak kami mengirim buletin terakhir kami. Dalam edisi ini, kami mempersembahkan kepada Anda beberapa barang menarik yang menurut kami akan Anda sukai. Untuk memulai, makalah penelitian ini tentang Jaringan Tetapan Waktu Cair yang dipimpin oleh Ramin Hasani et al. dari MIT menampilkan model jaringan saraf berulang baru yang dapat mengubah persamaan yang mendasarinya untuk beradaptasi dengan input data baru guna mengurangi kompleksitas secara masif secara terus menerus.

Sudahkah Anda mencoba demo API bahasa natural expert.ai (tidak perlu mendaftar untuk mencobanya!). Cukup, pilih bahasa, pilih dokumen atau gunakan teks sampel hingga 10.000 karakter, klik analisis, dan Anda akan melihat berbagai jenis yang dilakukan pakar analisis bahasa alami.

Kami baru-baru ini meluncurkan buku kami tentang statistik deskriptif dengan Python, jika Anda belum memeriksanya. Artikel ini atau PDF ini memberikan contoh dari 36 halaman pertama buku tersebut. Harap jangan lupa bahwa Anda dapat mengakses karya ini, lebih banyak buku, dan pernak-pernik lainnya dengan menjadi anggota.

Pekerjaan pembelajaran penguatan yang dipimpin oleh MineRL ini sangat menarik. Mereka memimpin karya mutakhir dalam kemajuan dan pengembangan terobosan metode RL untuk penelitian pembelajaran mesin. Periksalah, terutama jika Anda tertarik dengan Minecraft dan pembelajaran penguatan.

Selanjutnya, jika Anda tertarik dengan computer vision, lihat penelitian dari Carnegie Mellon yang dipimpin oleh Mihir Prabhudesai, Hsiao-Yu Fish Tung, dkk., Model mereka dapat mengenali objek baru dan memberikan jawaban atas pertanyaan visual kompleks dari kumpulan data berlabel kecil.

Di awal setiap tahun, Gradient Flow mengumpulkan beberapa dasar dari perkembangan teknologi tahun ini di berbagai bidang terkait data besar, analitik, pembelajaran mesin, dan AI, serta membagikan prediksi mereka pada laporan tren. Jika Anda belum memeriksanya, laporan tren 2021 mereka sangat komprehensif.

Berikutnya di NLP, model bahasa yang kuat (LM) seperti GPT-3 dan T5 memiliki kemampuan yang mengesankan untuk menjawab pertanyaan dalam skenario yang kompleks dengan melanjutkan petunjuk tekstual. Namun, seberapa yakin mereka? Zhengbao Jiang dkk. membahas masalah LM ini secara rinci dalam tulisan ini.

Sekarang ke dalam pilihan bulanan! Kami memilih artikel ini berdasarkan pembaca, penggemar, dan pandangan yang didapat artikel tertentu. Kami harap Anda menikmati membacanya seperti kami. Juga, kami mulai melakukan sesuatu yang baru! Kami akan memilih artikel berkinerja terbaik, dan editor kami akan memilih beberapa esai yang tidak memiliki kinerja luar biasa, tetapi karena kualitasnya – mereka berhasil untuk bulan itu.

Jika Anda bisa, silakan bagikan tautan langganan kami dengan teman, kolega, dan kenalan Anda. Satu email per bulan; berhenti berlangganan kapan saja! Jika Anda memiliki umpan balik tentang bagaimana kami dapat meningkatkan, jangan ragu untuk mengirimkan email kepada kami.

? Pilihan editor artikel unggulan bulan ini ↓ ?

Tesseract OCR untuk Pelokalan dan Deteksi Teks oleh Sharon Lim

Sistem pengenalan karakter optik (“OCR”) telah banyak digunakan untuk menyediakan entri teks otomatis ke dalam sistem terkomputerisasi. Namun, ketidakmampuan sistem OCR konvensional untuk membaca lebih dari segelintir jenis font dan format halaman masih belum terselesaikan. Akibatnya, OCR konvensional tidak pernah mencapai lebih dari dampak marjinal pada jumlah total dokumen yang memerlukan konversi ke dalam bentuk digitalnya.

[ Read More ]

Statistik Deskriptif untuk Pengambilan Keputusan Berdasarkan Data dengan Python oleh Pratik Shukla, Roberto Iriondo

Statistik deskriptif penting untuk pengambilan keputusan berdasarkan data. Menggunakan statistik deskriptif akan memberi Anda cara untuk membuat keputusan langsung tentang pengambilan keputusan Anda tanpa metodologi yang rumit. Statistik deskriptif membentuk platform fundamental untuk setiap analisis data kuantitatif. “Statistik Deskriptif untuk Pengambilan Keputusan Berbasis Data dengan Python” adalah sebuah buku oleh Pratik Shukla dan Roberto Iriondo. Di antara kami, kami telah bekerja sama selama setahun terakhir untuk membuat materi ini dan mempersiapkan Anda untuk pengambilan keputusan yang lugas dan berdasarkan data.

[ Read More ]

Bagaimana AI Akan Mengakhiri Pendekatan Satu Ukuran untuk Semua dalam Penilaian Manusia oleh Okan Bulut

Asumsikan bahwa Anda masuk ke toko untuk membeli setelan (atau gaun) yang bagus untuk diri Anda sendiri. Anda berjalan-jalan di toko sebentar dan akhirnya menemukan yang bagus yang sangat Anda sukai. Saat Anda meminta staf penjualan untuk membantu Anda menemukan ukuran yang tepat, dia berkata, “Kami hanya menjual pakaian satu ukuran untuk semua. Anda dapat mencoba setelan itu di ruang pas dan melihat apakah itu benar-benar cocok untuk Anda. ” Cerita ini mungkin terdengar seperti fiksi distopia bagi Anda karena saat ini, sebagian besar toko pakaian di seluruh dunia menawarkan ukuran pakaian yang berbeda dan layanan penjahitan / perubahan tambahan. Oleh karena itu, Anda mungkin tidak akan pernah membeli setelan satu ukuran untuk semua.

[ Read More ]

Algoritma Genetika untuk Optimasi Strategi Trading dengan Python oleh Louis Chan

Jika Anda pernah mendengar tentang perdagangan sistematis atau perdagangan algoritmik, Anda harus tahu bahwa pengoptimalan strategi adalah salah satu faktor terpenting yang menentukan apakah strategi tersebut akan impas. Dan bagian terburuknya adalah: pengoptimalan sangat berat secara komputasi. Bayangkan strategi crossover MACD sederhana, dan akan ada setidaknya 3 parameter: periode rata-rata pergerakan cepat, lambat dan sinyal, dan ratusan kemungkinan nilai untuk masing-masing, menjadikannya lebih dari satu juta kemungkinan kombinasi.

[ Read More ]

Implementasi langkah demi langkah GAN pada data gambar kustom di PyTorch: Part 2 oleh Varshita Sher

Di Bagian 1 tentang GAN, kami mulai membangun intuisi mengenai apa itu GAN, mengapa kami membutuhkannya, dan bagaimana inti di balik pelatihan GAN adalah membuat model generator yang tahu cara mengubah vektor derau acak menjadi hampir (indah) hampir. citra nyata. Karena kita telah membahas pseudocode secara mendalam di Bagian 1, pastikan untuk memeriksanya, karena akan ada banyak referensi tentangnya!

[ Read More ]

Membuat Aplikasi Web AI menggunakan TensorFlow, Google Cloud Platform, dan Firebase oleh Jonathan Quijas

Model Pelatihan Machine Learning untuk aplikasi web dengan fungsi ML hanya bagian dari cakupan pengembangan keseluruhan project. Salah satu aspek yang sering diabaikan adalah melampaui kotak pasir dan ke lingkungan produksi. Artikel ini akan menunjukkan cara menyajikan model TensorFlow dengan mudah melalui layanan prediksi menggunakan Platform AI Google Cloud Platform (GCP) dan Cloud Functions. Setelah itu, saya akan menunjukkan cara menerapkan dan menghosting klien web menggunakan Firebase untuk melakukan kueri model menggunakan permintaan HTTP.

[ Read More ]

Cara Memprediksi Harga Saham dengan LSTM oleh George Pipis

Memori jangka pendek (LSTM) adalah arsitektur jaringan saraf berulang buatan (RNN) yang digunakan dalam pembelajaran mendalam dengan koneksi umpan balik. Tidak hanya dapat memproses titik data tunggal seperti gambar, tetapi juga seluruh urutan data seperti ucapan atau video. Misalnya, LSTM berlaku untuk tugas-tugas seperti pengenalan tulisan tangan yang tidak tersegmentasi, terhubung, pengenalan ucapan, terjemahan mesin, deteksi anomali, analisis deret waktu, dll.

[ Read More ]

Dasar-dasar Rangkaian Waktu dengan Python oleh Amit Chauhan

Analisis deret waktu merupakan bagian dari aktivitas sehari-hari yang terjadi di sekitar kita terkait waktu. Sebagai hari, bulan, tahun berlalu dengan pengamatan di sekitar kita meninggalkan beberapa informasi. Kami mengambil bantuan dari analisa statistik untuk membuat data / informasi dalam beberapa format dan melakukan analisa untuk mendapatkan informasi tersebut. Dengan semakin banyaknya data yang dihasilkan di mana-mana, tidak mudah menggunakan alat analisis sederhana tingkat rendah. Jadi, alat dan algoritme baru dikembangkan untuk membuat data tersebut dalam format yang sesuai dalam jumlah besar dan menyelesaikan tujuan kita untuk mendapatkan informasi.

[ Read More ]

Thinking Fast and Slow dan Gelombang Ketiga AI oleh Louis (What’s AI) Bouchard

Inilah alasan mengapa Francesca Rossi dan timnya di IBM menerbitkan makalah ini yang mengusulkan arahan penelitian untuk memajukan AI. Menggambar inspirasi dari teori kognitif pengambilan keputusan manusia. Premisnya adalah: jika kita mendapatkan wawasan tentang kemampuan manusia yang masih kurang dalam AI, seperti kemampuan beradaptasi, ketahanan, abstraksi, kemampuan generalisasi, akal sehat, dan penalaran kausal, kita dapat memperoleh kemampuan yang sama seperti yang kita miliki dalam sistem AI.

[ Read More ]

Anda Tidak Akan Pernah Sukses Jika Anda Terus Melamar Pekerjaan Online oleh Arunn Thevapalan

Orang mempekerjakan orang. Perusahaan tidak.
Saya menyadari bahwa saya akan segera lulus dari perguruan tinggi. Saya tidak yakin apa selanjutnya. Aku butuh pekerjaan, aku memutuskan. Ilmu Data sepertinya keren. Saya mulai melamar online. Saya membayangkan semakin banyak perusahaan yang saya lamar, semakin besar peluang saya untuk diperhatikan.
Penerapan massal adalah permainan angka. Saya perlu menempatkan diri saya di luar sana untuk setiap peluang yang terdaftar. Saya tidak punya waktu untuk menyesuaikan surat lamaran dan CV untuk setiap pekerjaan, jadi saya akan menggunakan yang umum yang sama untuk semua. Bagaimanapun, itu memiliki segalanya tentang saya.

[ Read More ]

Hashing Mendalam untuk Pencarian Kesamaan oleh Rutuja Shivraj Pawar

Dalam beberapa tahun terakhir Perkiraan Tetangga Terdekat (JST) [1] pencarian telah menjadi topik penelitian yang menonjol untuk memproses jumlah data yang terus meningkat dalam aplikasi dunia nyata secara efektif. ANN memiliki berbagai aplikasi, antara lain Pengenalan Pola, Sistem Rekomendasi, Pencarian Kesamaan, Analisis Cluster, dll. Namun, pada artikel ini, kita akan fokus pada aplikasi Pencarian Kemiripan. Lebih lanjut, di antara teknik ANN yang ada, Hashing menjadi populer secara efektif dalam mengelola, menyimpan, dan memproses data berdimensi tinggi karena kecepatan kueri yang cepat dan biaya memori yang rendah. [2–10].

[ Read More ]

Metode, Tantangan, dan Bahaya Pengumpulan Tweet oleh Stephen DeFerrari

Setelah menyelesaikan proyek analisis sentimen pada tweet terkait vaksin Covid, saya merasa seperti saya hanya melihat sebagian kecil dari gambar. Saya telah membangun proyek menggunakan tweet yang dikumpulkan orang lain dengan anggun dan diposting di Kaggle. Kriteria pengumpulannya adalah memiliki tagar “#CovidVaccine” dengan retweet yang disaring.

[ Read More ]

Image De-noising Menggunakan Deep Learning oleh Chintan Dave

Mencela gambar adalah masalah klasik yang coba dipecahkan oleh para peneliti selama beberapa dekade. Dulu, peneliti menggunakan filter untuk mengurangi noise pada gambar. Mereka biasanya bekerja cukup baik untuk gambar dengan tingkat kebisingan yang wajar. Namun, menerapkan filter tersebut akan menambah buram pada gambar. Dan jika gambar terlalu berisik, maka gambar yang dihasilkan akan menjadi sangat kabur sehingga sebagian besar detail penting gambar hilang.

[ Read More ]

Siapkan Raspberry Pi Anda dengan Cepat oleh Nikolas Malamas

Raspberry Pi adalah komputer papan tunggal dengan kemudahan penggunaan yang dikembangkan untuk mengajarkan dasar-dasar ilmu komputer. Ini adalah alat yang hebat untuk mulai bereksperimen dengan proyek-proyek kecil seperti IoT, otomatisasi rumah, situs web, game, dan banyak lagi. Anda dapat menemukan banyak proyek yang ditampilkan oleh Raspberry Pi Foundation di sini. Model yang dirilis terakhir adalah Raspberry Pi 4 Model B, pilihan yang cukup murah namun bertenaga.

[ Read More ]

Pemodelan Topik Tweet Bagian 1: Menggunakan Twint untuk Mengikis Tweet oleh John Bica

Pemodelan topik adalah pendekatan pembelajaran mesin tanpa pengawasan untuk menemukan topik (atau cluster) “tersembunyi” di dalam kumpulan dokumen tekstual (korpus). Kekuatan sebenarnya adalah Anda tidak perlu data berlabel atau dianotasi, tetapi sebaliknya, ia menerima data teks mentah sebagai input saja, oleh karena itu mengapa tidak diawasi. Dengan kata lain, model tidak mengetahui topik apa saat melihat data, tetapi memproduksinya menggunakan hubungan statistik antara kata-kata di semua dokumen.

[ Read More ]

? Terima kasih telah menjadi pelanggan Towards AI! ?

Ikuti kami ↓

[ Facebook ] |[ Twitter ]| [ Instagram ]| [ LinkedIn ] | [ Github ] | [ Google News ]

Optical Character Recognition (OCR) untuk Pelokalan Teks, Deteksi, dan Lainnya! awalnya diterbitkan di Towards AI on Medium, di mana orang-orang melanjutkan percakapan dengan menyoroti dan menanggapi cerita ini.

Diterbitkan melalui Towards AI