SAS Python Interaction – Menuju AI – Teknologi, Sains, dan Teknik Terbaik

Penulis: Vivek Chaudhary

Pemrograman

SAS Py

Tujuan dari artikel ini adalah untuk memahami interaksi Python 3.x dengan SAS 9.4 edisi universitas. Membaca dataset SAS menggunakan pustaka python pandas dan memanipulasi dataset dan menulis hasilnya kembali ke SAS.

SAS University Edition adalah perangkat lunak SAS gratis yang dapat digunakan untuk pengajaran dan pembelajaran statistik dan metode kuantitatif. Cakupan artikel ini terbatas pada operasi ETL dengan SAS dan Python.

#Catatan: Dengan asumsi edisi SAS University diinstal.

Perpustakaan dan Establish Data SAS

Pustaka SAS adalah kumpulan dari satu atau lebih document / kumpulan information SAS yang dikenali oleh SAS dan yang direferensikan serta disimpan sebagai satu unit. Setiap kali sesi baru dibuat SAS secara otomatis membuat dua perpustakaan Kerja, perpustakaan sementara, dan SASUSER, perpustakaan permanen.

Dataset SAS adalah tabel dengan kolom dan baris. Dalam SAS, tabel disebut kumpulan information, kolom disebut variabel, dan baris disebut observasi. Dalam setiap observasi, setiap variabel memiliki nilai tertentu.

Dalam istilah sederhana atau istilah DB, perpustakaan SAS dapat diartikan sebagai skema sedangkan dataset SAS dapat dipahami sebagai tabel DB dengan struktur matriks yang memiliki baris dan kolom.

2. ) Buat Library dan Dataset

Perintah SAS untuk membuat perpustakaan:

libname mylib ‘‘;

Perintah SAS untuk membuat dataset:

DATA mylib.emp;
infile’ / / / emp.csv’
dlm=’,’
FIRSTOBS = two DSD; s
masukan EMPNO ENAME $ SAL DEPTNO COMM;
Lari;
Emp datasetDATA mylib.dept;
infile’ / / / dept.csv’
dlm=’,’
FIRSTOBS = two DSD;
masukan DEPTNO DNAME $ LOC $;
Lari;
Dept dataset

Establish data di SAS disimpan di disk dengan format info SAS: sas7bdat.

3. ) Membaca dataset SAS menggunakan Python

impor panda sebagai pd emp_df = pd.read_sas (r’D: VirtualMs SAS University Edition myfolders emp.sas7bdat ‘, encoding =’ utf-8 ‘)
emp_df. Mind (10)
emp datasetdept_df = pd.read_sas (r’D: VirtualMs SAS University Edition myfolders dept.sas7bdat ‘, encoding =’ utf-8 ‘)
dept_df. Mind (10)
put information dept

Langkah Manipulasi Data, terapkan equijoin untuk menggabungkan dataset emp dan dept.

Final_df = pd.merge (emp_df, dept_df[[‘DEPTNO’,’DNAME’,’LOC’]]pada =’DEPTNO'( how =’internal’)
final_df. Mind (10)
info gabungan

Tulis bingkai info Pandas ke disc:

final_df. to_csv (‘D: VirtualMs SAS University Edition myfolders emppy.csv’, index = False)

4. ) Buat Tabel SAS dari document CSV

App SAS untuk membuat tabel dari document CSV:

DATA mylib.emp_py;
infile ‘/folders/myfolders/emppy. Csv’
dlm=’,”
FIRSTOBS = two DSD;
masukan EMPNO ENAME $ SAL DEPTNO COMM DNAME $ LOC $;
Lari;
Info tabel SAS

Penjelasan application diatas:

Langkah Information: Langkah ini melibatkan pemuatan kumpulan info yang diperlukan ke dalam memori SAS dan mengidentifikasi variabel (juga disebut kolom) dari kumpulan data. Itu juga menangkap catatan yang juga disebut observasi.

Infile: tentukan jalur file enter dan nama bersama dengan pembatas dlm, dalam kasus kami’,’ karena document CSV.

FIRSTOBS: tentukan baris untuk mulai membaca, two berarti lewati tajuk dan baca dari pengamatan pertama, yang merupakan tajuk sebenarnya.

Untuk meringkas, kami telah berhasil membaca kumpulan information dari SAS menggunakan pustaka Python Pandas dan menulis kembali kumpulan information tersebut ke disc, lalu membuat tabel dari kumpulan data sama sama. Sekian untuk site ini.

Terima kasih telah mendukung kontennya.

SAS Python Interaction awalnya diterbitkan di Limit AI on Moderate, di mana orang-orang melanjutkan percakapan dengan menyoroti dan menanggapi cerita ini.

Diterbitkan melalui Towards AI