Analisis Data E-niaga untuk Strategi Penjualan Menggunakan Python – Menuju AI – Teknologi, Sains, dan Teknik Terbaik

Penulis: Juhi Sharma

Analisis data

Analisis Data E-commerce untuk Strategi Penjualan Menggunakan Python

Sumber – https://www.wvgazettemail.com/

Strategi penjualan K-mart untuk tahun 2020 berdasarkan wawasan dari data penjualan tahun 2019.

pengantar

Kmart adalah pengecer online terkemuka di AS dan sebagai bagian dari pertemuan tinjauan penjualan tahunan mereka, mereka perlu memutuskan strategi penjualan mereka untuk tahun 2020 berdasarkan wawasan dari data penjualan pada tahun 2019.

Data terkait dengan penjualan setiap bulan di tahun 2019 dan tugasnya adalah menghasilkan wawasan penting yang akan membantu tim penjualan Kmart mengambil beberapa keputusan bisnis utama untuk menyempurnakan strategi penjualan mereka.

Pemahaman Data

1.Data Milik Kmart – pengecer online terkemuka di AS.

2. Periode Waktu – Januari 2019 – Desember 2019

3. Produk Unik – 19

4. Total Pesanan – 178437

5. Kota – 9

6. KPI – Total Penjualan, Total Produk Terjual

Sumber – Oleh Penulis

Pernyataan Masalah Bisnis

1. Apa bulan terbaik untuk penjualan? Berapa penghasilan bulan itu?

2. Kota manakah yang memiliki jumlah penjualan tertinggi?

3. Sarankan waktu yang paling tepat untuk menampilkan iklan untuk memaksimalkan kemungkinan pelanggan membeli produk?

4. Produk apa yang paling banyak terjual? Menurut Anda, mengapa itu paling laku?

Analisis Data Menggunakan Python

1. Data yang dimuat tiap bulan dan dibuat data frame menggunakan panda

2. Set Data Gabungan untuk membuat satu Set Data untuk penjualan tahun 2019.

3. Mengolah Nilai Nol dan Data Sampah.

4. Buat Set Data Tersaring setelah data praproses

5. Analisis dan jawaban atas permasalahan bisnis. (visualisasi menggunakan matplot dan perpustakaan seaborn)

1.Impor Perpustakaan

import panda sebagai pd

2. Memuat Dataset dan membuat Dataframes

df1 = pd.read_csv (“Sales_January_2019.csv”)
df1[“month”]= “Jan”
df2 = pd.read_csv (“Sales_February_2019.csv”)
df2[“month”]= “feb”
df3 = pd.read_csv (“Sales_March_2019.csv”)
df3[“month”]= “mar”
df4 = pd.read_csv (“Sales_April_2019.csv”)
df4[“month”]= “apr”
df5 = pd.read_csv (“Sales_May_2019.csv”)
df5[“month”]= “mungkin”
df6 = pd.read_csv (“Sales_June_2019.csv”)
df6[“month”]= “Juni”
df7 = pd.read_csv (“Sales_July_2019.csv”)
df7[“month”]= “Juli”
df8 = pd.read_csv (“Sales_August_2019.csv”)
df8[“month”]= “Agustus”
df9 = pd.read_csv (“Sales_September_2019.csv”)
df9[“month”]= “sep”
df10 = pd.read_csv (“Sales_October_2019.csv”)
df10[“month”]= “okt”
df11 = pd.read_csv (“Sales_November_2019.csv”)
df11[“month”]= “nov”
df12 = pd.read_csv (“Sales_December_2019.csv”)
df12[“month”]= “dec” list =[df1,df2,df3,df4,df5,df6,df7,df8,df9,df10,df11,df12]

3. Bentuk set data setiap bulan

untuk saya dalam daftar:
cetak (bentuk i)
Sumber- Penulis

4. Menggabungkan dataset

frame = pd.concat (daftar)
Sumber- Penulis

5. Kolom Set Data Akhir

frame.columns
Sumber-Oleh Penulis

6. Informasi Kerangka Data

frame.info ()
Sumber-Oleh Penulis

7. Nilai nol dalam dataset

frame.isnull (). sum () # ada 545 nilai null di setiap kolom kecuali bulan
Source-By Author (frame.isnull (). Sum (). Sum ()) / len (frame) * 100 # kita punya 1,75 persen nilai null, jadi kita bisa membuangnya
Sumber-Oleh Penulis

8. Menjatuhkan Nilai Nol

frame = frame.dropna ()
frame.isnull (). sum ()
Sumber-Oleh Penulis

9. Menghapus Data Sampah

kami mengamati bahwa ada 355 kolom di mana nilai dalam baris sama dengan tajuk. jadi membuat kerangka data baru di mana nilai-nilai ini akan dikecualikan.

bingkai[frame[‘Quantity Ordered’] == “Jumlah yang Dipesan”]
df_filtered = bingkai[frame[‘Quantity Ordered’] ! = “Jumlah yang Dipesan”]
df_filtered.head (15)
df_filtered.shape
Sumber-Oleh Penulis

Solusi Masalah Bisnis

Qs 1. Apa bulan terbaik untuk penjualan? Berapa penghasilan bulan itu?

df_filtered[“Quantity Ordered”]= df_filtered[“Quantity Ordered”].astype (“float”)
df_filtered[“Price Each”]= df_filtered[“Price Each”].astype (“float”) # Membuat Kolom Penjualan Dengan mengalikan Jumlah Pesanan dan Harga Setiap Produk df_filtered[“sales”]= df_filtered[“Quantity Ordered”]* df_filtered[“Price Each”]
Sumber-Oleh Authormonth =[“dec”,”oct”,”apr”,”nov”,”may”,”mar”,”july”,”june”,”aug”,’feb’,”sep”,”jan”]
df[“month”]= bulan dari matplotlib import pyplot sebagai plt
a4_dims = (11,7, 8,27)
fig, ax = pyplot.subplots (figsize = a4_dims)
import seaborn sebagai sns
sns.barplot (x = “penjualan”,
y = “bulan”,
data = df)
plt.title (“Bulan Dijual”)
plt.show ()
Sumber-Oleh Penulis

Bulan terbaik untuk penjualan adalah DESEMBER
Total penjualan di bulan Desember adalah $ 4619297

Qs 2. Kota manakah yang memiliki jumlah penjualan tertinggi?

dftemp = df_filtered
list_city = []
untuk saya di dftemp[‘Purchase Address’]:
list_city.append (i.split (“,”)[1])
dftemp[‘City’] = list_city
dftemp.head ()
Sumber-Oleh Authordf_city = df_filtered.groupby ([“City”])[‘sales’].sum (). sort_values ​​(ascending = False)
df_city = df_city.to_frame ()
df_city
Sumber-Oleh Otoritas =[“San Francisco”,”Los Angeles”,”New York City”,”Boston”,”Atlanta”,”Dallas”,”Seattle”,”Portland”,”Austin”]
df_city[“city”]= kota dari matplotlib import pyplot
a4_dims = (11,7, 8,27)
fig, ax = pyplot.subplots (figsize = a4_dims)
sns.barplot (x = “penjualan”,
y = “kota”,
data = df_city)
plt.title (“City Wise Sales”)
plt.show ()
Sumber-Oleh Penulis

San Francisco memiliki penjualan tertinggi f sekitar $ 8262204.

Qs 3 Produk apa yang paling banyak terjual?

print (df_filtered[“Product”].unik())
print (df_filtered[“Product”].nunique ())
sumber- Oleh Authordf_p = df_filtered.groupby ([‘Product’])[‘Quantity Ordered’].sum (). sort_values ​​(ascending = False) .head ()
df_p = df_p.to_frame ()
df_p
Sumber-Oleh Authorproduct =[“AAA Batteries (4-pack)”,”AA Batteries (4-pack)”,”USB-C Charging Cable”,”Lightning Charging Cable”,”Wired Headphones”]
df_p[“Product”]= produk dari matplotlib import pyplot
a4_dims = (11,7, 8,27)
fig, ax = pyplot.subplots (figsize = a4_dims)
sns.barplot (x = “Jumlah yang Dipesan”,
y = “Produk”,
data = df_p)
plt.title (“Prouct and Quantity Ordered”)
plt.show ()
Sumber-Oleh Penulis

31017,0 kuantitas Baterai AAA (4-pak) terjual dalam setahun. Terjual maksimal karena merupakan produk termurah.

Qs 4 Sarankan waktu yang paling tepat untuk menampilkan iklan untuk memaksimalkan kemungkinan pelanggan membeli produk?

dftime = df_filtered
list_time = []
untuk saya di dftime[‘Order Date’]:
list_time.append (i.split (“”)[1])
dftime[‘Time’] = list_time
dftime.head ()
Sumber-Oleh Authordf_t = df_filtered.groupby ([‘Time’])[‘sales’].sum (). sort_values ​​(ascending = False) .head ()
df_t = df_t.to_frame ()
df_t
Source-By Authordf_t.columns
Sumber-Oleh Penulis

Sebelum kamu pergi

Terima kasih sudah membaca! Jika Anda ingin menghubungi saya, silakan hubungi saya di [email protected] atau Profil LinkedIn saya. Selain itu, Anda dapat menemukan kode untuk artikel ini dan beberapa proyek sains data yang sangat berguna di akun GitHub saya.

Analisis Data E-niaga untuk Strategi Penjualan Menggunakan Python awalnya diterbitkan di Towards AI on Medium, di mana orang-orang melanjutkan percakapan dengan menyoroti dan menanggapi cerita ini.

Diterbitkan melalui Towards AI