Veri bilimi alanı üzerine yapılan çalışmalarda çok sık kullanılan pandas kütüphanesini jupyter notebook aracılığı ile inceleyelim. Hem pandas kütüphanesini tanımış hemde egzersizlerle kendimizi geliştirmiş olacağız. Çalışmayı anaconda üzerinde jupyter notebook kullanarak yapacağız. Pandas kütüphanesinde basit alıştırmalar ile başlayalım.

Öncelikle jupter notebooku açıp pandas kütüphanesini import edelim. Kodlarımızı blok blok shift enter ile çalıştırabiliriz. Resimlerde görülen “#” ile başlyan satırlar yorum satırıdır.

import pandas as pd

İlgili url adresinden datamızı çekelim.

cars = pd.read_csv(“https://raw.githubusercontent.com/guipsamora/pandas_exercises/master/05_Merge/Auto_MPG/cars1.csv”)
print(cars1.head())

Veri seti içinden ilk 9 satırı getirelim. cars.head(9)

Verisetinde son 5 satırı getirelim : cars.tail(5)

Veri setinde kaç satır ve sütun olduğunu görelim : cars.shape

Verisetinde sadece kaç satır olduğunu görmek istersek : cars.shape[0]

Verisetinde kaç sütun olduğunu görmek istersek : cars.shape[1]

Verisetinde kolonların adlarını görmek istersek : cars.columns

Sadece “car” kolonunu yazdıralım : cars[“car”] veya cars.car.head()

“car” kolonunda kaç farklı değer mevcut : cars.car.nunique()

“car” kolonunda en sık kullanılan veri : cars.car.value_counts().head(1)

Verisetinde ki kolonların özet bilgilerini gösterelim, bu işlem sayısal değerler için yapılır ve açıklayıcı olur : cars.describe()

Verisetinden sadece “mpg” kolonunun özet bilgilerini gösterelim : cars.mpg.describe()

Verisetinden sadece “mpg” kolonunun ortalamasını gösterelim : cars.mpg.mean()

Bu çalışma ile pandas kütüphanesi ile tanışmış ve kısa scriptlerle ilk çalışmamızı yapmış olduk. Pandas ile ilgili çalışmalarımız çeşitli konularla devam edecek. Görüşmek üzere.