Pandas kütüphanesin de çalışmalarımıza kaldığımız yerden devam edelim. Yapacağımız alıştırmalar ile veri manipülasyon işlemlerini göreceğiz. Öncelikle jupiter notebooku açıp pandas kütüphanesini import edelim. Daha sonra ilgili urlden datamızı çekelim.

import pandas as pd

df = pd.read_csv(“https://raw.githubusercontent.com/guipsamora/pandas_exercises/master/05_Merge/Auto_MPG/cars2.csv”)
print(df.head())

Veri setinde kaç kolon mevcut olduğunu inceleyelim.

df.shape[0]

Sadece silindir sayısı 4 ten büyük olan datayı getirelim.

df[df.cylinders > 4]

Sadece araç markası “honda civic” olanların datasını getirelim.

df[df.car == “honda civic”]

Veri setinde ki mpg (yakıt tüketim miktarı) değerlerini büyükten küçüğe, sonra silindir değerlerini büyükten küçüğe sıralayalım.

df.sort_values([‘cylinders’, ‘mpg’], ascending = False)

Araç markalarına göre ortalama yakıt tüketim miktarlarını hesaplayalım.

df.groupby(‘car’).mpg.mean()

Araç markalarına göre ortalama yakıt tüketim miktarlarının istatistiksel değerlerini hesaplatalım.

df.groupby(‘car’).mpg.describe()

Araç markalarına göre tüm kolonların ortalamalarını hesaplayalım.

df.groupby(‘car’).mean()

Araç markalarına göre silindir sayılarının ortalama, minimum, maksimum değerlerini hesaplayalım.

df.groupby(‘car’).cylinders.agg([‘mean’, ‘min’, ‘max’])

Araç markası “honda civic” olanların yakıt tüketim miktarının ortalama, minimum, maksimum değerlerini hesaplayalım.

df[df.car == “honda civic”].mpg.agg([‘mean’, ‘min’, ‘max’])

Araç markalarına göre yakıt tüketim miktarının ortalamasını, silindir sayısını minimum değerlerini, araç ağırlıklarının maksimum değerlerini hesaplayalım.

df.groupby(‘car’).aggregate({‘mpg’:’mean’,’cylinders’:’min’,’weight’:’max’})

Bu çalışma ile pandas kütüphanesin de veri manipülasyon işlemlerini görmüş olduk. Pandas ile ilgili çalışmalarımıza çeşitli konularla devam edeceği. Görüşmek üzere.