PyTorch, günümüzde en popüler derin öğrenme framework'lerinden biridir. Meta AI tarafından geliştirilen ve artık Linux Foundation bünyesinde yer alan bu açık kaynaklı kütüphane, makine öğrenimi dünyasında sayıları işlemek için özel bir veri yapısı olan tensor'ları kullanır. Tensor'lar, PyTorch'un sayıları depolamak için kullandığı temel veri tipidir; onları listelerin veya dizilerin daha güçlü bir versiyonu olarak düşünebiliriz. Eğitim verilerimizi ve modelin öğrendiği ağırlıkları tutan tensor'lar, birçok faydalı fonksiyonla birlikte gelir.
Yeni bir tensor oluştururken başlangıç değerleriyle doldurmak gerekir. PyTorch, torch.rand(), torch.randn(), torch.ones() gibi çeşitli başlatma fonksiyonları sunar. Bu fonksiyonlar arasındaki farkları görselleştirmek için binlerce rastgele değer oluşturup histogram olarak çizmek, her birinin ne tür sayılar ürettiğini açıkça gösterir. Örneğin, torch.rand() 0 ile 1 arasında rastgele değerler üretirken, torch.randn() değerleri çoğunlukla 0 etrafında kümelenen bir dağılım sağlar. torch.zeros() tensor'u açıkça sıfırlarla doldururken, torch.empty() sadece bellek tahsis eder ve mevcut rastgele değerleri içerir, bu yüzden kullanmadan önce yazmak önemlidir.
Elbette, rastgele gürültü ile tensor'ları başlatmak faydalı olsa da, nihayetinde eğitim için kendi verilerimizi kullanmak isteriz. Makale, ev fiyatları gibi yapılandırılmış verilerin nasıl bir PyTorch tensor'una dönüştürüleceğini basit bir örnekle gösterir. Bu, makine öğrenimi modellerini gerçek dünya verileriyle beslemenin temel adımlarından biridir ve PyTorch'un veri işleme yeteneklerinin ne kadar esnek olduğunu ortaya koyar.
PyTorch'un temel veri yapısı olan tensor'ları ve bunların nasıl başlatılıp kendi verilerimizle nasıl kullanılacağını anlamak, derin öğrenme projelerine başlamak için kritik bir adımdır.