Bir yapay sinir ağı (artificial neural network) katmanlardan (layer), katmanlar ise düğümlerden (node) oluşur. Bu düğümler aynı zamanda nöron veya birim (unit) olarak da adlandırılır. Veriyi işleyen yapılar bunlardır. Süreç şu şekilde işler: Öncelikle, giriş alan her nöron giriş (input) verisini alır. Eğer bu ilk katmansa, giriş ham veridir; eğer daha üst bir katmansa, giriş bir alt katmandan gelir. Düğüm, girişlere ağırlıklar (weight) uygular, ardından bir sapma (bias) terimi ekler. Sonrasında ise doğrusal olmayan (non-linear) bir aktivasyon fonksiyonu (activation function) uygular (örneğin ReLU veya sigmoid) ve ortaya çıkan değeri bir sonraki katmana çıktı (output) olarak gönderir. Buradaki anahtar kelime “nonlinear”dır (doğrusal olmayan), çünkü gerçek hayatta olgular nadiren doğrusal davranır.
Gerçek hayattaki hemen her şey, birbirleriyle doğrusal ilişki kurmayan birçok değişkene bağlıdır. Bunu görselleştirmesi daha kolay olabilecek bir yapı mühendisliği analojisi üzerinden açıklayalım: Öncelikle bir yayı düşünün. Bir yaya uygulanan kuvvet ile yaydaki deformasyon arasındaki ilişki doğrusal bir denklemle ifade edilebilir: F = kx. Burada F kuvveti, k yay sabitini, x ise yayın uzama veya kısalma miktarını temsil eder. Bu, doğrusal bir ilişkidir; yayı ne kadar iter veya çekerseniz, o kadar deformasyon oluşur ve bu durum sabit bir k değeri üzerinden basit bir doğrusal ilişkiyle belirlenir. Şimdiye kadar her şey basit görünüyor, değil mi?
Fakat gerçek hayatta işler bu kadar basit değildir. Aslında verdiğimiz bu örnek bile teorik bir varsayımdır; çünkü doğada tamamen doğrusal bir ilişki gerçekte yoktur. Ancak bazı ilişkiler yeterince basittir; bu nedenle ilişkiyi doğrusal kabul edip yine de pratikte yeterli doğruluğu elde edebiliriz. Burada F = kx ilişkisi, belirli sınırlar içinde kaldığımız sürece tüm pratik amaçlar için yeterlidir. Örneğin, belirli bir yay için bu ilişkinin 1000 Newton kuvvete kadar geçerli olduğunu varsayabiliriz. Bu noktaya kadar ilişkinin doğrusal olduğunu söyleriz.
Ancak 1000 Newton’dan daha büyük bir kuvvet uygularsak, yayda aşırı deformasyonlar başlayabilir ve yay sabiti değişebilir. Bu durumda ilişki doğrusal olmaktan çıkmaya başlar ve non-linear (doğrusal olmayan) hale gelir. Böyle bir durumda kuvvet ile deformasyon arasındaki yeni ilişkiyi tanımlamak için doğrusal olmayan matematiksel bir fonksiyona ihtiyaç duyarız. Böylece ilişki daha karmaşık hale gelmiş olsa bile, kuvvete bağlı olarak deformasyonları hesaplamaya devam edebiliriz.
Şimdi ölçeği büyütelim ve bu kez bir bina üzerinden örnek verelim. Bir deprem olduğunda bina yanal olarak ileri geri sallanır. Belirli bir noktaya kadar kuvvet-yer değiştirme (force-deflection) ilişkisinin doğrusal olduğunu varsayabiliriz ve binanın deplasmanlarını hesaplamak görece kolay olur. Ancak deprem çok güçlüyse, daha büyük yer ivmeleri binada daha büyük kuvvetler oluşturacaktır. Bu durumda deformasyonlar artık o kadar kolay hesaplanamaz; çünkü taşıyıcı sistem içerisinde hasar görmüş elemanlar, kalıcı deformasyonlar ve çeşitli bölgelerde burkulmalar (buckling) meydana gelebilir. Bunlar, kuvvet ile toplam bina deplasmanı arasında çok daha karmaşık bir ilişki oluşturur. Yani ilişki artık tamamen non-linear hale gelmiştir ve bunu basit bir doğrusal denklemle açıklamak mümkün değildir.
Bu arka plandan sonra “doğrusal olmama” kavramının daha iyi görselleştiğini umarak, asıl konumuz olan yapay sinir ağlarına geri dönelim. Tıpkı yapısal sistemlerde doğrusal ilişkilerin ancak belirli bir noktaya kadar geçerli olması gibi, yapay sinir ağları da daha karmaşık davranışları modelleyebilmek için doğrusal olmayan fonksiyonlar kullanmak zorundadır.
Yapay sinir ağı, kendisine veri verildiğinde bu verilere ağırlıklar ve katmanlar atayan, ardından tahmin veya sınıflandırma şeklinde çıktılar üreten bir makine türü olarak düşünülebilir. Eğer giriş ve çıkış arasındaki ilişki tamamen doğrusal olsaydı, verdiğimiz her girişte çıktı da aynı oranda değişmek zorunda olurdu. Ancak durum böyle değildir; giriş ile çıkış arasında düz bir çizgi yoktur.
Gerçek dünyadaki görüntü tanıma veya dili anlama gibi problemler, düz bir çizgiyle açıklanamayacak kadar karmaşıktır. Bunun yerine farklı derecelerde eğriler ve zikzaklar vardır. Başka bir deyişle çıktı, girişe orantılı şekilde düz bir yol izlemez. Girişteki herhangi bir değişiklik, çıktının farklı desenlerde ve karmaşıklıklarda değişmesine neden olabilir.
İşte bu doğrusal olmama özelliği, yapay sinir ağına aktivasyon fonksiyonları aracılığıyla eklenir. Bu fonksiyonlar, özel anahtarlar ve filtreler gibi davranarak matematiğin gerçek dünyadaki verilere daha iyi uyum sağlamasına (fit) yardımcı olur; yani düz çizgiler yerine farklı eğriler oluşturulmasını sağlar. ReLU, tanh ve sigmoid gibi yapılar aktivasyon fonksiyonu örnekleridir. Doğrusal olmama özelliği olmasaydı; yapay zekânın görüntü işleme (computer vision), ses tanıma ve doğal dil işleme (NLP) gibi yetenekleri mümkün olmazdı. Bir görüntüdeki dokular (texture) ve kenarlar, finansal verilerdeki karmaşık döngüler veya dildeki sözdizimi (syntax) ve anlambilim (semantics) ancak y = kx gibi doğrusal bir ilişkiyle açıklanamayacak kadar karmaşık matematiksel modellerle işlenebilir.
Yazan: A. Tüter
Kullanım Koşulları: İçeriklerimizin her hakkı saklıdır, izinsiz olarak kopyalanamaz, yayınlanamaz. Paylaşımlarımızı tarihli olarak kaydetmekteyiz. İçeriklerimizde hata ve eksiklikler olabilir. Bahsi geçen ticari markalar sahiplerine aittir; bunlarla bağlantımız bulunmamaktadır ve bu içerik onay anlamı taşımaz. Kullanım koşulları sayfamızı ziyaret ediniz.
Yorum yapabilmek için kayıtlı kullanıcı olmanız gerekmektedir. Giriş