Art Ağları Ysa #9

Herkese merhaba,

Bildiğiniz gibi yeni bir seri başlattık bu yazıya başlamadan önce serinin diğer kısımlarında bakmanızı öneriyorum.

Bu konu oldukça eski fakat internette fazla kaynak olduğunu söylenemez tabi değerli bilim adamlarının yayınladığı tezler ve çalışmalar dışında teoriyi anlatan fazla arkadaş yok umarım bu yazı herkese faydalı olur.

Şimdi bildiğiniz gibi yapay zeka oldukça günümüzde popüler geçmiştede öyleydi fakat bir karanlık çağ dönemi var bilim her konusunda olduğu gibi o gerilemeden sonra bu konu üzerine oldukça güzel ve tatminkar üstelik bu konu üzerine bulanık mantığında el atması bu bilim dalının oldukça büyümesine ve popülerleşmesine sebep oldu ve farklı farklı varyasyonlar ortaya çıkarıldı.

Hafıza Kavramı

Sinir ağı dışarıdan herhangi bir destek almaksızın örneklere bakarak bilgileri kendisi keşfetmek ve hafızasında saklamak durumundadır.Bu ağlarda öğrenme doğru bilgilerin belirlenerek hafızaya alınması anlamına gelmektedir daha sonra görülmemiş örnekler hakkında bu bilgileri kullanarak yorumlar yapılabilmektedir.Bilgilerin hafızada saklanması ve hafızada tutulması iki şekilde olur.

Kısa Dönemli hafıza:Burada o anki çalışmaları yada o günkü bilgilerimizi tutarız.Bir önceki gün ne yediğimizi bile hatırlamakta zorluk çekebiliriz.

Uzun Dönemli hafıza: Bu hafıza türünde ise bizim için çok önemli bir akşam yemeğini yıllar geçse bile hatırlayabiliriz.

Ayrıntıların Saklandığı Kısa Dönemli Hafıza: Belirlenen farklılıklar ve çevresel olaylar davranışlara neden olmadan önce hafızada saklanmakta ve daha sonra eyleme dönüşmektedir.Bu uzun dönemli hafızada değişikliklere neden olacaktır.

Art Ağlarına Giriş

Art ağları Grosberg’in [1–2] 1976 yılında biyolojik beynin fonksiyonlarına yönelik olarak yaptığı çalışmalar neticesinde ortaya çıkmıştır.

Kendisi çalışmaları neticesinde beynin çalışmasını açıklayacak bir model önermiştir.Bu modelin 3 temel özelliği vardır.Bunlar;

Normalizasyon

Bu özellikle,biyolojik sistemlerin çevredeki büyük değişikliklere karşı adaptif olduklarını gösterilmektedir.Mesela insanın çok fazla gürültü bir ortamda bir süre sonra gürültüden rahatsız olmaması sisteme adapte olduğunu ve çevredeki olayların normalize edildiğini göstermektedir.

Ayrıştırabilme

Çevredeki görülmesi zor birbirinden farklılıkları ayrıştırmak çok önemlidir.Bazen küçük detaylar hayati öneme sahip olabilir.Uyuyan bir aslan ile saldırıya hazır bir aslanın fark edilmesinin önemi oldukça açık olarak görülmektedir.Biyolojik sistemlerin böyle ayrıntıları fark etmeleri çok önemli bir özelliktir.

Art Ağının Diğer YS Ağlarından Farkları

Art ağları aşağıda yer alan tüm sorulara cevap vermek üzere tasarlanmıştır bu sorular diğer ysa kavramlarında biraz daha farklı işler.

  • Yapay sinir ağlarının eğitim esnasında hiç görmedikleri bir sınıfa ait örnekleri çalışma esnasında öğrenmesi nasıl sağlanır?
  • Bir yapay sinir ağının hem eğitimde görmediği örnekleri sınıflandıracak kadar adaptif,hemde alakasız örnekleri reddedecek kadar kararlı yapıda olması nasıl mümkün olur?
  • Bir yapay sinir ağının yeni bilgiler öğrenirken eski bilgileri unutmaması nasıl sağlanır?

Diğer bir farklar ise;

  • Standart ileri besleme ağlarında görülen öğrenmedeki istikrarsızlık problemini çözmek amacıyla geliştirilmiştir.Geçmişte bilgileri elde edilen ağırlıklar yeni bilgiler geldikçe değişmektedir.Bu nedenle, zaman içerisinde eski bilgiyi kaybetme tehlikesi meydana gelmektedir.Ağırlıklar yeni bilgiyi barındıracak kadar esnek ama eski bilgiyi kaybetmeyecek kadar eski olmalıdır
  • Bu sabitlik-esneklik ilkesi olarak adlanrılır ve ysa paradigmasınn gelişiminde ana etkenlerden biridir.Art bu problemi,yukarıdan aşağıya (çıktı- grid) öğrenmeyle aşağıdan yukarıya (girdi -çıktı ) rekabetçi öğrenme kobinasyonunu ortaya koyarak çözümlemektedir.Art bilgiyi önceden önerilen örneklerele sabit ve adaptif(esnek olarak korunmaktadır.)
  • Art ağları birçok ağın tersine gerçek zamanlı,hızlı ve kararlı öğrenirler.Diğer ağlar ise çoğu zaman çevrimdışı öğrenirler ve ortama anlık olarak uyum sağlayamazlar.
  • Art ağları öğretmensiz öğrenir.
  • Art ağları ağa sunulan değişik durumlardaki örnekler karşısında kendi kendilerine kararlı bir yapı oluşturabilirler.
  • Art ağlarında öğrenme süreklidir ve uzun dönemli hafızada bulunan ağırlıklar sürekli güncellenir.
  • Art ağları girdi değerini otomatik olarak normalize ederler.
  • Art ağlarında hem aşağıdan yukarı hem de yukarıdan aşağıya ağırlık değerleri vardır.Aşağıdan yukarı gelen bilgiler ile karşılaştırma kısa zamanlı(KDH) oluşur.Yukarıdan aşağı ağırlıklar KDH’da yapılan karşılaştırma ile aynı kategoride olmayan girdilerin o kategoriye girmesini önlerler.
  • Art ağları yakın eşleme özelliği sayesinde hem hızlı hemde yavaş öğrenebilirler.Hızlı öğrenme uzun dönemli hafızada(UDH) bir denemede yeni bir dengenin(equilibriuım) oluşturması ile gerçekleştirilir.yavaş öğrenme ise bir dengenin oluşması için birden çok denemenin yapılmasıdır.

ART Ağlarının Yapısı

Genel olarak 2 katmandan oluşmaktadır.Bu katmanlar F1 ve F2 olarak isimlendirilmiştir.F1 katmanı girdinin özelliklerini gösterirken,F2 katmanı kategorileri(ayrıştırılmış sınıfları) göstermektedir.Art ağlarında girdiler direkt olarak sınıflandırılmazlar.Öncelikle girdilerin özellikleri incelenerek F1 katmanın aktivasyonu belirlenir.

Art Ağlarının Çalışma Prensipleri

Daha önce belirtildiği gibi ART ağları F1 katmanından gelen bilgileri F2 katmanındaki sınıflara eleştirmektedir.Bu eşleşme sağlanamaz ise yeni bir sınıf oluşturulmaktadır.

Bir Takım Önemli Art Ağları

Art-1 Ağı

  • Art-1 ağı sadece ikili(binary girdiler ile çalışan en basit art ağı örneğidir.
  • Yukarıda belirtildiği gibi iki katmandan oluşmaktadır.F1 katmanı karşılaştırma katmanı,F2 katmanı ise tanıma katmanı olarak isimlendirilmiştir.
  • F1 katmanındaki bütün proses elemanları F2 katmanındaki proses elemanlarının tamamına bağlanmıştır.

ART 1 Ağının Eğitilmesi ve Öğrenmesi

Art 1 ağının öğrenme kuralı aşağıdaki adımlardan oluşmaktadır.

1.Ağırlıklara başlangıç değeri atanır.

F1 katmanında N adet,F2 katmanında ise M adet proses elemanı olduğu varsayılsın.Burada

M>= N olması önemlidir, çünkü n adet girdinin hepsinin birbirinden farklı olması durumunda ağın her biri için bir sınıf ayıracak durumda olması gerekir.Bazı uygulamalarda sınıf sayısı belirli bir sayı ile sınırlandırılmaktadır.Bu durumda ağın görevi girdi setini belirlenen sayısa sınıfa ayırmaktadır.Bunu sağlamak için benzerlik katsayısının değeri iyi ayarlanmaldırı.

F2 ve F1 arasındaki geriye doğru ağırlıkların bütün değerleri başlangıçta 1 değerini alır.Yani:

F2 ve F1 arasındaki geriye doğru ağırlıkların başlangıç değerleri,N F1 katmanındaki proses elemanı sayısı olmak üzere ise şu şekilde atanmaktadır.

2.Benzerlik katsayının ® değeri belirlenir.

Bu 0 ve 1 arasında bir sayıdır.Buradaki r benzerlik katsayısı olarak bilinmektedir.Bu katsayı ne kadar büyük alınırsa sınıf sayısıda o kadar çoğalır.Bu sayı düşük alınırsa o zaman sınıf sayısı da az olur.

3. Girdi setinden bir örnek ağa gösterilir.

Girdi setindeki örnek X (x1,x2,x3…xN) vektörü olarak devam etmektedir.Her bir elemanı xi olarak tanımlanmıştır.

4.F2 katmanındaki proses elemanlarının çıktılarının hesaplanması

F2 katmanındaki her proses elemanının değeri şu şekilde hesaplanmaktadır.

j:1,2,3…..N

5. Kazanan elemanın seçilmesi

Bu en büyük çıktıya sahip proses elemanıdır.Bu elemanın sahip olduğu ağırlık vektörü en uygun gösterim vektörü denmektedir.Bunun k nolu proses elemanı olduğu varsayılırsa;

6. Uygunluk testinin yapılması

Burada kazanan elemanın ağırlık vektörü ile girdi vektörünün birbirlerine benzerliği kontrol edilmektedir.Bunun için önce girdi vektöründe bulunan 1'lerin sayısı (s1) belirlenir.

Bundan sonra sınıf gösterim vektörü ile girdi vektörünün uyuştuğu 1'lerin sayısı (s2) bulunur.Bunu veren förmül ise;

Eğer s2/s1 >= p ise o zaman 2 vektör birbirinin benzeri kabul edilir.Bu durumda ise ağırlıklar aşağıdaki şekilde değiştirilir;

Eğer s2/s1<p ise o zaman en büyük çıktığı veren proses elemanın çıktısı 0 olarak atanır ve ondan sonra en büyük çıktıyı veren proses elemanı seçilerek 4. Adımdan itibaren tekrar edilir.

Yukarıdaki işlemler bütün girdi vektörleri sınıflandırılıncaya kadar devam eder.

Özetle

*Basit algoritmaya sahiptir,

*Matematiksel olarak kararlıdır( Carpenter & Grossberg; 1987),

*Hızlı öğrenir,

*Çok fazla kategoriye gerek duymaz,

*Var olan kategorileri örnekleyerek yeni kategoriler oluşturabilir.

ART-2 Ağı

Art-2 modeli 1986 ve 87 yıllarında carpenter ve grossberg [5–6] tarafından geliştirilmiştir.Art-1 algoritmasının geliştirilmiş halidir.Art-1 algoritması sadece iki girdiler içinde çalışabilmektedir.Art2 hem iki hemde sürekli girdi değerleri ile çalışabilme yeteneğine sahiptir.her iki modelin arasındaki en önemli yapısal fark art-2 ağında f1 katmanında 3 alt sistemin bulunmasıdır.Bunlar:

  • Aşağıdan yukarı girdi değerlerini okuyan alt sistem
  • Yukarıdan aşağıya (F2 katmanından F1 katmanına )girdileri okuyan alt sistem
  • Bu ikisini birbiri ile eşleştiren alt sistem

ART-2 Ağının Yapısı

ART-2 ağının yapısı şekilde verilmiştir.Bu ağ da ART-1 ağı gibi iki alt sistemden oluşmaktadır. Bunlar:

* Oryantasyon (Yeniden Yerleştirme Modülü) alt sistemi

* Atansiyonel (Dikkat/Farkına varma) alt sistemi

* Atansiyonel alt sistemi ise F1 ve F2 olmak üzere iki katmandan oluşmaktadır.

* Bunlardan F1 katmanı özellik gösterim katmanı F2 ise sınıf gösterim katmanı olarak belirlenmiştir.F1 katmanında iki tür proses elemanı vardır.Bunlar:

* Doğrusal elemanlar:bunlar girdilerini toplayan elemanlardır.Şekil üzerindeki pi,vi,wi bu elemanları göstermektedir.

* Parallel elemanlar: Bunlar ise girdilerini normalize eden elemanlardır.Şekilde qi,xi,ui bu elemanları göstermektedir.

*F1 ve F2 katmanları arasındaki bağıntılar uzun dönemli hafızada tutulan değerler, proses elemanlarının çıktıları ise kısa dönemli hafızada tutulan değerlerdir.

*Ağın hem F1 hem de F2 katmanlarında kısa dönemli hafızası vardır.

*Oryantasyon (Yeniden yerleştirme modülü) katmanı ise sadece yukarıdan aşağı F1 girdilerinin daha önce oluşturulmuş olan sınıflara uymadığı zamanlarda aktif olmaktadır. Aksi halde çalıştırılmaktadır.

*Şekilde gösterildiği gibi, ağa sunulan girdi değerleri I vektörü ile gösterilmektedir. F1 katmanının w, x, u, v, p, ve q üniteleri vardır. F2 katmanında ise y üniteleri vardır.

*Aşağıdan yukarı ve yukarıdan aşağı b ve t ile gösterilen ağırlık değerleri bulunmaktadır. Girdilerin ağın belirlediği vektörler ile eşleştirilmesi sonucu birbirlerine benzerliklerini kontrol eden mekanizma ise r ile gösterilmektedir. Bu ünitelerin aktivasyon değerlerinin hesaplanması aşağıda gösterilmiştir.

ART 2 Ağının Çalışma Prensibi

Art2 ağının öğrenme kuralı bir hipotez testine dayanmaktadır.Ağa yeni bir girdi örneği sunulduğunda, ağ bu girdi örneğini oluşturulmuş olan sınıflardan birisine koyup koymadığını belirlemektedir.Eğer bu mümkünse o zaman öğrenmeye başlar ve atansiyonel alt sistem aktif olur.Eğer bu mümkün değil ise o zaman ağ,o girdi için yeni bir sınıf oluşturur (oryantasyon alt sistemi aktif olur) ondan sonra öğrenme başlar.

ART 2 Ağının Çalışma Prensibi — Örnek

ART 2 Ağının Öğrenme Kuralı

* Ağın öğrenmesinde iki filtre vardır.

* Bunlardan birincisi yukarıda aşağı adaptif bir filtredir. F1 ve F2 katmanları arasındaki ağırlık değerlerinin değiştirilmesidir. Burada girdi örneklerinin belirlenmiş sınıfların hangisine ait olacakları belirlenir.

* İkinci filtre ise aşağıdan yukarı çalışan bir filtredir. Bu da öğrenmenin hızını artırmak amacı ile geliştirilmiştir. Bu filtre paralel arama, şekil uydurma görevini üstlenmektedir.

Kaynaklar

  • Grossberg, S. (1976a). Adaptive pattern classification and universal recoding I: Parallel development and coding of neural feature detectors, Biological Cybernetics, 23, 121–134
  • Grossberg, S. (1976b). Adaptive pattern classification and universal recoding II: Feedback, expectation, olfaction, and illusions, Biological Cybernetics, 23, 187–2002
  • Grosberg S. (1988) Nonlinear Neural Networks, Principles, mechanisms, and architectures, Neural Networks, Vol.1, pp.17–61
  • Carpenter G.A., Grosberg S., (1987), A massively parallel architecture for self organizing neural pattern recognition machine, Compuet Vision, Graphics and Image Processing, Vol. 37, pp. 54- 115.
  • Carpenter G.A., and S. Grossberg, (1987) “ART2: Self-organisation of stable category
  • recognition codes for analog input patterns,”Applied Optics, vol. 26, pp. 4919–4930.
  • Carpenter G.A, Grsoberg S, (1990) “ART3: Hierarchical search using chemical transmitters in self — organizing pattern recognition architectures”, Neural Networks, Vol 3, pp. 129–152.
  • Carpenter, G.A., Grossberg, S. and Reynolds, J.H. (1991a), “ARTMAP: Supervised real-time learning and classification of non-stationary data by a self-organizing neural network”, Neural Networks 4, 565–588
  • Huang, J., Georgiopoulos, M. and Heileman, G.L. (1995), “Fuzzy ART properties”, Neural Networks 8, 203–213.
  • Carpenter, G.A., Grossberg, S., Markuzon, N., Reynolds, J.H. and Rosen, D.B. (1992), “Fuzzy ARTMAP: A neural network architecture for incremental supervised learning of analog multidimensional maps”, IEEE Transactions on Neural Networks 3, 698–712.

Originally published at https://avnikasikci.me on January 1, 2022.

--

--

Full Stack Developer

Love podcasts or audiobooks? Learn on the go with our new app.

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store