Mikro İş Parçacıkları (çok çekirdekli) - Micro-Threads (multi core)

Mikro İplikler çok çekirdekli ve çok çekirdekli işlemciler için, çok iş parçacıklı mimarilere benzer şekilde bellek gecikmesini gizleyen bir mekanizmadır. Ancak, yazılım Bellek gecikmesi veya G / Ç işlemleri nedeniyle oluşan gecikmeleri dinamik olarak gizlemek için Cell Broadband Engine gibi çok çekirdekli işlemciler için.

Giriş

Mikro iş parçacığı, çok çekirdekli veya çok çekirdekli işlemcilerin içinde küçük iş parçacıkları oluşturan yazılım tabanlı bir iş parçacığı çerçevesidir. Her bir çekirdek boşta kalma süresini kullanan iki veya daha fazla küçük iş parçacığına sahip olabilir. Intel tarafından icat edilen hiper iş parçacığı veya modern mikro işlemcilerdeki genel çok iş parçacıklı mimari gibidir. Bu çekirdekte çoklu iş parçacığı olmasa bile, sistemin ana belleğine pahalı içerik geçişi yapmadan aynı çekirdek üzerinde çalışan birden fazla iş parçacığının varlığını sağlar. donanım mantığı. Mikro iş parçacıkları, hesaplamaları bellek talepleriyle üst üste getirerek temel olarak her bir çekirdek içindeki bellek gecikmesini gizler. Mikro iş parçacıkları ile mevcut iş parçacığı modelleri arasındaki temel fark, mikro iş parçacıkları bağlam anahtarlama ek yükünün çok küçük olmasıdır. Örneğin, genel gider mikro iş parçacığı uygulaması Hücre Geniş Bant Motoru 160 nano saniyedir; bu arada, tüm çekirdeğin (SPE) iş parçacığının bağlam değiştirme ek yükü yaklaşık 2000 mikro saniyedir. Bu düşük genel gider üç ana faktörden kaynaklanmaktadır. Birincisi, mikro iplikler çok küçüktür. Her mikro iş parçacığı bir veya iki basit ama kritik işlevi çalıştırır. İkinci olarak, mikro iş parçacığı bağlamı yalnızca şu anda mikro iş parçacığının üzerinde yürütüldüğü çekirdeğin yazmaç dosyasını içerir. Üçüncüsü, mikro iş parçacıkları, çekirdeğin özel önbelleğine bağlam değiştirilir, bu da bu işlemi çok hızlı ve verimli hale getirir.

Arka fon

Mikroişlemciler daha hızlı hale geldikçe, özellikle birkaç ayda bir eklenen çekirdekler nedeniyle, bellek gecikme aralığı daha da genişliyor. Bellek gecikmesi 1980'de birkaç döngü oldu ve günümüzde neredeyse 1000 döngüye ulaşıyor. Mikro işlemcinin yeterli çekirdeği varsa ve umarım ana belleğe istekleri aynı anda göndermiyorsa, bellek gecikmesinin kısmen toplu olarak gizlenmesi olacaktır. Bazı çekirdekler yürütülürken diğerleri bellek yanıtını beklerken olabilir. Bu, çok çekirdekli işlemciler için en iyi durum değildir. Yüksek performanslı bilgi işlem uzmanları tüm çekirdekleri her zaman meşgul tutmaya çalışıyor. Bu nedenle, her bir çekirdek her zaman meşgul tutulursa, tüm mikro işlemcinin eksiksiz bir şekilde kullanılması mümkündür. Yazılım tabanlı iş parçacıkları oluşturmak sorunu tek bir nedenden ötürü çözmez. Bağlamın ana belleğe geçişi, bellek gecikmesine kıyasla çok daha pahalı bir işlemdir. Örneğin, Cell Broadband Engine bağlamında, çekirdeğin herhangi bir iş parçacığını değiştirmek, en iyi durumlarda 2000 mikro saniye sürer. Çift veya çoklu arabellekleme gibi bazı yazılım teknikleri bellek gecikme sorununu çözebilir. Bununla birlikte, programın bellekten geri alınacak bir sonraki veri parçasının nerede olduğunu bildiği normal algoritmalarda kullanılabilirler; bu durumda, daha önceden talep edilen veriyi işlerken hafızaya istek gönderir. Ancak, program bellekten alacağı bir sonraki veri yığınını bilmiyorsa bu teknik çalışmayacaktır. Başka bir deyişle, ağaç yayma veya rastgele liste sıralaması gibi kombinatoryal algoritmalarda çalışmaz. Ek olarak, çoklu arabellekleme, bellek gecikmesinin sabit olduğunu ve statik olarak gizlenebileceğini varsayar. Ancak gerçek, bellek gecikmesinin uygulamadan diğerine değiştiğini göstermektedir. Bellek taleplerinin paylaşılan çekirdek ara bağlantılarının hızı gibi, mikroişlemcinin paylaşılan kaynakları üzerindeki toplam yüke bağlıdır.

Mevcut Uygulama

Şu anda mikro iş parçacığı, Hücre Geniş Bant Motoru.[1] Üç ila beş kat performans artışı sağlanabilir. Şu anda düzenli ve kombinatoryal algoritmalar için kanıtlanmıştır. Diğer bazı çabalar, bilimsel algoritmalar için uygulanabilirliğini kanıtlamaya çalışıyor.

Verim

Mikro iş parçacıkları, mikroişlemcinin çalışma zamanı kullanımına bağlı olarak bellek gecikmesini en iyi şekilde gizlemek için çok iyi bir çözüm sağlar. Örneğin, bellek gecikmesi işleme ve içerik değiştirme süresine kıyasla çok yüksekse, daha fazla mikro iş parçacığı eklenebilir; bu, bellekten büyük veri yığınları talep edildiğinde veya çok sayıda bellek etkin noktası olduğunda meydana gelir. Bu oran küçükse, çalışma zamanında daha az mikro iş parçacığı eklenebilir. Bu, uygulanan uygulama ve sistemin çalışma zamanı faktörleriyle ilgili faktörlere bağlıdır.

Eleştiri

Mikro iş parçacıkları, çok ve çok çekirdekli işlemciler için bellek gecikmesini gizlemek için umut verici bir model sağlasa da, ele alınması gereken bazı önemli eleştiriler vardır:

  • Özel donanım desteği gerektirir. Her bir çekirdek, mikro iş parçacıkları verimli bir şekilde programlamak için kendi yerel kesme tesisine sahip olmalıdır. Bununla birlikte, önleyici olmayan planlama politikası izlenirse, kesintiye uğratan tesis içinde inşa edilmesi gerekli değildir.
  • Her çekirdeğin programcı tarafından manuel olarak yönetilen kendi yerel önbelleği olduğunda en iyi şekilde çalışır.
  • Çekirdek başına daha fazla mikro iş parçacığı eklemek, mikroişlemcinin paylaşılan kaynakları üzerindeki yükü önemli ölçüde artırır. Daha fazla bellek ve senkronizasyon talebi, paylaşılan kaynaklarda büyük olasılıkla tıkanıklık yaratacaktır. Bununla birlikte, bu sorun, çalışma zamanı sisteminin mikroişlemcinin bellek gecikmesi gibi kritik önlemlerini izlemesi ve buna bağlı olarak mikro iş parçacıklarını azaltarak veya zamanlama ilkesini değiştirerek genel yürütmeyi yavaşlatmasıyla hafifletilebilir.

Referanslar

  1. ^ Ahmed, M .; R. Ammar; S. Rajasekaran (2008), "SPENK: hücre geniş bant motoruna başka bir paralellik düzeyi eklemek" (pdf), Yeni nesil çok çekirdekli / çok çekirdek teknolojileri üzerine 1. uluslararası forum, Kahire, Mısır: ACM, s. 1–10, alındı 2009-03-04 Alıntıda boş bilinmeyen parametre var: | editörler = (Yardım)