ZKProphet: GPU'lar Üzerinde Sıfır Bilgi Kanıtlarının Performansını Anlama

İçindekiler

200x

CPU Üzerinde Maksimum Hızlanma

90%

Gecikmede NTT Katkısı

32-bit

Tamsayı İşlem Hattı Kullanımı

1. Giriş

Sıfır Bilgi Kanıtları (ZKP'ler), bir tarafın (Kanıtlayıcı) gizli girdi hakkında hiçbir bilgi açığa vurmadan, bu gizli girdiye dair bilgi sahibi olduğunu kanıtlamasını sağlayan devrim niteliğinde bir kriptografik protokoldür. Bu yetenek, gizli kripto paralar, doğrulanabilir hesaplama dış kaynak kullanımı ve blok zinciri ölçeklendirme çözümlerinde dönüştürücü uygulamalara olanak sağlamıştır. ZKP benimsemesindeki temel zorluk, kanıt üretimi için gereken önemli hesaplama yükü olmuştur; bu, karmaşık hesaplamalar için modern CPU'larda birkaç dakika sürebilmektedir.

Temel hesaplama çekirdeklerinin veri-paralel doğası nedeniyle GPU'lar, ZKP'ler için birincil hızlandırma platformu olarak ortaya çıkmıştır. Şekil 1'de gösterildiği gibi, GPU ile hızlandırılmış ZKP'ler, CPU uygulamalarına kıyasla 200 kata varan hızlanma göstermektedir. Ancak, bu etkileyici kazanımlara rağmen, modern GPU mimarilerindeki performans darboğazlarının ve ölçeklenebilirlik sınırlamalarının sistematik bir karakterizasyonu literatürde dikkat çekici şekilde eksik kalmıştır.

2. Arka Plan ve İlgili Çalışmalar

2.1 Sıfır Bilgi Kanıtı Temelleri

Sıfır Bilgi Kanıtları, bir Kanıtlayıcının, bir $w$ tanığı hakkında hiçbir bilgi açığa vurmadan, $f(x,w) = y$ olacak şekilde bir genel fonksiyon $f$ ve girdi $x$ için bu tanığa sahip olduğunu bir Doğrulayıcıya ikna edebileceği prensibiyle çalışır. Bu çalışmanın temelini oluşturan Groth16 protokolü, özlü kanıtlar ve milisaniye altı doğrulama süreleri sağlayarak, özellikle gerçek dünya uygulamaları için uygun hale gelmektedir.

2.2 Kriptografide GPU Hızlandırma

Kriptografik ilkellerin GPU ile hızlandırılmasına yönelik önceki çalışmalar, önemli performans iyileştirmeleri göstermiştir. [19,30,31,42] gibi çalışmalar, GPU'ların paralel mimarisinin, özellikle büyük ölçekli matematiksel hesaplamalar içeren kriptografik işlemler için uygun olduğunu göstermiştir. Ancak, bu çabalar ağırlıklı olarak bireysel çekirdekler yerine uçtan uca sistem performansına odaklanmıştır.

3. Metodoloji ve Deneysel Kurulum

3.1 ZKProphet Çerçevesi

ZKProphet, GPU'lar üzerinde ZKP performansını değerlendirmek için kapsamlı bir analiz çerçevesi sağlar. Çerçeve, ZKP üretimindeki hesaplama iş yükünün %95'inden fazlasını oluşturan Çoklu Skaler Çarpım (MSM) ve Sayı Teorik Dönüşüm (NTT) dahil olmak üzere temel hesaplama çekirdeklerini sistematik olarak değerlendirir.

3.2 Kıyaslama Konfigürasyonları

Deneysel kurulumumuz, NVIDIA'nın Ampere ve Ada Lovelace nesillerinden modern GPU mimarilerini kullanmaktadır. Performansı, kanıtlanan hesaplamanın karmaşıklığını temsil eden değişen kısıt sayıları üzerinden değerlendiriyoruz. Kıyaslamalar, hem sentetik iş yüklerini hem de kripto para ve blok zinciri alanlarından gerçek dünya ZKP uygulamalarını içermektedir.

4. Performans Analiz Sonuçları

4.1 Çekirdek Performans Dağılımı

Analizimiz, performans darboğazlarında kritik bir değişimi ortaya koymaktadır. Önceki araştırmalar ağırlıklı olarak MSM işlemlerini optimize etmeye odaklanırken, modern optimize edilmiş MSM uygulamaları ile NTT işlemlerinin artık kanıt üretim gecikmesinin %90'ına kadarını oluşturduğunu bulduk. Bu, NTT optimizasyonuna yeniden odaklanmayı gerektiren önemli bir paradigma kaymasını temsil etmektedir.

Şekil 1: Kanıtlayıcı Hızlanması vs Kısıt Sayısı
Deneysel sonuçlar, GPU uygulamalarının CPU temel çizgilerine göre önemli ölçüde hızlanma sağladığını, büyük kısıt kümeleri için performansın kısıt sayısıyla yaklaşık olarak doğrusal ölçeklenerek 200 kata varan iyileşme gösterdiğini göstermektedir.

4.2 Ölçeklenebilirlik Analizi

ZKP hesaplamalarının özel olarak GPU'ların 32-bit tamsayı işlem hatlarında çalıştığını ve doğal veri bağımlılıkları nedeniyle sınırlı komut düzeyinde paralellik sergilediğini gözlemliyoruz. Bu, temelde performans ölçeklenebilirliğini kayan nokta yeteneklerinden ziyade mevcut tamsayı hesaplama birimlerine dayalı olarak sınırlamaktadır.

5. Teknik Uygulama Detayları

5.1 Matematiksel Temeller

ZKP'lerdeki temel matematiksel işlemler, büyük asal alanlar üzerinde sonlu cisim aritmetiğine dayanır. Sonlu cisimlerde Fourier dönüşümünün özelleşmiş bir formu olan NTT işlemi şu şekilde ifade edilebilir:

$$X_k = \sum_{j=0}^{n-1} x_j \cdot \omega^{jk} \mod p$$

burada $\omega$, $p$ modulo biriminin ilkel $n$-inci köküdür ve $p$ büyük bir asal sayıdır. Ters NTT benzer şekilde $\omega^{-1}$ ile tanımlanır.

5.2 Kod Uygulaması

Aşağıdaki sözde kod, GPU mimarileri için optimize edilmiş bir NTT uygulamasını göstermektedir:

__global__ void ntt_kernel(uint32_t *a, uint32_t *roots, int n) {
    int tid = threadIdx.x + blockIdx.x * blockDim.x;
    int stride = blockDim.x * gridDim.x;
    
    for (int i = tid; i < n/2; i += stride) {
        int j = bit_reverse(i, log2(n));
        if (i < j) {
            swap(a[i], a[j]);
        }
    }
    
    __syncthreads();
    
    for (int len = 2; len <= n; len <<= 1) {
        int half = len >> 1;
        for (int i = tid; i < n; i += stride) {
            if ((i & (len - 1)) < half) {
                uint32_t u = a[i];
                uint32_t v = mul_mod(a[i + half], roots[len + (i & (half - 1))]);
                a[i] = add_mod(u, v);
                a[i + half] = sub_mod(u, v);
            }
        }
        __syncthreads();
    }
}

6. Gelecek Uygulamalar ve Yönler

GPU'larda ZKP'lerin optimizasyonu, sayısız uygulama olanağı açmaktadır. Blok zinciri teknolojisinde, optimize edilmiş ZKP'ler daha verimli toplu işlem (rollup) çözümlerine ve gizliliği koruyan akıllı sözleşmelere olanak sağlayabilir. [32] gibi çalışmalarda araştırıldığı üzere, doğrulanabilir makine öğrenimi için, GPU ile hızlandırılmış ZKP'ler, özel model parametrelerini açığa vurmadan model çıkarımlarının pratik doğrulamasını etkinleştirebilir.

Gelecek araştırma yönleri arasında, GPU tensor çekirdeklerini daha iyi kullanmak için karışık hassasiyetli aritmetiği keşfetmek, özel donanım-yazılım birlikte tasarım yaklaşımları geliştirmek ve belirli donanım yeteneklerine ve uygulama gereksinimlerine dayalı olarak ZKP parametrelerini otomatik olarak ayarlayabilen uyarlanabilir optimizasyon çerçeveleri oluşturmak yer almaktadır.

Orijinal Analiz

ZKProphet çalışması, modern GPU mimarilerinde Sıfır Bilgi Kanıtlarının performans özelliklerini anlamada önemli bir ilerlemeyi temsil etmektedir. Ben-Sasson vd. (2014) tarafından zk-SNARK'lar üzerine yapılan temel çalışma gibi önceki araştırmalar teorik temelleri oluştururken ve libsnark ve bellman gibi sonraki uygulamalar pratik çerçeveler sağlarken, tüm hesaplama hattı boyunca sistematik performans analizinde kayda değer bir boşluk bulunmaktaydı.

NTT'nin yeni birincil darboğaz olarak tanımlanması (gecikmenin %90'ına kadarını oluşturması), optimizasyon önceliklerinde kritik bir değişimi işaret etmektedir. Bu bulgu, ilk optimizasyonların en belirgin darboğazları hedeflediği, ancak ilk iyileştirmelerden sonra baskın hale gelen ikincil kısıtlamaları ortaya çıkaran diğer hesaplama yoğun alanlardaki gözlemlerle uyumludur. Benzer desenler, eliptik eğri işlemleri optimize edildikten sonra bellek erişim desenlerinin sınırlayıcı faktör haline geldiği blok zinciri sistemleri için kriptografik uygulamalarda gözlemlenmiştir.

32-bit tamsayı işlem hatlarının münhasır kullanımı hem zorluklar hem de fırsatlar sunmaktadır. Tensor çekirdeklerini ve FP32/FP16 aritmetiğini ağırlıklı olarak kullanan makine öğrenimi iş yüklerinin aksine, ZKP'ler mevcut GPU mimarilerinde bu özelleşmiş birimlerden faydalanamamaktadır. Bu, sinir ağları için Google'ın TPU mimarisinde benimsenen yaklaşıma benzer, ancak kriptografik işlemler için özelleşmiş donanım-yazılım birlikte tasarımı için potansiyel olduğunu göstermektedir. Veri bağımlılıkları nedeniyle sınırlı komut düzeyinde paralellik, daha fazla paralellik ortaya çıkarabilen algoritmik yeniliklere olan ihtiyacı daha da vurgulamaktadır.

Homomorfik şifreleme ([9]'da referans verildiği gibi) veya doğrulanabilir hesaplama çerçeveleri için olanlar gibi diğer kriptografik hızlandırma çabalarıyla karşılaştırıldığında, ZKProphet'un bireysel çekirdek optimizasyonu yerine uçtan uca performansa odaklanması, gerçek dünya dağıtımı için daha pratik içgörüler sağlamaktadır. [32]'de doğrulanabilir makine öğrenimi uygulamalarına yapılan atıf, GPU ile hızlandırılmış ZKP'lerin yapay zeka sistemlerinde yeni güven modellerini etkinleştirebileceği umut verici çapraz alan uygulamalarını önermektedir.

Bu çalışmada belirlenen performans ölçeklenebilirlik sınırlamalarının, ZKP'lerin üretim sistemlerinde pratik dağıtımı için önemli çıkarımları vardır. Kısıt sayıları daha karmaşık hesaplamalarla arttıkça, doğrusal ölçeklenme ilişkisi, kriptografik iş yüklerini özel olarak hedefleyen mimari yenilikler olmadan mevcut GPU mimarilerinin temel sınırlarla karşılaşabileceğini düşündürmektedir.

7. Referanslar

Groth, J. (2016). "On the Size of Pairing-Based Non-interactive Arguments." EUROCRYPT 2016.
Ben-Sasson, E., et al. (2014). "Succinct Non-Interactive Zero Knowledge for a von Neumann Architecture." USENIX Security Symposium.
Parno, B., et al. (2013). "Pinocchio: Nearly Practical Verifiable Computation." IEEE Symposium on Security and Privacy.
Setty, S., et al. (2013). "Resolving the conflict between generality and plausibility in verified computation." EuroSys.
Zhang, J., et al. (2020). "vCNN: Verifiable Convolutional Neural Network based on zk-SNARKs." Cryptology ePrint Archive.
Wahby, R.S., et al. (2018). "Full accounting for verifiable outsourcing." CCS.
Kosba, A., et al. (2016). "C∅C∅: A Framework for Building Composable Zero-Knowledge Proofs." USENIX Security.
Xie, T., et al. (2022). "zkCNN: Zero Knowledge Proofs for Convolutional Neural Network Predictions and Accuracy." CCS.