Page 89 - bilgem-teknoloji-dergisi-12
P. 89
Yapay Zekâ BILGEM
TEKNOLOJI
nılan en temel yöntem verilerin tekil kalmasının lanır. Bu yöntem, alanların kendi içerisindeki ilişki-
önüne geçmektir. Veri setinde bir satırın alanlarına yi bozduğu için dikkatli kullanılmalıdır. Zira makine olsa da; Federe öğrenme, özellikle şifreleme metotları Kısmen
bakılınca diğer satırlardan ayrılıyorsa bir şekilde öğrenmesi gibi tekniklerde kullanılacaksa, modelin veri mahremiyetinin önemli oldu- Homomorfik Şifrelemeye
örnek olarak verilebilir.
verinin kime veya hangi kurumla ilişkili olduğunun hatalı kalıplar öğrenmesine yol açabilir. ğu Sağlık, Eğitim, Bankacılık gibi
ortaya çıkma tehlikesi vardır. Bu problemin önüne sektörlerde de kullanılmaktadır. Biraz Homomorfik şifrele-
Ayrıca literatürde, Federe öğren-
geçmek için kullanılan yöntemler aşağıda yer al- Federe Öğrenme me ile sağlanan mahremiyetin me(SHE) yönteminde ise
maktadır. İlk olarak 2016 yılında yapılan bir çalışmada[3] arttırılmasına yönelik çalışma- matematiksel işlem türün-
karşımıza çıkan Federe öğrenme; merkezi makine lar da yapılmaktadır. Bu amaçla, den ziyade, bu işlemlerin
Karakter Maskeleme: Anonimleştirmede kulla- öğrenmesi modellerinin yerel cihazlarda bulunan merkezi ve yerel cihazlar arasında gerçekleştirilme sayısı kı-
nılan en temel yöntemlerden biri yazının başında kişisel verileri görmediği ve modellerin yerel cihaz- paylaşılan modelin ve paramet- sıtlıdır. Tamamen Homo-
bahsedilen maskeleme yöntemidir. Veri içeriğinin lar arasında dağıtıldığı, işbirlikçi bir makine öğren- relerin gizliliğini sağlayan çeşitli morfik şifreleme (FHE) yön-
temleri şifrelenmiş veriler
hepsi veya bir kısmı anlamsız veya rastgele karak- mesi yöntemidir. Federe öğrenme, verilerin tek bir güvenlik yöntemleri kullanılmak- üzerinde sınırsız sayıda
terlerle değiştirilmektedir. merkezde toplandığı klasik makine öğrenimi yön- tadır. hem toplama hem de çarp-
temlerinin aksine verileri modele getirmez, makine
öğrenimi modellerini veri kaynaklarına getirir. Bu Homomorfik Şifrelemenin ma işlemlerinin gerçekleş-
Genelleştirme: Verinin ifade ettiği anlamın daha sayede, kişisel verilerin mahremiyeti ve güvenliği tirilmesine olanak sağlar.
geniş bir ifadeyle değiştirilme yöntemidir. Yaşı sağlanırken aynı zamanda model performansı için Makine Öğrenmesinde
Kullanılması
yaş aralığına çevirmek ya da adreslerde tam adres ihtiyaç duyulan büyük veriler de modellere kazan- Makine öğrenmesi, birçok sektör- Homomorfik şifreleme şe-
ması, Flaticon.com’dan alı-
kullanmak yerine ilçe veya il adlarıyla değiştirmek dırılmaktadır. Ayrıca, klasik yöntemlerde verilerin de kullanılmaya ve bir ihtiyaç ha- nan ücretsiz simgeler ile yapılmıştır. Eser Sahip-
örnek olarak verilebilir. merkezileştirilmesinden dolayı ortaya çıkan; veri- line gelmeye başladı. Ancak sağlık, finans gibi leri: Freepik, Pixel perfect ve Smartline.
Değiştirme/Karıştırma: Veri setinin içindeki alan- lerin yönetimi, işlenmesi, aktarımı gibi teknik zor- bazı sektörlerde verilerin özel ve hassas olması,
luklardan da kaçınılmış olur.
ları birbirleriyle değiştirerek anonimleştirme sağ- makine öğrenmesi çözümlerinin uygulanmasına Homomorfik şifreleme ile şifrelenmiş veri üze-
rinde makine öğrenmesi teknikleri uygulanabilir
engel oluyordu. Aynı şekilde gelişen teknolojiy-
Federe öğrenme yöntemi 4 temel le birlikte veriler hızla büyümeye başlamış ve bu olmuştur. İhtiyaca göre farklı kullanım senaryo-
süreç ile uygulanmaktadır; büyük verinin işlenmesi için daha güçlü makine- ları oluşturulabilmektedir. Kullanıcının önceden
Merkezi sunucu, merkezi modeli lere, bulut ortamlarına ihtiyaç duyulmuştur. Kul- eğitilmiş bir makine öğrenmesi modeline veri
ve başlangıç parametrelerini yerel gönderip sonuç almak istediği bir senaryoda
cihazlara gönderir. Veriler, yerel lanıcılar verilerini işlenmesi için başka ortamlara kullanıcı, verisini şifreler ve şifrelenmiş verisini
cihazlarda bulunur ve bu verilerin veya bulut ortamlarına aktarma ihtiyacı duy- açık anahtar (public key) ile birlikte hesaplama-
yerel cihazlardan herhangi bir çıkı- makta ve eğer verileri özelse bu veriyi bir şekilde nın yapılacağı ortama gönderir. Şifrelemede açık
şı olmaz. şifrelemesi gerekmektedir. Geleneksel şifreleme
Yerel cihazlar, gelen merkezi yöntemleri maalesef bu soruna çözüm olamaz- anahtar veriyi şifrelemek, gizli anahtar (private
modeli kendi veri kümesini kulla- ken, homomorfik şifreleme metotları bu sorun key) ise şifrelenmiş veriyi çözmek için kullanı-
narak eğitir. Her yerel model, mer- için uygulanabilir bir çözüm sunmuştur. lır. Kullanılan şifreleme yöntemine göre modelin
kez sunucudan gelen en güncel parametreleri açık anahtar ile şifrelenerek ma-
parametrelerle ve yerel veri küme- Homomorfik şifreleme, şifrelenmiş veri üzerin- tematiksel işlemler gerçekleştirilir ve sonuç yine
leri kullanılarak eğitilir. de hesaplama yapmaya izin veren bir şifreleme şifrelenmiş olarak elde edilir. Kullanıcı gizli anah-
Eğitilen yerel modellerin güncel yöntemidir. Şifrelenmiş veride matematiksel top- tarı ile şifrelenmiş sonucu çözebilir. Aynı şekilde
parametreleri merkezi sunucuya kullanıcı hazırda olan bir modeli kullanmak yeri-
geri aktarılır. lama ve çarpma işlemleri gerçekleştirilebilmek- ne elindeki veriyi şifreleyerek başka bir ortamda
Merkez sunucuda her yerel ci- tedir. Toplama ve çarpma işlemlerini yapabil- makine öğrenmesi modeli eğitebilir. Ancak veri
hazdan gelen yeni parametreler, mek polinom hesabı yapabileceğimiz anlamına her zaman tek bir kullanıcının elinde olmayabilir.
çeşitli yöntemler kullanılarak bir- gelmektedir. Bu sayede şifreli metin(ciphertext) Birden fazla kullanıcının veri sağladığı sistem-
leştirilir. Merkezi model, birleşti- çözülmeden düzyazı(plaintext) halindeki gibi lerde ise anahtar yönetimi Güvenli Çok Şahıslı
rilen güncel parametreler kulla- işlenebilir ve analiz edilebilir olmuştur. m veriyi, Hesaplama (Secure Multi-party Computation)
nılarak yeniden eğitilir. Merkezi E(m) ise verinin şifrelenmiş halini temsil edecek [5] veya Güvenilir Üçüncü Şahıs (Trusted Third
modelde optimum parametreler olursa: Party) [6] ile yapılabilir.
elde edilene kadar önceki adımlar
tekrar edilir. Kaynakça
1. “What is Data Masking”, DataSunrise. [Online]. Available:
Federe öğrenmeye Google’ın And- https://www.datasunrise.com/blog/professional-info/what-
roid cihazlardaki klavye uygulaması Çeşitli homomorfik şifreleme yöntemleri vardır. is-data-masking/ [Accessed: 14-Apr-2021]
olan Gboard örnek verilebilir [4]. Bu Aralarındaki fark, şifrelenmiş veriler üzerinde 2. “GUIDE TO BASIC DATA ANONYMISATION TECHNIQUES”,
Personal Data Protection Commission Singapore, 2018. Avai-
uygulamada, kullanıcıya sunulan gerçekleştirilebilecek matematiksel işlem türleri lable:https://www.pdpc.gov.sg/help-and-resources/2018/01/
önerilerin geliştirilmesi için kulla- ve işlem sayısıdır. Bunlar Kısmen Homomorfik guide-to-basic-data-anonymisation-techniques
nıcıların kişisel sorgularına verilen Şifreleme (Partially Homomorphic Encryption), 3. McMahan, Brendan, et al. “Communication-efficient learning
önerilerin tıklanma durumları yerel Biraz Homomorfik Şifreleme (Somewhat Homo- of deep networks from decentralized data.” Artificial Intelligen-
cihazlarda depolanır. Bu verilere morphic Encryption) ve Tamamen Homomorfik ce and Statistics. PMLR, 2017.
4.https://ai.googleblog.com/2017/04/federated-learning-col-
erişim olmadan Federe öğrenme ile Şifreleme(Fully Homomorphic Encryption)’dir. laborative.html
Gboard’un sorgu öneri modelinin 5. Karthik A Jagadeesh, David J Wu, Johannes A Birgmeier,
iyileştirilmesi sağlanır. Kısmen homomorfik şifreleme(PHE), sadece Dan Bonehand Gill Bejerano. Deriving genomic diagnoses
bir matematiksel işlemin sınırsız sayıda ger- without revealing patient
Federe öğrenmenin ilk örnekleri çekleştirilebildiği bir şifreleme yöntemidir. Ri- 6. Runhua Xu, James B.D. Joshi, and Chao Li. CryptoNN: Trai-
ning Neural Networks over Encrypted Data
mobil cihazlar üzerinde yapılmış vest-Shamir-Adleman (RSA), ElGamal ve Paillier
86 87