Page 89 - bilgem-teknoloji-dergisi-12
P. 89

Yapay Zekâ                                                                                       BILGEM
                                                                                                  TEKNOLOJI





 nılan  en  temel  yöntem  verilerin  tekil  kalmasının   lanır. Bu yöntem, alanların kendi içerisindeki ilişki-
 önüne geçmektir. Veri setinde bir satırın alanlarına   yi bozduğu için dikkatli kullanılmalıdır. Zira makine   olsa da; Federe öğrenme, özellikle   şifreleme metotları Kısmen
 bakılınca  diğer  satırlardan  ayrılıyorsa  bir  şekilde   öğrenmesi gibi tekniklerde kullanılacaksa, modelin   veri mahremiyetinin önemli oldu-  Homomorfik   Şifrelemeye
                                                                                  örnek olarak verilebilir.
 verinin kime veya hangi kurumla ilişkili olduğunun   hatalı kalıplar öğrenmesine yol açabilir.  ğu  Sağlık,  Eğitim,  Bankacılık  gibi
 ortaya çıkma tehlikesi vardır. Bu problemin önüne   sektörlerde  de  kullanılmaktadır.   Biraz  Homomorfik  şifrele-
                Ayrıca  literatürde,  Federe  öğren-
 geçmek için kullanılan yöntemler aşağıda yer al-  Federe Öğrenme  me  ile  sağlanan  mahremiyetin   me(SHE)  yönteminde  ise
 maktadır.  İlk  olarak  2016  yılında  yapılan  bir  çalışmada[3]  arttırılmasına  yönelik  çalışma-  matematiksel  işlem  türün-
 karşımıza çıkan Federe öğrenme; merkezi makine   lar  da  yapılmaktadır.  Bu  amaçla,   den  ziyade,  bu  işlemlerin
 Karakter  Maskeleme:  Anonimleştirmede  kulla-  öğrenmesi modellerinin yerel cihazlarda bulunan   merkezi ve yerel cihazlar arasında   gerçekleştirilme  sayısı  kı-
 nılan en temel yöntemlerden biri yazının başında   kişisel verileri görmediği ve modellerin yerel cihaz-  paylaşılan  modelin  ve  paramet-  sıtlıdır.  Tamamen  Homo-
 bahsedilen maskeleme yöntemidir. Veri içeriğinin   lar arasında dağıtıldığı, işbirlikçi bir makine öğren-  relerin  gizliliğini  sağlayan  çeşitli   morfik şifreleme (FHE) yön-
                                                                                  temleri  şifrelenmiş  veriler
 hepsi veya bir kısmı anlamsız veya rastgele karak-  mesi yöntemidir. Federe öğrenme, verilerin tek bir   güvenlik  yöntemleri  kullanılmak-  üzerinde  sınırsız  sayıda
 terlerle değiştirilmektedir.  merkezde toplandığı klasik makine öğrenimi yön-  tadır.  hem toplama hem de çarp-
 temlerinin aksine verileri modele getirmez, makine
 öğrenimi  modellerini  veri  kaynaklarına  getirir.  Bu   Homomorfik Şifrelemenin   ma  işlemlerinin  gerçekleş-
 Genelleştirme:  Verinin  ifade  ettiği  anlamın  daha   sayede, kişisel verilerin mahremiyeti ve güvenliği   tirilmesine olanak sağlar.
 geniş  bir  ifadeyle  değiştirilme  yöntemidir.  Yaşı   sağlanırken aynı zamanda model performansı için   Makine Öğrenmesinde
                Kullanılması
 yaş aralığına çevirmek ya da adreslerde tam adres   ihtiyaç duyulan büyük veriler de modellere kazan-  Makine öğrenmesi, birçok sektör-  Homomorfik  şifreleme  şe-
                                                                                  ması,  Flaticon.com’dan  alı-
 kullanmak yerine ilçe veya il adlarıyla değiştirmek   dırılmaktadır.  Ayrıca,  klasik  yöntemlerde  verilerin   de kullanılmaya ve bir ihtiyaç ha-  nan ücretsiz simgeler ile yapılmıştır. Eser Sahip-
 örnek olarak verilebilir.  merkezileştirilmesinden dolayı ortaya çıkan; veri-  line  gelmeye  başladı.  Ancak  sağlık,  finans  gibi   leri: Freepik, Pixel perfect ve Smartline.
 Değiştirme/Karıştırma: Veri setinin içindeki alan-  lerin yönetimi, işlenmesi, aktarımı gibi teknik zor-  bazı sektörlerde verilerin özel ve hassas olması,
 luklardan da kaçınılmış olur.
 ları birbirleriyle değiştirerek anonimleştirme sağ-  makine öğrenmesi çözümlerinin uygulanmasına   Homomorfik  şifreleme  ile  şifrelenmiş  veri  üze-
                                                               rinde makine öğrenmesi teknikleri uygulanabilir
                engel oluyordu. Aynı şekilde gelişen teknolojiy-
 Federe  öğrenme  yöntemi  4  temel   le birlikte veriler hızla büyümeye başlamış ve bu   olmuştur. İhtiyaca göre farklı kullanım senaryo-
 süreç ile uygulanmaktadır;  büyük verinin işlenmesi için daha güçlü makine-  ları oluşturulabilmektedir. Kullanıcının önceden
 Merkezi sunucu, merkezi modeli   lere, bulut ortamlarına ihtiyaç duyulmuştur. Kul-  eğitilmiş  bir  makine  öğrenmesi  modeline  veri
 ve başlangıç parametrelerini yerel                            gönderip  sonuç  almak  istediği  bir  senaryoda
 cihazlara  gönderir.  Veriler,  yerel   lanıcılar verilerini işlenmesi için başka ortamlara   kullanıcı, verisini şifreler ve şifrelenmiş verisini
 cihazlarda bulunur ve bu verilerin   veya  bulut  ortamlarına  aktarma  ihtiyacı  duy-  açık anahtar (public key) ile birlikte hesaplama-
 yerel cihazlardan herhangi bir çıkı-  makta ve eğer verileri özelse bu veriyi bir şekilde   nın yapılacağı ortama gönderir. Şifrelemede açık
 şı olmaz.      şifrelemesi gerekmektedir. Geleneksel şifreleme
 Yerel  cihazlar,  gelen  merkezi   yöntemleri maalesef bu soruna çözüm olamaz-  anahtar  veriyi  şifrelemek,  gizli  anahtar  (private
 modeli  kendi  veri  kümesini  kulla-  ken,  homomorfik  şifreleme  metotları  bu  sorun   key)  ise  şifrelenmiş  veriyi  çözmek  için  kullanı-
 narak eğitir. Her yerel model, mer-  için uygulanabilir bir çözüm sunmuştur.   lır. Kullanılan şifreleme yöntemine göre modelin
 kez  sunucudan  gelen  en  güncel                             parametreleri açık anahtar ile şifrelenerek ma-
 parametrelerle ve yerel veri küme-  Homomorfik  şifreleme,  şifrelenmiş  veri  üzerin-  tematiksel işlemler gerçekleştirilir ve sonuç yine
 leri kullanılarak eğitilir.  de hesaplama yapmaya izin veren bir şifreleme   şifrelenmiş olarak elde edilir. Kullanıcı gizli anah-
 Eğitilen  yerel  modellerin  güncel   yöntemidir. Şifrelenmiş veride matematiksel top-  tarı ile şifrelenmiş sonucu çözebilir. Aynı şekilde
 parametreleri  merkezi  sunucuya                              kullanıcı hazırda olan bir modeli kullanmak yeri-
 geri aktarılır.   lama ve çarpma işlemleri gerçekleştirilebilmek-  ne elindeki veriyi şifreleyerek başka bir ortamda
 Merkez  sunucuda  her  yerel  ci-  tedir.  Toplama  ve  çarpma  işlemlerini  yapabil-  makine öğrenmesi modeli eğitebilir. Ancak veri
 hazdan  gelen  yeni  parametreler,   mek polinom hesabı yapabileceğimiz anlamına   her zaman tek bir kullanıcının elinde olmayabilir.
 çeşitli  yöntemler  kullanılarak  bir-  gelmektedir. Bu sayede şifreli metin(ciphertext)   Birden  fazla  kullanıcının  veri  sağladığı  sistem-
 leştirilir.  Merkezi  model,  birleşti-  çözülmeden  düzyazı(plaintext)  halindeki  gibi   lerde  ise  anahtar  yönetimi  Güvenli  Çok  Şahıslı
 rilen  güncel  parametreler  kulla-  işlenebilir ve analiz edilebilir olmuştur. m veriyi,   Hesaplama  (Secure  Multi-party  Computation)
 nılarak  yeniden  eğitilir.  Merkezi   E(m) ise verinin şifrelenmiş halini temsil edecek   [5] veya Güvenilir Üçüncü Şahıs (Trusted Third
 modelde  optimum  parametreler   olursa:                      Party) [6] ile yapılabilir.
 elde edilene kadar önceki adımlar
 tekrar edilir.                                                Kaynakça
                                                               1. “What is Data Masking”, DataSunrise. [Online]. Available:
 Federe  öğrenmeye  Google’ın  And-                            https://www.datasunrise.com/blog/professional-info/what-
 roid cihazlardaki klavye uygulaması   Çeşitli homomorfik şifreleme yöntemleri vardır.   is-data-masking/ [Accessed: 14-Apr-2021]
 olan Gboard örnek verilebilir [4]. Bu   Aralarındaki  fark,  şifrelenmiş  veriler  üzerinde   2. “GUIDE TO BASIC DATA ANONYMISATION TECHNIQUES”,
                                                               Personal Data Protection Commission Singapore, 2018. Avai-
 uygulamada,  kullanıcıya  sunulan   gerçekleştirilebilecek matematiksel işlem türleri   lable:https://www.pdpc.gov.sg/help-and-resources/2018/01/
 önerilerin  geliştirilmesi  için  kulla-  ve  işlem  sayısıdır.  Bunlar  Kısmen  Homomorfik   guide-to-basic-data-anonymisation-techniques
 nıcıların  kişisel  sorgularına  verilen   Şifreleme  (Partially  Homomorphic  Encryption),   3. McMahan, Brendan, et al. “Communication-efficient learning
 önerilerin tıklanma durumları yerel   Biraz Homomorfik Şifreleme (Somewhat Homo-  of deep networks from decentralized data.” Artificial Intelligen-
 cihazlarda  depolanır.  Bu  verilere   morphic Encryption) ve Tamamen Homomorfik   ce and Statistics. PMLR, 2017.
                                                               4.https://ai.googleblog.com/2017/04/federated-learning-col-
 erişim olmadan Federe öğrenme ile   Şifreleme(Fully Homomorphic Encryption)’dir.   laborative.html
 Gboard’un  sorgu  öneri  modelinin                            5. Karthik A Jagadeesh, David J Wu, Johannes A Birgmeier,
 iyileştirilmesi sağlanır.   Kısmen  homomorfik  şifreleme(PHE),  sadece   Dan Bonehand Gill Bejerano. Deriving genomic diagnoses
                bir  matematiksel  işlemin  sınırsız  sayıda  ger-  without revealing patient
 Federe  öğrenmenin  ilk  örnekleri   çekleştirilebildiği  bir  şifreleme  yöntemidir.  Ri-  6. Runhua Xu, James B.D. Joshi, and Chao Li. CryptoNN: Trai-
                                                               ning Neural Networks over Encrypted Data
 mobil  cihazlar  üzerinde  yapılmış   vest-Shamir-Adleman (RSA), ElGamal ve Paillier





 86                                                       87
   84   85   86   87   88   89   90   91   92   93   94