Normlar ve mesafeler, yapay zekanın veri vektörlerinin "büyüklüğünü" ölçmesini ve aralarındaki farklılıkları ya da benzerlikleri anlamlandırmasını sağlayan temel ölçüm araçlarıdır. Bu makalede, en yaygın kullanılan Öklid (L²), Manhattan (L¹) ve Chebyshev (L-Sonsuz) ailelerini, hem norm hem de mesafe kavramları üzerinden yapay zeka uygulamaları perspektifiyle inceleyeceğiz.
Norm ve Mesafe Nedir?
Vektörleri ve matrisleri anladık; artık elimizde veriyi temsil eden ve onu dönüştüren güçlü araçlar var. Peki, bu verinin "boyutunu" nasıl ölçeriz? Bir veri noktasının orijinden ne kadar "uzak" olduğunu nasıl ifade ederiz? Veya iki farklı veri noktasının birbirine ne kadar "yakın" ya da "uzak" olduğunu nasıl anlarız?
Bu sorular, yapay zekanın en temel görevlerinden olan sınıflandırma, kümeleme ve hata hesaplama gibi işlemlerin kalbinde yatar. Bu soruları cevaplamak için kullandığımız iki temel matematiksel enstrüman vardır: Norm ve Mesafe. Tıpkı bir mimarın cetveli veya bir terzinin mezurası gibi, bu iki kavram da bizim sayısal dünyadaki ölçüm sistemimizi oluşturur.
Norm: Bir Vektörün Öz Büyüklüğü
Bir norm, en basit tanımıyla, bir vektöre "uzunluk" veya "büyüklük" değeri atayan bir fonksiyondur. Bir \(\upsilon\) vektörünün normu, genellikle \(\|\upsilon\|\) sembolüyle gösterilir. Kısacası "norm", tek bir vektörün orijine göre olan büyüklüğünü ölçen bir cetveldir.
Mesafe: İki Nokta Arasındaki Uzaklık
Mesafe, iki nokta arasındaki "uzaklığı" ölçen bir fonksiyondur. \(P_1 ve P_2\) gibi iki nokta arasındaki mesafeyi genellikle \(d(P_1, P_2)\) ile gösteririz. İki nokta arasındaki mesafe, o iki noktayı birleştiren fark vektörünün normuna eşittir. Matematiksel olarak bu zarif ilişkiyi şöyle ifade ederiz:
Özetle bir "mesafe" hesaplamak istediğimizde, aslında önce o iki noktadan bir "vektör" oluştururuz ve sonra o vektörün "normunu" alırız.
- Norm, bir ölçüm aracıdır (cetvel).
- Mesafe, o aracın iki nokta arasında kullanılmasının sonucudur (ölçüm eylemi).
L² Normu (Öklid Normu)
L² normu, ya da diğer adıyla öklid normu, vektörün başlangıcından bitişine kuş uçuşu boyunu tasvir eder. Mantığı en kolay kavranan norm çeşididir. Vektörün bileşenlerinin karelerinin toplamının karekökü alınarak bulunur.
Aşağıda iki boyutlu düzlemdeki bir vektörün öklid normunun hesaplanışını görüyoruz.
Aşağıda ise üç boyutlu uzaydaki bir vektörün öklid normunun hesaplanışını görüyoruz.
Kağıt üzerinde çizemesek de 3'den fazla boyutlu evrenlerin vektörleri de aynı formüle göre hesaplanır. Örneğin aşağıda beş boyutlu bir evrendeki vektörün öklid normunun hesaplanışını görüyoruz.
L² Mesafesi (Öklid Mesafesi)
L² mesafesi, ya da diğer adıyla öklid mesafesi, iki nokta arasındaki kuş uçuşu mesafeyi tasvir eder. Yine mantığı en kolay kavranan mesafe çeşididir. Noktaların arasına bir vektör çizerek, bu vektörün öklid normu hesap edilerek bulunur.
Aşağıda iki boyutlu düzlemdeki bir vektörün öklid mesafesinin hesaplanışını görüyoruz.
Aşağıda ise üç boyutlu uzaydaki iki nokta arasındaki öklid mesafesinin hesaplanışını görüyoruz.
Yine kağıt üzerinde çizemesek de 3'den fazla boyutlu evrenlerin mesafeleri de aynı formüle göre hesaplanır. Örneğin aşağıda beş boyutlu bir evrendeki iki nokta arasındaki öklid mesafesinin hesaplanışını görüyoruz.
L¹ Normu (Manhattan Normu)
L¹ Normu, ya da diğer adıyla Manhattan normu, adını ızgara şeklindeki caddelere sahip olan Manhattan'dan almıştır. Bu normda kuş uçuşu doğrusal bir yoldan ziyade, bir taksinin Manhattan caddelerinde gidişi gibi sadece bileşenlerin eksenleri boyunca hareket etmesine izin vardır (x ekseni boyunca 3 birim, y ekseni boyunca 4 birim). Dolayısıyla normun değeri, bileşenlerin mutlak değerlerinin toplamına eşittir.
Aşağıda iki boyutlu düzlemdeki bir vektörün Manhattan normunun hesaplanışını görüyoruz.
Aşağıda ise üç boyutlu uzaydaki bir vektörün Manhattan normunun hesaplanışını görüyoruz.
3'den fazla boyutlu evrenlerin vektörleri de aynı formüle göre hesaplanır. Aşağıda beş boyutlu bir evrendeki vektörün Manhattan normunun hesaplanışını görüyoruz.
L¹ Mesafesi (Manhattan Mesafesi)
L¹ mesafesi, ya da diğer adıyla Manhattan mesafesi, iki nokta arasındaki eksenler boyunca mesafeyi tasvir eder. Noktaların arasına bir vektör çizerek, bu vektörün Manhattan normu hesap edilerek bulunur.
Aşağıda iki boyutlu düzlemdeki bir vektörün Manhattan mesafesinin hesaplanışını görüyoruz.
Aşağıda üç boyutlu uzaydaki iki nokta arasındaki Manhattan mesafesinin hesaplanışını görüyoruz.
3'den fazla boyutlu evrenlerin mesafeleri de aynı formüle göre hesaplanır. Aşağıda beş boyutlu bir evrendeki iki nokta arasındaki Manhattan mesafesinin hesaplanışını görüyoruz.
L-Sonsuz Normu (Chebyshev Normu)
L-Sonsuz Normu, ya da diğer adıyla Chebyshev normu, vektörün bileşenlerinin mutlak değerlerinin maksimum olanının değerine eşittir.
Aşağıda iki boyutlu düzlemdeki bir vektörün Chebyshev normunun hesaplanışını görüyoruz.
Aşağıda ise üç boyutlu uzaydaki bir vektörün Chebyshev normunun hesaplanışını görüyoruz.
3'den fazla boyutlu evrenlerin vektörleri de aynı formüle göre hesaplanır. Aşağıda beş boyutlu bir evrendeki vektörün Chebyshev normunun hesaplanışını görüyoruz.
L-Sonsuz Mesafesi (Chebyshev Mesafesi)
Hesaplanması çok kolay olan Chebyshev normunu gördük ancak böyle bir norma neden ihtiyacımız olabileceğini bir örnek üzerinden işleyelim. Depoda çalışan bir tavan vincini hayal edelim. Bu vinç X ve Y eksenlerinde aynı anda hareket edebilir. Vincin, A(2, 1) noktasından B(9, 5) noktasına bir paket taşıması gerekiyor. Fark Vektörü: (9-2, 5-1) = (7, 4). Vincin X ekseninde 7 birim, Y ekseninde 4 birim hareket etmesi lazım. Vinç, iki motorunu da aynı anda çalıştırır. Y eksenindeki 4 birimlik hareketini tamamladığında, X eksenindeki motor hala çalışıyor olacaktır. Toplam operasyon süresini, daha uzun olan X eksenindeki hareket belirler. Hareketin tamamlanması için gereken süre, max(7, 4) = 7 birim zamandır. İşte bu, Chebyshev mesafesidir.
Aşağıda iki boyutlu düzlemdeki iki nokta arasındaki Chebyshev mesafesinin hesaplanışını görüyoruz.
Aşağıda ise üç boyutlu uzaydaki iki nokta arasındaki Chebyshev mesafesinin hesaplanışını görüyoruz.
3'den fazla boyutlu evrenlerin mesafeleri de aynı formüle göre hesaplanır. Aşağıda beş boyutlu bir evrendeki iki nokta arasındaki Chebyshev mesafesinin hesaplanışını görüyoruz.
Sonuç: Veriye Uygun Ölçütü Seçmek
Bu makalede incelediğimiz gibi, "uzaklık" kavramı tek bir formülle sınırlı değildir. L², L¹ ve L-Sonsuz aileleri, bize veri noktaları arasındaki ilişkiyi ölçmek için her biri farklı varsayımlara ve sonuçlara sahip üç temel araç sunar.
- L² (Öklid): Boyutlar arası en kısa, 'hipotenüs' yolu. Düşük boyutlu, geometrik olarak sezgisel veriler (örn: KNN, K-Means).
- L¹ (Manhattan): Boyutlar boyunca alınan mutlak adımların toplamı. Yüksek boyutlu veriler, ızgara yapılı problemler (örn: Metin analizi, görüntü işleme).
- L∞ (Chebyshev): Boyutlar arasındaki en büyük tekil fark. Darboğaz analizi, eş zamanlı sistemler.
Bir makine öğrenmesi modelinde bu ölçütlerden hangisinin seçileceği, modelin hangi veri noktalarını "benzer" veya "yakın" olarak kabul edeceğini temelden belirler ve dolayısıyla modelin doğruluğu ve performansı üzerinde doğrudan bir etkiye sahiptir. Varsayılan olarak sıkça kullanılan Öklid mesafesi her zaman en iyi seçenek olmayabilir. Özellikle yüksek boyutlu verilerle çalışırken Manhattan mesafesinin sağlamlığı veya bir sistemdeki maksimum hatayı tespit etmeye çalışırken Chebyshev mesafesinin yeteneği kritik avantajlar sunabilir.
Zamanı geldiğinde bu ve buna benzer pek çok aracı kullanacağız. Şimdilik matematiksel temellerimizi sağlamlaştırmaya devam edelim.
Yazar: Levent KARAGÖL