AI necə işləyir?

AI necə işləyir?

Süni intellekt hər kəsin sakitcə düşünərkən başını tərpətdiyi sehrli fənd kimi hiss edə bilər... gözləyin, bu əslində işləyir? Yaxşı xəbər. Biz onu tüy-tük olmadan aydınlaşdıracağıq, praktik olaraq qalacağıq və hələ də onu klikləməyə vadar edən bir neçə qeyri-kamil bənzətmələrə atacağıq. Sadəcə mahiyyəti bilmək istəyirsinizsə, aşağıdakı bir dəqiqəlik cavaba keçin; amma düzünü desəm, təfərrüatlar lampanın yandığı yerdədir 💡.

Bundan sonra oxumaq istədiyiniz məqalələr:

🔗 GPT nə deməkdir
GPT akroniminin və onun mənasının qısa izahı.

🔗 AI məlumatı haradan əldə edir
AI-nin öyrənmək, məşq etmək və suallara cavab vermək üçün istifadə etdiyi mənbələr.

🔗 AI-ni biznesinizə necə daxil etmək olar
AI-ni effektiv şəkildə inteqrasiya etmək üçün praktik addımlar, alətlər və iş axınları.

🔗 AI şirkətinə necə başlamaq olar
İdeyadan işə salınana qədər: doğrulama, maliyyələşdirmə, komanda və icra.


AI necə işləyir? Bir dəqiqəlik cavab ⏱️

Süni intellekt proqnoz vermək və ya məzmun yaratmaq üçün verilənlərdən nümunələri öyrənir - əl ilə yazılmış qaydalar tələb olunmur. Sistem misalları qəbul edir, itki funksiyası vasitəsilə nə qədər səhv olduğunu ölçür və hər dəfə bir az səhv olması üçün daxili düymələri- parametrləri Durulayın, təkrarlayın, yaxşılaşdırın. Kifayət qədər dövrlərlə, faydalı olur. E-poçtları təsnif etmək, şişləri aşkar etmək, stolüstü oyunlar oynamaq və ya haikus yazmağınızdan asılı olmayaraq eyni hekayə. “Maşın öyrənməsi”ndə sadə dildə əsaslandırma üçün IBM-in icmalı möhkəmdir [1].

Ən müasir AI maşın öyrənməsidir. Sadə versiya: verilənlərlə qidalandırın, girişlərdən çıxışlara qədər xəritəni öyrənin, sonra yeni materiallara ümumiləşdirin. Sehrli deyil, riyaziyyat, hesablama və əgər düzünü desək, bir çimdik sənət.


"AI necə işləyir?" ✅

İnsanlar google-da AI necə işləyir? , adətən istəyirlər:

  • etibar edə biləcəkləri təkrar istifadə edilə bilən zehni model

  • əsas öyrənmə növlərinin xəritəsi, beləliklə jarqon qorxulu olmağı dayandırır

  • itirmədən neyron şəbəkələrinə nəzər salın

  • niyə transformatorlar indi dünyanı idarə edir

  • verilənlərdən tutmuş yerləşdirməyə qədər praktik boru xətti

  • ekran görüntüsünü çəkə və saxlaya biləcəyiniz sürətli müqayisə cədvəli

  • əl dalğası olmayan etika, qərəzlilik və etibarlılığa dair qoruyucu barmaqlıqlar

Burada əldə edəcəyiniz budur. Mən dolaşsam, bu, məqsədyönlü şəkildə mənzərəli marşrutla getmək və növbəti dəfə küçələri daha yaxşı xatırlamaq kimidir. 🗺️


Əksər AI sistemlərinin əsas inqrediyentləri 🧪

Süni intellekt sistemini mətbəx kimi düşünün. Dörd inqrediyent təkrar-təkrar görünür:

  1. Data — etiketli və ya etiketsiz nümunələr.

  2. Model — tənzimlənən parametrləri olan riyazi funksiya.

  3. Məqsəd - təxminlərin nə qədər pis olduğunu ölçən itki funksiyası.

  4. Optimallaşdırma - itkini azaltmaq üçün parametrləri dürtleyen bir alqoritm.

Dərin öyrənmədə bu dürtmə adətən geri yayılma ilə qradiyent enişdir - nəhəng səs lövhəsindəki hansı düymənin cırıldığını anlamaq üçün effektiv bir üsuldur, sonra onu bir tük kimi aşağı çevirin [2].

Mini-case: Biz kövrək qaydaya əsaslanan spam filtrini kiçik nəzarət edilən modellə əvəz etdik. Bir həftəlik etiket → ölçü → yeniləmə döngələrindən sonra yalan pozitivlər azaldı və dəstək biletləri düşdü. Xülyalı heç nə yoxdur - daha təmiz məqsədlər ("ham" e-poçtlarında dəqiqlik) və daha yaxşı optimallaşdırma.


Bir baxışda paradiqmaları öyrənmək 🎓

  • Nəzarət altında öyrənmə
    Siz giriş-çıxış cütlərini təmin edirsiniz (etiketli fotoşəkillər, spam/spam deyil) qeyd olunan e-poçtlar. Model giriş → çıxışı öyrənir. Bir çox praktik sistemlərin əsası [1].

  • Nəzarətsiz öyrənmə
    Etiket yoxdur. Struktur-klasterləri, sıxılmaları, gizli amilləri tapın. Kəşfiyyat və ya hazırlıq üçün əladır.

  • Öz-özünə nəzarət edilən öyrənmə
    Model öz etiketlərini düzəldir (növbəti sözü, çatışmayan şəkil yamasını proqnozlaşdırın). Xam məlumatları miqyasda təlim siqnalına çevirir; müasir dil və baxış modellərinin əsasını təşkil edir.

  • Gücləndirici öyrənmə
    Agent fəaliyyət göstərir, mükafatlar və məcmu mükafatı maksimuma çatdıran siyasəti öyrənir. Əgər “dəyər funksiyaları”, “siyasətlər” və “zaman fərqini öyrənmə” zəng çalırsa, bu onların evidir [5].

Bəli, praktikada kateqoriyalar bulanıqlaşır. Hibrid üsullar normaldır. Real həyat qarışıqdır; yaxşı mühəndislik onu olduğu yerdə qarşılayır.


Baş ağrısız bir neyron şəbəkə daxilində 🧠

Neyron şəbəkəsi kiçik riyazi vahidlərin (neyronların) təbəqələrini yığır. Hər bir təbəqə çəkilər, qərəzlər və ReLU və ya GELU kimi squishy qeyri-xəttilik ilə girişləri çevirir. Erkən təbəqələr sadə xüsusiyyətləri öyrənir; daha dərin olanlar abstraksiyaları kodlayır. "Sehrli" - əgər biz bunu adlandıra bilsək - kompozisiyadır : kiçik funksiyaları zəncirləyin və siz olduqca mürəkkəb hadisələri modelləşdirə bilərsiniz.

Təlim dövrəsi, yalnız vibes:

  • təxmin et → səhvi ölçün → arxa dayaq vasitəsilə atribut günahını → çəkiləri dürtün → təkrarlayın.

Bunu qruplar arasında edin və hər mahnını təkmilləşdirən yöndəmsiz bir rəqqasə kimi, model ayaq barmağınıza basmağı dayandırır. Səmimi, ciddi arxa dayaq fəsli üçün bax [2].


Transformatorlar niyə ələ keçirdi və “diqqət” əslində nə deməkdir 🧲

Transformatorlar, girişin hansı hissələrinin bir-birinə əhəmiyyət verdiyini eyni anda ölçmək üçün öz diqqətindən Köhnə modellər kimi bir cümləni ciddi şəkildə soldan sağa oxumaq əvəzinə, transformator hər yerə baxa və kimin kiminlə danışdığını görmək üçün izdihamlı otağı skan edərək münasibətləri dinamik şəkildə qiymətləndirə bilər.

Bu dizayn ardıcıllıq modelləşdirməsi üçün təkrarlanma və qıvrımları azaldıb, kütləvi paralellik və əla miqyaslaşdırmaya imkan verir. Onu işə salan kağız - Diqqət Sizə Lazımdır - Arxitektura və nəticələri təqdim edir [3].

Bir sətirdə özünə diqqət: sorğu , açardəyər vektorlarını yaradın; diqqət çəkilərini almaq üçün oxşarlıqları hesablayın; dəyərləri müvafiq olaraq qarışdırın. Təfərrüatda təlaşlı, ruhda zərif.

Diqqət: Transformatorlar inhisara deyil, üstünlük təşkil edirlər. CNN-lər, RNN-lər və ağac ansamblları hələ də müəyyən məlumat növləri və gecikmə/qiymət məhdudiyyətlərində qalib gəlir. İş üçün arxitekturanı seçin, şırınga deyil.


AI necə işləyir? Əslində istifadə edəcəyiniz praktik boru kəməri 🛠️

  1. Problemin qurulması
    Nəyi proqnozlaşdırırsınız və ya yaradırsınız və uğur necə ölçüləcək?

  2. Məlumat
    toplayın, lazım olduqda etiketləyin, təmizləyin və bölün. Çatışmayan dəyərləri və kənar halları gözləyin.

  3. Modelləşdirmə
    Sadə başlayın. Əsas xətlər (logistik reqressiya, gradient gücləndirmə və ya kiçik transformator) tez-tez qəhrəmanlıq mürəkkəbliyini üstələyir.

  4. Təlim
    Məqsəd seçin, optimallaşdırıcı seçin, hiperparametrləri təyin edin. Təkrar edin.

  5. Qiymətləndirmə
    Həqiqi hədəfinizlə əlaqəli gözləmələrdən, çarpaz doğrulamadan və ölçülərdən istifadə edin (dəqiqlik, F1, AUROC, BLEU, çaşqınlıq, gecikmə).

  6. Yerləşdirmə
    API arxasında xidmət edin və ya tətbiqə yerləşdirin. Gecikməni, dəyəri, ötürmə qabiliyyətini izləyin.

  7. Monitorinq və idarəetmə
    Drift, ədalət, möhkəmlik və təhlükəsizliyə baxın. NIST AI Risk İdarəetmə Çərçivəsi (Govern, MAP, MEASURE, MANAGE) etibarlı sistemlər üçün başdan-başa praktiki yoxlama siyahısıdır [4].

Mini-case: Görmə modeli laboratoriyanı işə saldı, sonra işıqlandırma dəyişdirildikdə sahədə sürüşdü. Giriş histoqramlarında işarələnmiş sürüşmənin monitorinqi; sürətli artım + incə tənzimləmə zərbəsi bərpa edilmiş performans. Darıxdırıcı? Bəli. Effektiv? Həmçinin bəli.


Müqayisə cədvəli - yanaşmalar, kimin üçündür, təxmini xərc, niyə işləyirlər 📊

Məqsədi ilə qeyri-kamil: bir az qeyri-bərabər ifadələr insan hiss etməsinə kömək edir.

yanaşma İdeal tamaşaçı Qiyməti Niyə işləyir / qeyd edir
Nəzarət olunan öyrənmə Analitiklər, məhsul qrupları aşağı-orta Birbaşa xəritələşdirmə girişi→etiket. Etiketlər mövcud olduqda əladır; bir çox yerləşdirilmiş sistemlərin onurğa sütununu təşkil edir [1].
Nəzarətsiz Məlumat tədqiqatçıları, R&D aşağı Çoxluqlar/sıxılmalar/gizli faktorları tapır-kəşf etmək və əvvəlcədən hazırlıq üçün yaxşıdır.
Özünə nəzarət Platforma komandaları orta Hesablama və data ilə xam data-miqyaslarından öz etiketlərini yaradır.
Möhkəmləndirici öyrənmə Robototexnika, əməliyyat araşdırması orta – yüksək Siyasətləri mükafat siqnallarından öyrənir; kanon üçün Sutton & Barto oxuyun [5].
Transformatorlar NLP, görmə, multimodal orta – yüksək Özünə diqqət uzun məsafəli dərinlikləri tutur və yaxşı paralelləşir; orijinal kağıza baxın [3].
Klassik ML (ağaclar) Cədvəl biznes proqramları aşağı Strukturlaşdırılmış məlumatlara dair ucuz, sürətli, tez-tez şokedici dərəcədə güclü bazalar.
Qayda əsaslı/simvolik Uyğunluq, deterministik çox aşağı Şəffaf məntiq; audit qabiliyyətinə ehtiyacınız olduqda hibridlərdə faydalıdır.
Qiymətləndirmə və risk Hər kəs dəyişir Onu təhlükəsiz və faydalı saxlamaq üçün NIST-in GOVERN-MAP-MEASURE-MANAGE-dan istifadə edin [4].

Qiymət-ish = data etiketləmə + hesablama + insanlar + xidmət.


Dərin dalış 1 - itirmə funksiyaları, gradientlər və hər şeyi dəyişən kiçik addımlar 📉

Təsəvvür edin ki, evin qiymətini ölçüdən proqnozlaşdırmaq üçün bir xətt çəkə bilərsiniz. Siz (w) və (b) parametrlərini seçirsiniz, proqnozlaşdırırsınız (\hat{y} = wx + b) və səhvi orta kvadrat itki ilə ölçürsünüz. Qradiyen sizə hansı istiqamətdə hərəkət edəcəyinizi bildirir (w) və (b) yerin hansı tərəfə enişini hiss edərək, dumanda aşağı eniş kimi ən sürətli itkini azaltmaq üçün. Hər partiyadan sonra yeniləyin və xəttiniz reallığa yaxınlaşır.

Dərin şəbəkələrdə daha böyük qrupla eyni mahnıdır. Backprop hər bir təbəqənin parametrlərinin yekun xətaya necə təsir etdiyini hesablayır - beləliklə, milyonlarla (və ya milyardlarla) düymələri düzgün istiqamətə dürtmək olar [2].

Əsas intuisiyalar:

  • İtki mənzərəni formalaşdırır.

  • Gradientlər sizin kompasınızdır.

  • Öyrənmə sürəti addım ölçüsüdür - çox böyükdür və siz yellənirsiniz, çox kiçikdir və yuxuya gedirsiniz.

  • Tənzimləmə sizi mükəmməl geri çağırışa malik, lakin heç bir anlayışa malik olmayan tutuquşu kimi məşq dəstini yadda saxlamağa mane olur.


Dərin dalış 2 - yerləşdirmə, təklif və axtarış 🧭

Yerləşdirmə sözləri, şəkilləri və ya əşyaları oxşar şeylərin bir-birinə yaxın düşdüyü vektor boşluqlarına yerləşdirir Bu sizə imkan verir:

  • semantik cəhətdən oxşar keçidləri tapın

  • mənasını anlayan güc axtarışı

  • Axtarış-artırılmış nəsil (RAG) daxil edin ki, dil modeli yazmadan əvvəl faktlara baxa bilsin

Təklif generativ modelləri necə idarə etdiyinizdir - tapşırığı təsvir edin, nümunələr verin, məhdudiyyətlər qoyun. Bunu çox sürətli bir təcrübəçi üçün çox təfərrüatlı bir spesifikasiya yazmaq kimi düşünün: həvəsli, bəzən həddindən artıq inamlı.

Praktiki məsləhət: modeliniz halüsinasiyalar görürsə, axtarış əlavə edin, əmri sərtləşdirin və ya “vibes” əvəzinə əsaslı ölçülərlə qiymətləndirin.


Dərin dalış 3 - illüziyasız qiymətləndirmə 🧪

Yaxşı qiymətləndirmə darıxdırıcı hiss edir - bu, tam olaraq nöqtədir.

  • Kilidlənmiş test dəstindən istifadə edin.

  • İstifadəçinin ağrısını əks etdirən bir metrik seçin.

  • Nəyin kömək etdiyini bildiyiniz üçün ablasyon aparın.

  • Uğursuzluqları real, qarışıq nümunələrlə qeyd edin.

İstehsalda monitorinq heç vaxt dayanmayan qiymətləndirmədir. Drift baş verir. Yeni jarqon görünür, sensorlar yenidən kalibrlənir və dünənki model bir az sürüşür. NIST çərçivəsi davam edən risklərin idarə edilməsi və idarəetmə üçün praktiki istinaddır - rəfdə saxlanacaq siyasət sənədi deyil [4].


Etika, qərəzlilik və etibarlılıq haqqında qeyd ⚖️

AI sistemləri onların məlumatlarını və yerləşdirmə kontekstini əks etdirir. Bu, risk gətirir: qərəz, qruplar arasında qeyri-bərabər səhvlər, paylama dəyişikliyində kövrəklik. Etik istifadə isteğe bağlı deyil - bu, masadakı paylardır. NIST konkret təcrübələrə işarə edir: riskləri və təsirləri sənədləşdirin, zərərli qərəzləri ölçün, geri dönmələr qurun və risklər yüksək olanda insanları dövrədə saxlayın [4].

Kömək edən konkret hərəkətlər:

  • müxtəlif, təmsilçi məlumatları toplamaq

  • alt populyasiyalar arasında performansı ölçün

  • sənəd model kartları və məlumat vərəqləri

  • risklərin yüksək olduğu yerlərdə insan nəzarətini əlavə edin

  • sistem qeyri-müəyyən olduqda xətadan qoruyan dizayn


AI necə işləyir? Zehni model olaraq təkrar istifadə edə bilərsiniz 🧩

Demək olar ki, hər hansı bir AI sisteminə müraciət edə biləcəyiniz kompakt yoxlama siyahısı:

  • Məqsəd nədir? Proqnoz, sıralama, nəsil, nəzarət?

  • Öyrənmə siqnalı haradan gəlir? Etiketlər, özünə nəzarət edilən tapşırıqlar, mükafatlar?

  • Hansı memarlıqdan istifadə olunur? Xətti model, ağac ansamblı, CNN, RNN, transformator [3]?

  • Necə optimallaşdırılıb? Qradient eniş varyasyonları/arxa dirək [2]?

  • Hansı məlumat rejimi? Kiçik etiketli dəst, etiketsiz mətn okeanı, simulyasiya edilmiş mühit?

  • Uğursuzluq rejimləri və qorunma vasitələri hansılardır? NIST-in DÖVLƏT-XƏRİTƏSİ-TƏDBİR-İDARƏ EDİLMƏSİ [4]-ə uyğun olaraq, qərəzlilik, sürüşmə, hallüsinasiya, gecikmə.

Bunlara cavab verə bilsəniz, sistemi əsasən başa düşürsünüz - qalanı tətbiq detalları və domen bilikləridir.


Əlfəcin qoymağa dəyər sürətli mənbələr 🔖

  • Maşın öyrənmə konsepsiyalarına (IBM) sadə dildə giriş [1]

  • Diaqramlar və incə riyaziyyatla geri yayılma [2]

  • Ardıcıl modelləşdirməni dəyişdirən transformator kağızı [3]

  • NIST-in AI Risk İdarəetmə Çərçivəsi (praktiki idarəetmə) [4]

  • Kanonik möhkəmləndirmə öyrənmə dərsliyi (pulsuz) [5]


Tez-tez verilən suallar ildırım turu ⚡

Süni intellekt sadəcə statistikadır?
Bu, statistika üstəgəl optimallaşdırma, hesablama, məlumat mühəndisliyi və məhsul dizaynıdır. Statistikalar skeletdir; qalan hissəsi əzələdir.

Daha böyük modellər həmişə qalib gəlirmi?
Ölçəkləmə kömək edir, lakin məlumat keyfiyyəti, qiymətləndirmə və yerləşdirmə məhdudiyyətləri çox vaxt daha çox əhəmiyyət kəsb edir. Məqsədinizə çatan ən kiçik model adətən istifadəçilər və pul kisələri üçün ən yaxşısıdır.

AI başa düşə bilərmi?
Anlamağı müəyyənləşdirin . Modellər verilənlərdəki strukturu ələ keçirir və təsirli şəkildə ümumiləşdirir; lakin onların kor nöqtələri var və əminliklə səhv edə bilərlər. Onlara müdriklər deyil, güclü alətlər kimi davranın.

Transformator dövrü əbədidirmi?
Yəqin ki, əbədi deyil. Bu, indi üstünlük təşkil edir, çünki orijinal sənəddə göstərildiyi kimi diqqət paralelləşir və yaxşı ölçülür [3]. Ancaq araşdırmalar davam edir.


AI necə işləyir? Çox uzun oldu, oxumadım 🧵

  • Süni intellekt verilənlərdən nümunələri öyrənir, itkiləri minimuma endirir və yeni girişlərə ümumiləşdirir [1,2].

  • Nəzarət olunan, nəzarətsiz, öz-özünə nəzarət və gücləndirici öyrənmə əsas təlim quruluşlarıdır; RL mükafatlardan öyrənir [5].

  • Neyron şəbəkələri milyonlarla parametri səmərəli şəkildə tənzimləmək üçün geri yayılma və gradient enişindən istifadə edir [2].

  • Transformatorlar bir çox ardıcıl tapşırıqlarda üstünlük təşkil edir, çünki özünə diqqət miqyasda paralel olaraq əlaqələri ələ keçirir [3].

  • Real dünya AI bir boru xəttidir - yerləşdirmə və idarəetmə vasitəsilə problemlərin qurulması və NIST-in çərçivəsi sizi risk mövzusunda dürüst saxlayır [4].

Kimsə yenidən soruşsa, AI necə işləyir? , gülümsəyə, qəhvənizi qurtumlaya və deyə bilərsiniz: o, məlumatlardan öyrənir, itkini optimallaşdırır və problemdən asılı olaraq transformatorlar və ya ağac ansamblları kimi arxitekturalardan istifadə edir. Sonra bir göz qırpağı əlavə edin, çünki bu, həm sadə, həm də gizli şəkildə tamamlanır. 😉


İstinadlar

[1] IBM - Machine Learning nədir?
daha çox oxuyun

[2] Michael Nielsen - Geri yayılma alqoritmi necə işləyir,
daha ətraflı oxuyun

[3] Vaswani və b. - Diqqət Sizə Lazımdır (arXiv)
daha çox oxuyun

[4] NIST - Süni İntellekt Risk İdarəetmə Çərçivəsi (AI RMF 1.0)
daha çox oxu

[5] Sutton & Barto - Reinforcement Learning: An Introduction (2-ci nəşr)
daha çox oxu

Rəsmi AI köməkçisi mağazasında ən son AI-ni tapın

Haqqımızda

Bloqa qayıt