Süni intellekt modellərini necə sınaqdan keçirmək olar

Süni intellekt modellərini necə sınaqdan keçirmək olar

Qısa cavab: Süni intellekt modellərini yaxşı qiymətləndirmək üçün əvvəlcə real istifadəçi və mövcud qərar üçün "yaxşı"nın nə olduğunu müəyyən edin. Daha sonra nümayəndəli məlumatlar, sərt sızma nəzarəti və çoxsaylı metriklərlə təkrarlana bilən qiymətləndirmələr qurun. Stress, qərəz və təhlükəsizlik yoxlamaları əlavə edin və hər hansı bir dəyişiklik olduqda (məlumatlar, göstərişlər, siyasət), qoşquları yenidən işə salın və işə salındıqdan sonra monitorinqə davam edin.

Əsas nəticələr:

Uğur meyarları : Metrikləri seçməzdən əvvəl istifadəçiləri, qərarları, məhdudiyyətləri və ən pis hallarda baş verən uğursuzluqları müəyyənləşdirin.

Təkrarlana bilənlik : Hər dəyişikliklə müqayisə edilə bilən testləri təkrarlayan bir qiymətləndirmə qoşqusu qurun.

Məlumat gigiyenası : Sabit bölünmələri saxlayın, təkrarlanmaların qarşısını alın və xüsusiyyət sızmasının erkən qarşısını alın.

Etibar yoxlamaları : Stress-test möhkəmliyi, ədalətlilik hissələri və aydın rubrikalarla LLM təhlükəsizlik davranışları.

Həyat dövrü intizamı : Mərhələlərlə tətbiq edin, dəyişiklikləri və hadisələri izləyin və məlum boşluqları sənədləşdirin.

Bundan sonra oxumaq istəyə biləcəyiniz məqalələr:

🔗 AI etikası nədir
Məsuliyyətli süni intellekt dizaynına, istifadəsinə və idarə olunmasına rəhbərlik edən prinsipləri araşdırın.

🔗 Süni intellekt qərəzi nədir
Qərəzli məlumatların süni intellekt qərarlarını və nəticələrini necə təhrif etdiyini öyrənin.

🔗 AI ölçeklenebilirliği nədir
Süni intellekt sistemlərinin performans, qiymət və etibarlılıq baxımından miqyaslandırılmasını başa düşün.

🔗 Süni intellekt nədir
Süni intellekt, növləri və real həyatda istifadəsinə dair aydın bir baxış.


1) “Yaxşı” sözünün xoşagəlməz tərifi ilə başlayın 

Metrikalardan, idarəetmə panellərindən, hər hansı bir etalon dəyişikliyindən əvvəl uğurun necə göründüyünə qərar verin.

Aydınlaşdırın:

  • İstifadəçi: daxili analitik, müştəri, klinisyen, sürücü, saat 16:00-da yorğun dəstək agenti...

  • Qərar: krediti təsdiqləmək, saxtakarlığı qeyd etmək, məzmun təklif etmək, qeydləri ümumiləşdirmək

  • Ən vacib uğursuzluqlar:

    • Yalançı müsbətlər (qıcıqlandırıcı) və yalançı mənfilər (təhlükəli)

  • Məhdudiyyətlər: gecikmə, sorğu başına xərc, məxfilik qaydaları, izahlılıq tələbləri, əlçatanlıq

Bu, komandaların "mənalı nəticə" əvəzinə "gözəl metrik" üçün optimallaşdırmaya keçdiyi hissədir. Bu, tez-tez baş verir. Məsələn... çox.

Süni İntellekt Risklərinin İdarə Edilməsi Çərçivəsində (Sİ RMF 1.0) [1], testləri etibarlılıq və həyat dövrü risklərinin idarə edilməsi ətrafında qurmaqdır.

 

Süni intellekt modellərinin sınaqdan keçirilməsi

2) “Süni intellekt modellərini necə sınaqdan keçirmək olar”ın yaxşı versiyasını nə təşkil edir? ✅

Möhkəm bir test yanaşmasının bir neçə müzakirə olunmayan tərəfi var:

  • Təmsiledici məlumatlar (yalnız təmiz laboratoriya məlumatları deyil)

  • təmiz çatlar (bu barədə bir saniyə sonra daha ətraflı məlumat)

  • Əsas xətlər etməli olduğunuz sadə modellər - saxta qiymətləndiricilərin mövcudluğunun bir səbəbi var [4])

  • Birdən çox ölçü (çünki bir rəqəm sizə, nəzakətlə, üzünüzə doğru uzanır)

  • Stress testləri (kənar hallar, qeyri-adi girişlər, rəqib ssenariləri)

  • İnsan baxış dövrləri (xüsusilə generativ modellər üçün)

  • Başlatmadan sonra monitorinq (çünki dünya dəyişir, boru kəmərləri qırılır və istifadəçilər... yaradıcıdırlar [1])

Həmçinin: yaxşı bir yanaşma nəyi sınaqdan keçirdiyinizi, nəyi sınaqdan keçirmədiyinizi və nədən narahat olduğunuzu sənədləşdirməyi əhatə edir. "Nədən narahatam" bölməsi narahat hiss olunur və etibarın artmağa başladığı yer də budur.

Komandaların səmimi qalmasına kömək edən iki sənədləşmə nümunəsi:

  • Model Kartları (model nə üçündür, necə qiymətləndirilib, harada uğursuz olub) [2]

  • Məlumat Dəstləri üçün Məlumat Vərəqləri (məlumatlar nədir, necə toplanıb, nə üçün istifadə olunmalıdır/nə üçün istifadə edilməməlidir) [3]


3) Alət reallığı: insanların praktikada istifadə etdikləri şey 🧰

Alətlər könüllüdür, yaxşı qiymətləndirmə vərdişləri isə könüllü deyil.

Praqmatik bir quruluş istəyirsinizsə, əksər komandalar üç çömçə ilə nəticələnir:

  1. Təcrübə izləmə (işləmələr, konfiqurasiyalar, artefaktlar)

  2. Qiymətləndirmə qoşqusu (təkrarlana bilən oflayn testlər + reqressiya dəstləri)

  3. Monitorinq (sürüşmə siqnalları, performans proksiləri, hadisə xəbərdarlıqları)

Təbiətdə çox görəcəyiniz nümunələr (təsdiqlər deyil və bəli - xüsusiyyətlər/qiymət dəyişikliyi): MLflow, Weights & Biases, Great Expectations, Evidently, Deepchecks, OpenAI Evals, TruLens, LangSmith.

Bu bölmədən ideya seçsəniz təkrarlana bilən qiymətləndirmə qoşqusu qurun . Siz "düyməni basın → müqayisə edilə bilən nəticələr əldə edin" istəyirsiniz, "dəftəri yenidən işə salın və dua edin" yox.


4) Düzgün test dəstini qurun (və məlumatların sızmasını dayandırın) 🚧

Şok edici sayda "möhtəşəm" model təsadüfən fırıldaqçılıq edir.

Standart ML üçün

Karyeranı xilas edən bir neçə qeyri-seksual qayda:

  • Təlim/doğrulama/test saxlayın (və bölmə məntiqini yazın)

  • Bölünmüş fayllar arasında təkrarların qarşısını alın (eyni istifadəçi, eyni sənəd, eyni məhsul, demək olar ki, təkrarlanan fayllar)

  • Xüsusiyyət sızmasına diqqət yetirin (gələcək məlumatlar "cari" xüsusiyyətlərə gizlicə daxil olur)

  • Heç nəyi məğlub etməyi qeyd etməmək üçün əsas xətlərdən (saxta qiymətləndiricilərdən) istifadə edin [4]

Sızma tərifi (sürətli versiya): təlim/qiymətləndirmədə modelə qərar vaxtında sahib ola bilməyəcəyi məlumata giriş imkanı verən hər hansı bir şey. Bu, aşkar ("gələcək etiket") və ya gizli ("hadisə sonrası zaman möhürü vedrə") ola bilər.

LLM və generativ modellər üçün

sadəcə "model" deyil, həm də təcili və siyasət sistemi qurursunuz

  • Qızıl bir sıra tapşırıqlar yaradın (kiçik, yüksək keyfiyyətli, sabit)

  • Son real nümunələri əlavə edin (anonimləşdirilmiş + məxfilik təhlükəsizliyi)

  • Hərf səhvləri, jarqon, qeyri-standart formatlama, boş girişlər, çoxdilli sürprizlər kimi ehtiyatlı olun

Praktik olaraq bir dəfədən çox baş verdiyini müşahidə etmişəm: bir komanda "güclü" oflayn balı ilə göndərir, sonra müştəri dəstəyi deyir: "Əla. Əhəmiyyətli olan bir cümləni inamla əldən verir." Düzəliş "daha böyük model" deyildi. Daha yaxşı test tapşırıqları , daha aydın rubrikalar və məhz həmin uğursuzluq rejimini cəzalandıran reqressiya dəsti idi. Sadə. Effektiv.


5) Oflayn qiymətləndirmə: bir şey ifadə edən ölçülər 📏

Metrikalar yaxşıdır, metrik monokultura isə yox.

Təsnifat (spam, fırıldaqçılıq, niyyət, çeşidləmə)

Dəqiqlikdən daha çox istifadə edin.

  • Dəqiqlik, geri çağırış, F1

  • Eşik tənzimləməsi (standart həddiniz nadir hallarda xərcləriniz üçün "düzgün" olur) [4]

  • Seqment üzrə qarışıqlıq matrisləri (region, cihaz növü, istifadəçi qrupu)

Reqressiya (proqnozlaşdırma, qiymətqoyma, qiymətləndirmə)

  • MAE / RMSE (səhvləri necə cəzalandırmaq istədiyinizə əsasən seçin)

  • Kalibrləmə üsulu ilə çıxışlar "ballar" kimi istifadə edildikdə yoxlamalar aparılır (ballar reallıqla uyğun gəlirmi?)

Reytinq / tövsiyə sistemləri

  • NDCG, MAP, MRR

  • Sorğu növünə görə dilimləyin (baş və quyruq)

Kompüter görmə qabiliyyəti

  • mAP, IoU

  • Sinif başına performans (nadir hallarda modellərin sizi utandırdığı siniflər olur)

Generativ modellər (GM)

İnsanların fəlsəfi düşüncələrə daldığı yer budur 😵💫

Real komandalarda işləyən praktik seçimlər:

  • İnsan qiymətləndirməsi (ən yaxşı siqnal, ən yavaş dövrə)

  • Cütlük seçimi / qalibiyyət nisbəti (A vs B mütləq hesablamadan daha asandır)

  • Avtomatlaşdırılmış mətn ölçüləri (bəzi tapşırıqlar üçün əlverişli, digərləri üçün yanlış)

  • Tapşırıq əsaslı yoxlamalar: “Düzgün sahələri çıxardı?” “Siyasətə əməl etdimi?” “Lazım olduqda mənbələrə istinad etdimi?”

Əgər strukturlaşdırılmış "çoxmetrik, çox ssenarili" istinad nöqtəsi istəyirsinizsə, HELM yaxşı bir lövbərdir: o, qiymətləndirməni dəqiqlikdən kənara çıxaraq kalibrləmə, möhkəmlik, qərəzlilik/toksiklik və səmərəlilik güzəştləri kimi şeylərə yönəldir [5].

Kiçik bir haşiyə: yazı keyfiyyəti üçün avtomatlaşdırılmış ölçülər bəzən sanki bir sendviçi çəki ilə qiymətləndirmək kimi hiss olunur. Bu heç nə deyil, amma... buyurun 🥪


6) Davamlılıq testi: bir az tərlədin 🥵🧪

Əgər modeliniz yalnız səliqəli girişlərdə işləyirsə, deməli, bu, əsasən şüşə vazadır. Gözəl, kövrək və bahalıdır.

Test:

  • Səs-küy: yazı səhvləri, çatışmayan dəyərlər, qeyri-standart unikod, formatlama nasazlıqları

  • Dağıtım dəyişikliyi: yeni məhsul kateqoriyaları, yeni jarqon, yeni sensorlar

  • Ekstremal dəyərlər: diapazondan kənar ədədlər, nəhəng faydalı yüklər, boş sətirlər

  • Təlim dəstinizə bənzəməyən, lakin istifadəçilərə bənzəyən "

LLM-lər üçün aşağıdakılar daxildir:

  • Sürətli inyeksiya cəhdləri (istifadəçi məzmununun içərisində gizlədilmiş təlimatlar)

  • "Əvvəlki təlimatları qulaqardına vur" nümunələri

  • Alət istifadəsindəki kənar hallar (pis URL-lər, fasilələr, qismən çıxışlar)

Möhkəmlik, hadisələr baş verənə qədər mücərrəd səslənən etibarlılıq xüsusiyyətlərindən biridir. Sonra isə... çox hiss olunan hala gəlir [1].


7) Qərəz, ədalət və bunun kimə faydası var ⚖️

Bir model ümumilikdə "dəqiq" ola bilər, eyni zamanda müəyyən qruplar üçün davamlı olaraq daha pis ola bilər. Bu, kiçik bir səhv deyil. Bu, məhsul və etibar problemidir.

Praktik addımlar:

  • Mənalı seqmentlər üzrə performansı qiymətləndirin (ölçmək üçün hüquqi/etik cəhətdən uyğun)

  • Qruplar arasında səhv nisbətlərini və kalibrləməni müqayisə edin

  • Həssas xüsusiyyətləri kodlaya bilən proksi xüsusiyyətləri (poçt kodu, cihaz növü, dil) üçün test edin

Bunu haradasa sənədləşdirmirsinizsə, əslində gələcəkdən xəritəsiz etibar böhranını həll etməyi xahiş edirsiniz. Model Kartları bunu qoymaq üçün möhkəm bir yerdir [2] və NIST-in etibarlılıq çərçivəsi sizə "yaxşı" anlayışına nələrin daxil edilməli olduğuna dair güclü bir yoxlama siyahısı verir [1].


8) Təhlükəsizlik və mühafizə testləri (xüsusilə LLM-lər üçün) 🛡️

Əgər modeliniz məzmun yarada bilirsə, deməli, siz dəqiqlikdən daha çox şey yoxlayırsınız. Davranışı yoxlayırsınız.

Testləri daxil edin:

  • İcazəsiz məzmun yaradılması (siyasət pozuntuları)

  • Məxfilik sızması (sirləri əks etdirirmi?)

  • Yüksək riskli sahələrdə halüsinasiyalar

  • Həddindən artıq imtina (model normal sorğuları rədd edir)

  • Toksiklik və təcavüz nəticələri

  • Sürətli inyeksiya vasitəsilə məlumatların çıxarılması cəhdləri

Əsaslandırılmış yanaşma belədir: siyasət qaydalarını müəyyən etmək → test tapşırıqları yaratmaq → nəticələrə insan + avtomatlaşdırılmış yoxlamalarla qiymət vermək → hər dəfə bir şey dəyişdikdə onu işə salmaq. Bu "hər dəfə" hissəsi icarə haqqıdır.

Bu, həyat dövrü risk düşüncə tərzinə tam uyğun gəlir: idarə et, konteksti xəritələşdir, ölç, idarə et, təkrarla [1].


9) Onlayn test: mərhələli yayımlar (həqiqətin yaşadığı yer) 🚀

Oflayn testlər vacibdir. Onlayn təcrübə, palçıqlı ayaqqabı geyinərək reallığın ortaya çıxdığı yerdir.

Dəbdəbəli olmaq məcburiyyətində deyilsən. Sadəcə intizamlı olmalısan:

  • Kölgə rejimində işləyin (model işləyir, istifadəçilərə təsir etmir)

  • Tədricən yayım (əvvəlcə kiçik trafik, sağlam olarsa genişləndirin)

  • hadisələri (şikayətlər, eskalasiyalar, siyasətdəki uğursuzluqlar) izləyin

Dərhal etiketlər əldə edə bilməsəniz belə, proksi siqnallarını və əməliyyat sağlamlığını (gecikmə, nasazlıq nisbətləri, xərc) izləyə bilərsiniz. Əsas məqam: bütün istifadəçi bazanızdan əvvəl


10) Yerləşdirildikdən sonra monitorinq: sürüşmə, çürümə və səssiz nasazlıq 📉👀

Sınaqdan keçirdiyiniz model, sonda yaşadığınız model deyil. Məlumatlar dəyişir. İstifadəçilər dəyişir. Dünya dəyişir. Boru kəməri gecə saat 2-də qırılır. Bilirsən necədir..

Monitor:

  • Giriş məlumatlarının sürüşməsi (sxem dəyişiklikləri, çatışmazlıq, paylanma dəyişiklikləri)

  • Çıxış dəyişikliyi (sinif balansında dəyişikliklər, bal dəyişiklikləri)

  • Performans proksiləri (etiket gecikmələri real olduğu üçün)

  • Əks əlaqə siqnalları (bəyənmələr, yenidən redaktə etmək, eskalasiyalar)

  • Seqment səviyyəli reqressiyalar (səssiz qatillər)

Və çox da titrəməyən xəbərdarlıq hədləri təyin edin. Daim qışqıran monitora məhəl qoyulmur - şəhərdəki avtomobil siqnalizasiyası kimi.

Etibarlılığa əhəmiyyət verirsinizsə, bu “izləmə + zamanla təkmilləşdirmə” döngəsi könüllü deyil [1].


11) Kopyalaya biləcəyiniz praktik bir iş axını 🧩

Budur, miqyaslı sadə bir döngə:

  1. Uğur + uğursuzluq rejimlərini təyin edin (xərc/gecikmə/təhlükəsizlik daxil olmaqla) [1]

  2. Məlumat dəstləri yaradın:

    • qızılı dəst

    • kənar qutu paketi

    • son real nümunələr (məxfilik təhlükəsizliyi)

  3. Metrikaları seçin:

    • Tapşırıq metrikləri (F1, MAE, qalibiyyət nisbəti) [4][5]

    • təhlükəsizlik metrikləri (siyasətin keçmə nisbəti) [1][5]

    • əməliyyat metrikləri (gecikmə, xərc)

  4. Qiymətləndirmə qoşqusunu qurun (hər model/dəyişmə sorğusunda işləyir) [4][5]

  5. Stress testləri + rəqib testləri əlavə edin [1][5]

  6. Nümunə üçün insan araşdırması (xüsusilə LLM nəticələri üçün) [5]

  7. Kölgə + mərhələli yayım vasitəsilə göndərmə [1]

  8. İntizamla nəzarət + xəbərdarlıq + yenidən təlim [1]

  9. Sənəd model-kart stilində yazı ilə nəticələnir [2][3]

Təlim cazibədardır, testlər isə pul qazandırır.


12) Yekun qeydlər + qısa xülasə 🧠✨

Süni intellekt modellərini necə sınaqdan keçirəcəyiniz barədə yalnız bir neçə şeyi xatırlayırsınızsa :

  • Nümunəvi test məlumatlarından istifadə edin və sızmanın qarşısını alın [4]

  • Real nəticələrə bağlı birdən çox metrik seçin

  • LLM-lər üçün insan rəyi + qalibiyyət nisbəti stil müqayisələrinə [5]

  • Test möhkəmliyi - qeyri-adi girişlər maskalanmış normal girişlərdir [1]

  • Təhlükəsiz şəkildə yayın və izləyin, çünki modellər sürüşür və boru kəmərləri qırılır [1]

  • Nə etdiyinizi və nəyi sınaqdan keçirmədiyinizi sənədləşdirin (narahat, lakin güclü) [2][3]

Test etmək sadəcə "işlədiyini sübut etmək" deyil. Bu, "istifadəçilərinizdən əvvəl necə uğursuz olduğunu tapmaq" deməkdir. Bəli, bu, daha az cəlbedicidir - amma işlər titrəyəndə sisteminizi ayaqda saxlayan hissədir... 🧱🙂


Tez-tez verilən suallar

Süni intellekt modellərini real istifadəçi ehtiyaclarına uyğunlaşdırmaq üçün sınaqdan keçirməyin ən yaxşı yolu

"Yaxşı" anlayışını yalnız liderlik lövhəsi metrikası deyil, həm də real istifadəçi və modelin dəstəklədiyi qərar baxımından təyin etməklə başlayın. Ən yüksək xərc tələb edən uğursuzluq rejimlərini (yalançı müsbət və yalançı mənfi) müəyyən edin və gecikmə, xərc, məxfilik və izahlılıq kimi sərt məhdudiyyətləri izah edin. Daha sonra bu nəticələri əks etdirən metriklər və test halları seçin. Bu, heç vaxt daha yaxşı bir məhsula çevrilməyən "gözəl bir metrikanı" optimallaşdırmaqdan sizi saxlayır.

Qiymətləndirmə metriklərini seçməzdən əvvəl uğur meyarlarının müəyyən edilməsi

İstifadəçinin kim olduğunu, modelin hansı qərarı dəstəkləməli olduğunu və istehsalda "ən pis vəziyyətdəki uğursuzluğun" necə göründüyünü yazın. Qəbul edilən gecikmə və hər sorğu üçün xərc kimi əməliyyat məhdudiyyətlərini, üstəgəl məxfilik qaydaları və təhlükəsizlik siyasəti kimi idarəetmə ehtiyaclarını əlavə edin. Bunlar aydın olduqdan sonra, metriklər düzgün şeyi ölçməyin bir yoluna çevrilir. Bu çərçivə olmadan komandalar ölçmək üçün ən asan olanı optimallaşdırmağa meyllidirlər.

Model qiymətləndirməsində məlumat sızmasının və təsadüfi fırıldaqçılığın qarşısının alınması

Təlim/doğrulama/test bölmələrini sabit saxlayın və nəticələrin təkrarlana bilməsi üçün bölmə məntiqini sənədləşdirin. Bölünmələr arasında (eyni istifadəçi, sənəd, məhsul və ya təkrarlanan nümunələr) dublikatları və demək olar ki, dublikatları aktiv şəkildə bloklayın. "Gələcək" məlumatlarının zaman damğaları və ya hadisə sonrası sahələr vasitəsilə girişlərə daxil olduğu xüsusiyyət sızmasına diqqət yetirin. Güclü bir baza xətti (hətta saxta qiymətləndiricilər də) səs-küyü qeyd etdiyiniz zaman fərq etməyə kömək edir.

Testlərin dəyişikliklər zamanı təkrarlana bilməsi üçün qiymətləndirmə dəstinə nələr daxil edilməlidir

Praktik bir qoşqu, eyni məlumat dəstləri və qiymətləndirmə qaydalarından istifadə edərək hər bir model, sorğu və ya siyasət dəyişikliyi üzərində müqayisəli testləri təkrarlayır. Adətən, reqressiya dəsti, aydın metriklər panelləri və izlənilə bilən konfiqurasiyalar və artefaktları ehtiva edir. LLM sistemləri üçün həmçinin sabit bir "qızıl dəst" və kənar paket tələb olunur. Məqsəd "düyməni basın → müqayisəli nəticələrdir", "dəftəri yenidən işə salın və dua edin" deyil

Süni intellekt modellərini dəqiqlikdən kənarda sınaqdan keçirmək üçün metriklər

Birdən çox metrikdən istifadə edin, çünki tək bir rəqəm vacib güzəştləri gizlədə bilər. Təsnifat üçün dəqiqlik/geri çağırış/F1-i seqmentə görə eşik tənzimləməsi və qarışıqlıq matrisləri ilə birləşdirin. Reqressiya üçün səhvləri necə cəzalandırmaq istədiyinizə əsasən MAE və ya RMSE seçin və nəticələr ballar kimi işlədikdə kalibrləmə tərzi yoxlamaları əlavə edin. Reytinq üçün qeyri-bərabər performansı müəyyən etmək üçün NDCG/MAP/MRR istifadə edin və baş və quyruq sorğularına görə bölün.

Avtomatlaşdırılmış ölçülər çatışmadıqda LLM nəticələrinin qiymətləndirilməsi

Bunu yalnız mətn oxşarlığı deyil, həm də sorğu və siyasət sistemi və qiymətləndirmə davranışı kimi qəbul edin. Bir çox komanda insan qiymətləndirməsini cütlük seçimi (A/B qalibiyyət nisbəti) ilə birləşdirir, üstəgəl "düzgün sahələri çıxardı" və ya "siyasətə əməl etdi" kimi tapşırıq əsaslı yoxlamaları birləşdirir. Avtomatlaşdırılmış mətn metrikləri dar hallarda kömək edə bilər, lakin onlar tez-tez istifadəçilərin nəyə əhəmiyyət verdiyini nəzərə almırlar. Aydın rubrikalar və reqressiya dəsti adətən tək bir baldan daha vacibdir.

Modelin səs-küylü girişlərdə sıradan çıxmaması üçün davamlılıq testləri aparılmalıdır

Modeli səhvlər, çatışmayan dəyərlər, qəribə formatlama və qeyri-standart unikodla stress testi edin, çünki real istifadəçilər nadir hallarda səliqəli olurlar. Yeni kateqoriyalar, jarqonlar, sensorlar və ya dil nümunələri kimi paylanma dəyişikliyi hallarını əlavə edin. Səthi kövrək davranışa həddindən artıq dəyərləri (boş sətirlər, böyük yüklər, diapazondan kənar rəqəmlər) daxil edin. LLM-lər üçün həmçinin tez inyeksiya nümunələrini və zaman aşımı və ya qismən çıxışlar kimi alət istifadəsi uğursuzluqlarını sınaqdan keçirin.

Nəzəriyyədə azmadan qərəz və ədalət məsələlərinin yoxlanılması

Mənalı dilimlər üzrə performansı qiymətləndirin və ölçmək üçün qanuni və etik cəhətdən uyğun olduqda qruplar arasında səhv nisbətlərini və kalibrləməni müqayisə edin. Həssas xüsusiyyətləri dolayı yolla kodlaya bilən proxy xüsusiyyətlərini (poçt kodu, cihaz növü və ya dil kimi) axtarın. Model müəyyən kohortlar üçün ardıcıl olaraq uğursuz olsa da, "ümumilikdə dəqiq" görünə bilər. Ölçdüklərinizi və ölçmədiklərinizi sənədləşdirin ki, gələcək dəyişikliklər səssizcə reqressiyaları yenidən tətbiq etməsin.

Generativ süni intellekt və LLM sistemləri üçün daxil ediləcək təhlükəsizlik və mühafizə testləri

İcazə verilməyən məzmun yaradılması, məxfilik sızması, yüksək riskli sahələrdə halüsinasiyalar və modelin normal sorğuları blokladığı həddindən artıq imtina hallarını yoxlayın. Xüsusilə sistem alətlərdən istifadə etdikdə və ya məzmunu əldə etdikdə, sorğu yeritmə və məlumatların çıxarılması cəhdlərini daxil edin. Əsaslandırılmış iş axını aşağıdakılardır: siyasət qaydalarını müəyyənləşdirin, test sorğu dəsti yaradın, insan və avtomatlaşdırılmış yoxlamalarla qiymətləndirin və sorğular, məlumatlar və ya siyasətlər dəyişdikdə onu təkrarlayın. Ardıcıllıq ödədiyiniz məbləğdir.

Süni intellekt modellərinin buraxılışdan sonra sürüşmə və hadisələri aşkar etmək üçün yayımlanması və monitorinqi

Tam istifadəçi bazanız uğursuzluqları tapmazdan əvvəl kölgə rejimi və tədricən trafik rampaları kimi mərhələli yayım nümunələrindən istifadə edərək nasazlıqları tapın. Giriş sürüşməsini (sxem dəyişiklikləri, çatışmazlıqlar, paylanma dəyişiklikləri) və çıxış sürüşməsini (bal dəyişiklikləri, sinif balans dəyişiklikləri), üstəgəl gecikmə və xərc kimi əməliyyat sağlamlığını izləyin. Redaktə, eskalasiya və şikayətlər kimi geribildirim siqnallarını izləyin və seqment səviyyəli reqressiyaları izləyin. Bir şey dəyişdikdə, eyni qolu yenidən işə salın və davamlı olaraq monitorinqə davam edin.

İstinadlar

[1] NIST - Süni İntellekt Risklərinin İdarə Edilməsi Çərçivəsi (AI RMF 1.0) (PDF)
[2] Mitchell və digərləri - “Model Hesabatı üçün Model Kartları” (arXiv:1810.03993)
[3] Gebru və digərləri - “Verilənlər Dəsti üçün Məlumat Vərəqləri” (arXiv:1803.09010)
[4] scikit-learn - “Model Seçimi və Qiymətləndirilməsi” sənədləri
[5] Liang və digərləri - “Dil Modellərinin Vahid Qiymətləndirilməsi” (arXiv:2211.09110)

Ən son süni intellekt texnologiyalarını rəsmi süni intellekt köməkçisi mağazasında tapın

Haqqımızda

Bloqa qayıt