Kompüterinizdə süni intellekt necə yaradılır

Kompüterinizdə süni intellekt necə yaradılır. Tam təlimat.

Yaxşı, deməli, "Süni İntellekt" qurmaqla maraqlanırsınız. Hollivud mənasında deyil, mövcudluğu nəzərdə tutan, proqnozlar verən, şeyləri sıralayan və hətta bir az söhbət edən noutbukunuzda işlədə biləcəyiniz bir növ. "Kompüterinizdə Süni İntellekt Necə Yaradılır" yoxluqdan yerli olaraq işləyən bir şeyə sürükləmək cəhdimdir . Qısa yollar, kobud fikirlər və bəzən yayınma gözləyin, çünki, doğrusu, təkmilləşdirmə heç vaxt təmiz deyil.

Bundan sonra oxumaq istəyə biləcəyiniz məqalələr:

🔗 Süni intellekt modelini necə yaratmaq olar: tam addımlar izah olunur
Süni intellekt modelinin yaradılmasının əvvəldən axıra qədər aydın şəkildə təhlili.

🔗 Simvolik süni intellekt nədir: bilməli olduğunuz hər şey
Simvolik süni intellekt əsaslarını, tarixini və müasir tətbiqlərini öyrənin.

🔗 Süni intellekt üçün məlumatların saxlanması tələbləri: sizə lazım olanlar
Səmərəli və miqyaslana bilən süni intellekt sistemləri üçün saxlama ehtiyaclarını anlayın.


Niyə indi narahat olursan? 🧭

Çünki "yalnız Google miqyaslı laboratoriyalar süni intellektlə məşğul ola bilər" dövrü geridə qalıb. Bu günlərdə adi bir noutbuk, bəzi açıq mənbəli alətlər və inadkarlıqla e-poçtları təsnif edən, mətni ümumiləşdirən və ya şəkilləri etiketləyən kiçik modellər hazırlaya bilərsiniz. Məlumat mərkəzinə ehtiyac yoxdur. Sadəcə ehtiyacınız var:

  • bir plan,

  • təmiz bir quruluş,

  • və maşını pəncərədən atmaq istəmədən başa vura biləcəyiniz bir məqsəd.


Bunu izləməyə dəyər edən nədir ✅

“Kompüterinizdə süni intellekt necə yaradılır” sualını verən insanlar adətən doktorluq dərəcəsi almaq istəmirlər. Onlar həqiqətən işlədə biləcəkləri bir şey istəyirlər. Yaxşı bir plan bir neçə şeyi özündə cəmləşdirir:

  • Kiçikdən başlayın : "zəkanı həll etmək" yox, hissləri təsnif edin.

  • Təkrarlana bilənlik : conda və ya venv , beləliklə sabahı panik olmadan yenidən qura bilərsiniz.

  • Avadanlıq dürüstlüyü : CPU-lar scikit-learn üçün, GPU-lar isə dərin şəbəkələr üçün yaxşıdır (əgər şanslısınızsa) [2][3].

  • Təmiz məlumatlar : səhv etiketlənmiş zibil yoxdur; həmişə qatar/etibarlı/test bölmələrinə bölünür.

  • Bir şey ifadə edən metriklər : dəqiqlik, dəqiqlik, xatırlama, F1. Balanssızlıq üçün ROC-AUC/PR-AUC [1].

  • Paylaşmağın bir yolu : kiçik bir API, CLI və ya demo tətbiqi.

  • Təhlükəsizlik : şübhəli məlumat dəstləri yoxdur, şəxsi məlumat sızması yoxdur, riskləri aydın şəkildə qeyd edin [4].

Bunları düzgün edin və hətta "kiçik" modeliniz belə realdır.


Qorxulu görünməyən bir yol xəritəsi 🗺️

  1. Kiçik bir problem + bir metrik seçin.

  2. Python və bir neçə əsas kitabxananı quraşdırın.

  3. Təmiz bir mühit yaradın (daha sonra özünüzə təşəkkür edəcəksiniz).

  4. Verilənlər bazanızı yükləyin, düzgün şəkildə bölün.

  5. Axmaq, lakin dürüst bir təməl hazırlayın.

  6. Neyron şəbəkəsini yalnız dəyər qatdığı təqdirdə sınayın.

  7. Demo paketi.

  8. Gələcəkdə bəzi qeydlər aparın - təşəkkür edəcəksiniz.


Minimum dəst: həddindən artıq mürəkkəbləşdirməyin 🧰

  • Python : python.org saytından götürün.

  • Ətraf mühit : Conda və ya venv pip ilə.

  • Noutbuklar : Oyun üçün Yupiter.

  • Redaktor : VS Code, dostcasına və güclüdür.

  • Əsas kitabxanalar

    • pandas + NumPy (məlumat mübahisəsi)

    • scikit-learn (klassik ML)

    • PyTorch və ya TensorFlow (dərin öyrənmə, GPU maddə qurur) [2][3]

    • Qucaqlaşan Üz Transformerləri, spaCy, OpenCV (NLP + vizyon)

  • Sürətləndirmə (isteğe bağlı)

    • NVIDIA → CUDA qurğuları [2]

    • AMD → ROCm qurğuları [2]

    • Apple → Metal arxa planlı PyTorch (MPS) [2]

quraşdırma üçün dəqiq verməsinə icazə versəniz, əksər "quraşdırma çətinlikləri" aradan qalxır

Əsas qayda: əvvəlcə CPU üzərində sürün, sonra GPU ilə sprint edin.


Yığınızı seçin: parlaq şeylərə qarşı durun 🧪

  • Cədvəl məlumatları → scikit-learn. Logistik reqressiya, təsadüfi meşələr, qradiyent gücləndirilməsi.

  • Mətn və ya şəkillər → PyTorch və ya TensorFlow. Mətn üçün kiçik bir Transformatoru dəqiq tənzimləmək böyük bir qazancdır.

  • Chatbot-a bənzər → llama.cpp noutbuklarda kiçik LLM-ləri işlədə bilər. Sehr gözləməyin, amma qeydlər və xülasələr üçün işləyir [5].


Təmiz mühit quruluşu 🧼

# Conda way conda create -n localai python=3.11 conda activate localai # OR venv python -m venv .venv source .venv/bin/activate # Windows: .venv\Scripts\activate

Sonra əsasları quraşdırın:

pip install numpy pandas scikit-learn jupyter pip install torch torchvision torchaudio # və ya tensorflow pip install transformers datasets

(GPU versiyaları üçün, ciddi şəkildə, rəsmi selektordan [2][3] istifadə edin.)


İlk işləyən model: kiçik saxlayın 🏁

İlkin mərhələ. CSV → xüsusiyyətlər + etiketlər → logistik reqressiya.

sklearn.linear_model-dən LogisticRegression-u import edin ... print("Dəqiqlik:", dəqiqlik_bal(y_test, preds)) print(classification_report(y_test, preds))

Əgər bu təsadüfi nəticəni üstələsə, qeyd edirsiniz. Qəhvə və ya peçenye sizin ixtiyarınızdadır ☕.
Balanssız siniflər üçün xam dəqiqlik əvəzinə dəqiqlik/geri çağırış + ROC/PR əyrilərinə baxın [1].


Neyron torları (yalnız kömək edərsə) 🧠

Mətniniz var və hiss təsnifatı istəyirsiniz? Əvvəlcədən hazırlanmış kiçik bir Transformatoru dəqiq tənzimləyin. Sürətli, səliqəlidir, cihazınızı qızdırmır.

transformatorlardan AutoModelForSequenceClassification idxalından ... trainer.train() print(trainer.evaluate())

Peşəkar məsləhət: kiçik nümunələrlə başlayın. Məlumatların 1%-də xətaların aradan qaldırılması saatlara qənaət edir.


Məlumatlar: atlaya bilməyəcəyiniz əsaslar 📦

  • İctimai verilənlər dəstləri: Kaggle, Hugging Face, akademik depolar (lisenziyaları yoxlayın).

  • Etika: şəxsi məlumatları təmizləyin, hüquqlara hörmət edin.

  • Bölünmələr: təlim, təsdiq, sınaq. Heç vaxt baxma.

  • Etiketlər: ardıcıllıq dəbdəbəli modellərdən daha vacibdir.

Həqiqət bombası: Nəticələrin 60%-i memarlıq sehrbazlığından deyil, təmiz etiketlərdən gəlir.


Sizi dürüst saxlayan ölçülər 🎯

  • Təsnifat → dəqiqlik, dəqiqlik, xatırlatma, F1.

  • Balanssız çoxluqlar → ROC-AUC, PR-AUC daha vacibdir.

  • Reqressiya → MAE, RMSE, R².

  • Reallıq yoxlaması → bir neçə nəticəyə göz yummaq; rəqəmlər yalan danışa bilər.

Faydalı istinad: scikit-learn metrics guide [1].


Sürətləndirmə tövsiyələri 🚀

  • NVIDIA → PyTorch CUDA quruluşu [2]

  • AMD → ROCm [2]

  • Apple → MPS arxa planı [2]

  • TensorFlow → rəsmi GPU quraşdırmasını izləyin və təsdiqləyin [3]

Amma əsas xətt hələ işə düşməmişdən əvvəl optimallaşdırmayın. Bu, avtomobil təkərləri olmamışdan əvvəl diskləri cilalamaq kimidir.


Yerli generativ modellər: körpə əjdahalar 🐉

  • Dil llama.cpp vasitəsilə kvantlaşdırılmış LLM-lər [5]. Dərin söhbət üçün deyil, qeydlər və ya kod göstərişləri üçün yaxşıdır.

  • Şəkillər → Sabit Diffuziya variantları mövcuddur; lisenziyaları diqqətlə oxuyun.

Bəzən tapşırıq üçün xüsusi hazırlanmış Transformator kiçik aparatlarda şişmiş LLM-i üstələyir.


Qablaşdırma demoları: insanların klikləməsinə icazə verin 🖥️

  • Gradio → ən asan istifadəçi interfeysi.

  • FastAPI → təmiz API.

  • Flask → sürətli skriptlər.

idxal gradio as gr clf = boru kəməri ("hiss-analiz") ... demo.launch()

Brauzeriniz bunu göstərəndə sehr kimi hiss olunur.


Ağıl sağlamlığını qoruyan vərdişlər 🧠

  • Versiya nəzarəti üçün Git.

  • MLflow və ya təcrübələri izləmək üçün noutbuklar.

  • DVC və ya heşlərlə məlumatların versiyalaşdırılması.

  • Başqalarının sizin işlərinizi idarə etməsi lazımdırsa, Docker-dən istifadə edin.

  • Pin asılılıqları ( requirements.txt ).

İnanın mənə, gələcək - minnətdar olacaqsınız.


Problemlərin həlli: ümumi "uf" anlar 🧯

  • Quraşdırma xətaları? Sadəcə mühiti silin və yenidən qurun.

  • GPU aşkarlanmadı? Sürücü uyğunsuzluğu, versiyaları yoxlayın [2][3].

  • Model öyrənmir? Öyrənmə sürətini azaldın, sadələşdirin və ya etiketləri təmizləyin.

  • Həddindən artıq uyğunluq? Normallaşdırmaq, silmək və ya sadəcə daha çox məlumat.

  • Çox yaxşı göstəricilərdir? Test dəstini sızdırdınız (bu, düşündüyünüzdən daha çox baş verir).


Təhlükəsizlik + məsuliyyət 🛡️

  • PII zolağı.

  • Lisenziyalara hörmət edin.

  • Yerli-ilk = məxfilik + nəzarət, lakin hesablama limitləri ilə.

  • Riskləri sənədləşdirin (ədalət, təhlükəsizlik, dayanıqlıq və s.) [4].


Əlverişli müqayisə cədvəli 📊

Alət Ən Yaxşısı Niyə istifadə edirsiniz?
scikit-öyrənmək Cədvəl məlumatları Tez qələbələr, təmiz API 🙂
PyTorch Xüsusi hazırlanmış dərin torlar Çevik, böyük bir icma
TensorFlow İstehsal boru kəmərləri Ekosistem + xidmət seçimləri
Transformatorlar Mətn tapşırıqları Əvvəlcədən təlim keçmiş modellər hesablamanı xilas edir
spaCy NLP boru kəmərləri Sənaye gücü, praqmatik
Qradio Demolar/İnterfeyslər 1 fayl → UI
FastAPI API-lər Sürət + avtomatik sənədlər
ONNX İcra Müddəti Çarpaz çərçivə istifadəsi Portativ + səmərəli
llama.cpp Kiçik yerli LLM-lər CPU-ya uyğun kvantlaşdırma [5]
Docker Paylaşım mühitləri "Hər yerdə işləyir"

Üç daha dərin dalış (əslində istifadə edəcəksiniz) 🏊

  1. Cədvəllər üçün xüsusiyyət mühəndisliyi → normallaşdırmaq, birdəfəlik istifadə, ağac modellərini sınamaq, çarpaz doğrulama [1].

  2. Mətn üçün transfer öyrənməsi → kiçik Transformatorları dəqiqləşdirin, ardıcıllıq uzunluğunu təvazökar saxlayın, nadir siniflər üçün F1-i saxlayın [1].

  3. Lokal nəticə çıxarma üçün optimallaşdırma → kvantlaşdırma, ONNX ixracı, keş tokenizatorları.


Klassik tələlər 🪤

  • Çox böyük, çox tez tikilir.

  • Məlumatların keyfiyyətinə məhəl qoymamaq.

  • Test bölməsini atlayıram.

  • Kor kopyalama-yapışdırma kodlaşdırması.

  • Heç nəyi sənədləşdirmir.

Hətta README belə saatlarla sonraya qənaət etməyə imkan verir.


Vaxtınıza dəyər öyrənmə resursları 📚

  • Rəsmi sənədlər (PyTorch, TensorFlow, scikit-learn, Transformers).

  • Google ML Crash Kursu, DeepLearning.AI.

  • Görmə əsasları üçün OpenCV sənədləri.

  • NLP boru kəmərləri üçün spaCy istifadə təlimatı.

Kiçik bir həyat hacki: GPU quraşdırma əmrinizi yaradan rəsmi quraşdırıcılar həyat qurtaranlardır [2][3].


Hamısını bir yerə yığıram 🧩

  1. Məqsəd → dəstək biletlərini 3 növə təsnif edin.

  2. Məlumat → CSV ixracı, anonimləşdirilmiş, bölünmüş.

  3. Əsas → scikit-learn TF-IDF + logistik reqressiya.

  4. Təkmilləşdirmə → Əsas xətt dayanarsa, transformatoru dəqiq tənzimləyin.

  5. Demo → Gradio mətn qutusu tətbiqi.

  6. Gəmi → Docker + OXUMA.

  7. Təkrarlayın → səhvləri düzəldin, yenidən etiketləyin, təkrarlayın.

  8. Təhlükəsizlik → sənəd riskləri [4].

Darıxdırıcı dərəcədə təsirlidir.


TL;DR 🎂

Kompüterinizdə süni intellekt necə qurulacağını öyrənmək = kiçik bir problem seçin, əsas xətt qurun, yalnız kömək etdikdə genişləndirin və quraşdırmanızı təkrarlana bilən saxlayın. Bunu iki dəfə edin və özünüzü bacarıqlı hiss edəcəksiniz. Bunu beş dəfə edin və insanlar sizdən kömək istəməyə başlayacaqlar ki, bu da gizli şəkildə əyləncəli hissədir.

Bəli, bəzən tosterə şeir yazmağı öyrətmək kimi hiss olunur. Bu normaldır. Davamlı çalışın. 🔌📝


İstinadlar

[1] scikit-learn — Metrikalar və model qiymətləndirməsi: link
[2] PyTorch — Yerli quraşdırma seçicisi (CUDA/ROCm/Mac MPS): link
[3] TensorFlow — Quraşdırma + GPU yoxlanışı: link
[4] NIST — Süni intellekt Risklərin İdarə Edilməsi Çərçivəsi: link
[5] llama.cpp — Yerli LLM repo: link


Ən son süni intellekt texnologiyalarını rəsmi süni intellekt köməkçisi mağazasında tapın

Haqqımızda

Bloqa qayıt