ਆਪਣੇ ਕੰਪਿਊਟਰ 'ਤੇ AI ਕਿਵੇਂ ਬਣਾਇਆ ਜਾਵੇ। ਪੂਰੀ ਗਾਈਡ।

ਠੀਕ ਹੈ, ਤਾਂ ਤੁਸੀਂ "ਇੱਕ AI" ਬਣਾਉਣ ਬਾਰੇ ਉਤਸੁਕ ਹੋ। ਹਾਲੀਵੁੱਡ ਦੇ ਅਰਥਾਂ ਵਿੱਚ ਨਹੀਂ ਜਿੱਥੇ ਇਹ ਹੋਂਦ ਬਾਰੇ ਵਿਚਾਰ ਕਰਦਾ ਹੈ, ਪਰ ਉਸ ਕਿਸਮ ਦੀ ਜਿਸਨੂੰ ਤੁਸੀਂ ਆਪਣੇ ਲੈਪਟਾਪ 'ਤੇ ਚਲਾ ਸਕਦੇ ਹੋ ਜੋ ਭਵਿੱਖਬਾਣੀਆਂ ਕਰਦਾ ਹੈ, ਚੀਜ਼ਾਂ ਨੂੰ ਛਾਂਟਦਾ ਹੈ, ਸ਼ਾਇਦ ਥੋੜ੍ਹੀ ਜਿਹੀ ਗੱਲਬਾਤ ਵੀ ਕਰਦਾ ਹੈ। ਆਪਣੇ ਕੰਪਿਊਟਰ 'ਤੇ AI ਕਿਵੇਂ ਬਣਾਉਣਾ ਹੈ ਕੁਝ ਵੀ ਨਹੀਂ ਵੱਲ ਖਿੱਚਣ ਦੀ ਮੇਰੀ ਕੋਸ਼ਿਸ਼ ਹੈ ਜੋ ਅਸਲ ਵਿੱਚ ਸਥਾਨਕ ਤੌਰ 'ਤੇ ਕੰਮ ਕਰਦੀ ਹੈ । ਸ਼ਾਰਟਕੱਟ, ਸਪੱਸ਼ਟ ਰਾਏ, ਅਤੇ ਕਦੇ-ਕਦਾਈਂ ਪਾਸੇ ਵੱਲ ਜਾਣ ਦੀ ਉਮੀਦ ਕਰੋ ਕਿਉਂਕਿ, ਆਓ ਅਸਲੀ ਬਣੀਏ, ਛੇੜਛਾੜ ਕਦੇ ਵੀ ਸਾਫ਼ ਨਹੀਂ ਹੁੰਦੀ।

ਇਸ ਤੋਂ ਬਾਅਦ ਤੁਸੀਂ ਜੋ ਲੇਖ ਪੜ੍ਹਨਾ ਪਸੰਦ ਕਰ ਸਕਦੇ ਹੋ:

🔗 ਏਆਈ ਮਾਡਲ ਕਿਵੇਂ ਬਣਾਇਆ ਜਾਵੇ: ਪੂਰੇ ਕਦਮ ਦੱਸੇ ਗਏ
ਸ਼ੁਰੂ ਤੋਂ ਲੈ ਕੇ ਅੰਤ ਤੱਕ AI ਮਾਡਲ ਬਣਾਉਣ ਦਾ ਸਪੱਸ਼ਟ ਵੇਰਵਾ।

🔗 ਪ੍ਰਤੀਕਾਤਮਕ AI ਕੀ ਹੈ: ਤੁਹਾਨੂੰ ਸਿਰਫ਼ ਇਹ ਜਾਣਨ ਦੀ ਲੋੜ ਹੈ
ਪ੍ਰਤੀਕਾਤਮਕ AI ਮੂਲ ਗੱਲਾਂ, ਇਤਿਹਾਸ ਅਤੇ ਆਧੁਨਿਕ ਸਮੇਂ ਦੇ ਉਪਯੋਗ ਸਿੱਖੋ।

🔗 AI ਲਈ ਡਾਟਾ ਸਟੋਰੇਜ ਲੋੜਾਂ: ਤੁਹਾਨੂੰ ਕੀ ਚਾਹੀਦਾ ਹੈ
ਕੁਸ਼ਲ ਅਤੇ ਸਕੇਲੇਬਲ AI ਸਿਸਟਮਾਂ ਲਈ ਸਟੋਰੇਜ ਦੀਆਂ ਜ਼ਰੂਰਤਾਂ ਨੂੰ ਸਮਝੋ।

ਹੁਣ ਕਿਉਂ ਪਰੇਸ਼ਾਨ? 🧭

ਕਿਉਂਕਿ "ਸਿਰਫ਼ ਗੂਗਲ-ਪੈਮਾਨੇ ਦੀਆਂ ਲੈਬਾਂ ਹੀ AI ਕਰ ਸਕਦੀਆਂ ਹਨ" ਦਾ ਯੁੱਗ ਹੁਣ ਖਤਮ ਹੋ ਗਿਆ ਹੈ। ਇਨ੍ਹੀਂ ਦਿਨੀਂ, ਇੱਕ ਨਿਯਮਤ ਲੈਪਟਾਪ, ਕੁਝ ਓਪਨ-ਸੋਰਸ ਟੂਲਸ ਅਤੇ ਜ਼ਿੱਦ ਨਾਲ, ਤੁਸੀਂ ਛੋਟੇ ਮਾਡਲ ਬਣਾ ਸਕਦੇ ਹੋ ਜੋ ਈਮੇਲਾਂ ਨੂੰ ਵਰਗੀਕ੍ਰਿਤ ਕਰਦੇ ਹਨ, ਟੈਕਸਟ ਦਾ ਸਾਰ ਦਿੰਦੇ ਹਨ, ਜਾਂ ਚਿੱਤਰਾਂ ਨੂੰ ਟੈਗ ਕਰਦੇ ਹਨ। ਕਿਸੇ ਡੇਟਾ ਸੈਂਟਰ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ। ਤੁਹਾਨੂੰ ਸਿਰਫ਼ ਇਹ ਚਾਹੀਦਾ ਹੈ:

ਇੱਕ ਯੋਜਨਾ,
ਇੱਕ ਸਾਫ਼ ਸੈੱਟਅੱਪ,
ਅਤੇ ਇੱਕ ਅਜਿਹਾ ਟੀਚਾ ਜਿਸਨੂੰ ਤੁਸੀਂ ਮਸ਼ੀਨ ਨੂੰ ਖਿੜਕੀ ਤੋਂ ਬਾਹਰ ਸੁੱਟਣ ਦੀ ਇੱਛਾ ਤੋਂ ਬਿਨਾਂ ਪੂਰਾ ਕਰ ਸਕਦੇ ਹੋ।

ਇਸਨੂੰ ਫਾਲੋ ਕਰਨ ਦੇ ਯੋਗ ਕਿਉਂ ਬਣਾਉਂਦਾ ਹੈ ✅

"ਆਪਣੇ ਕੰਪਿਊਟਰ 'ਤੇ ਏਆਈ ਕਿਵੇਂ ਬਣਾਈਏ" ਪੁੱਛਣ ਵਾਲੇ ਲੋਕ ਆਮ ਤੌਰ 'ਤੇ ਪੀਐਚਡੀ ਨਹੀਂ ਚਾਹੁੰਦੇ। ਉਹ ਕੁਝ ਅਜਿਹਾ ਚਾਹੁੰਦੇ ਹਨ ਜੋ ਉਹ ਅਸਲ ਵਿੱਚ ਚਲਾ ਸਕਣ। ਇੱਕ ਚੰਗੀ ਯੋਜਨਾ ਕੁਝ ਚੀਜ਼ਾਂ ਨੂੰ ਪੂਰਾ ਕਰਦੀ ਹੈ:

ਛੋਟੀ ਜਿਹੀ ਸ਼ੁਰੂਆਤ ਕਰੋ : ਭਾਵਨਾ ਨੂੰ ਸ਼੍ਰੇਣੀਬੱਧ ਕਰੋ, "ਬੁੱਧੀ ਨੂੰ ਹੱਲ ਕਰੋ" ਨੂੰ ਨਹੀਂ।
ਪ੍ਰਜਨਨਯੋਗਤਾ : ਕੌਂਡਾ ਜਾਂ ਵੇਨਵ ਤਾਂ ਜੋ ਤੁਸੀਂ ਕੱਲ੍ਹ ਨੂੰ ਬਿਨਾਂ ਘਬਰਾਹਟ ਦੇ ਦੁਬਾਰਾ ਬਣਾ ਸਕੋ।
ਹਾਰਡਵੇਅਰ ਇਮਾਨਦਾਰੀ : scikit-learn ਲਈ CPU ਠੀਕ ਹਨ, ਡੂੰਘੇ ਨੈੱਟ ਲਈ GPU (ਜੇ ਤੁਸੀਂ ਖੁਸ਼ਕਿਸਮਤ ਹੋ) [2][3]।
ਸਾਫ਼ ਡੇਟਾ : ਕੋਈ ਗਲਤ ਲੇਬਲ ਵਾਲਾ ਜੰਕ ਨਹੀਂ; ਹਮੇਸ਼ਾ ਟ੍ਰੇਨ/ਵੈਧ/ਟੈਸਟ ਵਿੱਚ ਵੰਡਿਆ ਜਾਂਦਾ ਹੈ।
ਮੈਟ੍ਰਿਕਸ ਜਿਨ੍ਹਾਂ ਦਾ ਕੁਝ ਮਤਲਬ ਹੈ : ਸ਼ੁੱਧਤਾ, ਸ਼ੁੱਧਤਾ, ਯਾਦ, F1। ਅਸੰਤੁਲਨ ਲਈ, ROC-AUC/PR-AUC [1]।
ਸਾਂਝਾ ਕਰਨ ਦਾ ਇੱਕ ਤਰੀਕਾ : ਇੱਕ ਛੋਟਾ API, CLI, ਜਾਂ ਡੈਮੋ ਐਪ।
ਸੁਰੱਖਿਆ : ਕੋਈ ਸ਼ੱਕੀ ਡੇਟਾਸੈੱਟ ਨਹੀਂ, ਕੋਈ ਨਿੱਜੀ ਜਾਣਕਾਰੀ ਲੀਕ ਨਹੀਂ, ਜੋਖਮਾਂ ਨੂੰ ਸਪੱਸ਼ਟ ਤੌਰ 'ਤੇ ਨੋਟ ਕਰੋ [4]।

ਉਹਨਾਂ ਨੂੰ ਸਹੀ ਕਰੋ, ਅਤੇ ਤੁਹਾਡਾ "ਛੋਟਾ" ਮਾਡਲ ਵੀ ਅਸਲੀ ਹੈ।

ਇੱਕ ਰੋਡਮੈਪ ਜੋ ਡਰਾਉਣਾ ਨਹੀਂ ਲੱਗਦਾ 🗺️

ਇੱਕ ਛੋਟੀ ਸਮੱਸਿਆ + ਇੱਕ ਮਾਪਕ ਚੁਣੋ।
ਪਾਈਥਨ ਅਤੇ ਕੁਝ ਮੁੱਖ ਲਾਇਬ੍ਰੇਰੀਆਂ ਸਥਾਪਿਤ ਕਰੋ।
ਇੱਕ ਸਾਫ਼ ਵਾਤਾਵਰਣ ਬਣਾਓ (ਤੁਸੀਂ ਬਾਅਦ ਵਿੱਚ ਆਪਣਾ ਧੰਨਵਾਦ ਕਰੋਗੇ)।
ਆਪਣਾ ਡੇਟਾਸੈਟ ਲੋਡ ਕਰੋ, ਸਹੀ ਢੰਗ ਨਾਲ ਵੰਡੋ।
ਇੱਕ ਮੂਰਖ ਪਰ ਇਮਾਨਦਾਰ ਆਧਾਰਲਾਈਨ ਸਿਖਾਓ।
ਜੇਕਰ ਇਹ ਮੁੱਲ ਜੋੜਦਾ ਹੈ ਤਾਂ ਹੀ ਨਿਊਰਲ ਨੈੱਟ ਅਜ਼ਮਾਓ।
ਇੱਕ ਡੈਮੋ ਪੈਕ ਕਰੋ।
ਕੁਝ ਨੋਟਸ ਰੱਖੋ, ਭਵਿੱਖ ਵਿੱਚ - ਤੁਸੀਂ ਤੁਹਾਡਾ ਧੰਨਵਾਦ ਕਰੋਗੇ।

ਘੱਟੋ-ਘੱਟ ਕਿੱਟ: ਜ਼ਿਆਦਾ ਗੁੰਝਲਦਾਰ ਨਾ ਬਣਾਓ 🧰

ਪਾਈਥਨ : python.org ਤੋਂ ਲਓ।
ਵਾਤਾਵਰਣ ਪਿੱਪ ਦੇ ਨਾਲ ਕੌਂਡਾ ਜਾਂ ਵੈਨਵ
ਨੋਟਬੁੱਕ : ਖੇਡਣ ਲਈ ਜੁਪੀਟਰ।
ਸੰਪਾਦਕ : VS ਕੋਡ, ਦੋਸਤਾਨਾ ਅਤੇ ਸ਼ਕਤੀਸ਼ਾਲੀ।
ਕੋਰ ਲਿਬਸ
- ਪਾਂਡਾ + ਨਮਪੀ (ਡੇਟਾ ਰੈਂਗਲਿੰਗ)
- ਸਾਈਕਿਟ-ਲਰਨ (ਕਲਾਸੀਕਲ ਐਮਐਲ)
- ਪਾਈਟੋਰਚ ਜਾਂ ਟੈਂਸਰਫਲੋ (ਡੂੰਘੀ ਸਿਖਲਾਈ, GPU ਮੈਟਰ ਬਣਾਉਂਦਾ ਹੈ) [2][3]
- ਹੱਗਿੰਗ ਫੇਸ ਟ੍ਰਾਂਸਫਾਰਮਰ, ਸਪੇਸ, ਓਪਨਸੀਵੀ (ਐਨਐਲਪੀ + ਵਿਜ਼ਨ)
ਪ੍ਰਵੇਗ (ਵਿਕਲਪਿਕ)
- NVIDIA → CUDA ਬਿਲਡ [2]
- AMD → ROCm ਬਿਲਡ [2]
- ਐਪਲ → ਪਾਈਟੋਰਚ ਮੈਟਲ ਬੈਕਐਂਡ (MPS) ਦੇ ਨਾਲ [2]

⚡ ਸਾਈਡ ਨੋਟ: ਜ਼ਿਆਦਾਤਰ "ਇੰਸਟਾਲੇਸ਼ਨ ਦਰਦ" ਅਲੋਪ ਹੋ ਜਾਂਦਾ ਹੈ ਜੇਕਰ ਤੁਸੀਂ ਸਿਰਫ਼ ਅਧਿਕਾਰਤ ਇੰਸਟਾਲਰਾਂ ਨੂੰ ਸਹੀ ਕਮਾਂਡ ਦੇਣ ਦਿੰਦੇ ਹੋ। ਕਾਪੀ ਕਰੋ, ਪੇਸਟ ਕਰੋ, ਹੋ ਗਿਆ [2][3]।

ਨਿਯਮ: ਪਹਿਲਾਂ CPU 'ਤੇ ਘੁੰਮੋ, ਬਾਅਦ ਵਿੱਚ GPU ਨਾਲ ਦੌੜੋ।

ਆਪਣਾ ਸਟੈਕ ਚੁਣਨਾ: ਚਮਕਦਾਰ ਚੀਜ਼ਾਂ ਦਾ ਵਿਰੋਧ ਕਰੋ 🧪

ਸਾਰਣੀ ਡੇਟਾ → ਵਿਗਿਆਨ-ਸਿੱਖੋ। ਲੌਜਿਸਟਿਕ ਰਿਗਰੈਸ਼ਨ, ਬੇਤਰਤੀਬ ਜੰਗਲ, ਗਰੇਡੀਐਂਟ ਬੂਸਟਿੰਗ।
ਟੈਕਸਟ ਜਾਂ ਤਸਵੀਰਾਂ → ਪਾਈਟੋਰਚ ਜਾਂ ਟੈਂਸਰਫਲੋ। ਟੈਕਸਟ ਲਈ, ਇੱਕ ਛੋਟੇ ਟ੍ਰਾਂਸਫਾਰਮਰ ਨੂੰ ਵਧੀਆ ਬਣਾਉਣਾ ਇੱਕ ਵੱਡੀ ਜਿੱਤ ਹੈ।
ਚੈਟਬੋਟ-ਇਸ਼ → llama.cpp ਲੈਪਟਾਪਾਂ 'ਤੇ ਛੋਟੇ LLM ਚਲਾ ਸਕਦਾ ਹੈ। ਜਾਦੂ ਦੀ ਉਮੀਦ ਨਾ ਕਰੋ, ਪਰ ਇਹ ਨੋਟਸ ਅਤੇ ਸੰਖੇਪਾਂ ਲਈ ਕੰਮ ਕਰਦਾ ਹੈ [5]।

ਸਾਫ਼ ਵਾਤਾਵਰਣ ਸੈੱਟਅੱਪ 🧼

# ਕੋਂਡਾ ਵੇ ਕੋਂਡਾ ਬਣਾਓ -n ਲੋਕਲਾਈ ਪਾਈਥਨ=3.11 ਕੰਡਾ ਐਕਟੀਵੇਟ ਲੋਕਲਾਈ # ਜਾਂ venv python -m venv .venv ਸਰੋਤ .venv/bin/activate # ਵਿੰਡੋਜ਼: .venv\Scripts\activate

ਫਿਰ ਜ਼ਰੂਰੀ ਚੀਜ਼ਾਂ ਸਥਾਪਿਤ ਕਰੋ:

ਪਾਈਪ ਇੰਸਟਾਲ ਨਮਪੀ ਪਾਂਡਾ ਸਾਈਕਿਟ-ਲਰਨ ਜੁਪੀਟਰ ਪਾਈਪ ਇੰਸਟਾਲ ਟਾਰਚ ਟਾਰਚਵਿਜ਼ਨ ਟਾਰਚਆਡੀਓ # ਜਾਂ ਟੈਂਸਰਫਲੋ ਪਾਈਪ ਇੰਸਟਾਲ ਟ੍ਰਾਂਸਫਾਰਮਰ ਡੇਟਾਸੈੱਟ

(ਜੀਪੀਯੂ ਬਿਲਡ ਲਈ, ਗੰਭੀਰਤਾ ਨਾਲ, ਸਿਰਫ਼ ਅਧਿਕਾਰਤ ਚੋਣਕਾਰ [2][3] ਦੀ ਵਰਤੋਂ ਕਰੋ।)

ਪਹਿਲਾ ਕੰਮ ਕਰਨ ਵਾਲਾ ਮਾਡਲ: ਇਸਨੂੰ ਛੋਟਾ ਰੱਖੋ 🏁

ਪਹਿਲਾਂ ਬੇਸਲਾਈਨ। CSV → ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ + ਲੇਬਲ → ਲੌਜਿਸਟਿਕ ਰਿਗਰੈਸ਼ਨ।

sklearn.linear_model ਤੋਂ ਆਯਾਤ LogisticRegression ... ਪ੍ਰਿੰਟ ("ਸ਼ੁੱਧਤਾ:", accuracy_score (y_test, preds)) ਪ੍ਰਿੰਟ (ਵਰਗੀਕਰਣ_ਰਿਪੋਰਟ (y_test, preds))

ਜੇਕਰ ਇਹ ਬੇਤਰਤੀਬ ਤੋਂ ਵਧੀਆ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ, ਤਾਂ ਤੁਸੀਂ ਜਸ਼ਨ ਮਨਾਉਂਦੇ ਹੋ। ਕੌਫੀ ਜਾਂ ਕੂਕੀ, ਤੁਹਾਡੀ ਕਾਲ ☕।
ਅਸੰਤੁਲਿਤ ਕਲਾਸਾਂ ਲਈ, ਕੱਚੀ ਸ਼ੁੱਧਤਾ [1] ਦੀ ਬਜਾਏ ਸ਼ੁੱਧਤਾ/ਯਾਦ + ROC/PR ਕਰਵ ਦੇਖੋ।

ਨਿਊਰਲ ਜਾਲ (ਸਿਰਫ਼ ਜੇਕਰ ਉਹ ਮਦਦ ਕਰਦੇ ਹਨ) 🧠

ਕੀ ਤੁਹਾਡੇ ਕੋਲ ਟੈਕਸਟ ਹੈ ਅਤੇ ਤੁਸੀਂ ਭਾਵਨਾ ਵਰਗੀਕਰਣ ਚਾਹੁੰਦੇ ਹੋ? ਇੱਕ ਛੋਟੇ ਜਿਹੇ ਪਹਿਲਾਂ ਤੋਂ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਟ੍ਰਾਂਸਫਾਰਮਰ ਨੂੰ ਵਧੀਆ ਬਣਾਓ। ਤੇਜ਼, ਸਾਫ਼-ਸੁਥਰਾ, ਤੁਹਾਡੀ ਮਸ਼ੀਨ ਨੂੰ ਫ੍ਰਾਈ ਨਹੀਂ ਕਰਦਾ।

ਟ੍ਰਾਂਸਫਾਰਮਰਾਂ ਤੋਂ ਆਯਾਤ AutoModelForSequenceClassification ... trainer.train() print(trainer.evaluate())

ਪੇਸ਼ੇਵਰ ਸੁਝਾਅ: ਛੋਟੇ ਸੈਂਪਲਾਂ ਨਾਲ ਸ਼ੁਰੂਆਤ ਕਰੋ। 1% ਡੇਟਾ 'ਤੇ ਡੀਬੱਗ ਕਰਨ ਨਾਲ ਘੰਟੇ ਬਚਦੇ ਹਨ।

ਡਾਟਾ: ਮੂਲ ਗੱਲਾਂ ਜਿਨ੍ਹਾਂ ਨੂੰ ਤੁਸੀਂ ਛੱਡ ਨਹੀਂ ਸਕਦੇ 📦

ਜਨਤਕ ਡੇਟਾਸੈੱਟ: ਕੈਗਲ, ਹੱਗਿੰਗ ਫੇਸ, ਅਕਾਦਮਿਕ ਰਿਪੋ (ਲਾਇਸੰਸਾਂ ਦੀ ਜਾਂਚ ਕਰੋ)।
ਨੈਤਿਕਤਾ: ਨਿੱਜੀ ਜਾਣਕਾਰੀ ਨੂੰ ਸਾਫ਼ ਕਰੋ, ਅਧਿਕਾਰਾਂ ਦਾ ਸਤਿਕਾਰ ਕਰੋ।
ਵੰਡ: ਟ੍ਰੇਨ, ਪ੍ਰਮਾਣਿਕਤਾ, ਟੈਸਟ। ਕਦੇ ਵੀ ਨਾ ਝਾਕੋ।
ਲੇਬਲ: ਇਕਸਾਰਤਾ ਫੈਂਸੀ ਮਾਡਲਾਂ ਨਾਲੋਂ ਜ਼ਿਆਦਾ ਮਾਇਨੇ ਰੱਖਦੀ ਹੈ।

ਸੱਚਾਈ ਦਾ ਬੰਬ: 60% ਨਤੀਜੇ ਸਾਫ਼ ਲੇਬਲਾਂ ਤੋਂ ਹਨ, ਨਾ ਕਿ ਆਰਕੀਟੈਕਚਰ ਦੇ ਜਾਦੂ ਤੋਂ।

ਮਾਪਦੰਡ ਜੋ ਤੁਹਾਨੂੰ ਇਮਾਨਦਾਰ ਰੱਖਦੇ ਹਨ 🎯

ਵਰਗੀਕਰਨ → ਸ਼ੁੱਧਤਾ, ਸ਼ੁੱਧਤਾ, ਯਾਦ, F1।
ਅਸੰਤੁਲਿਤ ਸੈੱਟ → ROC-AUC, PR-AUC ਜ਼ਿਆਦਾ ਮਾਇਨੇ ਰੱਖਦੇ ਹਨ।
ਰਿਗਰੈਸ਼ਨ → MAE, RMSE, R²।
ਹਕੀਕਤ ਦੀ ਜਾਂਚ → ਕੁਝ ਨਤੀਜਿਆਂ 'ਤੇ ਨਜ਼ਰ ਮਾਰੋ; ਅੰਕੜੇ ਝੂਠ ਬੋਲ ਸਕਦੇ ਹਨ।

ਸੌਖਾ ਹਵਾਲਾ: ਵਿਗਿਆਨ-ਸਿੱਖਣ ਮੈਟ੍ਰਿਕਸ ਗਾਈਡ [1]।

ਪ੍ਰਵੇਗ ਸੁਝਾਅ 🚀

NVIDIA → PyTorch CUDA ਬਿਲਡ [2]
ਏਐਮਡੀ → ਆਰਓਸੀਐਮ [2]
ਐਪਲ → MPS ਬੈਕਐਂਡ [2]
ਟੈਂਸਰਫਲੋ → ਅਧਿਕਾਰਤ GPU ਇੰਸਟਾਲ ਦੀ ਪਾਲਣਾ ਕਰੋ + ਪੁਸ਼ਟੀ ਕਰੋ [3]

ਪਰ ਆਪਣੀ ਬੇਸਲਾਈਨ ਚੱਲਣ ਤੋਂ ਪਹਿਲਾਂ ਹੀ ਅਨੁਕੂਲ ਨਾ ਬਣਾਓ। ਇਹ ਕਾਰ ਦੇ ਪਹੀਏ ਲੱਗਣ ਤੋਂ ਪਹਿਲਾਂ ਹੀ ਰਿਮਾਂ ਨੂੰ ਪਾਲਿਸ਼ ਕਰਨ ਵਾਂਗ ਹੈ।

ਸਥਾਨਕ ਜਨਰੇਟਿਵ ਮਾਡਲ: ਬੇਬੀ ਡਰੈਗਨ 🐉

ਭਾਸ਼ਾ llama.cpp [5] ਰਾਹੀਂ ਕੁਆਂਟਾਈਜ਼ਡ LLM
ਤਸਵੀਰਾਂ → ਸਥਿਰ ਪ੍ਰਸਾਰ ਰੂਪ ਮੌਜੂਦ ਹਨ; ਲਾਇਸੈਂਸਾਂ ਨੂੰ ਧਿਆਨ ਨਾਲ ਪੜ੍ਹੋ।

ਕਈ ਵਾਰ ਇੱਕ ਟਾਸਕ-ਵਿਸ਼ੇਸ਼ ਫਾਈਨ-ਟਿਊਨਡ ਟ੍ਰਾਂਸਫਾਰਮਰ ਛੋਟੇ ਹਾਰਡਵੇਅਰ 'ਤੇ ਇੱਕ ਫੁੱਲੇ ਹੋਏ LLM ਨੂੰ ਮਾਤ ਦਿੰਦਾ ਹੈ।

ਪੈਕੇਜਿੰਗ ਡੈਮੋ: ਲੋਕਾਂ ਨੂੰ ਕਲਿੱਕ ਕਰਨ ਦਿਓ 🖥️

ਗ੍ਰੇਡੀਓ → ਸਭ ਤੋਂ ਆਸਾਨ UI।
ਫਾਸਟਏਪੀਆਈ → ਸਾਫ਼ ਏਪੀਆਈ।
ਫਲਾਸਕ → ਤੇਜ਼ ਸਕ੍ਰਿਪਟਾਂ।

ਗ੍ਰੇਡੀਓ ਨੂੰ gr clf = ਪਾਈਪਲਾਈਨ ("ਭਾਵਨਾ-ਵਿਸ਼ਲੇਸ਼ਣ") ਦੇ ਰੂਪ ਵਿੱਚ ਆਯਾਤ ਕਰੋ ... demo.launch()

ਜਦੋਂ ਤੁਹਾਡਾ ਬ੍ਰਾਊਜ਼ਰ ਇਸਨੂੰ ਦਿਖਾਉਂਦਾ ਹੈ ਤਾਂ ਜਾਦੂ ਵਰਗਾ ਮਹਿਸੂਸ ਹੁੰਦਾ ਹੈ।

ਆਦਤਾਂ ਜੋ ਸਮਝਦਾਰੀ ਨੂੰ ਬਚਾਉਂਦੀਆਂ ਹਨ 🧠

ਵਰਜਨ ਕੰਟਰੋਲ ਲਈ Git।
ਪ੍ਰਯੋਗਾਂ ਨੂੰ ਟਰੈਕ ਕਰਨ ਲਈ MLflow ਜਾਂ ਨੋਟਬੁੱਕ।
DVC ਜਾਂ ਹੈਸ਼ਾਂ ਨਾਲ ਡਾਟਾ ਵਰਜਨਿੰਗ।
ਜੇ ਦੂਜਿਆਂ ਨੂੰ ਤੁਹਾਡਾ ਸਮਾਨ ਚਲਾਉਣ ਦੀ ਲੋੜ ਹੋਵੇ ਤਾਂ ਡੌਕਰ ਕਰੋ।
ਪਿੰਨ ਨਿਰਭਰਤਾਵਾਂ ( requirements.txt )।

ਮੇਰੇ ਤੇ ਵਿਸ਼ਵਾਸ ਕਰੋ, ਭਵਿੱਖ - ਤੁਸੀਂ ਧੰਨਵਾਦੀ ਹੋਵੋਗੇ।

ਸਮੱਸਿਆ ਨਿਪਟਾਰਾ: ਆਮ "ਉਫ਼" ਪਲ 🧯

ਕੀ ਇੰਸਟਾਲ ਵਿੱਚ ਗਲਤੀਆਂ ਹਨ? ਬਸ env ਨੂੰ ਪੂੰਝੋ ਅਤੇ ਦੁਬਾਰਾ ਬਣਾਓ।
GPU ਨਹੀਂ ਮਿਲਿਆ? ਡਰਾਈਵਰ ਮੇਲ ਨਹੀਂ ਖਾਂਦਾ, ਵਰਜਨਾਂ ਦੀ ਜਾਂਚ ਕਰੋ [2][3]।
ਕੀ ਮਾਡਲ ਸਿੱਖ ਨਹੀਂ ਰਿਹਾ? ਸਿੱਖਣ ਦੀ ਦਰ ਘਟਾਓ, ਸਰਲ ਬਣਾਓ, ਜਾਂ ਲੇਬਲ ਸਾਫ਼ ਕਰੋ।
ਕੀ ਤੁਸੀਂ ਜ਼ਿਆਦਾ ਫਿਟਿੰਗ ਕਰ ਰਹੇ ਹੋ? ਨਿਯਮਤ ਕਰੋ, ਛੱਡ ਦਿਓ, ਜਾਂ ਸਿਰਫ਼ ਹੋਰ ਡਾਟਾ।
ਕੀ ਮੈਟ੍ਰਿਕਸ ਬਹੁਤ ਵਧੀਆ ਹਨ? ਤੁਸੀਂ ਟੈਸਟ ਸੈੱਟ ਲੀਕ ਕਰ ਦਿੱਤਾ (ਇਹ ਤੁਹਾਡੇ ਸੋਚਣ ਨਾਲੋਂ ਕਿਤੇ ਜ਼ਿਆਦਾ ਹੁੰਦਾ ਹੈ)।

ਸੁਰੱਖਿਆ + ਜ਼ਿੰਮੇਵਾਰੀ 🛡️

ਸਟ੍ਰਿਪ PII।
ਲਾਇਸੈਂਸਾਂ ਦਾ ਸਤਿਕਾਰ ਕਰੋ।
ਲੋਕਲ-ਫਸਟ = ਗੋਪਨੀਯਤਾ + ਕੰਟਰੋਲ, ਪਰ ਗਣਨਾ ਸੀਮਾਵਾਂ ਦੇ ਨਾਲ।
ਦਸਤਾਵੇਜ਼ ਜੋਖਮ (ਨਿਰਪੱਖਤਾ, ਸੁਰੱਖਿਆ, ਲਚਕੀਲਾਪਣ, ਆਦਿ) [4]।

ਸੌਖਾ ਤੁਲਨਾ ਸਾਰਣੀ 📊

ਔਜ਼ਾਰ	ਲਈ ਸਭ ਤੋਂ ਵਧੀਆ	ਇਸਨੂੰ ਕਿਉਂ ਵਰਤਣਾ ਹੈ?
ਵਿਗਿਆਨ-ਸਿੱਖੋ	ਸਾਰਣੀ ਡੇਟਾ	ਤੇਜ਼ ਜਿੱਤਾਂ, ਸਾਫ਼ API 🙂
ਪਾਈਟੋਰਚ	ਕਸਟਮ ਡੂੰਘੇ ਜਾਲ	ਲਚਕਦਾਰ, ਵਿਸ਼ਾਲ ਭਾਈਚਾਰਾ
ਟੈਂਸਰਫਲੋ	ਉਤਪਾਦਨ ਪਾਈਪਲਾਈਨਾਂ	ਈਕੋਸਿਸਟਮ + ਸਰਵਿੰਗ ਵਿਕਲਪ
ਟ੍ਰਾਂਸਫਾਰਮਰ	ਟੈਕਸਟ ਕਾਰਜ	ਪਹਿਲਾਂ ਤੋਂ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਮਾਡਲ ਗਣਨਾ ਨੂੰ ਬਚਾਉਂਦੇ ਹਨ
ਸਪੇਸੀ	NLP ਪਾਈਪਲਾਈਨਾਂ	ਉਦਯੋਗਿਕ-ਸ਼ਕਤੀ, ਵਿਹਾਰਕ
ਗ੍ਰੇਡੀਓ	ਡੈਮੋ/UI	1 ਫ਼ਾਈਲ → UI
ਫਾਸਟਏਪੀਆਈ	ਏਪੀਆਈ	ਸਪੀਡ + ਆਟੋ ਡੌਕਸ
ONNX ਰਨਟਾਈਮ	ਕਰਾਸ-ਫਰੇਮਵਰਕ ਵਰਤੋਂ	ਪੋਰਟੇਬਲ + ਕੁਸ਼ਲ
ਲਾਮਾ.ਸੀਪੀਪੀ	ਛੋਟੇ ਸਥਾਨਕ ਐਲਐਲਐਮ	CPU-ਅਨੁਕੂਲ ਕੁਆਂਟਾਈਜ਼ੇਸ਼ਨ [5]
ਡੌਕਰ	ਸਾਂਝਾਕਰਨ envs	"ਇਹ ਹਰ ਜਗ੍ਹਾ ਕੰਮ ਕਰਦਾ ਹੈ"

ਤਿੰਨ ਡੂੰਘੇ ਡੁਬਕੀ (ਤੁਸੀਂ ਅਸਲ ਵਿੱਚ ਵਰਤੋਗੇ) 🏊

ਟੇਬਲਾਂ ਲਈ ਵਿਸ਼ੇਸ਼ਤਾ ਇੰਜੀਨੀਅਰਿੰਗ → ਸਧਾਰਣ, ਇੱਕ-ਗਰਮ, ਟ੍ਰੀ ਮਾਡਲਾਂ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰੋ, ਕਰਾਸ-ਵੈਲੀਡੇਟ [1]।
ਟੈਕਸਟ ਲਈ ਟ੍ਰਾਂਸਫਰ ਲਰਨਿੰਗ → ਛੋਟੇ ਟ੍ਰਾਂਸਫਾਰਮਰਾਂ ਨੂੰ ਵਧੀਆ ਬਣਾਓ, seq ਲੰਬਾਈ ਨੂੰ ਸਾਧਾਰਨ ਰੱਖੋ, ਦੁਰਲੱਭ ਕਲਾਸਾਂ ਲਈ F1 [1]।
→ ਕੁਆਂਟਾਈਜ਼, ਐਕਸਪੋਰਟ ONNX, ਕੈਸ਼ ਟੋਕਨਾਈਜ਼ਰ ਲਈ ਅਨੁਕੂਲਤਾ

ਕਲਾਸਿਕ ਮੁਸ਼ਕਲਾਂ 🪤

ਬਹੁਤ ਵੱਡੀ ਇਮਾਰਤ, ਬਹੁਤ ਜਲਦੀ।
ਡਾਟਾ ਗੁਣਵੱਤਾ ਨੂੰ ਅਣਡਿੱਠਾ ਕਰਨਾ।
ਟੈਸਟ ਸਪਲਿਟ ਛੱਡਿਆ ਜਾ ਰਿਹਾ ਹੈ।
ਅੰਨ੍ਹੀ ਕਾਪੀ-ਪੇਸਟ ਕੋਡਿੰਗ।
ਕੁਝ ਵੀ ਦਸਤਾਵੇਜ਼ੀ ਨਹੀਂ ਬਣਾ ਰਿਹਾ।

ਇੱਕ README ਵੀ ਘੰਟਿਆਂ ਬਾਅਦ ਬਚਾਉਂਦਾ ਹੈ।

ਸਮੇਂ ਦੇ ਯੋਗ ਸਿੱਖਣ ਦੇ ਸਰੋਤ 📚

ਅਧਿਕਾਰਤ ਦਸਤਾਵੇਜ਼ (ਪਾਈਟੋਰਚ, ਟੈਂਸਰਫਲੋ, ਸਾਇੰਸਿਟ-ਲਰਨ, ਟ੍ਰਾਂਸਫਾਰਮਰ)।
ਗੂਗਲ ਐਮਐਲ ਕਰੈਸ਼ ਕੋਰਸ, ਡੀਪਲਰਨਿੰਗ.ਏਆਈ।
ਦ੍ਰਿਸ਼ਟੀ ਦੀ ਮੂਲ ਗੱਲਾਂ ਲਈ ਓਪਨਸੀਵੀ ਦਸਤਾਵੇਜ਼।
NLP ਪਾਈਪਲਾਈਨਾਂ ਲਈ ਸਪੇਸੀ ਵਰਤੋਂ ਗਾਈਡ।

ਛੋਟਾ ਜਿਹਾ ਲਾਈਫ-ਹੈਕ: ਤੁਹਾਡੇ GPU ਇੰਸਟਾਲ ਕਮਾਂਡ ਨੂੰ ਤਿਆਰ ਕਰਨ ਵਾਲੇ ਅਧਿਕਾਰਤ ਇੰਸਟਾਲਰ ਜੀਵਨ ਬਚਾਉਣ ਵਾਲੇ ਹਨ [2][3]।

ਸਭ ਕੁਝ ਇਕੱਠਾ ਕਰਨਾ 🧩

ਟੀਚਾ → ਸਹਾਇਤਾ ਟਿਕਟਾਂ ਨੂੰ 3 ਕਿਸਮਾਂ ਵਿੱਚ ਸ਼੍ਰੇਣੀਬੱਧ ਕਰੋ।
ਡਾਟਾ → CSV ਨਿਰਯਾਤ, ਗੁਮਨਾਮ, ਵੰਡਿਆ ਗਿਆ।
ਬੇਸਲਾਈਨ → ਵਿਗਿਆਨ-ਸਿੱਖਣ TF-IDF + ਲੌਜਿਸਟਿਕ ਰਿਗਰੈਸ਼ਨ।
ਅੱਪਗ੍ਰੇਡ ਕਰੋ → ਜੇਕਰ ਬੇਸਲਾਈਨ ਰੁਕ ਜਾਂਦੀ ਹੈ ਤਾਂ ਟ੍ਰਾਂਸਫਾਰਮਰ ਨੂੰ ਠੀਕ ਕਰੋ।
ਡੈਮੋ → ਗ੍ਰੇਡੀਓ ਟੈਕਸਟਬਾਕਸ ਐਪ।
ਜਹਾਜ਼ → ਡੌਕਰ + README।
ਦੁਹਰਾਓ → ਗਲਤੀਆਂ ਠੀਕ ਕਰੋ, ਦੁਬਾਰਾ ਲੇਬਲ ਕਰੋ, ਦੁਹਰਾਓ।
ਸੇਫਗਾਰਡ → ਦਸਤਾਵੇਜ਼ ਜੋਖਮ [4]।

ਇਹ ਬੋਰਿੰਗ ਤੌਰ 'ਤੇ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਹੈ।

TL;DR 🎂

ਆਪਣੇ ਕੰਪਿਊਟਰ 'ਤੇ AI ਕਿਵੇਂ ਬਣਾਉਣਾ ਹੈ ਸਿੱਖਣਾ = ਇੱਕ ਛੋਟੀ ਜਿਹੀ ਸਮੱਸਿਆ ਚੁਣੋ, ਇੱਕ ਬੇਸਲਾਈਨ ਬਣਾਓ, ਸਿਰਫ਼ ਉਦੋਂ ਹੀ ਵਧਾਓ ਜਦੋਂ ਇਹ ਮਦਦ ਕਰੇ, ਅਤੇ ਆਪਣੇ ਸੈੱਟਅੱਪ ਨੂੰ ਦੁਬਾਰਾ ਪੈਦਾ ਕਰਨ ਯੋਗ ਰੱਖੋ। ਇਸਨੂੰ ਦੋ ਵਾਰ ਕਰੋ ਅਤੇ ਤੁਸੀਂ ਸਮਰੱਥ ਮਹਿਸੂਸ ਕਰੋਗੇ। ਇਸਨੂੰ ਪੰਜ ਵਾਰ ਕਰੋ ਅਤੇ ਲੋਕ ਤੁਹਾਡੇ ਤੋਂ ਮਦਦ ਮੰਗਣਾ ਸ਼ੁਰੂ ਕਰ ਦੇਣਗੇ, ਜੋ ਕਿ ਗੁਪਤ ਤੌਰ 'ਤੇ ਮਜ਼ੇਦਾਰ ਹਿੱਸਾ ਹੈ।

ਅਤੇ ਹਾਂ, ਕਈ ਵਾਰ ਇਹ ਇੱਕ ਟੋਸਟਰ ਨੂੰ ਕਵਿਤਾ ਲਿਖਣਾ ਸਿਖਾਉਣ ਵਰਗਾ ਲੱਗਦਾ ਹੈ। ਕੋਈ ਗੱਲ ਨਹੀਂ। ਛੇੜਛਾੜ ਕਰਦੇ ਰਹੋ। 🔌📝

ਹਵਾਲੇ

[1] scikit-learn — ਮੈਟ੍ਰਿਕਸ ਅਤੇ ਮਾਡਲ ਮੁਲਾਂਕਣ: ਲਿੰਕ
[2] PyTorch — ਸਥਾਨਕ ਇੰਸਟਾਲ ਚੋਣਕਾਰ (CUDA/ROCm/Mac MPS): ਲਿੰਕ
[3] TensorFlow — ਇੰਸਟਾਲ + GPU ਤਸਦੀਕ: ਲਿੰਕ
[4] NIST — AI ਜੋਖਮ ਪ੍ਰਬੰਧਨ ਫਰੇਮਵਰਕ: ਲਿੰਕ
[5] llama.cpp — ਸਥਾਨਕ LLM ਰੈਪੋ: ਲਿੰਕ

ਅਧਿਕਾਰਤ AI ਸਹਾਇਕ ਸਟੋਰ 'ਤੇ ਨਵੀਨਤਮ AI ਲੱਭੋ

ਸਾਡੇ ਬਾਰੇ

ਬਲੌਗ ਤੇ ਵਾਪਸ ਜਾਓ

ਦੇਸ਼/ਖੇਤਰ