ਇੱਕ AI ਮਾਡਲ ਬਣਾਉਣਾ ਨਾਟਕੀ ਲੱਗਦਾ ਹੈ - ਜਿਵੇਂ ਇੱਕ ਫਿਲਮ ਵਿੱਚ ਇੱਕ ਵਿਗਿਆਨੀ ਵਿਭਿੰਨਤਾਵਾਂ ਬਾਰੇ ਬੁੜਬੁੜਾਉਂਦਾ ਹੈ - ਜਦੋਂ ਤੱਕ ਤੁਸੀਂ ਅਸਲ ਵਿੱਚ ਇੱਕ ਵਾਰ ਨਹੀਂ ਕਰਦੇ। ਫਿਰ ਤੁਹਾਨੂੰ ਅਹਿਸਾਸ ਹੁੰਦਾ ਹੈ ਕਿ ਇਹ ਅੱਧਾ ਡੇਟਾ ਸਫਾਈ ਦਾ ਕੰਮ ਹੈ, ਅੱਧਾ ਬੇਢੰਗਾ ਪਲੰਬਿੰਗ, ਅਤੇ ਅਜੀਬ ਤੌਰ 'ਤੇ ਨਸ਼ਾ ਕਰਨ ਵਾਲਾ ਹੈ। ਇਹ ਗਾਈਡ ਦੱਸਦੀ ਹੈ ਕਿ ਇੱਕ AI ਮਾਡਲ ਨੂੰ ਅੰਤ ਤੋਂ ਅੰਤ ਤੱਕ ਕਿਵੇਂ ਬਣਾਇਆ ਜਾਵੇ : ਡੇਟਾ ਤਿਆਰੀ, ਸਿਖਲਾਈ, ਟੈਸਟਿੰਗ, ਤੈਨਾਤੀ, ਅਤੇ ਹਾਂ - ਬੋਰਿੰਗ-ਪਰ-ਮਹੱਤਵਪੂਰਨ ਸੁਰੱਖਿਆ ਜਾਂਚਾਂ। ਅਸੀਂ ਸੁਰ ਵਿੱਚ ਆਮ, ਡੂੰਘਾਈ ਨਾਲ ਵਿਸਥਾਰ ਵਿੱਚ ਜਾਵਾਂਗੇ, ਅਤੇ ਇਮੋਜੀ ਨੂੰ ਮਿਸ਼ਰਣ ਵਿੱਚ ਰੱਖਾਂਗੇ, ਕਿਉਂਕਿ ਇਮਾਨਦਾਰੀ ਨਾਲ, ਤਕਨੀਕੀ ਲਿਖਤ ਨੂੰ ਟੈਕਸ ਭਰਨ ਵਰਗਾ ਕਿਉਂ ਮਹਿਸੂਸ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ?
ਇਸ ਤੋਂ ਬਾਅਦ ਤੁਸੀਂ ਜੋ ਲੇਖ ਪੜ੍ਹਨਾ ਪਸੰਦ ਕਰ ਸਕਦੇ ਹੋ:
🔗 ਏਆਈ ਆਰਬਿਟਰੇਜ ਕੀ ਹੈ: ਇਸ ਬਜ਼ਵਰਡ ਦੇ ਪਿੱਛੇ ਦੀ ਸੱਚਾਈ
ਏਆਈ ਆਰਬਿਟਰੇਜ, ਇਸਦੇ ਜੋਖਮਾਂ, ਮੌਕਿਆਂ ਅਤੇ ਅਸਲ-ਸੰਸਾਰ ਦੇ ਪ੍ਰਭਾਵਾਂ ਬਾਰੇ ਦੱਸਦਾ ਹੈ।
🔗 ਏਆਈ ਟ੍ਰੇਨਰ ਕੀ ਹੁੰਦਾ ਹੈ?
ਇੱਕ AI ਟ੍ਰੇਨਰ ਦੀ ਭੂਮਿਕਾ, ਹੁਨਰ ਅਤੇ ਜ਼ਿੰਮੇਵਾਰੀਆਂ ਨੂੰ ਕਵਰ ਕਰਦਾ ਹੈ।
🔗 ਸਿੰਬੋਲਿਕ ਏਆਈ ਕੀ ਹੈ: ਤੁਹਾਨੂੰ ਸਿਰਫ਼ ਇਹ ਜਾਣਨ ਦੀ ਲੋੜ ਹੈ
ਪ੍ਰਤੀਕਾਤਮਕ AI ਸੰਕਲਪਾਂ, ਇਤਿਹਾਸ ਅਤੇ ਵਿਹਾਰਕ ਉਪਯੋਗਾਂ ਨੂੰ ਤੋੜਦਾ ਹੈ।
ਇੱਕ AI ਮਾਡਲ ਕੀ ਬਣਾਉਂਦਾ ਹੈ - ਮੂਲ ਗੱਲਾਂ ✅
ਇੱਕ "ਚੰਗਾ" ਮਾਡਲ ਉਹ ਨਹੀਂ ਹੁੰਦਾ ਜੋ ਤੁਹਾਡੀ ਡਿਵੈਲਪ ਨੋਟਬੁੱਕ ਵਿੱਚ 99% ਸ਼ੁੱਧਤਾ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ ਅਤੇ ਫਿਰ ਤੁਹਾਨੂੰ ਉਤਪਾਦਨ ਵਿੱਚ ਸ਼ਰਮਿੰਦਾ ਕਰਦਾ ਹੈ। ਇਹ ਉਹ ਹੈ ਜੋ:
-
ਚੰਗੀ ਤਰ੍ਹਾਂ ਤਿਆਰ ਕੀਤਾ ਗਿਆ → ਸਮੱਸਿਆ ਸਪਸ਼ਟ ਹੈ, ਇਨਪੁਟ/ਆਉਟਪੁੱਟ ਸਪੱਸ਼ਟ ਹਨ, ਮੈਟ੍ਰਿਕ 'ਤੇ ਸਹਿਮਤੀ ਹੈ।
-
ਡੇਟਾ-ਈਮਾਨਦਾਰ → ਡੇਟਾਸੈਟ ਅਸਲ ਵਿੱਚ ਗੜਬੜ ਵਾਲੀ ਅਸਲ ਦੁਨੀਆਂ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ, ਫਿਲਟਰ ਕੀਤੇ ਸੁਪਨੇ ਦੇ ਸੰਸਕਰਣ ਨੂੰ ਨਹੀਂ। ਵੰਡ ਜਾਣੀ ਜਾਂਦੀ ਹੈ, ਲੀਕੇਜ ਸੀਲ ਕੀਤੀ ਜਾਂਦੀ ਹੈ, ਲੇਬਲ ਟਰੇਸ ਕਰਨ ਯੋਗ ਹਨ।
-
ਮਜ਼ਬੂਤ → ਮਾਡਲ ਨਹੀਂ ਟੁੱਟਦਾ।
-
ਸਮਝ → ਮੈਟ੍ਰਿਕਸ ਨਾਲ ਮੁਲਾਂਕਣ ਕੀਤਾ ਗਿਆ । ROC AUC ਵਧੀਆ ਲੱਗਦਾ ਹੈ ਪਰ ਕਈ ਵਾਰ F1 ਜਾਂ ਕੈਲੀਬ੍ਰੇਸ਼ਨ ਉਹ ਹੁੰਦਾ ਹੈ ਜਿਸਦੀ ਕਾਰੋਬਾਰ ਪਰਵਾਹ ਕਰਦਾ ਹੈ।
-
ਤੈਨਾਤ ਕਰਨ ਯੋਗ → ਅਨੁਮਾਨਿਤ ਸਮਾਂ ਅਨੁਮਾਨਯੋਗ, ਸਰੋਤ ਸਮਝਦਾਰ, ਤੈਨਾਤ ਤੋਂ ਬਾਅਦ ਦੀ ਨਿਗਰਾਨੀ ਸ਼ਾਮਲ ਹੈ।
-
ਜ਼ਿੰਮੇਵਾਰ → ਨਿਰਪੱਖਤਾ ਟੈਸਟ, ਵਿਆਖਿਆਯੋਗਤਾ, ਦੁਰਵਰਤੋਂ ਲਈ ਰੇਲਿੰਗ [1]।
ਇਹਨਾਂ ਨੂੰ ਮਾਰੋ ਅਤੇ ਤੁਸੀਂ ਪਹਿਲਾਂ ਹੀ ਜ਼ਿਆਦਾਤਰ ਰਸਤਾ ਤੈਅ ਕਰ ਲਿਆ ਹੈ। ਬਾਕੀ ਸਿਰਫ਼ ਦੁਹਰਾਓ ਹੈ... ਅਤੇ ਥੋੜ੍ਹੀ ਜਿਹੀ "ਅੰਤੜੀ ਦੀ ਭਾਵਨਾ"। 🙂
ਛੋਟੀ ਜੰਗ ਦੀ ਕਹਾਣੀ: ਇੱਕ ਧੋਖਾਧੜੀ ਵਾਲੇ ਮਾਡਲ 'ਤੇ, ਕੁੱਲ ਮਿਲਾ ਕੇ F1 ਸ਼ਾਨਦਾਰ ਦਿਖਾਈ ਦਿੱਤਾ। ਫਿਰ ਅਸੀਂ ਭੂਗੋਲ + "ਕਾਰਡ ਮੌਜੂਦ ਬਨਾਮ ਨਹੀਂ" ਦੁਆਰਾ ਵੰਡਿਆ। ਹੈਰਾਨੀ: ਇੱਕ ਟੁਕੜੇ ਵਿੱਚ ਝੂਠੇ ਨਕਾਰਾਤਮਕ ਅੰਕੜੇ ਵਧ ਗਏ। ਸਬਕ ਨੂੰ ਸਾੜ ਦਿੱਤਾ ਗਿਆ - ਟੁਕੜੇ ਨੂੰ ਜਲਦੀ ਕੱਟੋ, ਅਕਸਰ ਟੁਕੜੇ ਨੂੰ ਕੱਟੋ।
ਤੇਜ਼ ਸ਼ੁਰੂਆਤ: ਏਆਈ ਮਾਡਲ ਬਣਾਉਣ ਦਾ ਸਭ ਤੋਂ ਛੋਟਾ ਰਸਤਾ ⏱️
-
ਕੰਮ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕਰੋ : ਵਰਗੀਕਰਨ, ਰਿਗਰੈਸ਼ਨ, ਦਰਜਾਬੰਦੀ, ਕ੍ਰਮ ਲੇਬਲਿੰਗ, ਪੀੜ੍ਹੀ, ਸਿਫਾਰਸ਼।
-
ਡੇਟਾ ਇਕੱਠਾ ਕਰੋ : ਇਕੱਠਾ ਕਰੋ, ਘਟਾਓ, ਸਹੀ ਢੰਗ ਨਾਲ ਵੰਡੋ (ਸਮਾਂ/ਹਸਤੀ), ਇਸਨੂੰ ਦਸਤਾਵੇਜ਼ ਬਣਾਓ [1]।
-
ਬੇਸਲਾਈਨ : ਹਮੇਸ਼ਾ ਛੋਟੀ ਸ਼ੁਰੂਆਤ ਕਰੋ - ਲੌਜਿਸਟਿਕ ਰਿਗਰੈਸ਼ਨ, ਛੋਟਾ ਰੁੱਖ [3]।
-
ਇੱਕ ਮਾਡਲ ਪਰਿਵਾਰ ਚੁਣੋ : ਸਾਰਣੀ → ਗਰੇਡੀਐਂਟ ਬੂਸਟਿੰਗ; ਟੈਕਸਟ → ਛੋਟਾ ਟ੍ਰਾਂਸਫਾਰਮਰ; ਦ੍ਰਿਸ਼ਟੀ → ਪਹਿਲਾਂ ਤੋਂ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ CNN ਜਾਂ ਬੈਕਬੋਨ [3][5]।
-
ਸਿਖਲਾਈ ਲੂਪ : ਆਪਟੀਮਾਈਜ਼ਰ + ਸ਼ੁਰੂਆਤੀ ਸਟਾਪ; ਨੁਕਸਾਨ ਅਤੇ ਪ੍ਰਮਾਣਿਕਤਾ ਦੋਵਾਂ ਨੂੰ ਟਰੈਕ ਕਰੋ [4]।
-
ਮੁਲਾਂਕਣ : ਕਰਾਸ-ਵੈਲੀਡੇਟ ਕਰੋ, ਗਲਤੀਆਂ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰੋ, ਸ਼ਿਫਟ ਅਧੀਨ ਟੈਸਟ ਕਰੋ।
-
ਪੈਕੇਜ : ਵਜ਼ਨ ਬਚਾਓ, ਪ੍ਰੀਪ੍ਰੋਸੈਸਰ, API ਰੈਪਰ [2]।
-
ਮਾਨੀਟਰ : ਘੜੀ ਦਾ ਵਹਾਅ, ਲੇਟੈਂਸੀ, ਸ਼ੁੱਧਤਾ ਦਾ ਸੜਨ [2]।
ਇਹ ਕਾਗਜ਼ 'ਤੇ ਸਾਫ਼-ਸੁਥਰਾ ਲੱਗਦਾ ਹੈ। ਅਮਲ ਵਿੱਚ, ਗੜਬੜ ਵਾਲਾ। ਅਤੇ ਇਹ ਠੀਕ ਹੈ।
ਤੁਲਨਾ ਸਾਰਣੀ: ਏਆਈ ਮਾਡਲ ਕਿਵੇਂ ਬਣਾਉਣਾ ਹੈ ਲਈ ਟੂਲ 🛠️
| ਔਜ਼ਾਰ / ਲਾਇਬ੍ਰੇਰੀ | ਲਈ ਸਭ ਤੋਂ ਵਧੀਆ | ਕੀਮਤ | ਇਹ ਕਿਉਂ ਕੰਮ ਕਰਦਾ ਹੈ (ਨੋਟ) |
|---|---|---|---|
| ਵਿਗਿਆਨ-ਸਿੱਖੋ | ਸਾਰਣੀ, ਬੇਸਲਾਈਨ | ਮੁਫ਼ਤ - OSS | ਸਾਫ਼ API, ਤੇਜ਼ ਪ੍ਰਯੋਗ; ਫਿਰ ਵੀ ਕਲਾਸਿਕ ਜਿੱਤਦਾ ਹੈ [3]। |
| ਪਾਈਟੋਰਚ | ਡੂੰਘੀ ਸਿੱਖਿਆ | ਮੁਫ਼ਤ - OSS | ਗਤੀਸ਼ੀਲ, ਪੜ੍ਹਨਯੋਗ, ਵਿਸ਼ਾਲ ਭਾਈਚਾਰਾ [4]। |
| ਟੈਂਸਰਫਲੋ + ਕੇਰਾਸ | ਉਤਪਾਦਨ ਡੀ.ਐਲ. | ਮੁਫ਼ਤ - OSS | ਕੇਰਾ ਅਨੁਕੂਲ; ਟੀਐਫ ਸਰਵਿੰਗ ਤੈਨਾਤੀ ਨੂੰ ਸੁਚਾਰੂ ਬਣਾਉਂਦੀ ਹੈ। |
| JAX + ਸਣ | ਖੋਜ + ਗਤੀ | ਮੁਫ਼ਤ - OSS | ਆਟੋਡਿਫ + ਐਕਸਐਲਏ = ਪ੍ਰਦਰਸ਼ਨ ਬੂਸਟ। |
| ਜੱਫੀ ਪਾਉਣ ਵਾਲੇ ਚਿਹਰੇ ਵਾਲੇ ਟ੍ਰਾਂਸਫਾਰਮਰ | ਐਨਐਲਪੀ, ਸੀਵੀ, ਆਡੀਓ | ਮੁਫ਼ਤ - OSS | ਪਹਿਲਾਂ ਤੋਂ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਮਾਡਲ + ਪਾਈਪਲਾਈਨਾਂ... ਸ਼ੈੱਫ ਦਾ ਚੁੰਮਣ [5]। |
| XGBoost/ਲਾਈਟGBM | ਸਾਰਣੀਗਤ ਦਬਦਬਾ | ਮੁਫ਼ਤ - OSS | ਅਕਸਰ ਮਾਮੂਲੀ ਡੇਟਾਸੈੱਟਾਂ 'ਤੇ DL ਨੂੰ ਹਰਾਉਂਦਾ ਹੈ। |
| ਫਾਸਟਏਆਈ | ਦੋਸਤਾਨਾ DL | ਮੁਫ਼ਤ - OSS | ਉੱਚ-ਪੱਧਰੀ, ਮਾਫ਼ ਕਰਨ ਵਾਲੀਆਂ ਡਿਫਾਲਟਾਂ। |
| ਕਲਾਉਡ ਆਟੋਐਮਐਲ (ਵੱਖ-ਵੱਖ) | ਕੋਈ/ਘੱਟ-ਕੋਡ ਨਹੀਂ | ਵਰਤੋਂ-ਅਧਾਰਿਤ $ | ਖਿੱਚੋ, ਸੁੱਟੋ, ਤੈਨਾਤ ਕਰੋ; ਹੈਰਾਨੀਜਨਕ ਤੌਰ 'ਤੇ ਠੋਸ। |
| ONNX ਰਨਟਾਈਮ | ਅਨੁਮਾਨ ਗਤੀ | ਮੁਫ਼ਤ - OSS | ਅਨੁਕੂਲਿਤ ਸਰਵਿੰਗ, ਕਿਨਾਰੇ-ਅਨੁਕੂਲ। |
ਉਹ ਦਸਤਾਵੇਜ਼ ਜੋ ਤੁਸੀਂ ਦੁਬਾਰਾ ਖੋਲ੍ਹਦੇ ਰਹੋਗੇ: scikit-learn [3], PyTorch [4], Hugging Face [5]।
ਕਦਮ 1 - ਸਮੱਸਿਆ ਨੂੰ ਇੱਕ ਵਿਗਿਆਨੀ ਵਾਂਗ ਬਣਾਓ, ਨਾ ਕਿ ਇੱਕ ਹੀਰੋ ਵਾਂਗ 🎯
ਕੋਡ ਲਿਖਣ ਤੋਂ ਪਹਿਲਾਂ, ਇਹ ਉੱਚੀ ਆਵਾਜ਼ ਵਿੱਚ ਕਹੋ: ਇਹ ਮਾਡਲ ਕੀ ਫੈਸਲਾ ਦੇਵੇਗਾ? ਜੇਕਰ ਇਹ ਧੁੰਦਲਾ ਹੈ, ਤਾਂ ਡੇਟਾਸੈਟ ਹੋਰ ਵੀ ਮਾੜਾ ਹੋਵੇਗਾ।
-
ਭਵਿੱਖਬਾਣੀ ਟੀਚਾ → ਸਿੰਗਲ ਕਾਲਮ, ਸਿੰਗਲ ਪਰਿਭਾਸ਼ਾ। ਉਦਾਹਰਣ: 30 ਦਿਨਾਂ ਦੇ ਅੰਦਰ-ਅੰਦਰ ਮੰਥਨ?
-
ਗ੍ਰੈਨਿਊਲੈਰਿਟੀ → ਪ੍ਰਤੀ ਉਪਭੋਗਤਾ, ਪ੍ਰਤੀ ਸੈਸ਼ਨ, ਪ੍ਰਤੀ ਆਈਟਮ - ਮਿਕਸ ਨਾ ਕਰੋ। ਲੀਕੇਜ ਦਾ ਜੋਖਮ ਅਸਮਾਨ ਛੂਹ ਰਿਹਾ ਹੈ।
-
ਪਾਬੰਦੀਆਂ → ਲੇਟੈਂਸੀ, ਮੈਮੋਰੀ, ਗੋਪਨੀਯਤਾ, ਕਿਨਾਰਾ ਬਨਾਮ ਸਰਵਰ।
-
ਸਫਲਤਾ ਦਾ ਮਾਪਕ → ਇੱਕ ਪ੍ਰਾਇਮਰੀ + ਕੁਝ ਗਾਰਡ। ਅਸੰਤੁਲਿਤ ਕਲਾਸਾਂ? AUPRC + F1 ਦੀ ਵਰਤੋਂ ਕਰੋ। ਰਿਗਰੈਸ਼ਨ? ਜਦੋਂ ਮੀਡੀਏਨ ਮਾਇਨੇ ਰੱਖਦੇ ਹਨ ਤਾਂ MAE RMSE ਨੂੰ ਹਰਾ ਸਕਦਾ ਹੈ।
ਲੜਾਈ ਤੋਂ ਸੁਝਾਅ: README ਦੇ ਪਹਿਲੇ ਪੰਨੇ 'ਤੇ ਇਹਨਾਂ ਸੀਮਾਵਾਂ + ਮੈਟ੍ਰਿਕ ਨੂੰ ਲਿਖੋ। ਪ੍ਰਦਰਸ਼ਨ ਬਨਾਮ ਲੇਟੈਂਸੀ ਟਕਰਾਉਣ 'ਤੇ ਭਵਿੱਖ ਦੇ ਆਰਗੂਮੈਂਟਾਂ ਨੂੰ ਸੁਰੱਖਿਅਤ ਕਰਦਾ ਹੈ।
ਕਦਮ 2 - ਡੇਟਾ ਇਕੱਠਾ ਕਰਨਾ, ਸਫਾਈ ਕਰਨਾ, ਅਤੇ ਵੰਡ ਜੋ ਅਸਲ ਵਿੱਚ ਟਿਕਾਈ ਰੱਖਦੇ ਹਨ 🧹📦
ਡੇਟਾ ਮਾਡਲ ਹੈ। ਤੁਸੀਂ ਇਹ ਜਾਣਦੇ ਹੋ। ਫਿਰ ਵੀ, ਨੁਕਸਾਨ:
-
ਉਤਪਤੀ → ਇਹ ਕਿੱਥੋਂ ਆਇਆ, ਇਸਦਾ ਮਾਲਕ ਕੌਣ ਹੈ, ਕਿਸ ਨੀਤੀ ਦੇ ਤਹਿਤ [1]।
-
ਲੇਬਲ → ਸਖ਼ਤ ਦਿਸ਼ਾ-ਨਿਰਦੇਸ਼, ਅੰਤਰ-ਐਨੋਟੇਟਰ ਜਾਂਚਾਂ, ਆਡਿਟ।
-
ਡੀ-ਡੁਪਲੀਕੇਸ਼ਨ → ਗੁਪਤ ਡੁਪਲੀਕੇਟ ਮੈਟ੍ਰਿਕਸ ਨੂੰ ਵਧਾਉਂਦੇ ਹਨ।
-
ਸਪਲਿਟਸ → ਰੈਂਡਮ ਹਮੇਸ਼ਾ ਸਹੀ ਨਹੀਂ ਹੁੰਦਾ। ਪੂਰਵ ਅਨੁਮਾਨ ਲਈ ਸਮਾਂ-ਅਧਾਰਿਤ, ਉਪਭੋਗਤਾ ਲੀਕੇਜ ਤੋਂ ਬਚਣ ਲਈ ਇਕਾਈ-ਅਧਾਰਿਤ ਵਰਤੋਂ।
-
ਲੀਕੇਜ → ਸਿਖਲਾਈ ਸਮੇਂ ਭਵਿੱਖ ਵਿੱਚ ਝਾਤੀ ਮਾਰਨ ਦੀ ਕੋਈ ਲੋੜ ਨਹੀਂ।
-
ਡੌਕਸ ਸਕੀਮਾ, ਸੰਗ੍ਰਹਿ, ਪੱਖਪਾਤ [1] ਦੇ ਨਾਲ ਇੱਕ ਤੇਜ਼ ਡੇਟਾ ਕਾਰਡ
ਰਸਮ: ਕਦੇ ਨਾ ਛੂਹਣ ਵਾਲੇ ਟੈਸਟ ਸੈੱਟ ਨੂੰ ਅੰਤਿਮ ਰੂਪ ਦੇਣ ਤੱਕ ਰੋਕੋ
ਕਦਮ 3 - ਪਹਿਲਾਂ ਮੁੱਢਲੀਆਂ ਰੇਖਾਵਾਂ: ਨਿਮਰ ਮਾਡਲ ਜੋ ਮਹੀਨਿਆਂ ਦੀ ਬਚਤ ਕਰਦਾ ਹੈ 🧪
ਮੁੱਢਲੀਆਂ ਗੱਲਾਂ ਸ਼ਾਨਦਾਰ ਨਹੀਂ ਹਨ, ਪਰ ਇਹ ਉਮੀਦਾਂ 'ਤੇ ਖਰਾ ਉਤਰਦੀਆਂ ਹਨ।
-
ਟੇਬੂਲਰ → ਸਾਈਕਿਟ-ਲਰਨ ਲੌਜਿਸਟਿਕ ਰੈਗ੍ਰੇਸ਼ਨ ਜਾਂ ਰੈਂਡਮਫੋਰੈਸਟ, ਫਿਰ XGBoost/LightGBM [3]।
-
ਟੈਕਸਟ → TF-IDF + ਲੀਨੀਅਰ ਵਰਗੀਕਰਣ। ਟ੍ਰਾਂਸਫਾਰਮਰਾਂ ਤੋਂ ਪਹਿਲਾਂ ਸੈਨਿਟੀ ਜਾਂਚ।
-
ਦ੍ਰਿਸ਼ਟੀ → ਛੋਟੀ ਸੀਐਨਐਨ ਜਾਂ ਪਹਿਲਾਂ ਤੋਂ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਰੀੜ੍ਹ ਦੀ ਹੱਡੀ, ਜੰਮੀਆਂ ਹੋਈਆਂ ਪਰਤਾਂ।
ਜੇਕਰ ਤੁਹਾਡਾ ਡੀਪ ਨੈੱਟ ਬੇਸਲਾਈਨ ਤੋਂ ਥੋੜ੍ਹਾ ਜਿਹਾ ਵੱਧ ਜਾਂਦਾ ਹੈ, ਤਾਂ ਸਾਹ ਲਓ। ਕਈ ਵਾਰ ਸਿਗਨਲ ਬਹੁਤ ਤੇਜ਼ ਨਹੀਂ ਹੁੰਦਾ।
ਕਦਮ 4 - ਇੱਕ ਮਾਡਲਿੰਗ ਪਹੁੰਚ ਚੁਣੋ ਜੋ ਡੇਟਾ ਦੇ ਅਨੁਕੂਲ ਹੋਵੇ 🍱
ਸਾਰਣੀਬੱਧ
ਪਹਿਲਾਂ ਗਰੇਡੀਐਂਟ ਬੂਸਟਿੰਗ - ਬਹੁਤ ਪ੍ਰਭਾਵਸ਼ਾਲੀ। ਵਿਸ਼ੇਸ਼ਤਾ ਇੰਜੀਨੀਅਰਿੰਗ (ਇੰਟਰੈਕਸ਼ਨ, ਏਨਕੋਡਿੰਗ) ਅਜੇ ਵੀ ਮਾਇਨੇ ਰੱਖਦੀ ਹੈ।
ਟੈਕਸਟ
ਹਲਕੇ ਫਾਈਨ-ਟਿਊਨਿੰਗ ਵਾਲੇ ਪਹਿਲਾਂ ਤੋਂ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਟ੍ਰਾਂਸਫਾਰਮਰ। ਜੇਕਰ ਲੇਟੈਂਸੀ ਮਾਇਨੇ ਰੱਖਦੀ ਹੈ ਤਾਂ ਡਿਸਟਿਲਡ ਮਾਡਲ [5]। ਟੋਕਨਾਈਜ਼ਰ ਵੀ ਮਾਇਨੇ ਰੱਖਦੇ ਹਨ। ਤੇਜ਼ ਜਿੱਤਾਂ ਲਈ: HF ਪਾਈਪਲਾਈਨਾਂ।
ਚਿੱਤਰ
ਪਹਿਲਾਂ ਤੋਂ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਬੈਕਬੋਨ + ਫਾਈਨ-ਟਿਊਨ ਹੈੱਡ ਨਾਲ ਸ਼ੁਰੂ ਕਰੋ। ਯਥਾਰਥਵਾਦੀ ਤੌਰ 'ਤੇ ਵਧਾਓ (ਫਲਿਪਸ, ਕ੍ਰੌਪ, ਝਟਕੇ)। ਛੋਟੇ ਡੇਟਾ, ਕੁਝ-ਸ਼ਾਟ ਜਾਂ ਲੀਨੀਅਰ ਪ੍ਰੋਬਾਂ ਲਈ।
ਸਮਾਂ ਲੜੀ
ਬੇਸਲਾਈਨ: ਲੈਗ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ, ਮੂਵਿੰਗ ਔਸਤ। ਪੁਰਾਣੇ ਸਮੇਂ ਦੇ ARIMA ਬਨਾਮ ਆਧੁਨਿਕ ਬੂਸਟਡ ਟ੍ਰੀ। ਪ੍ਰਮਾਣਿਕਤਾ ਵਿੱਚ ਹਮੇਸ਼ਾ ਸਮੇਂ ਦੇ ਕ੍ਰਮ ਦਾ ਸਤਿਕਾਰ ਕਰੋ।
ਨਿਯਮ: ਇੱਕ ਛੋਟਾ, ਸਥਿਰ ਮਾਡਲ > ਇੱਕ ਓਵਰਫਿੱਟ ਰਾਖਸ਼।
ਕਦਮ 5 - ਸਿਖਲਾਈ ਦਾ ਚੱਕਰ, ਪਰ ਜ਼ਿਆਦਾ ਗੁੰਝਲਦਾਰ ਨਾ ਬਣਾਓ 🔁
ਤੁਹਾਨੂੰ ਸਿਰਫ਼ ਲੋੜ ਹੈ: ਡਾਟਾ ਲੋਡਰ, ਮਾਡਲ, ਨੁਕਸਾਨ, ਆਪਟੀਮਾਈਜ਼ਰ, ਸ਼ਡਿਊਲਰ, ਲੌਗਿੰਗ। ਹੋ ਗਿਆ।
-
ਆਪਟੀਮਾਈਜ਼ਰ : ਐਡਮ ਜਾਂ SGD ਮੋਮੈਂਟਮ ਦੇ ਨਾਲ। ਓਵਰ-ਟਵੀਕ ਨਾ ਕਰੋ।
-
ਬੈਚ ਦਾ ਆਕਾਰ : ਬਿਨਾਂ ਥ੍ਰੈਸ਼ਿੰਗ ਦੇ ਡਿਵਾਈਸ ਮੈਮੋਰੀ ਨੂੰ ਵੱਧ ਤੋਂ ਵੱਧ ਕਰੋ।
-
ਨਿਯਮਤਕਰਨ : ਪੜ੍ਹਾਈ ਛੱਡਣਾ, ਭਾਰ ਘਟਣਾ, ਜਲਦੀ ਬੰਦ ਹੋਣਾ।
-
ਮਿਸ਼ਰਤ ਸ਼ੁੱਧਤਾ : ਬਹੁਤ ਜ਼ਿਆਦਾ ਗਤੀ ਵਧਾਉਣਾ; ਆਧੁਨਿਕ ਢਾਂਚੇ ਇਸਨੂੰ ਆਸਾਨ ਬਣਾਉਂਦੇ ਹਨ [4]।
-
ਪ੍ਰਜਨਨਯੋਗਤਾ : ਬੀਜ ਲਗਾਉਣਾ। ਇਹ ਫਿਰ ਵੀ ਹਿੱਲਦਾ ਰਹੇਗਾ। ਇਹ ਆਮ ਗੱਲ ਹੈ।
ਕੈਨੋਨੀਕਲ ਪੈਟਰਨਾਂ ਲਈ PyTorch ਟਿਊਟੋਰਿਅਲ ਵੇਖੋ [4]।
ਕਦਮ 6 - ਮੁਲਾਂਕਣ ਜੋ ਅਸਲੀਅਤ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ, ਲੀਡਰਬੋਰਡ ਅੰਕ ਨਹੀਂ 🧭
ਟੁਕੜਿਆਂ ਦੀ ਜਾਂਚ ਕਰੋ, ਸਿਰਫ਼ ਔਸਤ ਹੀ ਨਹੀਂ:
-
ਕੈਲੀਬ੍ਰੇਸ਼ਨ → ਸੰਭਾਵਨਾਵਾਂ ਦਾ ਕੁਝ ਮਤਲਬ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ। ਭਰੋਸੇਯੋਗਤਾ ਪਲਾਟ ਮਦਦ ਕਰਦੇ ਹਨ।
-
ਉਲਝਣ ਵਾਲੀਆਂ ਸੂਝਾਂ → ਥ੍ਰੈਸ਼ਹੋਲਡ ਵਕਰ, ਟ੍ਰੇਡ-ਆਫ ਦਿਖਾਈ ਦੇ ਰਹੇ ਹਨ।
-
ਗਲਤੀ ਦੀਆਂ ਬਕਟਾਂ → ਖੇਤਰ, ਡਿਵਾਈਸ, ਭਾਸ਼ਾ, ਸਮੇਂ ਅਨੁਸਾਰ ਵੰਡੋ। ਕਮਜ਼ੋਰੀਆਂ ਦਾ ਪਤਾ ਲਗਾਓ।
-
ਮਜ਼ਬੂਤੀ → ਸ਼ਿਫਟਾਂ ਅਧੀਨ ਟੈਸਟ, ਪਰੇਸ਼ਾਨ ਕਰਨ ਵਾਲੇ ਇਨਪੁਟ।
-
ਹਿਊਮਨ-ਇਨ-ਲੂਪ → ਜੇਕਰ ਲੋਕ ਇਸਨੂੰ ਵਰਤਦੇ ਹਨ, ਤਾਂ ਵਰਤੋਂਯੋਗਤਾ ਦੀ ਜਾਂਚ ਕਰੋ।
ਛੋਟੀ ਜਿਹੀ ਗੱਲ: ਇੱਕ ਰੀਕਾਲ ਡਿੱਪ ਸਿਖਲਾਈ ਅਤੇ ਉਤਪਾਦਨ ਵਿਚਕਾਰ ਯੂਨੀਕੋਡ ਸਧਾਰਣਕਰਨ ਦੇ ਮੇਲ ਨਾ ਖਾਣ ਕਾਰਨ ਆਈ। ਲਾਗਤ? 4 ਪੂਰੇ ਅੰਕ।
ਕਦਮ 7 - ਪੈਕਿੰਗ, ਸਰਵਿੰਗ, ਅਤੇ ਹੰਝੂਆਂ ਤੋਂ ਬਿਨਾਂ MLOps 🚚
ਇਹ ਉਹ ਥਾਂ ਹੈ ਜਿੱਥੇ ਪ੍ਰੋਜੈਕਟ ਅਕਸਰ ਫਸ ਜਾਂਦੇ ਹਨ।
-
ਕਲਾਕ੍ਰਿਤੀਆਂ : ਮਾਡਲ ਵੇਟ, ਪ੍ਰੀਪ੍ਰੋਸੈਸਰ, ਕਮਿਟ ਹੈਸ਼।
-
Env : ਪਿੰਨ ਵਰਜਨ, ਕੰਟੇਨਰਾਈਜ਼ ਲੀਨ।
-
ਇੰਟਰਫੇਸ :
/health+/predict। -
ਲੇਟੈਂਸੀ/ਥਰੂਪੁੱਟ : ਬੈਚ ਬੇਨਤੀਆਂ, ਵਾਰਮ-ਅੱਪ ਮਾਡਲ।
-
ਹਾਰਡਵੇਅਰ : ਕਲਾਸਿਕ ਲਈ CPU ਠੀਕ ਹੈ; DL ਲਈ GPU। ONNX ਰਨਟਾਈਮ ਗਤੀ/ਪੋਰਟੇਬਿਲਟੀ ਨੂੰ ਵਧਾਉਂਦਾ ਹੈ।
ਪੂਰੀ ਪਾਈਪਲਾਈਨ (CI/CD/CT, ਨਿਗਰਾਨੀ, ਰੋਲਬੈਕ) ਲਈ, Google ਦੇ MLOps ਦਸਤਾਵੇਜ਼ ਠੋਸ ਹਨ [2]।
ਕਦਮ 8 - ਬਿਨਾਂ ਘਬਰਾਹਟ ਦੇ ਨਿਗਰਾਨੀ, ਡ੍ਰਿਫਟ, ਅਤੇ ਮੁੜ ਸਿਖਲਾਈ 📈🧭
ਮਾਡਲ ਸੜਦੇ ਹਨ। ਉਪਭੋਗਤਾ ਵਿਕਸਤ ਹੁੰਦੇ ਹਨ। ਡੇਟਾ ਪਾਈਪਲਾਈਨਾਂ ਗਲਤ ਵਿਵਹਾਰ ਕਰਦੀਆਂ ਹਨ।
-
ਡਾਟਾ ਜਾਂਚ : ਸਕੀਮਾ, ਰੇਂਜ, ਨਲ।
-
ਭਵਿੱਖਬਾਣੀਆਂ : ਵੰਡ, ਡ੍ਰਿਫਟ ਮੈਟ੍ਰਿਕਸ, ਆਊਟਲੀਅਰ।
-
ਪ੍ਰਦਰਸ਼ਨ : ਇੱਕ ਵਾਰ ਲੇਬਲ ਆਉਣ ਤੋਂ ਬਾਅਦ, ਮੈਟ੍ਰਿਕਸ ਦੀ ਗਣਨਾ ਕਰੋ।
-
ਚੇਤਾਵਨੀਆਂ : ਲੇਟੈਂਸੀ, ਗਲਤੀਆਂ, ਵਹਿਣਾ।
-
ਕੈਡੈਂਸ ਨੂੰ ਮੁੜ ਸਿਖਲਾਈ ਦਿਓ : ਟਰਿੱਗਰ-ਅਧਾਰਿਤ > ਕੈਲੰਡਰ-ਅਧਾਰਿਤ।
ਲੂਪ ਨੂੰ ਦਸਤਾਵੇਜ਼ ਬਣਾਓ। ਇੱਕ ਵਿਕੀ "ਕਬਾਇਲੀ ਯਾਦਦਾਸ਼ਤ" ਨੂੰ ਮਾਤ ਦਿੰਦਾ ਹੈ। ਗੂਗਲ ਸੀਟੀ ਪਲੇਬੁੱਕਸ [2] ਵੇਖੋ।
ਜ਼ਿੰਮੇਵਾਰ ਏਆਈ: ਨਿਰਪੱਖਤਾ, ਨਿੱਜਤਾ, ਵਿਆਖਿਆਯੋਗਤਾ 🧩🧠
ਜੇਕਰ ਲੋਕ ਪ੍ਰਭਾਵਿਤ ਹੁੰਦੇ ਹਨ, ਤਾਂ ਜ਼ਿੰਮੇਵਾਰੀ ਵਿਕਲਪਿਕ ਨਹੀਂ ਹੁੰਦੀ।
-
ਨਿਰਪੱਖਤਾ ਟੈਸਟ → ਸੰਵੇਦਨਸ਼ੀਲ ਸਮੂਹਾਂ ਵਿੱਚ ਮੁਲਾਂਕਣ ਕਰੋ, ਜੇਕਰ ਪਾੜੇ ਹਨ ਤਾਂ ਘਟਾਓ [1]।
-
ਵਿਆਖਿਆਯੋਗਤਾ → ਸਾਰਣੀ ਲਈ SHAP, ਡੂੰਘਾਈ ਲਈ ਵਿਸ਼ੇਸ਼ਤਾ। ਧਿਆਨ ਨਾਲ ਵਰਤੋਂ।
-
ਗੋਪਨੀਯਤਾ/ਸੁਰੱਖਿਆ → PII ਨੂੰ ਘੱਟ ਤੋਂ ਘੱਟ ਕਰੋ, ਗੁਮਨਾਮ ਕਰੋ, ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਨੂੰ ਲਾਕ ਕਰੋ।
-
ਨੀਤੀ → ਇਰਾਦਾ ਬਨਾਮ ਵਰਜਿਤ ਵਰਤੋਂ ਲਿਖੋ। ਬਾਅਦ ਵਿੱਚ ਦਰਦ ਬਚਾਉਂਦਾ ਹੈ [1]।
ਇੱਕ ਛੋਟੀ ਜਿਹੀ ਵਾਕਥਰੂ 🧑🍳
ਮੰਨ ਲਓ ਅਸੀਂ ਸਮੀਖਿਆਵਾਂ ਨੂੰ ਵਰਗੀਕ੍ਰਿਤ ਕਰ ਰਹੇ ਹਾਂ: ਸਕਾਰਾਤਮਕ ਬਨਾਮ ਨਕਾਰਾਤਮਕ।
-
ਡਾਟਾ → ਸਮੀਖਿਆਵਾਂ ਇਕੱਠੀਆਂ ਕਰੋ, ਨਕਲ ਕਰੋ, ਸਮੇਂ ਅਨੁਸਾਰ ਵੰਡੋ [1]।
-
ਬੇਸਲਾਈਨ → TF-IDF + ਲੌਜਿਸਟਿਕ ਰਿਗਰੈਸ਼ਨ (ਸਿਕਿਟ-ਲਰਨ) [3]।
-
ਅੱਪਗ੍ਰੇਡ → ਛੋਟਾ ਪਹਿਲਾਂ ਤੋਂ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਟ੍ਰਾਂਸਫਾਰਮਰ ਹੱਗਿੰਗ ਫੇਸ ਦੇ ਨਾਲ [5]।
-
ਟ੍ਰੇਨ → ਕੁਝ ਯੁੱਗ, ਜਲਦੀ ਰੁਕਣਾ, ਟਰੈਕ F1 [4]।
-
ਈਵਲ → ਉਲਝਣ ਮੈਟ੍ਰਿਕਸ, ਪ੍ਰੀਸੀਜ਼ਨ@ਰੀਕਾਲ, ਕੈਲੀਬ੍ਰੇਸ਼ਨ।
-
ਪੈਕੇਜ → ਟੋਕਨਾਈਜ਼ਰ + ਮਾਡਲ, ਫਾਸਟਏਪੀਆਈ ਰੈਪਰ [2]।
-
ਮਾਨੀਟਰ → ਸ਼੍ਰੇਣੀਆਂ ਵਿੱਚ ਵਹਿਣ ਦੀ ਨਿਗਰਾਨੀ [2]।
-
ਜ਼ਿੰਮੇਵਾਰ ਟਵੀਕਸ → ਫਿਲਟਰ PII, ਸੰਵੇਦਨਸ਼ੀਲ ਡੇਟਾ ਦਾ ਸਤਿਕਾਰ ਕਰੋ [1]।
ਕੀ ਲੇਟੈਂਸੀ ਘੱਟ ਹੈ? ਮਾਡਲ ਨੂੰ ਡਿਸਟਿਲ ਕਰੋ ਜਾਂ ONNX ਨੂੰ ਐਕਸਪੋਰਟ ਕਰੋ।
ਆਮ ਗਲਤੀਆਂ ਜੋ ਮਾਡਲਾਂ ਨੂੰ ਚਲਾਕ ਦਿਖਾਉਂਦੀਆਂ ਹਨ ਪਰ ਮੂਰਖਤਾ ਭਰੀਆਂ ਕਾਰਵਾਈਆਂ ਕਰਦੀਆਂ ਹਨ 🙃
-
ਲੀਕ ਹੋਣ ਵਾਲੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ (ਰੇਲਗੱਡੀ ਵਿੱਚ ਘਟਨਾ ਤੋਂ ਬਾਅਦ ਦਾ ਡੇਟਾ)।
-
ਗਲਤ ਮੈਟ੍ਰਿਕ (AUC ਜਦੋਂ ਟੀਮ ਵਾਪਸ ਬੁਲਾਉਣ ਦੀ ਪਰਵਾਹ ਕਰਦੀ ਹੈ)।
-
ਛੋਟਾ ਵੈਲ ਸੈੱਟ (ਸ਼ੋਰ-ਸ਼ਰਾਬੇ ਵਾਲਾ "ਸਫਲਤਾਵਾਂ")।
-
ਵਰਗ ਅਸੰਤੁਲਨ ਨੂੰ ਅਣਡਿੱਠ ਕੀਤਾ ਗਿਆ.
-
ਪ੍ਰੀਪ੍ਰੋਸੈਸਿੰਗ ਮੇਲ ਨਹੀਂ ਖਾਂਦੀ (ਟ੍ਰੇਨ ਬਨਾਮ ਸਰਵ)।
-
ਬਹੁਤ ਜਲਦੀ ਜ਼ਿਆਦਾ ਅਨੁਕੂਲਿਤ ਕਰਨਾ.
-
ਪਾਬੰਦੀਆਂ ਨੂੰ ਭੁੱਲਣਾ (ਇੱਕ ਮੋਬਾਈਲ ਐਪ ਵਿੱਚ ਵਿਸ਼ਾਲ ਮਾਡਲ)।
ਔਪਟੀਮਾਈਜੇਸ਼ਨ ਟ੍ਰਿਕਸ 🔧
-
ਸਮਾਰਟ ਸ਼ਾਮਲ ਕਰੋ : ਹਾਰਡ ਨੈਗੇਟਿਵ, ਯਥਾਰਥਵਾਦੀ ਵਾਧਾ।
-
ਸਖ਼ਤੀ ਨਾਲ ਨਿਯਮਤ ਕਰੋ: ਸਕੂਲ ਛੱਡਣ ਵਾਲੇ, ਛੋਟੇ ਮਾਡਲ।
-
ਸਿੱਖਣ ਦੀ ਦਰ ਸਮਾਂ-ਸਾਰਣੀ (ਕੋਸਾਈਨ/ਕਦਮ)।
-
ਬੈਚ ਸਵੀਪ - ਵੱਡਾ ਹਮੇਸ਼ਾ ਬਿਹਤਰ ਨਹੀਂ ਹੁੰਦਾ।
-
ਗਤੀ ਲਈ ਮਿਸ਼ਰਤ ਸ਼ੁੱਧਤਾ + ਵੈਕਟਰਾਈਜ਼ੇਸ਼ਨ [4]।
-
ਕੁਆਂਟਾਈਜ਼ੇਸ਼ਨ, ਸਲਿਮ ਮਾਡਲਾਂ ਦੀ ਛਾਂਟੀ।
-
ਕੈਸ਼ ਏਮਬੈਡਿੰਗ/ਪ੍ਰੀ-ਕੰਪਿਊਟ ਹੈਵੀ ਓਪਸ।
ਡਾਟਾ ਲੇਬਲਿੰਗ ਜੋ ਫਟਦੀ ਨਹੀਂ 🏷️
-
ਦਿਸ਼ਾ-ਨਿਰਦੇਸ਼: ਵਿਸਤ੍ਰਿਤ, ਕਿਨਾਰੇ ਵਾਲੇ ਕੇਸਾਂ ਦੇ ਨਾਲ।
-
ਟ੍ਰੇਨ ਲੇਬਲਰ: ਕੈਲੀਬ੍ਰੇਸ਼ਨ ਕਾਰਜ, ਸਮਝੌਤੇ ਦੀ ਜਾਂਚ।
-
ਕੁਆਲਿਟੀ: ਸੋਨੇ ਦੇ ਸੈੱਟ, ਸਪਾਟ ਚੈੱਕ।
-
ਟੂਲ: ਵਰਜਨ ਕੀਤੇ ਡੇਟਾਸੈੱਟ, ਨਿਰਯਾਤਯੋਗ ਸਕੀਮਾ।
-
ਨੈਤਿਕਤਾ: ਨਿਰਪੱਖ ਤਨਖਾਹ, ਜ਼ਿੰਮੇਵਾਰ ਸੋਰਸਿੰਗ। ਪੂਰਾ ਵਿਰਾਮ [1]।
ਤੈਨਾਤੀ ਪੈਟਰਨ 🚀
-
ਬੈਚ ਸਕੋਰਿੰਗ → ਰਾਤ ਦੀਆਂ ਨੌਕਰੀਆਂ, ਗੋਦਾਮ।
-
ਰੀਅਲ-ਟਾਈਮ ਮਾਈਕ੍ਰੋਸਰਵਿਸ → ਸਿੰਕ API, ਕੈਸ਼ਿੰਗ ਸ਼ਾਮਲ ਕਰੋ।
-
ਸਟ੍ਰੀਮਿੰਗ → ਘਟਨਾ-ਸੰਚਾਲਿਤ, ਉਦਾਹਰਨ ਲਈ, ਧੋਖਾਧੜੀ।
-
ਐਜ → ਕੰਪ੍ਰੈਸ, ਟੈਸਟ ਡਿਵਾਈਸਾਂ, ONNX/TensorRT।
ਇੱਕ ਰਨਬੁੱਕ ਰੱਖੋ: ਰੋਲਬੈਕ ਸਟੈਪਸ, ਆਰਟੀਫੈਕਟ ਰੀਸਟੋਰ [2]।
ਤੁਹਾਡੇ ਸਮੇਂ ਦੇ ਯੋਗ ਸਰੋਤ 📚
-
ਮੁੱਢਲੀਆਂ ਗੱਲਾਂ: ਸਾਈਕਿਟ-ਲਰਨ ਯੂਜ਼ਰ ਗਾਈਡ [3]
-
ਡੀਐਲ ਪੈਟਰਨ: ਪਾਈਟੋਰਚ ਟਿਊਟੋਰਿਅਲ [4]
-
ਟ੍ਰਾਂਸਫਰ ਲਰਨਿੰਗ: ਹੱਗਿੰਗ ਫੇਸ ਕੁਇੱਕਸਟਾਰਟ [5]
-
ਸ਼ਾਸਨ/ਜੋਖਮ: NIST AI RMF [1]
-
ਐਮਐਲਓਪੀਐਸ: ਗੂਗਲ ਕਲਾਉਡ ਪਲੇਬੁੱਕਸ [2]
ਅਕਸਰ ਪੁੱਛੇ ਜਾਣ ਵਾਲੇ ਸਵਾਲ 💡
-
ਕੀ GPU ਚਾਹੀਦਾ ਹੈ? ਟੇਬਲਰ ਲਈ ਨਹੀਂ। DL ਲਈ, ਹਾਂ (ਕਲਾਊਡ ਰੈਂਟਲ ਕੰਮ ਕਰਦਾ ਹੈ)।
-
ਕੀ ਕਾਫ਼ੀ ਡਾਟਾ ਹੈ? ਲੇਬਲ ਸ਼ੋਰ-ਸ਼ਰਾਬੇ ਤੱਕ ਹੋਰ ਚੰਗਾ ਹੈ। ਛੋਟੀ ਸ਼ੁਰੂਆਤ ਕਰੋ, ਦੁਹਰਾਓ।
-
ਮੈਟ੍ਰਿਕ ਚੋਣ? ਇੱਕ ਮੇਲ ਖਾਂਦੇ ਫੈਸਲੇ ਦੀ ਕੀਮਤ ਹੈ। ਮੈਟ੍ਰਿਕਸ ਲਿਖੋ।
-
ਬੇਸਲਾਈਨ ਛੱਡ ਸਕਦੇ ਹੋ? ਤੁਸੀਂ... ਉਸੇ ਤਰ੍ਹਾਂ ਜਿਵੇਂ ਤੁਸੀਂ ਨਾਸ਼ਤਾ ਛੱਡ ਸਕਦੇ ਹੋ ਅਤੇ ਪਛਤਾ ਸਕਦੇ ਹੋ।
-
ਆਟੋਐਮਐਲ? ਬੂਟਸਟ੍ਰੈਪਿੰਗ ਲਈ ਵਧੀਆ। ਫਿਰ ਵੀ ਆਪਣੇ ਆਡਿਟ ਖੁਦ ਕਰੋ [2]।
ਥੋੜ੍ਹਾ ਜਿਹਾ ਗੜਬੜ ਵਾਲਾ ਸੱਚ 🎬
ਏਆਈ ਮਾਡਲ ਕਿਵੇਂ ਬਣਾਇਆ ਜਾਵੇ ਇਹ ਵਿਦੇਸ਼ੀ ਗਣਿਤ ਬਾਰੇ ਘੱਟ ਅਤੇ ਸ਼ਿਲਪਕਾਰੀ ਬਾਰੇ ਜ਼ਿਆਦਾ ਹੈ: ਤਿੱਖੀ ਫਰੇਮਿੰਗ, ਸਾਫ਼ ਡੇਟਾ, ਬੇਸਲਾਈਨ ਸੈਨਿਟੀ ਜਾਂਚ, ਠੋਸ ਮੁਲਾਂਕਣ, ਦੁਹਰਾਉਣਯੋਗ ਦੁਹਰਾਓ। ਜ਼ਿੰਮੇਵਾਰੀ ਸ਼ਾਮਲ ਕਰੋ ਤਾਂ ਜੋ ਭਵਿੱਖ ਵਿੱਚ ਤੁਸੀਂ ਰੋਕਥਾਮਯੋਗ ਗੜਬੜੀਆਂ ਨੂੰ ਸਾਫ਼ ਨਾ ਕਰੋ [1][2]।
ਸੱਚ ਤਾਂ ਇਹ ਹੈ ਕਿ "ਬੋਰਿੰਗ" ਵਰਜਨ - ਤੰਗ ਅਤੇ ਵਿਧੀਗਤ - ਅਕਸਰ ਸ਼ੁੱਕਰਵਾਰ ਸਵੇਰੇ 2 ਵਜੇ ਜਲਦੀ ਆਉਣ ਵਾਲੇ ਚਮਕਦਾਰ ਮਾਡਲ ਨੂੰ ਮਾਤ ਦਿੰਦਾ ਹੈ। ਅਤੇ ਜੇ ਤੁਹਾਡੀ ਪਹਿਲੀ ਕੋਸ਼ਿਸ਼ ਬੇਢੰਗੀ ਮਹਿਸੂਸ ਹੁੰਦੀ ਹੈ? ਇਹ ਆਮ ਹੈ। ਮਾਡਲ ਖੱਟੇ ਆਟੇ ਵਾਲੇ ਸਟਾਰਟਰਾਂ ਵਾਂਗ ਹੁੰਦੇ ਹਨ: ਖੁਆਓ, ਦੇਖੋ, ਕਦੇ-ਕਦੇ ਮੁੜ ਚਾਲੂ ਕਰੋ। 🥖🤷
ਟੀਐਲ; ਡੀਆਰ
-
ਫਰੇਮ ਸਮੱਸਿਆ + ਮੈਟ੍ਰਿਕ; ਲੀਕੇਜ ਨੂੰ ਖਤਮ ਕਰੋ।
-
ਪਹਿਲਾਂ ਮੁੱਢਲੀ ਲਾਈਨ; ਸਧਾਰਨ ਔਜ਼ਾਰ ਵਧੀਆ ਹਨ।
-
ਪਹਿਲਾਂ ਤੋਂ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਮਾਡਲ ਮਦਦ ਕਰਦੇ ਹਨ - ਉਨ੍ਹਾਂ ਦੀ ਪੂਜਾ ਨਾ ਕਰੋ।
-
ਟੁਕੜਿਆਂ ਵਿੱਚ ਮੁੱਲ ਨਿਰਧਾਰਤ ਕਰੋ; ਕੈਲੀਬਰੇਟ ਕਰੋ।
-
MLOps ਦੀਆਂ ਮੂਲ ਗੱਲਾਂ: ਸੰਸਕਰਣ, ਨਿਗਰਾਨੀ, ਰੋਲਬੈਕ।
-
ਜ਼ਿੰਮੇਵਾਰ ਏਆਈ ਤਿਆਰ ਹੈ, ਬੋਲਟਡ ਨਹੀਂ।
-
ਦੁਹਰਾਓ, ਮੁਸਕਰਾਓ - ਤੁਸੀਂ ਇੱਕ AI ਮਾਡਲ ਬਣਾਇਆ ਹੈ। 😄
ਹਵਾਲੇ
-
NIST — ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ ਰਿਸਕ ਮੈਨੇਜਮੈਂਟ ਫਰੇਮਵਰਕ (AI RMF 1.0) । ਲਿੰਕ
-
ਗੂਗਲ ਕਲਾਉਡ — ਐਮਐਲਓਪੀਐਸ: ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਵਿੱਚ ਨਿਰੰਤਰ ਡਿਲੀਵਰੀ ਅਤੇ ਆਟੋਮੇਸ਼ਨ ਪਾਈਪਲਾਈਨਾਂ । ਲਿੰਕ
-
scikit-learn — ਯੂਜ਼ਰ ਗਾਈਡ । ਲਿੰਕ
-
ਪਾਈਟੋਰਚ — ਅਧਿਕਾਰਤ ਟਿਊਟੋਰਿਅਲ । ਲਿੰਕ
-
ਜੱਫੀ ਪਾਉਣ ਵਾਲਾ ਚਿਹਰਾ — ਟ੍ਰਾਂਸਫਾਰਮਰ ਕੁਇੱਕਸਟਾਰਟ । ਲਿੰਕ