ਛੋਟਾ ਜਵਾਬ: ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ ਵੱਡੇ, ਆਮ-ਉਦੇਸ਼ ਵਾਲੇ AI ਮਾਡਲ ਹੁੰਦੇ ਹਨ ਜੋ ਵਿਸ਼ਾਲ, ਵਿਆਪਕ ਡੇਟਾਸੈਟਾਂ 'ਤੇ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਹੁੰਦੇ ਹਨ, ਫਿਰ ਪ੍ਰੋਂਪਟਿੰਗ, ਫਾਈਨ-ਟਿਊਨਿੰਗ, ਟੂਲਸ, ਜਾਂ ਪ੍ਰਾਪਤੀ ਰਾਹੀਂ ਬਹੁਤ ਸਾਰੇ ਕੰਮਾਂ (ਲਿਖਣਾ, ਖੋਜ ਕਰਨਾ, ਕੋਡਿੰਗ, ਚਿੱਤਰ) ਲਈ ਅਨੁਕੂਲਿਤ ਹੁੰਦੇ ਹਨ। ਜੇਕਰ ਤੁਹਾਨੂੰ ਭਰੋਸੇਯੋਗ ਜਵਾਬਾਂ ਦੀ ਲੋੜ ਹੈ, ਤਾਂ ਉਹਨਾਂ ਨੂੰ ਗਰਾਉਂਡਿੰਗ (ਜਿਵੇਂ ਕਿ RAG), ਸਪੱਸ਼ਟ ਪਾਬੰਦੀਆਂ ਅਤੇ ਜਾਂਚਾਂ ਨਾਲ ਜੋੜੋ, ਨਾ ਕਿ ਉਹਨਾਂ ਨੂੰ ਸੁਧਾਰ ਕਰਨ ਦਿਓ।
ਮੁੱਖ ਗੱਲਾਂ:
ਪਰਿਭਾਸ਼ਾ : ਇੱਕ ਵਿਆਪਕ ਤੌਰ 'ਤੇ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਬੇਸ ਮਾਡਲ ਜੋ ਕਈ ਕੰਮਾਂ ਵਿੱਚ ਦੁਬਾਰਾ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ, ਨਾ ਕਿ ਇੱਕ-ਕਾਰਜ-ਪ੍ਰਤੀ-ਮਾਡਲ।
ਅਨੁਕੂਲਨ : ਵਿਵਹਾਰ ਨੂੰ ਚਲਾਉਣ ਲਈ ਪ੍ਰੋਂਪਟਿੰਗ, ਫਾਈਨ-ਟਿਊਨਿੰਗ, LoRA/ਅਡਾਪਟਰ, RAG, ਅਤੇ ਟੂਲਸ ਦੀ ਵਰਤੋਂ ਕਰੋ।
ਜਨਰੇਟਿਵ ਫਿੱਟ : ਇਹ ਟੈਕਸਟ, ਚਿੱਤਰ, ਆਡੀਓ, ਕੋਡ, ਅਤੇ ਮਲਟੀਮੋਡਲ ਸਮੱਗਰੀ ਜਨਰੇਸ਼ਨ ਨੂੰ ਸ਼ਕਤੀ ਪ੍ਰਦਾਨ ਕਰਦੇ ਹਨ।
ਗੁਣਵੱਤਾ ਸੰਕੇਤ : ਨਿਯੰਤਰਣਯੋਗਤਾ, ਘੱਟ ਭਰਮ, ਬਹੁ-ਮਾਡਲ ਯੋਗਤਾ, ਅਤੇ ਕੁਸ਼ਲ ਅਨੁਮਾਨ ਨੂੰ ਤਰਜੀਹ ਦਿਓ।
ਜੋਖਮ ਨਿਯੰਤਰਣ : ਗਵਰਨੈਂਸ ਅਤੇ ਟੈਸਟਿੰਗ ਦੁਆਰਾ ਭਰਮ, ਪੱਖਪਾਤ, ਗੋਪਨੀਯਤਾ ਲੀਕੇਜ, ਅਤੇ ਤੁਰੰਤ ਟੀਕੇ ਲਈ ਯੋਜਨਾ ਬਣਾਓ।

ਇਸ ਤੋਂ ਬਾਅਦ ਤੁਸੀਂ ਜੋ ਲੇਖ ਪੜ੍ਹਨਾ ਪਸੰਦ ਕਰ ਸਕਦੇ ਹੋ:
🔗 ਇੱਕ AI ਕੰਪਨੀ ਕੀ ਹੈ?
ਸਮਝੋ ਕਿ AI ਫਰਮਾਂ ਉਤਪਾਦ, ਟੀਮਾਂ ਅਤੇ ਮਾਲੀਆ ਮਾਡਲ ਕਿਵੇਂ ਬਣਾਉਂਦੀਆਂ ਹਨ।.
🔗 ਏਆਈ ਕੋਡ ਕਿਹੋ ਜਿਹਾ ਦਿਖਾਈ ਦਿੰਦਾ ਹੈ?
ਪਾਈਥਨ ਮਾਡਲਾਂ ਤੋਂ ਲੈ ਕੇ API ਤੱਕ, AI ਕੋਡ ਦੀਆਂ ਉਦਾਹਰਣਾਂ ਵੇਖੋ।.
🔗 ਏਆਈ ਐਲਗੋਰਿਦਮ ਕੀ ਹੈ?
ਜਾਣੋ ਕਿ AI ਐਲਗੋਰਿਦਮ ਕੀ ਹਨ ਅਤੇ ਉਹ ਫੈਸਲੇ ਕਿਵੇਂ ਲੈਂਦੇ ਹਨ।.
🔗 ਏਆਈ ਤਕਨਾਲੋਜੀ ਕੀ ਹੈ?
ਆਟੋਮੇਸ਼ਨ, ਵਿਸ਼ਲੇਸ਼ਣ, ਅਤੇ ਬੁੱਧੀਮਾਨ ਐਪਸ ਨੂੰ ਸ਼ਕਤੀ ਦੇਣ ਵਾਲੀਆਂ ਮੁੱਖ AI ਤਕਨਾਲੋਜੀਆਂ ਦੀ ਪੜਚੋਲ ਕਰੋ।.
1) ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ - ਇੱਕ ਨੋ-ਫੋਗ ਪਰਿਭਾਸ਼ਾ 🧠
ਇੱਕ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ ਇੱਕ ਵੱਡਾ, ਆਮ-ਉਦੇਸ਼ ਵਾਲਾ AI ਮਾਡਲ ਹੁੰਦਾ ਹੈ ਜੋ ਵਿਆਪਕ ਡੇਟਾ (ਆਮ ਤੌਰ 'ਤੇ ਇਸ ਦੇ ਬਹੁਤ ਸਾਰੇ) 'ਤੇ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਹੁੰਦਾ ਹੈ ਤਾਂ ਜੋ ਇਸਨੂੰ ਸਿਰਫ਼ ਇੱਕ ( NIST , ਸਟੈਨਫੋਰਡ CRFM )
ਇਹਨਾਂ ਲਈ ਇੱਕ ਵੱਖਰਾ ਮਾਡਲ ਬਣਾਉਣ ਦੀ ਬਜਾਏ:
-
ਈਮੇਲ ਲਿਖਣਾ
-
ਸਵਾਲਾਂ ਦੇ ਜਵਾਬ ਦੇਣਾ
-
PDF ਦਾ ਸਾਰ ਦੇਣਾ
-
ਚਿੱਤਰ ਤਿਆਰ ਕੀਤੇ ਜਾ ਰਹੇ ਹਨ
-
ਸਹਾਇਤਾ ਟਿਕਟਾਂ ਦਾ ਵਰਗੀਕਰਨ
-
ਭਾਸ਼ਾਵਾਂ ਦਾ ਅਨੁਵਾਦ ਕਰਨਾ
-
ਕੋਡ ਸੁਝਾਅ ਦੇਣਾ
…ਤੁਸੀਂ ਇੱਕ ਵੱਡੇ ਬੇਸ ਮਾਡਲ ਨੂੰ ਇੱਕ ਅਸਪਸ਼ਟ ਅੰਕੜਾਤਮਕ ਤਰੀਕੇ ਨਾਲ "ਦੁਨੀਆ ਸਿੱਖਦਾ ਹੈ" ਸਿਖਲਾਈ ਦਿੰਦੇ ਹੋ, ਫਿਰ ਤੁਸੀਂ ਇਸਨੂੰ ਪ੍ਰੋਂਪਟ, ਫਾਈਨ-ਟਿਊਨਿੰਗ, ਜਾਂ ਜੋੜੇ ਗਏ ਔਜ਼ਾਰਾਂ ਨਾਲ ਖਾਸ ਨੌਕਰੀਆਂ ਲਈ ਢਾਲਦੇ ਹੋ ਬੋਮਾਸਾਨੀ ਐਟ ਅਲ., 2021 )।
ਦੂਜੇ ਸ਼ਬਦਾਂ ਵਿੱਚ: ਇਹ ਇੱਕ ਆਮ ਇੰਜਣ ਜਿਸਨੂੰ ਤੁਸੀਂ ਚਲਾ ਸਕਦੇ ਹੋ।
ਅਤੇ ਹਾਂ, ਕੀਵਰਡ "ਜਨਰਲ" ਹੈ। ਇਹੀ ਸਾਰੀ ਚਾਲ ਹੈ।.
2) ਜਨਰੇਟਿਵ ਏਆਈ ਵਿੱਚ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ ਕੀ ਹਨ? (ਇਹ ਖਾਸ ਤੌਰ 'ਤੇ ਕਿਵੇਂ ਫਿੱਟ ਬੈਠਦੇ ਹਨ) 🎨📝
ਤਾਂ, ਜਨਰੇਟਿਵ ਏਆਈ ਵਿੱਚ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ ਕੀ ਹਨ? ਇਹ ਉਹ ਅੰਡਰਲਾਈੰਗ ਮਾਡਲ ਹਨ ਜੋ ਸਿਸਟਮਾਂ ਨੂੰ ਪਾਵਰ ਦਿੰਦੇ ਹਨ ਜੋ ਨਵੀਂ ਸਮੱਗਰੀ - ਟੈਕਸਟ, ਚਿੱਤਰ, ਆਡੀਓ, ਕੋਡ, ਵੀਡੀਓ, ਅਤੇ ਵਧਦੀ ਹੋਈ... ਇਹਨਾਂ ਸਾਰਿਆਂ ਦੇ ਮਿਸ਼ਰਣ ( NIST , NIST ਜਨਰੇਟਿਵ ਏਆਈ ਪ੍ਰੋਫਾਈਲ ) ਤਿਆਰ ਕਰ ਸਕਦੇ ਹਨ।
ਜਨਰੇਟਿਵ ਏਆਈ ਸਿਰਫ਼ "ਸਪੈਮ / ਸਪੈਮ ਨਹੀਂ" ਵਰਗੇ ਲੇਬਲਾਂ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਬਾਰੇ ਨਹੀਂ ਹੈ। ਇਹ ਅਜਿਹੇ ਆਉਟਪੁੱਟ ਪੈਦਾ ਕਰਨ ਬਾਰੇ ਹੈ ਜੋ ਕਿਸੇ ਵਿਅਕਤੀ ਦੁਆਰਾ ਬਣਾਏ ਗਏ ਹੋਣ ਵਾਂਗ ਦਿਖਾਈ ਦਿੰਦੇ ਹਨ।.
-
ਪੈਰੇ
-
ਕਵਿਤਾਵਾਂ
-
ਉਤਪਾਦ ਵੇਰਵਾ
-
ਦ੍ਰਿਸ਼ਟਾਂਤ
-
ਸੁਰਾਂ
-
ਐਪ ਪ੍ਰੋਟੋਟਾਈਪ
-
ਸਿੰਥੈਟਿਕ ਆਵਾਜ਼ਾਂ
-
ਅਤੇ ਕਈ ਵਾਰ ਅਸੰਭਵ ਤੌਰ 'ਤੇ ਭਰੋਸੇਮੰਦ ਬਕਵਾਸ 🙃
ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ ਖਾਸ ਤੌਰ 'ਤੇ ਚੰਗੇ ਹਨ ਕਿਉਂਕਿ:
-
ਉਹਨਾਂ ਨੇ ਵੱਡੇ ਡੇਟਾਸੈਟਾਂ ਤੋਂ ਵਿਆਪਕ ਪੈਟਰਨਾਂ ਨੂੰ ਗ੍ਰਹਿਣ ਕੀਤਾ ਹੈ ( ਬੋਮਾਸਾਨੀ ਅਤੇ ਹੋਰ, 2021 )
-
ਉਹ ਨਵੇਂ ਪ੍ਰੋਂਪਟਾਂ (ਅਜੀਬ ਵੀ) ਨੂੰ ਆਮ ਬਣਾ ਸਕਦੇ ਹਨ ( ਬ੍ਰਾਊਨ ਐਟ ਅਲ., 2020 )
-
ਉਹਨਾਂ ਨੂੰ ਦਰਜਨਾਂ ਆਉਟਪੁੱਟ ਲਈ ਦੁਬਾਰਾ ਤਿਆਰ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ ਬਿਨਾਂ ਸ਼ੁਰੂ ਤੋਂ ਦੁਬਾਰਾ ਸਿਖਲਾਈ ਦਿੱਤੇ ( ਬੋਮਾਸਾਨੀ ਅਤੇ ਹੋਰ, 2021 )
ਇਹ "ਬੇਸ ਲੇਅਰ" ਹਨ - ਜਿਵੇਂ ਬਰੈੱਡ ਆਟੇ। ਤੁਸੀਂ ਇਸਨੂੰ ਬੈਗੁਏਟ, ਪੀਜ਼ਾ, ਜਾਂ ਦਾਲਚੀਨੀ ਰੋਲ ਵਿੱਚ ਬੇਕ ਕਰ ਸਕਦੇ ਹੋ... ਇਹ ਇੱਕ ਸੰਪੂਰਨ ਰੂਪਕ ਨਹੀਂ ਹੈ, ਪਰ ਤੁਸੀਂ ਮੈਨੂੰ ਸਮਝਦੇ ਹੋ 😄
3) ਉਨ੍ਹਾਂ ਨੇ ਸਭ ਕੁਝ ਕਿਉਂ ਬਦਲ ਦਿੱਤਾ (ਅਤੇ ਲੋਕ ਉਨ੍ਹਾਂ ਬਾਰੇ ਗੱਲ ਕਰਨਾ ਕਿਉਂ ਨਹੀਂ ਛੱਡਦੇ) 🚀
ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲਾਂ ਤੋਂ ਪਹਿਲਾਂ, ਬਹੁਤ ਸਾਰੇ AI ਕੰਮ-ਵਿਸ਼ੇਸ਼ ਸਨ:
-
ਭਾਵਨਾ ਵਿਸ਼ਲੇਸ਼ਣ ਲਈ ਇੱਕ ਮਾਡਲ ਨੂੰ ਸਿਖਲਾਈ ਦਿਓ
-
ਅਨੁਵਾਦ ਲਈ ਦੂਜੇ ਨੂੰ ਸਿਖਲਾਈ ਦਿਓ
-
ਚਿੱਤਰ ਵਰਗੀਕਰਨ ਲਈ ਕਿਸੇ ਹੋਰ ਨੂੰ ਸਿਖਲਾਈ ਦਿਓ
-
ਨਾਮੀ ਹਸਤੀ ਦੀ ਪਛਾਣ ਲਈ ਕਿਸੇ ਹੋਰ ਨੂੰ ਸਿਖਲਾਈ ਦਿਓ
ਇਹ ਕੰਮ ਕਰਦਾ ਰਿਹਾ, ਪਰ ਇਹ ਹੌਲੀ, ਮਹਿੰਗਾ, ਅਤੇ ਥੋੜ੍ਹਾ ਜਿਹਾ... ਭੁਰਭੁਰਾ ਸੀ।.
ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲਾਂ ਨੇ ਇਸਨੂੰ ਉਲਟਾ ਦਿੱਤਾ:
-
ਇੱਕ ਵਾਰ ਪ੍ਰੀਟ੍ਰੇਨ ਕਰੋ (ਵੱਡੀ ਕੋਸ਼ਿਸ਼)
-
ਹਰ ਥਾਂ ਮੁੜ ਵਰਤੋਂ (ਵੱਡਾ ਭੁਗਤਾਨ) ( ਬੋਮਸਾਨੀ ਐਟ ਅਲ., 2021 )
ਉਹ ਮੁੜ ਵਰਤੋਂ ਗੁਣਕ ਹੈ। ਕੰਪਨੀਆਂ ਇੱਕ ਮਾਡਲ ਪਰਿਵਾਰ ਦੇ ਉੱਪਰ 20 ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਬਣਾ ਸਕਦੀਆਂ ਹਨ, ਪਹੀਏ ਨੂੰ 20 ਵਾਰ ਦੁਬਾਰਾ ਖੋਜਣ ਦੀ ਬਜਾਏ।.
ਨਾਲ ਹੀ, ਉਪਭੋਗਤਾ ਅਨੁਭਵ ਹੋਰ ਕੁਦਰਤੀ ਹੋ ਗਿਆ:
-
ਤੁਸੀਂ "ਕਲਾਸੀਫਾਇਰ ਦੀ ਵਰਤੋਂ" ਨਹੀਂ ਕਰਦੇ।
-
ਤੁਸੀਂ ਮਾਡਲ ਨਾਲ ਇਸ ਤਰ੍ਹਾਂ ਗੱਲ ਕਰਦੇ ਹੋ ਜਿਵੇਂ ਇਹ ਇੱਕ ਮਦਦਗਾਰ ਸਹਿਕਰਮੀ ਹੋਵੇ ਜੋ ਕਦੇ ਨਹੀਂ ਸੌਂਦਾ ☕🤝
ਕਈ ਵਾਰ ਇਹ ਇੱਕ ਸਹਿਕਰਮੀ ਵਰਗਾ ਵੀ ਹੁੰਦਾ ਹੈ ਜੋ ਭਰੋਸੇ ਨਾਲ ਹਰ ਚੀਜ਼ ਨੂੰ ਗਲਤ ਸਮਝਦਾ ਹੈ, ਪਰ ਹੇ। ਵਿਕਾਸ।.
4) ਮੁੱਖ ਵਿਚਾਰ: ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ + ਅਨੁਕੂਲਨ 🧩
ਲਗਭਗ ਸਾਰੇ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ ਇੱਕ ਪੈਟਰਨ ਦੀ ਪਾਲਣਾ ਕਰਦੇ ਹਨ ( ਸਟੈਨਫੋਰਡ CRFM , NIST ):
ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ ("ਇੰਟਰਨੈੱਟ-ਸ਼ੌਕ ਨੂੰ ਸੋਖਣਾ" ਪੜਾਅ) 📚
ਇਹ ਮਾਡਲ ਸਵੈ-ਨਿਗਰਾਨੀ ਸਿਖਲਾਈ ( NIST ) ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਵਿਸ਼ਾਲ, ਵਿਆਪਕ ਡੇਟਾਸੈੱਟਾਂ 'ਤੇ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਹੈ। ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਲਈ, ਇਸਦਾ ਆਮ ਤੌਰ 'ਤੇ ਮਤਲਬ ਗੁੰਮ ਹੋਏ ਸ਼ਬਦਾਂ ਜਾਂ ਅਗਲੇ ਟੋਕਨ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨਾ ਹੁੰਦਾ ਹੈ ( ਡੇਵਲਿਨ ਐਟ ਅਲ., 2018 , ਬ੍ਰਾਊਨ ਐਟ ਅਲ., 2020 )।
ਮੁੱਦਾ ਇਸਨੂੰ ਇੱਕ ਕੰਮ ਸਿਖਾਉਣ ਦਾ ਨਹੀਂ ਹੈ। ਮੁੱਦਾ ਇਸਨੂੰ ਆਮ ਪੇਸ਼ਕਾਰੀਆਂ :
-
ਵਿਆਕਰਨ
-
ਤੱਥ (ਕਿਸਮ ਦੇ)
-
ਤਰਕ ਦੇ ਨਮੂਨੇ (ਕਈ ਵਾਰ)
-
ਲਿਖਣ ਸ਼ੈਲੀਆਂ
-
ਕੋਡ ਬਣਤਰ
-
ਆਮ ਮਨੁੱਖੀ ਇਰਾਦਾ
ਅਨੁਕੂਲਨ ("ਇਸਨੂੰ ਵਿਹਾਰਕ ਬਣਾਓ" ਪੜਾਅ) 🛠️
ਫਿਰ ਤੁਸੀਂ ਇਸਨੂੰ ਇਹਨਾਂ ਵਿੱਚੋਂ ਇੱਕ ਜਾਂ ਵੱਧ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਅਨੁਕੂਲ ਬਣਾਓ:
-
ਪ੍ਰੇਰਣਾ (ਸਾਦੀ ਭਾਸ਼ਾ ਵਿੱਚ ਹਦਾਇਤਾਂ)
-
ਹਦਾਇਤਾਂ ਦੀ ਟਿਊਨਿੰਗ (ਨਿਰਦੇਸ਼ਾਂ ਦੀ ਪਾਲਣਾ ਕਰਨ ਲਈ ਇਸਨੂੰ ਸਿਖਲਾਈ ਦੇਣਾ) ( ਵੇਈ ਅਤੇ ਹੋਰ, 2021 )
-
ਫਾਈਨ-ਟਿਊਨਿੰਗ (ਤੁਹਾਡੇ ਡੋਮੇਨ ਡੇਟਾ 'ਤੇ ਸਿਖਲਾਈ)
-
LoRA / ਅਡੈਪਟਰ (ਹਲਕੇ ਟਿਊਨਿੰਗ ਤਰੀਕੇ) ( Hu et al., 2021 )
-
RAG (ਪ੍ਰਾਪਤ-ਵਧਾਈ ਗਈ ਪੀੜ੍ਹੀ - ਮਾਡਲ ਤੁਹਾਡੇ ਦਸਤਾਵੇਜ਼ਾਂ ਨਾਲ ਸਲਾਹ ਕਰਦਾ ਹੈ) ( ਲੇਵਿਸ ਅਤੇ ਹੋਰ, 2020 )
-
ਟੂਲ ਦੀ ਵਰਤੋਂ (ਕਾਲਿੰਗ ਫੰਕਸ਼ਨ, ਅੰਦਰੂਨੀ ਸਿਸਟਮ ਬ੍ਰਾਊਜ਼ਿੰਗ, ਆਦਿ)
ਇਹੀ ਕਾਰਨ ਹੈ ਕਿ ਉਹੀ ਬੇਸ ਮਾਡਲ ਇੱਕ ਰੋਮਾਂਸ ਦ੍ਰਿਸ਼ ਲਿਖ ਸਕਦਾ ਹੈ... ਫਿਰ ਪੰਜ ਸਕਿੰਟਾਂ ਬਾਅਦ ਇੱਕ SQL ਪੁੱਛਗਿੱਛ ਨੂੰ ਡੀਬੱਗ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰ ਸਕਦਾ ਹੈ 😭
5) ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ ਦਾ ਇੱਕ ਚੰਗਾ ਸੰਸਕਰਣ ਕੀ ਬਣਾਉਂਦਾ ਹੈ? ✅
ਇਹ ਉਹ ਹਿੱਸਾ ਹੈ ਜਿਸਨੂੰ ਲੋਕ ਛੱਡ ਦਿੰਦੇ ਹਨ, ਅਤੇ ਫਿਰ ਬਾਅਦ ਵਿੱਚ ਪਛਤਾਉਂਦੇ ਹਨ।.
ਇੱਕ "ਚੰਗਾ" ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ ਸਿਰਫ਼ "ਵੱਡਾ" ਨਹੀਂ ਹੁੰਦਾ। ਵੱਡਾ ਮਦਦ ਕਰਦਾ ਹੈ, ਯਕੀਨਨ... ਪਰ ਇਹ ਇੱਕੋ ਇੱਕ ਚੀਜ਼ ਨਹੀਂ ਹੈ। ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ ਦੇ ਇੱਕ ਚੰਗੇ ਵਰਜਨ ਵਿੱਚ ਆਮ ਤੌਰ 'ਤੇ ਇਹ ਹੁੰਦਾ ਹੈ:
ਮਜ਼ਬੂਤ ਸਧਾਰਣੀਕਰਨ 🧠
ਇਹ ਕੰਮ-ਵਿਸ਼ੇਸ਼ ਮੁੜ ਸਿਖਲਾਈ ਦੀ ਲੋੜ ਤੋਂ ਬਿਨਾਂ ਬਹੁਤ ਸਾਰੇ ਕੰਮਾਂ ਵਿੱਚ ਵਧੀਆ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ ( ਬੋਮਾਸਾਨੀ ਅਤੇ ਹੋਰ, 2021 )।
ਸਟੀਅਰਿੰਗ ਅਤੇ ਨਿਯੰਤਰਣਯੋਗਤਾ 🎛️
ਇਹ ਭਰੋਸੇਮੰਦੀ ਨਾਲ ਨਿਰਦੇਸ਼ਾਂ ਦੀ ਪਾਲਣਾ ਕਰ ਸਕਦਾ ਹੈ ਜਿਵੇਂ ਕਿ:
-
"ਸੰਖੇਪ ਰਹੋ"
-
"ਬੁਲੇਟ ਪੁਆਇੰਟ ਵਰਤੋ"
-
"ਦੋਸਤਾਨਾ ਸੁਰ ਵਿੱਚ ਲਿਖੋ"
-
"ਗੁਪਤ ਜਾਣਕਾਰੀ ਦਾ ਖੁਲਾਸਾ ਨਾ ਕਰੋ"
ਕੁਝ ਮਾਡਲ ਸਮਾਰਟ ਹਨ ਪਰ ਤਿਲਕਣ ਵਾਲੇ ਹਨ। ਜਿਵੇਂ ਸ਼ਾਵਰ ਵਿੱਚ ਸਾਬਣ ਦੀ ਪੱਟੀ ਫੜਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਨਾ। ਮਦਦਗਾਰ, ਪਰ ਅਨਿਯਮਿਤ 😅
ਘੱਟ ਭਰਮ ਪ੍ਰਵਿਰਤੀ (ਜਾਂ ਘੱਟੋ ਘੱਟ ਸਪੱਸ਼ਟ ਅਨਿਸ਼ਚਿਤਤਾ) 🧯
ਕੋਈ ਵੀ ਮਾਡਲ ਭਰਮਾਂ ਤੋਂ ਮੁਕਤ ਨਹੀਂ ਹੈ, ਪਰ ਚੰਗੇ ਮਾਡਲ:
-
ਘੱਟ ਭਰਮ ਕਰੋ
-
ਅਨਿਸ਼ਚਿਤਤਾ ਨੂੰ ਜ਼ਿਆਦਾ ਵਾਰ ਸਵੀਕਾਰ ਕਰੋ
-
ਪ੍ਰਾਪਤੀ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਸਮੇਂ ਸਪਲਾਈ ਕੀਤੇ ਸੰਦਰਭ ਦੇ ਨੇੜੇ ਰਹੋ ( ਜੀ ਐਟ ਅਲ., 2023 , ਲੇਵਿਸ ਐਟ ਅਲ., 2020 )
ਚੰਗੀ ਮਲਟੀਮੋਡਲ ਯੋਗਤਾ (ਜਦੋਂ ਲੋੜ ਹੋਵੇ) 🖼️🎧
ਜੇਕਰ ਤੁਸੀਂ ਅਜਿਹੇ ਸਹਾਇਕ ਬਣਾ ਰਹੇ ਹੋ ਜੋ ਤਸਵੀਰਾਂ ਪੜ੍ਹਦੇ ਹਨ, ਚਾਰਟਾਂ ਦੀ ਵਿਆਖਿਆ ਕਰਦੇ ਹਨ, ਜਾਂ ਆਡੀਓ ਨੂੰ ਸਮਝਦੇ ਹਨ, ਤਾਂ ਮਲਟੀਮੋਡਲ ਬਹੁਤ ਮਾਇਨੇ ਰੱਖਦਾ ਹੈ ( ਰੈੱਡਫੋਰਡ ਐਟ ਅਲ., 2021 )।
ਕੁਸ਼ਲ ਅਨੁਮਾਨ ⚡
ਦੇਰੀ ਅਤੇ ਲਾਗਤ ਮਾਇਨੇ ਰੱਖਦੀ ਹੈ। ਇੱਕ ਮਾਡਲ ਜੋ ਮਜ਼ਬੂਤ ਪਰ ਹੌਲੀ ਹੈ, ਇੱਕ ਸਪੋਰਟਸ ਕਾਰ ਵਾਂਗ ਹੈ ਜਿਸਦਾ ਟਾਇਰ ਫਲੈਟ ਹੁੰਦਾ ਹੈ।.
ਸੁਰੱਖਿਆ ਅਤੇ ਅਨੁਕੂਲਤਾ ਵਿਵਹਾਰ 🧩
ਸਿਰਫ਼ "ਸਭ ਕੁਝ ਇਨਕਾਰ ਕਰੋ" ਹੀ ਨਹੀਂ, ਸਗੋਂ:
-
ਨੁਕਸਾਨਦੇਹ ਹਿਦਾਇਤਾਂ ਤੋਂ ਬਚੋ
-
ਪੱਖਪਾਤ ਘਟਾਓ
-
ਸੰਵੇਦਨਸ਼ੀਲ ਵਿਸ਼ਿਆਂ ਨੂੰ ਧਿਆਨ ਨਾਲ ਸੰਭਾਲੋ
-
ਮੁੱਢਲੇ ਜੇਲ੍ਹ ਤੋੜਨ ਦੀਆਂ ਕੋਸ਼ਿਸ਼ਾਂ ਦਾ ਵਿਰੋਧ ਕਰੋ (ਕੁਝ ਹੱਦ ਤੱਕ...) ( NIST AI RMF 1.0 , NIST ਜਨਰੇਟਿਵ AI ਪ੍ਰੋਫਾਈਲ )
ਦਸਤਾਵੇਜ਼ੀਕਰਨ + ਈਕੋਸਿਸਟਮ 🌱
ਇਹ ਸੁਣਨ ਵਿੱਚ ਸੁੱਕਾ ਲੱਗਦਾ ਹੈ, ਪਰ ਇਹ ਸੱਚ ਹੈ:
-
ਟੂਲਿੰਗ
-
ਈਵਲ ਹਾਰਨੇਸ
-
ਤੈਨਾਤੀ ਵਿਕਲਪ
-
ਐਂਟਰਪ੍ਰਾਈਜ਼ ਕੰਟਰੋਲ
-
ਫਾਈਨ-ਟਿਊਨਿੰਗ ਸਹਾਇਤਾ
ਹਾਂ, "ਈਕੋਸਿਸਟਮ" ਇੱਕ ਅਸਪਸ਼ਟ ਸ਼ਬਦ ਹੈ। ਮੈਨੂੰ ਵੀ ਇਹ ਨਫ਼ਰਤ ਹੈ। ਪਰ ਇਹ ਮਾਇਨੇ ਰੱਖਦਾ ਹੈ।.
6) ਤੁਲਨਾ ਸਾਰਣੀ - ਆਮ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ ਵਿਕਲਪ (ਅਤੇ ਉਹ ਕਿਸ ਲਈ ਚੰਗੇ ਹਨ) 🧾
ਹੇਠਾਂ ਇੱਕ ਵਿਹਾਰਕ, ਥੋੜ੍ਹਾ ਜਿਹਾ ਅਪੂਰਣ ਤੁਲਨਾ ਸਾਰਣੀ ਹੈ। ਇਹ "ਇੱਕੋ ਸੱਚੀ ਸੂਚੀ" ਨਹੀਂ ਹੈ, ਇਹ ਇਸ ਤਰ੍ਹਾਂ ਹੈ: ਲੋਕ ਜੰਗਲ ਵਿੱਚ ਕੀ ਚੁਣਦੇ ਹਨ।.
| ਟੂਲ / ਮਾਡਲ ਕਿਸਮ | ਦਰਸ਼ਕ | ਮਹਿੰਗਾਈ ਵਾਲਾ | ਇਹ ਕਿਉਂ ਕੰਮ ਕਰਦਾ ਹੈ? |
|---|---|---|---|
| ਮਲਕੀਅਤ LLM (ਚੈਟ-ਸ਼ੈਲੀ) | ਸਪੀਡ + ਪਾਲਿਸ਼ ਚਾਹੁੰਦੀਆਂ ਟੀਮਾਂ | ਵਰਤੋਂ-ਅਧਾਰਿਤ / ਗਾਹਕੀ | ਵਧੀਆ ਹਦਾਇਤਾਂ ਦੀ ਪਾਲਣਾ, ਵਧੀਆ ਆਮ ਪ੍ਰਦਰਸ਼ਨ, ਆਮ ਤੌਰ 'ਤੇ ਸਭ ਤੋਂ ਵਧੀਆ "ਬਾਕਸ ਤੋਂ ਬਾਹਰ" 😌 |
| ਓਪਨ-ਵੇਟ ਐਲਐਲਐਮ (ਸਵੈ-ਹੋਸਟੇਬਲ) | ਨਿਰਮਾਤਾ ਜੋ ਨਿਯੰਤਰਣ ਚਾਹੁੰਦੇ ਹਨ | ਬੁਨਿਆਦੀ ਢਾਂਚਾ ਲਾਗਤ (ਅਤੇ ਸਿਰ ਦਰਦ) | ਅਨੁਕੂਲਿਤ, ਗੋਪਨੀਯਤਾ-ਅਨੁਕੂਲ, ਸਥਾਨਕ ਤੌਰ 'ਤੇ ਚੱਲ ਸਕਦਾ ਹੈ... ਜੇਕਰ ਤੁਸੀਂ ਅੱਧੀ ਰਾਤ ਨੂੰ ਛੇੜਛਾੜ ਕਰਨਾ ਪਸੰਦ ਕਰਦੇ ਹੋ |
| ਡਿਫਿਊਜ਼ਨ ਚਿੱਤਰ ਜਨਰੇਟਰ | ਰਚਨਾਤਮਕ, ਡਿਜ਼ਾਈਨ ਟੀਮਾਂ | ਮੁਫ਼ਤ ਤੋਂ ਲੈ ਕੇ ਭੁਗਤਾਨ ਤੱਕ | ਸ਼ਾਨਦਾਰ ਚਿੱਤਰ ਸੰਸਲੇਸ਼ਣ, ਸ਼ੈਲੀ ਦੀ ਵਿਭਿੰਨਤਾ, ਦੁਹਰਾਓ ਵਾਲਾ ਵਰਕਫਲੋ (ਇਹ ਵੀ: ਉਂਗਲਾਂ ਬੰਦ ਹੋ ਸਕਦੀਆਂ ਹਨ) ✋😬 ( ਹੋ ਐਟ ਅਲ., 2020 , ਰੋਮਬਾਚ ਐਟ ਅਲ., 2021 ) |
| ਮਲਟੀਮੋਡਲ "ਦ੍ਰਿਸ਼ਟੀ-ਭਾਸ਼ਾ" ਮਾਡਲ | ਐਪਸ ਜੋ ਤਸਵੀਰਾਂ + ਟੈਕਸਟ ਪੜ੍ਹਦੀਆਂ ਹਨ | ਵਰਤੋਂ-ਅਧਾਰਿਤ | ਤੁਹਾਨੂੰ ਤਸਵੀਰਾਂ, ਸਕ੍ਰੀਨਸ਼ੌਟਸ, ਡਾਇਗ੍ਰਾਮਾਂ ਬਾਰੇ ਸਵਾਲ ਪੁੱਛਣ ਦਿੰਦਾ ਹੈ - ਹੈਰਾਨੀਜਨਕ ਤੌਰ 'ਤੇ ਸੌਖਾ ( ਰੈੱਡਫੋਰਡ ਅਤੇ ਹੋਰ, 2021 ) |
| ਏਮਬੈਡਿੰਗ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ | ਖੋਜ + RAG ਸਿਸਟਮ | ਪ੍ਰਤੀ ਕਾਲ ਘੱਟ ਕੀਮਤ | ਅਰਥ ਖੋਜ, ਕਲੱਸਟਰਿੰਗ, ਸਿਫਾਰਸ਼ ਲਈ ਟੈਕਸਟ ਨੂੰ ਵੈਕਟਰਾਂ ਵਿੱਚ ਬਦਲਦਾ ਹੈ - ਸ਼ਾਂਤ MVP ਊਰਜਾ ( ਕਾਰਪੁਖਿਨ ਐਟ ਅਲ., 2020 , ਡੂਜ਼ ਐਟ ਅਲ., 2024 ) |
| ਸਪੀਚ-ਟੂ-ਟੈਕਸਟ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ | ਕਾਲ ਸੈਂਟਰ, ਸਿਰਜਣਹਾਰ | ਵਰਤੋਂ-ਅਧਾਰਿਤ / ਸਥਾਨਕ | ਤੇਜ਼ ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ, ਬਹੁ-ਭਾਸ਼ਾਈ ਸਹਾਇਤਾ, ਸ਼ੋਰ ਵਾਲੀ ਆਡੀਓ ਲਈ ਕਾਫ਼ੀ ਵਧੀਆ (ਆਮ ਤੌਰ 'ਤੇ) 🎙️ ( ਫੁਸਫੁਸ ) |
| ਟੈਕਸਟ-ਟੂ-ਸਪੀਚ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ | ਉਤਪਾਦ ਟੀਮਾਂ, ਮੀਡੀਆ | ਵਰਤੋਂ-ਅਧਾਰਿਤ | ਕੁਦਰਤੀ ਆਵਾਜ਼ ਉਤਪਤੀ, ਆਵਾਜ਼ ਸ਼ੈਲੀ, ਬਿਰਤਾਂਤ - ਡਰਾਉਣੇ-ਅਸਲੀ ਹੋ ਸਕਦੇ ਹਨ ( ਸ਼ੇਨ ਆਦਿ, 2017 ) |
| ਕੋਡ-ਕੇਂਦ੍ਰਿਤ ਐਲਐਲਐਮ | ਡਿਵੈਲਪਰ | ਵਰਤੋਂ-ਅਧਾਰਿਤ / ਗਾਹਕੀ | ਕੋਡ ਪੈਟਰਨਾਂ, ਡੀਬੱਗਿੰਗ, ਰੀਫੈਕਟਰਾਂ ਵਿੱਚ ਬਿਹਤਰ... ਫਿਰ ਵੀ ਦਿਮਾਗ ਨੂੰ ਪੜ੍ਹਨ ਵਾਲਾ ਨਹੀਂ 😅 |
ਧਿਆਨ ਦਿਓ ਕਿ ਕਿਵੇਂ "ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ" ਦਾ ਮਤਲਬ ਸਿਰਫ਼ "ਚੈਟਬੋਟ" ਨਹੀਂ ਹੈ। ਏਮਬੈਡਿੰਗ ਅਤੇ ਸਪੀਚ ਮਾਡਲ ਵੀ ਫਾਊਂਡੇਸ਼ਨ ਵਰਗੇ ਹੋ ਸਕਦੇ ਹਨ, ਕਿਉਂਕਿ ਉਹ ਵਿਆਪਕ ਹਨ ਅਤੇ ਕਾਰਜਾਂ ਵਿੱਚ ਮੁੜ ਵਰਤੋਂ ਯੋਗ ਹਨ ( ਬੋਮਾਸਾਨੀ ਐਟ ਅਲ., 2021 , NIST )।
7) ਨੇੜਿਓਂ ਝਾਤ: ਭਾਸ਼ਾ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ ਕਿਵੇਂ ਸਿੱਖਦੇ ਹਨ (ਵਾਈਬ ਵਰਜ਼ਨ) 🧠🧃
ਭਾਸ਼ਾ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ (ਜਿਨ੍ਹਾਂ ਨੂੰ ਅਕਸਰ LLM ਕਿਹਾ ਜਾਂਦਾ ਹੈ) ਆਮ ਤੌਰ 'ਤੇ ਟੈਕਸਟ ਦੇ ਵਿਸ਼ਾਲ ਸੰਗ੍ਰਹਿ 'ਤੇ ਸਿਖਲਾਈ ਦਿੱਤੇ ਜਾਂਦੇ ਹਨ। ਉਹ ਟੋਕਨਾਂ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਕੇ ਸਿੱਖਦੇ ਹਨ ( ਬ੍ਰਾਊਨ ਐਟ ਅਲ., 2020 )। ਬੱਸ। ਕੋਈ ਗੁਪਤ ਪਰੀ ਧੂੜ ਨਹੀਂ।
ਪਰ ਜਾਦੂ ਇਹ ਹੈ ਕਿ ਟੋਕਨਾਂ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਨਾਲ ਮਾਡਲ ਬਣਤਰ ( CSET ) ਸਿੱਖਣ ਲਈ ਮਜਬੂਰ ਹੁੰਦਾ ਹੈ:
-
ਵਿਆਕਰਣ ਅਤੇ ਵਾਕ-ਰਚਨਾ
-
ਵਿਸ਼ੇ ਦੇ ਸਬੰਧ
-
ਤਰਕ ਵਰਗੇ ਪੈਟਰਨ (ਕਈ ਵਾਰ)
-
ਵਿਚਾਰਾਂ ਦੇ ਆਮ ਕ੍ਰਮ
-
ਲੋਕ ਕਿਵੇਂ ਗੱਲਾਂ ਸਮਝਾਉਂਦੇ ਹਨ, ਬਹਿਸ ਕਰਦੇ ਹਨ, ਮੁਆਫ਼ੀ ਮੰਗਦੇ ਹਨ, ਗੱਲਬਾਤ ਕਰਦੇ ਹਨ, ਸਿਖਾਉਂਦੇ ਹਨ
ਇਹ ਲੱਖਾਂ ਗੱਲਬਾਤਾਂ ਦੀ ਨਕਲ ਕਰਨਾ ਸਿੱਖਣ ਵਰਗਾ ਹੈ ਬਿਨਾਂ ਮਨੁੱਖਾਂ ਵਾਂਗ "ਸਮਝੇ"। ਜੋ ਕਿ ਇਸ ਤਰ੍ਹਾਂ ਲੱਗਦਾ ਹੈ ਕਿ ਇਸਨੂੰ ਕੰਮ ਨਹੀਂ ਕਰਨਾ ਚਾਹੀਦਾ... ਅਤੇ ਫਿਰ ਵੀ ਇਹ ਕੰਮ ਕਰਦਾ ਰਹਿੰਦਾ ਹੈ।.
ਇੱਕ ਹਲਕਾ ਜਿਹਾ ਵਧਾ-ਚੜ੍ਹਾ ਕੇ ਕਹਿਣਾ: ਇਹ ਮੂਲ ਰੂਪ ਵਿੱਚ ਮਨੁੱਖੀ ਲਿਖਤ ਨੂੰ ਇੱਕ ਵਿਸ਼ਾਲ ਸੰਭਾਵੀ ਦਿਮਾਗ ਵਿੱਚ ਸੰਕੁਚਿਤ ਕਰਨ ਵਰਗਾ ਹੈ।
ਫਿਰ, ਉਹ ਰੂਪਕ ਥੋੜ੍ਹਾ ਸਰਾਪਿਆ ਹੋਇਆ ਹੈ। ਪਰ ਅਸੀਂ ਅੱਗੇ ਵਧਦੇ ਹਾਂ 😄
8) ਨੇੜਿਓਂ ਝਾਤ: ਪ੍ਰਸਾਰ ਮਾਡਲ (ਚਿੱਤਰ ਵੱਖਰੇ ਢੰਗ ਨਾਲ ਕਿਉਂ ਕੰਮ ਕਰਦੇ ਹਨ) 🎨🌀
ਚਿੱਤਰ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ ਅਕਸਰ ਪ੍ਰਸਾਰ ਵਿਧੀਆਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ ( ਹੋ ਐਟ ਅਲ., 2020 , ਰੋਮਬਾਚ ਐਟ ਅਲ., 2021 )।
ਮੋਟਾ ਵਿਚਾਰ:
-
ਤਸਵੀਰਾਂ ਵਿੱਚ ਸ਼ੋਰ ਉਦੋਂ ਤੱਕ ਸ਼ਾਮਲ ਕਰੋ ਜਦੋਂ ਤੱਕ ਉਹ ਮੂਲ ਰੂਪ ਵਿੱਚ ਟੀਵੀ ਸਥਿਰ ਨਾ ਹੋ ਜਾਣ।
-
ਇੱਕ ਮਾਡਲ ਨੂੰ ਕਦਮ-ਦਰ-ਕਦਮ ਉਸ ਸ਼ੋਰ ਨੂੰ ਉਲਟਾਉਣ ਲਈ ਸਿਖਲਾਈ ਦਿਓ
-
ਪੀੜ੍ਹੀ ਦੇ ਸਮੇਂ, ਸ਼ੋਰ ਨਾਲ ਸ਼ੁਰੂ ਕਰੋ ਅਤੇ ਇੱਕ ਪ੍ਰੋਂਪਟ ਦੁਆਰਾ ਨਿਰਦੇਸ਼ਤ ਇੱਕ ਚਿੱਤਰ ਵਿੱਚ "ਨਕਾਰ" ਕਰੋ ( ਹੋ ਐਟ ਅਲ., 2020 )
ਇਹੀ ਕਾਰਨ ਹੈ ਕਿ ਚਿੱਤਰ ਪੀੜ੍ਹੀ ਇੱਕ ਫੋਟੋ ਨੂੰ "ਵਿਕਾਸ" ਕਰਨ ਵਾਂਗ ਮਹਿਸੂਸ ਕਰਦੀ ਹੈ, ਸਿਵਾਏ ਫੋਟੋ ਇੱਕ ਸੁਪਰਮਾਰਕੀਟ ਦੇ ਗਲਿਆਰੇ ਵਿੱਚ ਸਨੀਕਰ ਪਹਿਨੇ ਇੱਕ ਅਜਗਰ ਦੀ ਹੈ 🛒🐉
ਡਿਫਿਊਜ਼ਨ ਮਾਡਲ ਚੰਗੇ ਹਨ ਕਿਉਂਕਿ:
-
ਉਹ ਉੱਚ ਗੁਣਵੱਤਾ ਵਾਲੇ ਵਿਜ਼ੂਅਲ ਤਿਆਰ ਕਰਦੇ ਹਨ
-
ਉਹਨਾਂ ਨੂੰ ਟੈਕਸਟ ਦੁਆਰਾ ਜ਼ੋਰਦਾਰ ਢੰਗ ਨਾਲ ਸੇਧ ਦਿੱਤੀ ਜਾ ਸਕਦੀ ਹੈ
-
ਉਹ ਦੁਹਰਾਉਣ ਵਾਲੇ ਸੁਧਾਰ (ਭਿੰਨਤਾਵਾਂ, ਇਨਪੇਂਟਿੰਗ, ਅਪਸਕੇਲਿੰਗ) ਦਾ ਸਮਰਥਨ ਕਰਦੇ ਹਨ ( ਰੋਮਬਾਚ ਐਟ ਅਲ., 2021 )
ਉਹਨਾਂ ਨੂੰ ਕਈ ਵਾਰ ਇਹਨਾਂ ਨਾਲ ਵੀ ਸੰਘਰਸ਼ ਕਰਨਾ ਪੈਂਦਾ ਹੈ:
-
ਚਿੱਤਰਾਂ ਦੇ ਅੰਦਰ ਟੈਕਸਟ ਰੈਂਡਰਿੰਗ
-
ਵਧੀਆ ਸਰੀਰ ਵਿਗਿਆਨ ਦੇ ਵੇਰਵੇ
-
ਦ੍ਰਿਸ਼ਾਂ ਵਿੱਚ ਇਕਸਾਰ ਪਾਤਰ ਪਛਾਣ (ਇਹ ਸੁਧਰ ਰਿਹਾ ਹੈ, ਪਰ ਫਿਰ ਵੀ)
9) ਨੇੜਿਓਂ ਝਲਕ: ਮਲਟੀਮੋਡਲ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ (ਟੈਕਸਟ + ਚਿੱਤਰ + ਆਡੀਓ) 👀🎧📝
ਮਲਟੀਮੋਡਲ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲਾਂ ਦਾ ਉਦੇਸ਼ ਕਈ ਡੇਟਾ ਕਿਸਮਾਂ ਨੂੰ ਸਮਝਣਾ ਅਤੇ ਪੈਦਾ ਕਰਨਾ ਹੈ:
-
ਟੈਕਸਟ
-
ਚਿੱਤਰ
-
ਆਡੀਓ
-
ਵੀਡੀਓ
-
ਕਈ ਵਾਰ ਸੈਂਸਰ ਵਰਗੇ ਇਨਪੁੱਟ ( NIST ਜਨਰੇਟਿਵ AI ਪ੍ਰੋਫਾਈਲ )
ਇਹ ਅਸਲ ਜ਼ਿੰਦਗੀ ਵਿੱਚ ਕਿਉਂ ਮਾਇਨੇ ਰੱਖਦਾ ਹੈ:
-
ਗਾਹਕ ਸਹਾਇਤਾ ਸਕ੍ਰੀਨਸ਼ਾਟ ਦੀ ਵਿਆਖਿਆ ਕਰ ਸਕਦੀ ਹੈ
-
ਪਹੁੰਚਯੋਗਤਾ ਟੂਲ ਚਿੱਤਰਾਂ ਦਾ ਵਰਣਨ ਕਰ ਸਕਦੇ ਹਨ
-
ਸਿੱਖਿਆ ਐਪਸ ਚਿੱਤਰਾਂ ਦੀ ਵਿਆਖਿਆ ਕਰ ਸਕਦੇ ਹਨ
-
ਸਿਰਜਣਹਾਰ ਫਾਰਮੈਟਾਂ ਨੂੰ ਤੇਜ਼ੀ ਨਾਲ ਰੀਮਿਕਸ ਕਰ ਸਕਦੇ ਹਨ
-
ਕਾਰੋਬਾਰੀ ਟੂਲ ਡੈਸ਼ਬੋਰਡ ਸਕ੍ਰੀਨਸ਼ੌਟ ਨੂੰ "ਪੜ੍ਹ" ਸਕਦੇ ਹਨ ਅਤੇ ਇਸਨੂੰ ਸੰਖੇਪ ਕਰ ਸਕਦੇ ਹਨ
ਹੁੱਡ ਦੇ ਹੇਠਾਂ, ਮਲਟੀਮੋਡਲ ਸਿਸਟਮ ਅਕਸਰ ਪ੍ਰਤੀਨਿਧਤਾਵਾਂ ਨੂੰ ਇਕਸਾਰ ਕਰਦੇ ਹਨ:
-
ਇੱਕ ਚਿੱਤਰ ਨੂੰ ਏਮਬੈਡਿੰਗ ਵਿੱਚ ਬਦਲੋ
-
ਟੈਕਸਟ ਨੂੰ ਏਮਬੈਡਿੰਗ ਵਿੱਚ ਬਦਲੋ
-
ਇੱਕ ਸਾਂਝੀ ਜਗ੍ਹਾ ਸਿੱਖੋ ਜਿੱਥੇ "ਬਿੱਲੀ" ਬਿੱਲੀ ਦੇ ਪਿਕਸਲ ਨਾਲ ਮੇਲ ਖਾਂਦੀ ਹੋਵੇ 😺 ( ਰੈੱਡਫੋਰਡ ਅਤੇ ਹੋਰ, 2021 )
ਇਹ ਹਮੇਸ਼ਾ ਸ਼ਾਨਦਾਰ ਨਹੀਂ ਹੁੰਦਾ। ਕਈ ਵਾਰ ਇਸਨੂੰ ਰਜਾਈ ਵਾਂਗ ਸਿਲਾਈ ਜਾਂਦੀ ਹੈ। ਪਰ ਇਹ ਕੰਮ ਕਰਦਾ ਹੈ।.
10) ਫਾਈਨ-ਟਿਊਨਿੰਗ ਬਨਾਮ ਪ੍ਰੋਂਪਟਿੰਗ ਬਨਾਮ RAG (ਤੁਸੀਂ ਬੇਸ ਮਾਡਲ ਨੂੰ ਕਿਵੇਂ ਅਨੁਕੂਲ ਬਣਾਉਂਦੇ ਹੋ) 🧰
ਜੇਕਰ ਤੁਸੀਂ ਕਿਸੇ ਖਾਸ ਡੋਮੇਨ (ਕਾਨੂੰਨੀ, ਡਾਕਟਰੀ, ਗਾਹਕ ਸੇਵਾ, ਅੰਦਰੂਨੀ ਗਿਆਨ) ਲਈ ਇੱਕ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ ਨੂੰ ਵਿਹਾਰਕ ਬਣਾਉਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਰਹੇ ਹੋ, ਤਾਂ ਤੁਹਾਡੇ ਕੋਲ ਕੁਝ ਲੀਵਰ ਹਨ:
ਪ੍ਰੇਰਣਾਦਾਇਕ 🗣️
ਸਭ ਤੋਂ ਤੇਜ਼ ਅਤੇ ਸਰਲ।.
-
ਫਾਇਦੇ: ਜ਼ੀਰੋ ਸਿਖਲਾਈ, ਤੁਰੰਤ ਦੁਹਰਾਓ
-
ਨੁਕਸਾਨ: ਅਸੰਗਤ ਹੋ ਸਕਦਾ ਹੈ, ਸੰਦਰਭ ਸੀਮਾਵਾਂ, ਤੁਰੰਤ ਨਾਜ਼ੁਕਤਾ
ਫਾਈਨ-ਟਿਊਨਿੰਗ 🎯
ਆਪਣੀਆਂ ਉਦਾਹਰਣਾਂ 'ਤੇ ਮਾਡਲ ਨੂੰ ਹੋਰ ਸਿਖਲਾਈ ਦਿਓ।.
-
ਫਾਇਦੇ: ਵਧੇਰੇ ਇਕਸਾਰ ਵਿਵਹਾਰ, ਬਿਹਤਰ ਡੋਮੇਨ ਭਾਸ਼ਾ, ਪ੍ਰੋਂਪਟ ਦੀ ਲੰਬਾਈ ਨੂੰ ਘਟਾ ਸਕਦੀ ਹੈ
-
ਨੁਕਸਾਨ: ਲਾਗਤ, ਡਾਟਾ ਗੁਣਵੱਤਾ ਲੋੜਾਂ, ਓਵਰਫਿਟਿੰਗ ਦਾ ਜੋਖਮ, ਰੱਖ-ਰਖਾਅ
ਹਲਕਾ ਟਿਊਨਿੰਗ (LoRA / ਅਡੈਪਟਰ) 🧩
ਫਾਈਨ-ਟਿਊਨਿੰਗ ਦਾ ਇੱਕ ਵਧੇਰੇ ਕੁਸ਼ਲ ਸੰਸਕਰਣ ( ਹੂ ਐਟ ਅਲ., 2021 )।
-
ਫਾਇਦੇ: ਸਸਤਾ, ਮਾਡਯੂਲਰ, ਬਦਲਣ ਵਿੱਚ ਆਸਾਨ
-
ਨੁਕਸਾਨ: ਅਜੇ ਵੀ ਸਿਖਲਾਈ ਪਾਈਪਲਾਈਨ ਅਤੇ ਮੁਲਾਂਕਣ ਦੀ ਲੋੜ ਹੈ
RAG (ਪ੍ਰਾਪਤ-ਵਧਾਈ ਗਈ ਪੀੜ੍ਹੀ) 🔎
ਇਹ ਮਾਡਲ ਤੁਹਾਡੇ ਗਿਆਨ ਅਧਾਰ ਤੋਂ ਸੰਬੰਧਿਤ ਦਸਤਾਵੇਜ਼ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ ਅਤੇ ਉਹਨਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਜਵਾਬ ਦਿੰਦਾ ਹੈ ( ਲੇਵਿਸ ਐਟ ਅਲ., 2020 )।
-
ਫਾਇਦੇ: ਨਵੀਨਤਮ ਗਿਆਨ, ਅੰਦਰੂਨੀ ਤੌਰ 'ਤੇ ਹਵਾਲੇ (ਜੇ ਤੁਸੀਂ ਇਸਨੂੰ ਲਾਗੂ ਕਰਦੇ ਹੋ), ਘੱਟ ਮੁੜ ਸਿਖਲਾਈ
-
ਨੁਕਸਾਨ: ਪ੍ਰਾਪਤੀ ਗੁਣਵੱਤਾ ਇਸਨੂੰ ਬਣਾ ਜਾਂ ਤੋੜ ਸਕਦੀ ਹੈ, ਚੰਗੀ ਚੰਕਿੰਗ + ਏਮਬੈਡਿੰਗ ਦੀ ਲੋੜ ਹੈ
ਅਸਲੀ ਗੱਲ: ਬਹੁਤ ਸਾਰੇ ਸਫਲ ਸਿਸਟਮ ਪ੍ਰੋਂਪਟਿੰਗ + RAG ਨੂੰ ਜੋੜਦੇ ਹਨ। ਫਾਈਨ-ਟਿਊਨਿੰਗ ਸ਼ਕਤੀਸ਼ਾਲੀ ਹੈ, ਪਰ ਹਮੇਸ਼ਾ ਜ਼ਰੂਰੀ ਨਹੀਂ ਹੁੰਦੀ। ਲੋਕ ਇਸ ਵਿੱਚ ਬਹੁਤ ਜਲਦੀ ਛਾਲ ਮਾਰਦੇ ਹਨ ਕਿਉਂਕਿ ਇਹ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਲੱਗਦਾ ਹੈ 😅
11) ਜੋਖਮ, ਸੀਮਾਵਾਂ, ਅਤੇ "ਕਿਰਪਾ ਕਰਕੇ ਇਸਨੂੰ ਅੰਨ੍ਹੇਵਾਹ ਨਾ ਵਰਤੋ" ਭਾਗ 🧯😬
ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ ਸ਼ਕਤੀਸ਼ਾਲੀ ਹੁੰਦੇ ਹਨ, ਪਰ ਉਹ ਰਵਾਇਤੀ ਸੌਫਟਵੇਅਰ ਵਾਂਗ ਸਥਿਰ ਨਹੀਂ ਹੁੰਦੇ। ਉਹ ਵਧੇਰੇ... ਇੱਕ ਪ੍ਰਤਿਭਾਸ਼ਾਲੀ ਇੰਟਰਨ ਵਰਗੇ ਹੁੰਦੇ ਹਨ ਜਿਸ ਵਿੱਚ ਵਿਸ਼ਵਾਸ ਦੀ ਸਮੱਸਿਆ ਹੁੰਦੀ ਹੈ।.
ਯੋਜਨਾ ਬਣਾਉਣ ਲਈ ਮੁੱਖ ਸੀਮਾਵਾਂ:
ਭਰਮ 🌀
ਮਾਡਲ ਕਾਢ ਕੱਢ ਸਕਦੇ ਹਨ:
-
ਨਕਲੀ ਸਰੋਤ
-
ਗਲਤ ਤੱਥ
-
ਮੰਨਣਯੋਗ ਪਰ ਗਲਤ ਕਦਮ ( ਜੀ ਐਟ ਅਲ., 2023 )
ਘਟਾਉਣ ਦੇ ਉਪਾਅ:
-
ਜ਼ਮੀਨੀ ਸੰਦਰਭ ਦੇ ਨਾਲ RAG ( ਲੇਵਿਸ ਅਤੇ ਹੋਰ, 2020 )
-
ਸੀਮਤ ਆਉਟਪੁੱਟ (ਸਕੀਮਾ, ਟੂਲ ਕਾਲ)
-
ਸਪੱਸ਼ਟ "ਅਨੁਮਾਨ ਨਾ ਲਗਾਓ" ਹਦਾਇਤ
-
ਤਸਦੀਕ ਪਰਤਾਂ (ਨਿਯਮ, ਕਰਾਸ-ਚੈੱਕ, ਮਨੁੱਖੀ ਸਮੀਖਿਆ)
ਪੱਖਪਾਤ ਅਤੇ ਨੁਕਸਾਨਦੇਹ ਨਮੂਨੇ ⚠️
ਕਿਉਂਕਿ ਸਿਖਲਾਈ ਡੇਟਾ ਮਨੁੱਖਾਂ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ, ਤੁਸੀਂ ਇਹ ਪ੍ਰਾਪਤ ਕਰ ਸਕਦੇ ਹੋ:
-
ਰੂੜ੍ਹੀਵਾਦੀ ਧਾਰਨਾਵਾਂ
-
ਸਮੂਹਾਂ ਵਿੱਚ ਅਸਮਾਨ ਪ੍ਰਦਰਸ਼ਨ
-
ਅਸੁਰੱਖਿਅਤ ਸੰਪੂਰਨਤਾ ( NIST AI RMF 1.0 , Bommasani et al., 2021 )
ਘਟਾਉਣ ਦੇ ਉਪਾਅ:
-
ਸੁਰੱਖਿਆ ਟਿਊਨਿੰਗ
-
ਰੈੱਡ-ਟੀਮਿੰਗ
-
ਸਮੱਗਰੀ ਫਿਲਟਰ
-
ਸਾਵਧਾਨ ਡੋਮੇਨ ਸੀਮਾਵਾਂ ( NIST ਜਨਰੇਟਿਵ AI ਪ੍ਰੋਫਾਈਲ )
ਡਾਟਾ ਗੋਪਨੀਯਤਾ ਅਤੇ ਲੀਕੇਜ 🔒
ਜੇਕਰ ਤੁਸੀਂ ਗੁਪਤ ਡੇਟਾ ਨੂੰ ਇੱਕ ਮਾਡਲ ਐਂਡਪੁਆਇੰਟ ਵਿੱਚ ਫੀਡ ਕਰਦੇ ਹੋ, ਤਾਂ ਤੁਹਾਨੂੰ ਇਹ ਜਾਣਨ ਦੀ ਲੋੜ ਹੈ:
-
ਇਸਨੂੰ ਕਿਵੇਂ ਸਟੋਰ ਕੀਤਾ ਜਾਂਦਾ ਹੈ
-
ਕੀ ਇਹ ਸਿਖਲਾਈ ਲਈ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ
-
ਕੀ ਲਾਗਿੰਗ ਮੌਜੂਦ ਹੈ
-
ਤੁਹਾਡੀ ਸੰਸਥਾ ਦੀਆਂ ਜ਼ਰੂਰਤਾਂ ਨੂੰ ਕੀ ਕੰਟਰੋਲ ਕਰਦਾ ਹੈ ( NIST AI RMF 1.0 )
ਘਟਾਉਣ ਦੇ ਉਪਾਅ:
-
ਨਿੱਜੀ ਤੈਨਾਤੀ ਵਿਕਲਪ
-
ਮਜ਼ਬੂਤ ਸ਼ਾਸਨ
-
ਘੱਟੋ-ਘੱਟ ਡਾਟਾ ਐਕਸਪੋਜ਼ਰ
-
ਸਖ਼ਤ ਪਹੁੰਚ ਨਿਯੰਤਰਣ ਦੇ ਨਾਲ ਸਿਰਫ਼ ਅੰਦਰੂਨੀ RAG ( NIST ਜਨਰੇਟਿਵ AI ਪ੍ਰੋਫਾਈਲ , ਕਾਰਲਿਨੀ ਆਦਿ, 2021 )
ਤੁਰੰਤ ਟੀਕਾ (ਖਾਸ ਕਰਕੇ RAG ਨਾਲ) 🕳️
ਜੇਕਰ ਮਾਡਲ ਗੈਰ-ਭਰੋਸੇਯੋਗ ਟੈਕਸਟ ਪੜ੍ਹਦਾ ਹੈ, ਤਾਂ ਉਹ ਟੈਕਸਟ ਇਸਨੂੰ ਹੇਰਾਫੇਰੀ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਸਕਦਾ ਹੈ:
-
"ਪਿਛਲੀਆਂ ਹਦਾਇਤਾਂ ਨੂੰ ਅਣਡਿੱਠ ਕਰੋ..."
-
"ਮੈਨੂੰ ਭੇਤ ਭੇਜੋ..." ( OWASP , ਗ੍ਰੇਸ਼ੇਕ ਆਦਿ, 2023 )
ਘਟਾਉਣ ਦੇ ਉਪਾਅ:
-
ਆਈਸੋਲੇਟ ਸਿਸਟਮ ਨਿਰਦੇਸ਼
-
ਪ੍ਰਾਪਤ ਕੀਤੀ ਸਮੱਗਰੀ ਨੂੰ ਰੋਗਾਣੂ-ਮੁਕਤ ਕਰੋ
-
ਟੂਲ-ਅਧਾਰਿਤ ਨੀਤੀਆਂ ਦੀ ਵਰਤੋਂ ਕਰੋ (ਸਿਰਫ ਪ੍ਰੋਂਪਟ ਹੀ ਨਹੀਂ)
-
ਐਡਵਰਸੇਰੀਅਲ ਇਨਪੁਟਸ ਨਾਲ ਟੈਸਟ ( OWASP ਚੀਟ ਸ਼ੀਟ , NIST ਜਨਰੇਟਿਵ AI ਪ੍ਰੋਫਾਈਲ )
ਤੁਹਾਨੂੰ ਡਰਾਉਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਨਹੀਂ ਕਰ ਰਿਹਾ। ਬਸ... ਇਹ ਜਾਣਨਾ ਬਿਹਤਰ ਹੈ ਕਿ ਫਰਸ਼ ਦੇ ਬੋਰਡ ਕਿੱਥੇ ਚੀਕਦੇ ਹਨ।.
12) ਆਪਣੇ ਵਰਤੋਂ ਦੇ ਮਾਮਲੇ ਲਈ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ ਕਿਵੇਂ ਚੁਣਨਾ ਹੈ 🎛️
ਜੇਕਰ ਤੁਸੀਂ ਇੱਕ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ ਚੁਣ ਰਹੇ ਹੋ (ਜਾਂ ਇੱਕ 'ਤੇ ਨਿਰਮਾਣ ਕਰ ਰਹੇ ਹੋ), ਤਾਂ ਇਹਨਾਂ ਪ੍ਰੋਂਪਟਾਂ ਨਾਲ ਸ਼ੁਰੂਆਤ ਕਰੋ:
ਪਰਿਭਾਸ਼ਿਤ ਕਰੋ ਕਿ ਤੁਸੀਂ ਕੀ ਤਿਆਰ ਕਰ ਰਹੇ ਹੋ 🧾
-
ਸਿਰਫ਼ ਟੈਕਸਟ
-
ਚਿੱਤਰ
-
ਆਡੀਓ
-
ਮਿਸ਼ਰਤ ਮਲਟੀਮੋਡਲ
ਆਪਣੀ ਤੱਥ-ਪੱਟੀ ਸੈੱਟ ਕਰੋ 📌
ਜੇਕਰ ਤੁਹਾਨੂੰ ਉੱਚ ਸ਼ੁੱਧਤਾ (ਵਿੱਤ, ਸਿਹਤ, ਕਾਨੂੰਨੀ, ਸੁਰੱਖਿਆ) ਦੀ ਲੋੜ ਹੈ:
-
ਤੁਹਾਨੂੰ RAG ਚਾਹੀਦਾ ਹੋਵੇਗਾ ( ਲੇਵਿਸ ਐਟ ਅਲ., 2020 )
-
ਤੁਸੀਂ ਪ੍ਰਮਾਣਿਕਤਾ ਚਾਹੁੰਦੇ ਹੋਵੋਗੇ।
-
ਤੁਸੀਂ ਲੂਪ ਵਿੱਚ ਮਨੁੱਖੀ ਸਮੀਖਿਆ ਚਾਹੋਗੇ (ਘੱਟੋ ਘੱਟ ਕਈ ਵਾਰ) ( NIST AI RMF 1.0 )
ਆਪਣਾ ਲੇਟੈਂਸੀ ਟੀਚਾ ਤੈਅ ਕਰੋ ⚡
ਚੈਟ ਤੁਰੰਤ ਹੁੰਦੀ ਹੈ। ਬੈਚ ਸੰਖੇਪ ਹੌਲੀ ਹੋ ਸਕਦਾ ਹੈ।
ਜੇਕਰ ਤੁਹਾਨੂੰ ਤੁਰੰਤ ਜਵਾਬ ਦੀ ਲੋੜ ਹੈ, ਤਾਂ ਮਾਡਲ ਦਾ ਆਕਾਰ ਅਤੇ ਹੋਸਟਿੰਗ ਮਾਇਨੇ ਰੱਖਦੀ ਹੈ।
ਨਕਸ਼ੇ ਦੀ ਗੋਪਨੀਯਤਾ ਅਤੇ ਪਾਲਣਾ ਦੀਆਂ ਜ਼ਰੂਰਤਾਂ 🔐
ਕੁਝ ਟੀਮਾਂ ਨੂੰ ਇਹ ਲੋੜ ਹੁੰਦੀ ਹੈ:
-
ਆਨ-ਪ੍ਰੇਮ / VPC ਤੈਨਾਤੀ
-
ਕੋਈ ਡਾਟਾ ਧਾਰਨ ਨਹੀਂ
-
ਸਖ਼ਤ ਆਡਿਟ ਲੌਗ
-
ਪ੍ਰਤੀ ਦਸਤਾਵੇਜ਼ ਪਹੁੰਚ ਨਿਯੰਤਰਣ ( NIST AI RMF 1.0 , NIST ਜਨਰੇਟਿਵ AI ਪ੍ਰੋਫਾਈਲ )
ਬਜਟ ਨੂੰ ਸੰਤੁਲਿਤ ਕਰੋ - ਅਤੇ ਓਪਸ ਸਬਰ 😅
ਸਵੈ-ਹੋਸਟਿੰਗ ਨਿਯੰਤਰਣ ਦਿੰਦੀ ਹੈ ਪਰ ਜਟਿਲਤਾ ਵਧਾਉਂਦੀ ਹੈ।
ਪ੍ਰਬੰਧਿਤ API ਆਸਾਨ ਹਨ ਪਰ ਮਹਿੰਗੇ ਅਤੇ ਘੱਟ ਅਨੁਕੂਲਿਤ ਹੋ ਸਕਦੇ ਹਨ।
ਇੱਕ ਛੋਟੀ ਜਿਹੀ ਵਿਹਾਰਕ ਸਲਾਹ: ਪਹਿਲਾਂ ਕਿਸੇ ਆਸਾਨ ਚੀਜ਼ ਨਾਲ ਪ੍ਰੋਟੋਟਾਈਪ ਬਣਾਓ, ਫਿਰ ਬਾਅਦ ਵਿੱਚ ਸਖ਼ਤ ਕਰੋ। "ਸੰਪੂਰਨ" ਸੈੱਟਅੱਪ ਨਾਲ ਸ਼ੁਰੂ ਕਰਨ ਨਾਲ ਆਮ ਤੌਰ 'ਤੇ ਸਭ ਕੁਝ ਹੌਲੀ ਹੋ ਜਾਂਦਾ ਹੈ।.
13) ਜਨਰੇਟਿਵ ਏਆਈ ਵਿੱਚ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ ਕੀ ਹਨ? (ਤੁਰੰਤ ਮਾਨਸਿਕ ਮਾਡਲ) 🧠✨
ਆਓ ਇਸਨੂੰ ਵਾਪਸ ਲਿਆਈਏ। ਜਨਰੇਟਿਵ ਏਆਈ ਵਿੱਚ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ ਕੀ ਹਨ?
ਉਹ:
-
ਵੱਡੇ, ਆਮ ਮਾਡਲ ਜੋ ਵਿਆਪਕ ਡੇਟਾ 'ਤੇ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਹਨ ( NIST , ਸਟੈਨਫੋਰਡ CRFM )
-
ਸਮੱਗਰੀ (ਟੈਕਸਟ, ਚਿੱਤਰ, ਆਡੀਓ, ਆਦਿ) ਤਿਆਰ ਕਰਨ ਦੇ ਸਮਰੱਥ ( NIST ਜਨਰੇਟਿਵ AI ਪ੍ਰੋਫਾਈਲ )
-
ਪ੍ਰੋਂਪਟ, ਫਾਈਨ-ਟਿਊਨਿੰਗ, ਅਤੇ ਪ੍ਰਾਪਤੀ ਰਾਹੀਂ ਬਹੁਤ ਸਾਰੇ ਕੰਮਾਂ ਲਈ ਅਨੁਕੂਲ ( ਬੋਮਾਸਾਨੀ ਅਤੇ ਹੋਰ, 2021 )
-
ਜ਼ਿਆਦਾਤਰ ਆਧੁਨਿਕ ਜਨਰੇਟਿਵ ਏਆਈ ਉਤਪਾਦਾਂ ਨੂੰ ਸ਼ਕਤੀ ਪ੍ਰਦਾਨ ਕਰਨ ਵਾਲੀ ਬੇਸ ਲੇਅਰ
ਇਹ ਕੋਈ ਇੱਕਲਾ ਆਰਕੀਟੈਕਚਰ ਜਾਂ ਬ੍ਰਾਂਡ ਨਹੀਂ ਹੈ। ਇਹ ਮਾਡਲਾਂ ਦੀ ਇੱਕ ਸ਼੍ਰੇਣੀ ਹੈ ਜੋ ਇੱਕ ਪਲੇਟਫਾਰਮ ਵਾਂਗ ਵਿਵਹਾਰ ਕਰਦੀ ਹੈ।.
ਇੱਕ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ ਕੈਲਕੁਲੇਟਰ ਵਰਗਾ ਘੱਟ ਅਤੇ ਇੱਕ ਰਸੋਈ ਵਰਗਾ ਜ਼ਿਆਦਾ ਹੁੰਦਾ ਹੈ। ਤੁਸੀਂ ਇਸ ਵਿੱਚ ਬਹੁਤ ਸਾਰਾ ਖਾਣਾ ਪਕਾ ਸਕਦੇ ਹੋ। ਜੇਕਰ ਤੁਸੀਂ ਧਿਆਨ ਨਹੀਂ ਦੇ ਰਹੇ ਹੋ ਤਾਂ ਤੁਸੀਂ ਟੋਸਟ ਨੂੰ ਵੀ ਸਾੜ ਸਕਦੇ ਹੋ... ਪਰ ਰਸੋਈ ਫਿਰ ਵੀ ਕਾਫ਼ੀ ਸੁਵਿਧਾਜਨਕ ਹੈ 🍳🔥
14) ਰੀਕੈਪ ਅਤੇ ਟੇਕਅਵੇ ✅🙂
ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ ਜਨਰੇਟਿਵ AI ਦੇ ਮੁੜ ਵਰਤੋਂ ਯੋਗ ਇੰਜਣ ਹਨ। ਉਹਨਾਂ ਨੂੰ ਵਿਆਪਕ ਤੌਰ 'ਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਜਾਂਦੀ ਹੈ, ਫਿਰ ਪ੍ਰੋਂਪਟਿੰਗ, ਫਾਈਨ-ਟਿਊਨਿੰਗ, ਅਤੇ ਰਿਟ੍ਰੀਵਲ ( NIST , ਸਟੈਨਫੋਰਡ CRFM ) ਰਾਹੀਂ ਖਾਸ ਕੰਮਾਂ ਲਈ ਅਨੁਕੂਲ ਬਣਾਇਆ ਜਾਂਦਾ ਹੈ। ਉਹ ਹੈਰਾਨੀਜਨਕ, ਗੰਦੇ, ਸ਼ਕਤੀਸ਼ਾਲੀ, ਅਤੇ ਕਦੇ-ਕਦੇ ਹਾਸੋਹੀਣੇ ਹੋ ਸਕਦੇ ਹਨ - ਸਾਰੇ ਇੱਕੋ ਸਮੇਂ।
ਸੰਖੇਪ:
-
ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ = ਜਨਰਲ-ਪਰਪਜ਼ ਬੇਸ ਮਾਡਲ ( NIST )
-
ਜਨਰੇਟਿਵ ਏਆਈ = ਸਮੱਗਰੀ ਦੀ ਸਿਰਜਣਾ, ਸਿਰਫ਼ ਵਰਗੀਕਰਨ ਨਹੀਂ ( ਐਨਆਈਐਸਟੀ ਜਨਰੇਟਿਵ ਏਆਈ ਪ੍ਰੋਫਾਈਲ )
-
ਅਨੁਕੂਲਨ ਵਿਧੀਆਂ (ਪ੍ਰੋਂਪਟਿੰਗ, ਆਰਏਜੀ, ਟਿਊਨਿੰਗ) ਇਸਨੂੰ ਵਿਹਾਰਕ ਬਣਾਉਂਦੀਆਂ ਹਨ ( ਲੇਵਿਸ ਐਟ ਅਲ., 2020 , ਹੂ ਐਟ ਅਲ., 2021 )
-
ਮਾਡਲ ਦੀ ਚੋਣ ਕਰਨਾ ਵਪਾਰ ਬਾਰੇ ਹੈ: ਸ਼ੁੱਧਤਾ, ਲਾਗਤ, ਲੇਟੈਂਸੀ, ਗੋਪਨੀਯਤਾ, ਸੁਰੱਖਿਆ ( NIST AI RMF 1.0 )
ਜੇਕਰ ਤੁਸੀਂ ਜਨਰੇਟਿਵ AI ਨਾਲ ਕੁਝ ਵੀ ਬਣਾ ਰਹੇ ਹੋ, ਤਾਂ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲਾਂ ਨੂੰ ਸਮਝਣਾ ਵਿਕਲਪਿਕ ਨਹੀਂ ਹੈ। ਇਹ ਪੂਰੀ ਮੰਜ਼ਿਲ ਹੈ ਜਿਸ 'ਤੇ ਇਮਾਰਤ ਖੜ੍ਹੀ ਹੈ... ਅਤੇ ਹਾਂ, ਕਈ ਵਾਰ ਫਰਸ਼ ਥੋੜ੍ਹਾ ਜਿਹਾ ਹਿੱਲ ਜਾਂਦਾ ਹੈ 😅
ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ
ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ, ਸਰਲ ਸ਼ਬਦਾਂ ਵਿੱਚ
ਇੱਕ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ ਇੱਕ ਵੱਡਾ, ਆਮ-ਉਦੇਸ਼ ਵਾਲਾ AI ਮਾਡਲ ਹੁੰਦਾ ਹੈ ਜੋ ਵਿਆਪਕ ਡੇਟਾ 'ਤੇ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਹੁੰਦਾ ਹੈ ਤਾਂ ਜੋ ਇਸਨੂੰ ਕਈ ਕੰਮਾਂ ਲਈ ਦੁਬਾਰਾ ਵਰਤਿਆ ਜਾ ਸਕੇ। ਪ੍ਰਤੀ ਕੰਮ ਇੱਕ ਮਾਡਲ ਬਣਾਉਣ ਦੀ ਬਜਾਏ, ਤੁਸੀਂ ਇੱਕ ਮਜ਼ਬੂਤ "ਅਧਾਰ" ਮਾਡਲ ਨਾਲ ਸ਼ੁਰੂਆਤ ਕਰਦੇ ਹੋ ਅਤੇ ਲੋੜ ਅਨੁਸਾਰ ਇਸਨੂੰ ਅਨੁਕੂਲ ਬਣਾਉਂਦੇ ਹੋ। ਉਹ ਅਨੁਕੂਲਨ ਅਕਸਰ ਪ੍ਰੋਂਪਟਿੰਗ, ਫਾਈਨ-ਟਿਊਨਿੰਗ, ਰੀਟ੍ਰੀਵਲ (RAG), ਜਾਂ ਟੂਲਸ ਰਾਹੀਂ ਹੁੰਦਾ ਹੈ। ਕੇਂਦਰੀ ਵਿਚਾਰ ਚੌੜਾਈ ਅਤੇ ਸਟੀਅਰੇਬਿਲਟੀ ਹੈ।.
ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ ਰਵਾਇਤੀ ਕਾਰਜ-ਵਿਸ਼ੇਸ਼ AI ਮਾਡਲਾਂ ਤੋਂ ਕਿਵੇਂ ਵੱਖਰੇ ਹਨ
ਰਵਾਇਤੀ AI ਅਕਸਰ ਹਰੇਕ ਕੰਮ ਲਈ ਇੱਕ ਵੱਖਰੇ ਮਾਡਲ ਨੂੰ ਸਿਖਲਾਈ ਦਿੰਦੇ ਹਨ, ਜਿਵੇਂ ਕਿ ਭਾਵਨਾ ਵਿਸ਼ਲੇਸ਼ਣ ਜਾਂ ਅਨੁਵਾਦ। ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ ਉਸ ਪੈਟਰਨ ਨੂੰ ਉਲਟਾਉਂਦੇ ਹਨ: ਇੱਕ ਵਾਰ ਪ੍ਰੀਟ੍ਰੇਨ ਕਰੋ, ਫਿਰ ਕਈ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਅਤੇ ਉਤਪਾਦਾਂ ਵਿੱਚ ਦੁਬਾਰਾ ਵਰਤੋਂ ਕਰੋ। ਇਹ ਡੁਪਲੀਕੇਟ ਕੀਤੇ ਯਤਨਾਂ ਨੂੰ ਘਟਾ ਸਕਦਾ ਹੈ ਅਤੇ ਨਵੀਆਂ ਸਮਰੱਥਾਵਾਂ ਦੀ ਡਿਲੀਵਰੀ ਨੂੰ ਤੇਜ਼ ਕਰ ਸਕਦਾ ਹੈ। ਸਮਝੌਤਾ ਇਹ ਹੈ ਕਿ ਉਹ ਕਲਾਸਿਕ ਸੌਫਟਵੇਅਰ ਨਾਲੋਂ ਘੱਟ ਅਨੁਮਾਨਯੋਗ ਹੋ ਸਕਦੇ ਹਨ ਜਦੋਂ ਤੱਕ ਤੁਸੀਂ ਰੁਕਾਵਟਾਂ ਅਤੇ ਟੈਸਟਿੰਗ ਸ਼ਾਮਲ ਨਹੀਂ ਕਰਦੇ।.
ਜਨਰੇਟਿਵ ਏਆਈ ਵਿੱਚ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ
ਜਨਰੇਟਿਵ ਏਆਈ ਵਿੱਚ, ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ ਬੇਸ ਸਿਸਟਮ ਹੁੰਦੇ ਹਨ ਜੋ ਟੈਕਸਟ, ਚਿੱਤਰ, ਆਡੀਓ, ਕੋਡ, ਜਾਂ ਮਲਟੀਮੋਡਲ ਆਉਟਪੁੱਟ ਵਰਗੀ ਨਵੀਂ ਸਮੱਗਰੀ ਪੈਦਾ ਕਰ ਸਕਦੇ ਹਨ। ਉਹ ਲੇਬਲਿੰਗ ਜਾਂ ਵਰਗੀਕਰਨ ਤੱਕ ਸੀਮਿਤ ਨਹੀਂ ਹਨ; ਉਹ ਅਜਿਹੇ ਜਵਾਬ ਪੈਦਾ ਕਰਦੇ ਹਨ ਜੋ ਮਨੁੱਖੀ-ਨਿਰਮਿਤ ਕੰਮ ਵਰਗੇ ਹੁੰਦੇ ਹਨ। ਕਿਉਂਕਿ ਉਹ ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ ਦੌਰਾਨ ਵਿਆਪਕ ਪੈਟਰਨ ਸਿੱਖਦੇ ਹਨ, ਉਹ ਬਹੁਤ ਸਾਰੇ ਪ੍ਰੋਂਪਟ ਕਿਸਮਾਂ ਅਤੇ ਫਾਰਮੈਟਾਂ ਨੂੰ ਸੰਭਾਲ ਸਕਦੇ ਹਨ। ਉਹ ਜ਼ਿਆਦਾਤਰ ਆਧੁਨਿਕ ਜਨਰੇਟਿਵ ਅਨੁਭਵਾਂ ਦੇ ਪਿੱਛੇ "ਬੇਸ ਲੇਅਰ" ਹਨ।.
ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ ਪ੍ਰੀਟ੍ਰੇਨਿੰਗ ਦੌਰਾਨ ਕਿਵੇਂ ਸਿੱਖਦੇ ਹਨ
ਜ਼ਿਆਦਾਤਰ ਭਾਸ਼ਾ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ ਟੋਕਨਾਂ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਕੇ ਸਿੱਖਦੇ ਹਨ, ਜਿਵੇਂ ਕਿ ਅਗਲਾ ਸ਼ਬਦ ਜਾਂ ਟੈਕਸਟ ਵਿੱਚ ਗੁੰਮ ਹੋਏ ਸ਼ਬਦ। ਇਹ ਸਧਾਰਨ ਉਦੇਸ਼ ਉਹਨਾਂ ਨੂੰ ਵਿਆਕਰਣ, ਸ਼ੈਲੀ ਅਤੇ ਵਿਆਖਿਆ ਦੇ ਆਮ ਪੈਟਰਨਾਂ ਵਰਗੀ ਬਣਤਰ ਨੂੰ ਅੰਦਰੂਨੀ ਬਣਾਉਣ ਲਈ ਪ੍ਰੇਰਿਤ ਕਰਦਾ ਹੈ। ਉਹ ਵਿਸ਼ਵ ਗਿਆਨ ਦਾ ਇੱਕ ਵੱਡਾ ਹਿੱਸਾ ਵੀ ਜਜ਼ਬ ਕਰ ਸਕਦੇ ਹਨ, ਹਾਲਾਂਕਿ ਹਮੇਸ਼ਾ ਭਰੋਸੇਯੋਗ ਨਹੀਂ। ਨਤੀਜਾ ਇੱਕ ਮਜ਼ਬੂਤ ਆਮ ਪ੍ਰਤੀਨਿਧਤਾ ਹੈ ਜਿਸਨੂੰ ਤੁਸੀਂ ਬਾਅਦ ਵਿੱਚ ਖਾਸ ਕੰਮ ਵੱਲ ਲੈ ਜਾ ਸਕਦੇ ਹੋ।.
ਪ੍ਰੋਂਪਟਿੰਗ, ਫਾਈਨ-ਟਿਊਨਿੰਗ, LoRA, ਅਤੇ RAG ਵਿੱਚ ਅੰਤਰ
ਨਿਰਦੇਸ਼ਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਵਿਵਹਾਰ ਨੂੰ ਚਲਾਉਣ ਦਾ ਸਭ ਤੋਂ ਤੇਜ਼ ਤਰੀਕਾ ਪ੍ਰੋਂਪਟ ਕਰਨਾ ਹੈ, ਪਰ ਇਹ ਨਾਜ਼ੁਕ ਹੋ ਸਕਦਾ ਹੈ। ਫਾਈਨ-ਟਿਊਨਿੰਗ ਮਾਡਲ ਨੂੰ ਤੁਹਾਡੀਆਂ ਉਦਾਹਰਣਾਂ 'ਤੇ ਵਧੇਰੇ ਇਕਸਾਰ ਵਿਵਹਾਰ ਲਈ ਹੋਰ ਸਿਖਲਾਈ ਦਿੰਦੀ ਹੈ, ਪਰ ਇਹ ਲਾਗਤ ਅਤੇ ਰੱਖ-ਰਖਾਅ ਨੂੰ ਜੋੜਦੀ ਹੈ। LoRA/ਅਡਾਪਟਰ ਇੱਕ ਹਲਕਾ ਫਾਈਨ-ਟਿਊਨਿੰਗ ਪਹੁੰਚ ਹੈ ਜੋ ਅਕਸਰ ਸਸਤਾ ਅਤੇ ਵਧੇਰੇ ਮਾਡਯੂਲਰ ਹੁੰਦਾ ਹੈ। RAG ਸੰਬੰਧਿਤ ਦਸਤਾਵੇਜ਼ਾਂ ਨੂੰ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ ਅਤੇ ਉਸ ਸੰਦਰਭ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਮਾਡਲ ਜਵਾਬ ਰੱਖਦਾ ਹੈ, ਜੋ ਤਾਜ਼ਗੀ ਅਤੇ ਗਰਾਉਂਡਿੰਗ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ।.
ਫਾਈਨ-ਟਿਊਨਿੰਗ ਦੀ ਬਜਾਏ RAG ਦੀ ਵਰਤੋਂ ਕਦੋਂ ਕਰਨੀ ਹੈ
ਜਦੋਂ ਤੁਹਾਨੂੰ ਆਪਣੇ ਮੌਜੂਦਾ ਦਸਤਾਵੇਜ਼ਾਂ ਜਾਂ ਅੰਦਰੂਨੀ ਗਿਆਨ ਅਧਾਰ ਵਿੱਚ ਅਧਾਰਿਤ ਜਵਾਬਾਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ ਤਾਂ RAG ਅਕਸਰ ਇੱਕ ਮਜ਼ਬੂਤ ਵਿਕਲਪ ਹੁੰਦਾ ਹੈ। ਇਹ ਪੀੜ੍ਹੀ ਦੇ ਸਮੇਂ ਮਾਡਲ ਨੂੰ ਸੰਬੰਧਿਤ ਸੰਦਰਭ ਪ੍ਰਦਾਨ ਕਰਕੇ "ਅਨੁਮਾਨ ਲਗਾਉਣ" ਨੂੰ ਘਟਾ ਸਕਦਾ ਹੈ। ਜਦੋਂ ਤੁਹਾਨੂੰ ਇਕਸਾਰ ਸ਼ੈਲੀ, ਡੋਮੇਨ ਵਾਕਾਂਸ਼, ਜਾਂ ਵਿਵਹਾਰ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ ਜੋ ਪ੍ਰੋਂਪਟ ਭਰੋਸੇਯੋਗ ਢੰਗ ਨਾਲ ਪੈਦਾ ਨਹੀਂ ਕਰ ਸਕਦਾ, ਤਾਂ ਫਾਈਨ-ਟਿਊਨਿੰਗ ਇੱਕ ਬਿਹਤਰ ਫਿੱਟ ਹੁੰਦੀ ਹੈ। ਬਹੁਤ ਸਾਰੇ ਵਿਹਾਰਕ ਸਿਸਟਮ ਫਾਈਨ-ਟਿਊਨਿੰਗ ਤੱਕ ਪਹੁੰਚਣ ਤੋਂ ਪਹਿਲਾਂ ਪ੍ਰੋਂਪਟਿੰਗ + RAG ਨੂੰ ਜੋੜਦੇ ਹਨ।.
ਭਰਮਾਂ ਨੂੰ ਕਿਵੇਂ ਘਟਾਉਣਾ ਹੈ ਅਤੇ ਵਧੇਰੇ ਭਰੋਸੇਯੋਗ ਜਵਾਬ ਕਿਵੇਂ ਪ੍ਰਾਪਤ ਕਰਨੇ ਹਨ
ਇੱਕ ਆਮ ਤਰੀਕਾ ਇਹ ਹੈ ਕਿ ਮਾਡਲ ਨੂੰ ਰਿਟ੍ਰੀਵਲ (RAG) ਨਾਲ ਗਰਾਊਂਡ ਕੀਤਾ ਜਾਵੇ ਤਾਂ ਜੋ ਇਹ ਪ੍ਰਦਾਨ ਕੀਤੇ ਸੰਦਰਭ ਦੇ ਨੇੜੇ ਰਹੇ। ਤੁਸੀਂ ਸਕੀਮਾਂ ਨਾਲ ਆਉਟਪੁੱਟ ਨੂੰ ਸੀਮਤ ਵੀ ਕਰ ਸਕਦੇ ਹੋ, ਮੁੱਖ ਕਦਮਾਂ ਲਈ ਟੂਲ ਕਾਲਾਂ ਦੀ ਲੋੜ ਕਰ ਸਕਦੇ ਹੋ, ਅਤੇ ਸਪੱਸ਼ਟ "ਅਨੁਮਾਨ ਨਾ ਲਗਾਓ" ਨਿਰਦੇਸ਼ ਸ਼ਾਮਲ ਕਰ ਸਕਦੇ ਹੋ। ਤਸਦੀਕ ਪਰਤਾਂ ਵੀ ਮਾਇਨੇ ਰੱਖਦੀਆਂ ਹਨ, ਜਿਵੇਂ ਕਿ ਨਿਯਮ ਜਾਂਚਾਂ, ਕਰਾਸ-ਚੈਕਿੰਗ, ਅਤੇ ਉੱਚ-ਹਿੱਸੇਦਾਰੀ ਵਰਤੋਂ ਦੇ ਮਾਮਲਿਆਂ ਲਈ ਮਨੁੱਖੀ ਸਮੀਖਿਆ। ਮਾਡਲ ਨੂੰ ਇੱਕ ਸੰਭਾਵੀ ਸਹਾਇਕ ਵਾਂਗ ਸਮਝੋ, ਨਾ ਕਿ ਮੂਲ ਰੂਪ ਵਿੱਚ ਸੱਚਾਈ ਦੇ ਸਰੋਤ ਵਾਂਗ।.
ਉਤਪਾਦਨ ਵਿੱਚ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲਾਂ ਦੇ ਨਾਲ ਸਭ ਤੋਂ ਵੱਡੇ ਜੋਖਮ
ਆਮ ਜੋਖਮਾਂ ਵਿੱਚ ਭਰਮ, ਸਿਖਲਾਈ ਡੇਟਾ ਤੋਂ ਪੱਖਪਾਤੀ ਜਾਂ ਨੁਕਸਾਨਦੇਹ ਪੈਟਰਨ, ਅਤੇ ਜੇਕਰ ਸੰਵੇਦਨਸ਼ੀਲ ਡੇਟਾ ਨੂੰ ਗਲਤ ਢੰਗ ਨਾਲ ਸੰਭਾਲਿਆ ਜਾਂਦਾ ਹੈ ਤਾਂ ਗੋਪਨੀਯਤਾ ਲੀਕ ਹੋਣਾ ਸ਼ਾਮਲ ਹੈ। ਸਿਸਟਮ ਤੁਰੰਤ ਟੀਕੇ ਲਈ ਵੀ ਕਮਜ਼ੋਰ ਹੋ ਸਕਦੇ ਹਨ, ਖਾਸ ਕਰਕੇ ਜਦੋਂ ਮਾਡਲ ਦਸਤਾਵੇਜ਼ਾਂ ਜਾਂ ਵੈੱਬ ਸਮੱਗਰੀ ਤੋਂ ਅਵਿਸ਼ਵਾਸੀ ਟੈਕਸਟ ਪੜ੍ਹਦਾ ਹੈ। ਘਟਾਉਣ ਵਿੱਚ ਆਮ ਤੌਰ 'ਤੇ ਸ਼ਾਸਨ, ਰੈੱਡ-ਟੀਮਿੰਗ, ਪਹੁੰਚ ਨਿਯੰਤਰਣ, ਸੁਰੱਖਿਅਤ ਪ੍ਰੋਂਪਟ ਪੈਟਰਨ, ਅਤੇ ਢਾਂਚਾਗਤ ਮੁਲਾਂਕਣ ਸ਼ਾਮਲ ਹੁੰਦੇ ਹਨ। ਇਹਨਾਂ ਜੋਖਮਾਂ ਲਈ ਬਾਅਦ ਵਿੱਚ ਪੈਚ ਕਰਨ ਦੀ ਬਜਾਏ ਜਲਦੀ ਯੋਜਨਾ ਬਣਾਓ।.
ਤੁਰੰਤ ਟੀਕਾ ਲਗਾਉਣਾ ਅਤੇ ਇਹ RAG ਪ੍ਰਣਾਲੀਆਂ ਵਿੱਚ ਕਿਉਂ ਮਾਇਨੇ ਰੱਖਦਾ ਹੈ
ਪ੍ਰੋਂਪਟ ਇੰਜੈਕਸ਼ਨ ਉਦੋਂ ਹੁੰਦਾ ਹੈ ਜਦੋਂ ਗੈਰ-ਭਰੋਸੇਯੋਗ ਟੈਕਸਟ ਨਿਰਦੇਸ਼ਾਂ ਨੂੰ ਓਵਰਰਾਈਡ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦਾ ਹੈ, ਜਿਵੇਂ ਕਿ "ਪਿਛਲੀਆਂ ਹਦਾਇਤਾਂ ਨੂੰ ਅਣਡਿੱਠਾ ਕਰੋ" ਜਾਂ "ਭੇਦ ਪ੍ਰਗਟ ਕਰੋ"। RAG ਵਿੱਚ, ਪ੍ਰਾਪਤ ਕੀਤੇ ਦਸਤਾਵੇਜ਼ਾਂ ਵਿੱਚ ਉਹ ਖਤਰਨਾਕ ਨਿਰਦੇਸ਼ ਹੋ ਸਕਦੇ ਹਨ, ਅਤੇ ਜੇਕਰ ਤੁਸੀਂ ਸਾਵਧਾਨ ਨਹੀਂ ਹੋ ਤਾਂ ਮਾਡਲ ਉਹਨਾਂ ਦੀ ਪਾਲਣਾ ਕਰ ਸਕਦਾ ਹੈ। ਇੱਕ ਆਮ ਪਹੁੰਚ ਸਿਸਟਮ ਨਿਰਦੇਸ਼ਾਂ ਨੂੰ ਅਲੱਗ ਕਰਨਾ, ਪ੍ਰਾਪਤ ਕੀਤੀ ਸਮੱਗਰੀ ਨੂੰ ਰੋਗਾਣੂ-ਮੁਕਤ ਕਰਨਾ, ਅਤੇ ਸਿਰਫ਼ ਪ੍ਰੋਂਪਟ ਦੀ ਬਜਾਏ ਟੂਲ-ਅਧਾਰਿਤ ਨੀਤੀਆਂ 'ਤੇ ਭਰੋਸਾ ਕਰਨਾ ਹੈ। ਵਿਰੋਧੀ ਇਨਪੁਟਸ ਨਾਲ ਟੈਸਟਿੰਗ ਕਮਜ਼ੋਰ ਥਾਵਾਂ ਨੂੰ ਪ੍ਰਗਟ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦੀ ਹੈ।.
ਆਪਣੇ ਵਰਤੋਂ ਦੇ ਮਾਮਲੇ ਲਈ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ ਕਿਵੇਂ ਚੁਣਨਾ ਹੈ
ਇਹ ਪਰਿਭਾਸ਼ਿਤ ਕਰਕੇ ਸ਼ੁਰੂ ਕਰੋ ਕਿ ਤੁਹਾਨੂੰ ਕੀ ਤਿਆਰ ਕਰਨ ਦੀ ਲੋੜ ਹੈ: ਟੈਕਸਟ, ਚਿੱਤਰ, ਆਡੀਓ, ਕੋਡ, ਜਾਂ ਮਲਟੀਮੋਡਲ ਆਉਟਪੁੱਟ। ਫਿਰ ਆਪਣੀ ਤੱਥ ਬਾਰ ਸੈੱਟ ਕਰੋ - ਉੱਚ-ਸ਼ੁੱਧਤਾ ਵਾਲੇ ਡੋਮੇਨਾਂ ਨੂੰ ਅਕਸਰ ਗਰਾਉਂਡਿੰਗ (RAG), ਪ੍ਰਮਾਣਿਕਤਾ, ਅਤੇ ਕਈ ਵਾਰ ਮਨੁੱਖੀ ਸਮੀਖਿਆ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਲੇਟੈਂਸੀ ਅਤੇ ਲਾਗਤ 'ਤੇ ਵਿਚਾਰ ਕਰੋ, ਕਿਉਂਕਿ ਇੱਕ ਮਜ਼ਬੂਤ ਮਾਡਲ ਜੋ ਹੌਲੀ ਜਾਂ ਮਹਿੰਗਾ ਹੈ, ਭੇਜਣਾ ਮੁਸ਼ਕਲ ਹੋ ਸਕਦਾ ਹੈ। ਅੰਤ ਵਿੱਚ, ਨਕਸ਼ੇ ਦੀ ਗੋਪਨੀਯਤਾ ਅਤੇ ਪਾਲਣਾ ਨੂੰ ਤੈਨਾਤੀ ਵਿਕਲਪਾਂ ਅਤੇ ਨਿਯੰਤਰਣਾਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।.
ਹਵਾਲੇ
-
ਨੈਸ਼ਨਲ ਇੰਸਟੀਚਿਊਟ ਆਫ਼ ਸਟੈਂਡਰਡਜ਼ ਐਂਡ ਟੈਕਨਾਲੋਜੀ (NIST) - ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ (ਸ਼ਬਦਾਵਲੀ ਸ਼ਬਦ) - csrc.nist.gov
-
ਨੈਸ਼ਨਲ ਇੰਸਟੀਚਿਊਟ ਆਫ਼ ਸਟੈਂਡਰਡਜ਼ ਐਂਡ ਟੈਕਨਾਲੋਜੀ (NIST) - NIST AI 600-1: ਜਨਰੇਟਿਵ AI ਪ੍ਰੋਫਾਈਲ - nvlpubs.nist.gov
-
ਨੈਸ਼ਨਲ ਇੰਸਟੀਚਿਊਟ ਆਫ਼ ਸਟੈਂਡਰਡਜ਼ ਐਂਡ ਟੈਕਨਾਲੋਜੀ (NIST) - NIST AI 100-1: AI ਜੋਖਮ ਪ੍ਰਬੰਧਨ ਢਾਂਚਾ (AI RMF 1.0) - nvlpubs.nist.gov
-
ਸਟੈਨਫੋਰਡ ਸੈਂਟਰ ਫਾਰ ਰਿਸਰਚ ਆਨ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲਜ਼ (CRFM) - ਰਿਪੋਰਟ - crfm.stanford.edu
-
arXiv - ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲਾਂ ਦੇ ਮੌਕਿਆਂ ਅਤੇ ਜੋਖਮਾਂ 'ਤੇ (Bommasani et al., 2021) - arxiv.org
-
arXiv - ਭਾਸ਼ਾ ਮਾਡਲ ਘੱਟ ਸਿੱਖਣ ਵਾਲੇ ਹਨ (ਬ੍ਰਾਊਨ ਐਟ ਅਲ., 2020) - arxiv.org
-
arXiv - ਗਿਆਨ-ਗੁੰਝਲਦਾਰ NLP ਕਾਰਜਾਂ ਲਈ ਪ੍ਰਾਪਤੀ-ਵਧਾਈ ਗਈ ਪੀੜ੍ਹੀ (ਲੇਵਿਸ ਅਤੇ ਹੋਰ, 2020) - arxiv.org
-
arXiv - LoRA: ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਦਾ ਘੱਟ-ਦਰਜੇ ਦਾ ਅਨੁਕੂਲਨ (ਹੂ ਐਟ ਅਲ., 2021) - arxiv.org
-
arXiv - BERT: ਭਾਸ਼ਾ ਸਮਝ ਲਈ ਡੂੰਘੇ ਦੋ-ਦਿਸ਼ਾਵੀ ਟ੍ਰਾਂਸਫਾਰਮਰਾਂ ਦੀ ਪੂਰਵ-ਸਿਖਲਾਈ (ਡੇਵਲਿਨ ਅਤੇ ਹੋਰ, 2018) - arxiv.org
-
arXiv - ਫਾਈਨ-ਟਿਊਨਡ ਲੈਂਗਵੇਜ ਮਾਡਲ ਜ਼ੀਰੋ-ਸ਼ਾਟ ਸਿੱਖਣ ਵਾਲੇ ਹਨ (ਵੇਈ ਐਟ ਅਲ., 2021) - arxiv.org
-
ACM ਡਿਜੀਟਲ ਲਾਇਬ੍ਰੇਰੀ - ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਉਤਪਤੀ ਵਿੱਚ ਭਰਮ ਦਾ ਸਰਵੇਖਣ (ਜੀ ਅਤੇ ਹੋਰ, 2023) - dl.acm.org
-
arXiv - ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਨਿਗਰਾਨੀ ਤੋਂ ਤਬਾਦਲੇਯੋਗ ਵਿਜ਼ੂਅਲ ਮਾਡਲ ਸਿੱਖਣਾ (ਰੈੱਡਫੋਰਡ ਅਤੇ ਹੋਰ, 2021) - arxiv.org
-
arXiv - ਡੀਨੋਇਜ਼ਿੰਗ ਡਿਫਿਊਜ਼ਨ ਪ੍ਰੋਬੇਬਿਲਿਸਟਿਕ ਮਾਡਲ (ਹੋ ਐਟ ਅਲ., 2020) - arxiv.org
-
arXiv - ਲੇਟੈਂਟ ਡਿਫਿਊਜ਼ਨ ਮਾਡਲਾਂ ਦੇ ਨਾਲ ਉੱਚ-ਰੈਜ਼ੋਲਿਊਸ਼ਨ ਚਿੱਤਰ ਸੰਸਲੇਸ਼ਣ (ਰੋਮਬਾਚ ਅਤੇ ਹੋਰ, 2021) - arxiv.org
-
arXiv - ਓਪਨ-ਡੋਮੇਨ ਪ੍ਰਸ਼ਨ ਉੱਤਰ ਲਈ ਸੰਘਣੀ ਪੈਸੇਜ ਪ੍ਰਾਪਤੀ (ਕਾਰਪੁਖਿਨ ਅਤੇ ਹੋਰ, 2020) - arxiv.org
-
arXiv - The Faiss ਲਾਇਬ੍ਰੇਰੀ (Douze et al., 2024) - arxiv.org
-
ਓਪਨਏਆਈ - ਵਿਸਪਰ ਪੇਸ਼ ਕਰ ਰਿਹਾ ਹੈ - openai.com
-
arXiv - ਮੇਲ ਸਪੈਕਟ੍ਰੋਗ੍ਰਾਮ ਭਵਿੱਖਬਾਣੀਆਂ 'ਤੇ ਕੰਡੀਸ਼ਨਿੰਗ ਵੇਵਨੈੱਟ ਦੁਆਰਾ ਕੁਦਰਤੀ TTS ਸੰਸਲੇਸ਼ਣ (ਸ਼ੇਨ ਐਟ ਅਲ., 2017) - arxiv.org
-
ਸੈਂਟਰ ਫਾਰ ਸਿਕਿਓਰਿਟੀ ਐਂਡ ਇਮਰਜਿੰਗ ਟੈਕਨਾਲੋਜੀ (CSET), ਜਾਰਜਟਾਊਨ ਯੂਨੀਵਰਸਿਟੀ - ਅਗਲੇ ਸ਼ਬਦ ਦੀ ਭਵਿੱਖਬਾਣੀ ਦੀ ਹੈਰਾਨੀਜਨਕ ਸ਼ਕਤੀ: ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਦੀ ਵਿਆਖਿਆ (ਭਾਗ 1) - cset.georgetown.edu
-
USENIX - ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਤੋਂ ਸਿਖਲਾਈ ਡੇਟਾ ਕੱਢਣਾ (ਕਾਰਲਿਨੀ ਅਤੇ ਹੋਰ, 2021) - usenix.org
-
OWASP - LLM01: ਪ੍ਰੋਂਪਟ ਇੰਜੈਕਸ਼ਨ - genai.owasp.org
-
arXiv - ਤੁਹਾਡੇ ਮੰਗੇ ਤੋਂ ਵੱਧ: ਐਪਲੀਕੇਸ਼ਨ-ਏਕੀਕ੍ਰਿਤ ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਲਈ ਨਾਵਲ ਪ੍ਰੋਂਪਟ ਇੰਜੈਕਸ਼ਨ ਖਤਰਿਆਂ ਦਾ ਇੱਕ ਵਿਆਪਕ ਵਿਸ਼ਲੇਸ਼ਣ (ਗ੍ਰੀਸ਼ੇਕ ਅਤੇ ਹੋਰ, 2023) - arxiv.org
-
OWASP ਚੀਟ ਸ਼ੀਟ ਸੀਰੀਜ਼ - LLM ਪ੍ਰੋਂਪਟ ਇੰਜੈਕਸ਼ਨ ਪ੍ਰੀਵੈਂਸ਼ਨ ਚੀਟ ਸ਼ੀਟ - cheatsheetseries.owasp.org