ਛੋਟਾ ਜਵਾਬ: ਏਆਈ ਡਿਟੈਕਟਰ ਇਹ "ਸਾਬਤ" ਨਹੀਂ ਕਰਦੇ ਕਿ ਕਿਸਨੇ ਕੁਝ ਲਿਖਿਆ ਹੈ; ਉਹ ਅੰਦਾਜ਼ਾ ਲਗਾਉਂਦੇ ਹਨ ਕਿ ਇੱਕ ਪੈਰਾ ਜਾਣੇ-ਪਛਾਣੇ ਭਾਸ਼ਾ-ਮਾਡਲ ਪੈਟਰਨਾਂ ਨਾਲ ਕਿੰਨਾ ਮੇਲ ਖਾਂਦਾ ਹੈ। ਜ਼ਿਆਦਾਤਰ ਵਰਗੀਕਰਣ, ਭਵਿੱਖਬਾਣੀ ਸਿਗਨਲਾਂ (ਪਰੇਸ਼ਾਨੀ/ਫਟਣ), ਸਟਾਈਲੋਮੈਟਰੀ, ਅਤੇ, ਬਹੁਤ ਘੱਟ ਮਾਮਲਿਆਂ ਵਿੱਚ, ਵਾਟਰਮਾਰਕ ਜਾਂਚਾਂ ਦੇ ਮਿਸ਼ਰਣ 'ਤੇ ਨਿਰਭਰ ਕਰਦੇ ਹਨ। ਜਦੋਂ ਨਮੂਨਾ ਛੋਟਾ, ਬਹੁਤ ਰਸਮੀ, ਤਕਨੀਕੀ, ਜਾਂ ਕਿਸੇ ESL ਲੇਖਕ ਦੁਆਰਾ ਲਿਖਿਆ ਜਾਂਦਾ ਹੈ, ਤਾਂ ਸਕੋਰ ਨੂੰ ਸਮੀਖਿਆ ਲਈ ਇੱਕ ਸੰਕੇਤ ਵਜੋਂ ਮੰਨੋ - ਇੱਕ ਫੈਸਲਾ ਨਹੀਂ।
ਮੁੱਖ ਗੱਲਾਂ:
ਸੰਭਾਵਨਾ, ਸਬੂਤ ਨਹੀਂ : ਪ੍ਰਤੀਸ਼ਤਾਂ ਨੂੰ "AI-ਸਮਾਨਤਾ" ਜੋਖਮ ਸੰਕੇਤਾਂ ਵਜੋਂ ਸਮਝੋ, ਨਿਸ਼ਚਤਤਾ ਵਜੋਂ ਨਹੀਂ।
ਗਲਤ ਸਕਾਰਾਤਮਕ : ਰਸਮੀ, ਤਕਨੀਕੀ, ਟੈਂਪਲੇਟਡ, ਜਾਂ ਗੈਰ-ਮੂਲ ਲਿਖਤ ਅਕਸਰ ਗਲਤ ਫਲੈਗ ਕੀਤੀ ਜਾਂਦੀ ਹੈ।
ਵਿਧੀਆਂ ਦਾ ਮਿਸ਼ਰਣ : ਟੂਲ ਵਰਗੀਕਰਣ, ਪੇਚੀਦਗੀ/ਬਰਸਟੀਨੈੱਸ, ਸਟਾਈਲੋਮੈਟਰੀ, ਅਤੇ ਦੁਰਲੱਭ ਵਾਟਰਮਾਰਕ ਜਾਂਚਾਂ ਨੂੰ ਜੋੜਦੇ ਹਨ।
ਪਾਰਦਰਸ਼ਤਾ : ਅਜਿਹੇ ਡਿਟੈਕਟਰਾਂ ਨੂੰ ਤਰਜੀਹ ਦਿਓ ਜੋ ਸਪੈਨ, ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਅਤੇ ਅਨਿਸ਼ਚਿਤਤਾ ਨੂੰ ਦਰਸਾਉਂਦੇ ਹਨ - ਸਿਰਫ਼ ਇੱਕ ਨੰਬਰ ਹੀ ਨਹੀਂ।
ਮੁਕਾਬਲਾਯੋਗਤਾ : ਵਿਵਾਦਾਂ ਅਤੇ ਅਪੀਲਾਂ ਲਈ ਡਰਾਫਟ/ਨੋਟ ਅਤੇ ਪ੍ਰਕਿਰਿਆ ਸਬੂਤ ਹੱਥ ਵਿੱਚ ਰੱਖੋ।

ਇਸ ਤੋਂ ਬਾਅਦ ਤੁਸੀਂ ਜੋ ਲੇਖ ਪੜ੍ਹਨਾ ਪਸੰਦ ਕਰ ਸਕਦੇ ਹੋ:
🔗 ਸਭ ਤੋਂ ਵਧੀਆ AI ਡਿਟੈਕਟਰ ਕੀ ਹੈ?
ਸ਼ੁੱਧਤਾ, ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਅਤੇ ਵਰਤੋਂ ਦੇ ਮਾਮਲਿਆਂ ਦੀ ਤੁਲਨਾ ਵਿੱਚ ਚੋਟੀ ਦੇ AI ਖੋਜ ਟੂਲ।.
🔗 ਕੀ ਏਆਈ ਡਿਟੈਕਟਰ ਭਰੋਸੇਯੋਗ ਹਨ?
ਭਰੋਸੇਯੋਗਤਾ, ਗਲਤ ਸਕਾਰਾਤਮਕਤਾਵਾਂ, ਅਤੇ ਨਤੀਜੇ ਅਕਸਰ ਕਿਉਂ ਵੱਖ-ਵੱਖ ਹੁੰਦੇ ਹਨ, ਬਾਰੇ ਦੱਸਦਾ ਹੈ।.
🔗 ਕੀ ਟਰਨੀਟਿਨ ਏਆਈ ਦਾ ਪਤਾ ਲਗਾ ਸਕਦਾ ਹੈ?
ਟਰਨਿਟਿਨ ਏਆਈ ਖੋਜ, ਸੀਮਾਵਾਂ ਅਤੇ ਵਧੀਆ ਅਭਿਆਸਾਂ ਲਈ ਪੂਰੀ ਗਾਈਡ।.
🔗 ਕੀ ਕੁਇਲਬੋਟ ਏਆਈ ਡਿਟੈਕਟਰ ਸਹੀ ਹੈ?
ਸ਼ੁੱਧਤਾ, ਸ਼ਕਤੀਆਂ, ਕਮਜ਼ੋਰੀਆਂ, ਅਤੇ ਅਸਲ-ਸੰਸਾਰ ਦੇ ਟੈਸਟਾਂ ਦੀ ਵਿਸਤ੍ਰਿਤ ਸਮੀਖਿਆ।.
1) ਤੇਜ਼ ਵਿਚਾਰ - ਇੱਕ AI ਡਿਟੈਕਟਰ ਅਸਲ ਵਿੱਚ ਕੀ ਕਰ ਰਿਹਾ ਹੈ ⚙️
ਜ਼ਿਆਦਾਤਰ ਏਆਈ ਡਿਟੈਕਟਰ ਏਆਈ ਨੂੰ "ਫੜਨ" ਵਾਲੇ ਜਾਲ ਵਾਂਗ ਨਹੀਂ ਫੜ ਰਹੇ ਜੋ ਮੱਛੀ ਫੜਦਾ ਹੈ। ਉਹ ਕੁਝ ਹੋਰ ਵੀ ਵਿਅੰਗਾਤਮਕ ਕਰ ਰਹੇ ਹਨ:
-
ਉਹ ਇਸ ਸੰਭਾਵਨਾ ਦਾ ਅੰਦਾਜ਼ਾ ਲਗਾਉਂਦੇ ਹਨ ਕਿ ਟੈਕਸਟ ਦਾ ਇੱਕ ਹਿੱਸਾ ਇਸ ਤਰ੍ਹਾਂ ਲੱਗਦਾ ਹੈ ਜਿਵੇਂ ਇਹ ਕਿਸੇ ਭਾਸ਼ਾ ਮਾਡਲ ਤੋਂ ਆਇਆ ਹੋਵੇ (ਜਾਂ ਕਿਸੇ ਇੱਕ ਦੁਆਰਾ ਭਾਰੀ ਸਹਾਇਤਾ ਪ੍ਰਾਪਤ ਹੋਵੇ)। ( LLM-ਜਨਰੇਟਿਡ ਟੈਕਸਟ ਡਿਟੈਕਸ਼ਨ 'ਤੇ ਇੱਕ ਸਰਵੇਖਣ ; ਓਪਨਏਆਈ )
-
ਉਹ ਤੁਹਾਡੇ ਟੈਕਸਟ ਦੀ ਤੁਲਨਾ ਸਿਖਲਾਈ ਡੇਟਾ (ਮਨੁੱਖੀ ਲਿਖਤ ਬਨਾਮ ਮਾਡਲ-ਤਿਆਰ ਲਿਖਤ) ਵਿੱਚ ਦੇਖੇ ਗਏ ਪੈਟਰਨਾਂ ਨਾਲ ਕਰਦੇ ਹਨ। ( LLM-ਤਿਆਰ ਟੈਕਸਟ ਖੋਜ 'ਤੇ ਇੱਕ ਸਰਵੇਖਣ )
-
ਉਹ ਇੱਕ ਸਕੋਰ (ਅਕਸਰ ਇੱਕ ਪ੍ਰਤੀਸ਼ਤ) ਦਿੰਦੇ ਹਨ ਜੋ ਨਿਸ਼ਚਿਤ ਮਹਿਸੂਸ ਹੁੰਦਾ ਹੈ...ਪਰ ਆਮ ਤੌਰ 'ਤੇ ਅਜਿਹਾ ਨਹੀਂ ਹੁੰਦਾ। ( ਟਰਨਿਟਿਨ ਗਾਈਡਜ਼ )
ਇਮਾਨਦਾਰ ਬਣੋ - UI "92% AI" ਵਰਗਾ ਕੁਝ ਕਹੇਗਾ, ਅਤੇ ਤੁਹਾਡਾ ਦਿਮਾਗ "ਸਥਿਰ ਹੋ ਜਾਵੇਗਾ, ਅੰਦਾਜ਼ਾ ਲਗਾਓ ਕਿ ਇਹ ਇੱਕ ਤੱਥ ਹੈ।" ਇਹ ਕੋਈ ਤੱਥ ਨਹੀਂ ਹੈ। ਇਹ ਇੱਕ ਮਾਡਲ ਦਾ ਦੂਜੇ ਮਾਡਲ ਦੇ ਫਿੰਗਰਪ੍ਰਿੰਟਸ ਬਾਰੇ ਅਨੁਮਾਨ ਹੈ। ਜੋ ਕਿ ਥੋੜ੍ਹਾ ਜਿਹਾ ਹਾਸੋਹੀਣਾ ਹੈ, ਜਿਵੇਂ ਕੁੱਤੇ ਕੁੱਤਿਆਂ ਨੂੰ ਸੁੰਘ ਰਹੇ ਹਨ 🐕🐕
2) ਏਆਈ ਡਿਟੈਕਟਰ ਕਿਵੇਂ ਕੰਮ ਕਰਦੇ ਹਨ: ਸਭ ਤੋਂ ਆਮ "ਡਿਟੈਕਸ਼ਨ ਇੰਜਣ" 🔍
ਡਿਟੈਕਟਰ ਆਮ ਤੌਰ 'ਤੇ ਇਹਨਾਂ ਵਿੱਚੋਂ ਇੱਕ (ਜਾਂ ਮਿਸ਼ਰਣ) ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ: ( LLM-ਜਨਰੇਟਿਡ ਟੈਕਸਟ ਡਿਟੈਕਸ਼ਨ 'ਤੇ ਇੱਕ ਸਰਵੇਖਣ )
A) ਵਰਗੀਕਰਣ ਮਾਡਲ (ਸਭ ਤੋਂ ਆਮ)
ਇੱਕ ਵਰਗੀਕਰਣਕਰਤਾ ਨੂੰ ਲੇਬਲ ਕੀਤੀਆਂ ਉਦਾਹਰਣਾਂ 'ਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਜਾਂਦੀ ਹੈ:
-
ਮਨੁੱਖੀ-ਲਿਖੇ ਨਮੂਨੇ
-
AI-ਤਿਆਰ ਕੀਤੇ ਨਮੂਨੇ
-
ਕਈ ਵਾਰ "ਹਾਈਬ੍ਰਿਡ" ਨਮੂਨੇ (ਮਨੁੱਖੀ ਸੰਪਾਦਿਤ AI ਟੈਕਸਟ)
ਫਿਰ ਇਹ ਉਹਨਾਂ ਪੈਟਰਨਾਂ ਨੂੰ ਸਿੱਖਦਾ ਹੈ ਜੋ ਸਮੂਹਾਂ ਨੂੰ ਵੱਖ ਕਰਦੇ ਹਨ। ਇਹ ਕਲਾਸਿਕ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਪਹੁੰਚ ਹੈ ਅਤੇ ਇਹ ਹੈਰਾਨੀਜਨਕ ਤੌਰ 'ਤੇ ਵਧੀਆ ਹੋ ਸਕਦਾ ਹੈ... ਜਦੋਂ ਤੱਕ ਇਹ ਨਹੀਂ ਹੈ। ( LLM-ਜਨਰੇਟਿਡ ਟੈਕਸਟ ਡਿਟੈਕਸ਼ਨ 'ਤੇ ਇੱਕ ਸਰਵੇਖਣ )
ਅ) ਉਲਝਣ ਅਤੇ "ਫੱਟੜਤਾ" ਸਕੋਰਿੰਗ 📈
ਕੁਝ ਡਿਟੈਕਟਰ ਗਣਨਾ ਕਰਦੇ ਹਨ ਕਿ ਟੈਕਸਟ ਕਿੰਨਾ "ਅਨੁਮਾਨਯੋਗ" ਹੈ।.
-
ਉਲਝਣ : ਮੋਟੇ ਤੌਰ 'ਤੇ, ਇੱਕ ਭਾਸ਼ਾ ਮਾਡਲ ਅਗਲੇ ਸ਼ਬਦ ਤੋਂ ਕਿੰਨਾ ਹੈਰਾਨ ਹੁੰਦਾ ਹੈ। ( ਬੋਸਟਨ ਯੂਨੀਵਰਸਿਟੀ - ਉਲਝਣ ਵਾਲੀਆਂ ਪੋਸਟਾਂ )
-
ਘੱਟ ਉਲਝਣ ਇਹ ਸੁਝਾਅ ਦੇ ਸਕਦੀ ਹੈ ਕਿ ਟੈਕਸਟ ਬਹੁਤ ਜ਼ਿਆਦਾ ਅਨੁਮਾਨਯੋਗ ਹੈ (ਜੋ ਕਿ AI ਆਉਟਪੁੱਟ ਨਾਲ ਹੋ ਸਕਦਾ ਹੈ)। ( DetectGPT )
-
"ਬਰਸਟੀਨੇਸ" ਇਹ ਮਾਪਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦਾ ਹੈ ਕਿ ਵਾਕ ਦੀ ਗੁੰਝਲਤਾ ਅਤੇ ਤਾਲ ਵਿੱਚ ਕਿੰਨੀ ਭਿੰਨਤਾ ਹੈ। ( GPTZero )
ਇਹ ਤਰੀਕਾ ਸਰਲ ਅਤੇ ਤੇਜ਼ ਹੈ। ਇਸਨੂੰ ਉਲਝਾਉਣਾ ਵੀ ਆਸਾਨ ਹੈ, ਕਿਉਂਕਿ ਮਨੁੱਖ ਅਨੁਮਾਨਤ ਤੌਰ 'ਤੇ ਵੀ ਲਿਖ ਸਕਦੇ ਹਨ (ਹੈਲੋ ਕਾਰਪੋਰੇਟ ਈਮੇਲ)। ( OpenAI )
C) ਸਟਾਈਲੋਮੈਟਰੀ (ਲਿਖਣ ਵਾਲੀਆਂ ਉਂਗਲੀਆਂ ਦੇ ਨਿਸ਼ਾਨ) ✍️
ਸਟਾਈਲੋਮੈਟਰੀ ਇਸ ਤਰ੍ਹਾਂ ਦੇ ਪੈਟਰਨਾਂ ਨੂੰ ਦੇਖਦੀ ਹੈ:
-
ਔਸਤ ਵਾਕ ਦੀ ਲੰਬਾਈ
-
ਵਿਰਾਮ ਚਿੰਨ੍ਹ ਸ਼ੈਲੀ
-
ਫੰਕਸ਼ਨ ਸ਼ਬਦ ਬਾਰੰਬਾਰਤਾ (the, and, but…)
-
ਸ਼ਬਦਾਵਲੀ ਦੀ ਵਿਭਿੰਨਤਾ
-
ਪੜ੍ਹਨਯੋਗਤਾ ਸਕੋਰ
ਇਹ "ਹੱਥ ਲਿਖਤ ਵਿਸ਼ਲੇਸ਼ਣ" ਵਰਗਾ ਹੈ, ਟੈਕਸਟ ਨੂੰ ਛੱਡ ਕੇ। ਕਈ ਵਾਰ ਇਹ ਮਦਦ ਕਰਦਾ ਹੈ। ਕਈ ਵਾਰ ਇਹ ਕਿਸੇ ਦੇ ਜੁੱਤੇ ਦੇਖ ਕੇ ਜ਼ੁਕਾਮ ਦਾ ਪਤਾ ਲਗਾਉਣ ਵਰਗਾ ਹੈ। ( ਸਟਾਈਲੋਮੈਟਰੀ ਅਤੇ ਫੋਰੈਂਸਿਕ ਵਿਗਿਆਨ: ਇੱਕ ਸਾਹਿਤ ਸਮੀਖਿਆ ; ਲੇਖਕ ਵਿਸ਼ੇਸ਼ਤਾ ਵਿੱਚ ਫੰਕਸ਼ਨ ਸ਼ਬਦ )
ਡੀ) ਵਾਟਰਮਾਰਕ ਖੋਜ (ਜਦੋਂ ਇਹ ਮੌਜੂਦ ਹੋਵੇ) 🧩
ਕੁਝ ਮਾਡਲ ਪ੍ਰਦਾਤਾ ਸੂਖਮ ਪੈਟਰਨਾਂ ("ਵਾਟਰਮਾਰਕਸ") ਨੂੰ ਤਿਆਰ ਕੀਤੇ ਟੈਕਸਟ ਵਿੱਚ ਸ਼ਾਮਲ ਕਰ ਸਕਦੇ ਹਨ। ਜੇਕਰ ਕੋਈ ਡਿਟੈਕਟਰ ਵਾਟਰਮਾਰਕ ਸਕੀਮ ਨੂੰ ਜਾਣਦਾ ਹੈ, ਤਾਂ ਇਹ ਇਸਦੀ ਪੁਸ਼ਟੀ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਸਕਦਾ ਹੈ। ( ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਲਈ ਇੱਕ ਵਾਟਰਮਾਰਕ ; ਸਿੰਥਆਈਡੀ ਟੈਕਸਟ )
ਪਰ... ਸਾਰੇ ਮਾਡਲ ਵਾਟਰਮਾਰਕ ਨਹੀਂ, ਸਾਰੇ ਆਉਟਪੁੱਟ ਸੰਪਾਦਨਾਂ ਤੋਂ ਬਾਅਦ ਵਾਟਰਮਾਰਕ ਨਹੀਂ ਰੱਖਦੇ, ਅਤੇ ਸਾਰੇ ਡਿਟੈਕਟਰਾਂ ਕੋਲ ਗੁਪਤ ਸਾਸ ਤੱਕ ਪਹੁੰਚ ਨਹੀਂ ਹੁੰਦੀ। ਇਸ ਲਈ ਇਹ ਇੱਕ ਵਿਆਪਕ ਹੱਲ ਨਹੀਂ ਹੈ। ( ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਲਈ ਵਾਟਰਮਾਰਕਸ ਦੀ ਭਰੋਸੇਯੋਗਤਾ 'ਤੇ ; ਓਪਨਏਆਈ )
3) ਏਆਈ ਡਿਟੈਕਟਰ ਦਾ ਇੱਕ ਚੰਗਾ ਸੰਸਕਰਣ ਕੀ ਬਣਾਉਂਦਾ ਹੈ ✅
ਇੱਕ "ਚੰਗਾ" ਡਿਟੈਕਟਰ (ਮੇਰੇ ਤਜਰਬੇ ਵਿੱਚ ਸੰਪਾਦਕੀ ਵਰਕਫਲੋ ਲਈ ਉਹਨਾਂ ਦੇ ਇੱਕ ਸਮੂਹ ਨੂੰ ਨਾਲ-ਨਾਲ ਟੈਸਟ ਕਰਨਾ) ਉਹ ਨਹੀਂ ਹੁੰਦਾ ਜੋ ਸਭ ਤੋਂ ਵੱਧ ਚੀਕਦਾ ਹੈ। ਇਹ ਉਹ ਹੁੰਦਾ ਹੈ ਜੋ ਜ਼ਿੰਮੇਵਾਰੀ ਨਾਲ ਵਿਵਹਾਰ ਕਰਦਾ ਹੈ।.
ਇੱਥੇ ਇੱਕ AI ਡਿਟੈਕਟਰ ਨੂੰ ਠੋਸ ਬਣਾਉਣ ਵਾਲੀਆਂ ਗੱਲਾਂ ਹਨ:
-
ਕੈਲੀਬ੍ਰੇਟਿਡ ਵਿਸ਼ਵਾਸ : 70% ਦਾ ਮਤਲਬ ਕੁਝ ਇਕਸਾਰ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ, ਹੱਥ ਹਿਲਾਉਣਾ ਨਹੀਂ। ( ਐਲਐਲਐਮ-ਜਨਰੇਟਿਡ ਟੈਕਸਟ ਡਿਟੈਕਸ਼ਨ 'ਤੇ ਇੱਕ ਸਰਵੇਖਣ )
-
ਘੱਟ ਗਲਤ ਸਕਾਰਾਤਮਕ : ਇਸਨੂੰ ਗੈਰ-ਮੂਲ ਅੰਗਰੇਜ਼ੀ, ਕਾਨੂੰਨੀ ਲਿਖਤ, ਜਾਂ ਤਕਨੀਕੀ ਮੈਨੂਅਲ ਨੂੰ "AI" ਵਜੋਂ ਫਲੈਗ ਨਹੀਂ ਕਰਨਾ ਚਾਹੀਦਾ ਕਿਉਂਕਿ ਉਹ ਸਾਫ਼ ਹਨ। ( ਸਟੈਨਫੋਰਡ HAI ; ਲਿਆਂਗ ਅਤੇ ਹੋਰ (arXiv) )
-
ਪਾਰਦਰਸ਼ੀ ਸੀਮਾਵਾਂ : ਇਸਨੂੰ ਅਨਿਸ਼ਚਿਤਤਾ ਨੂੰ ਸਵੀਕਾਰ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ ਅਤੇ ਸੀਮਾਵਾਂ ਦਿਖਾਉਣੀਆਂ ਚਾਹੀਦੀਆਂ ਹਨ, ਨਾ ਕਿ ਇਹ ਦਿਖਾਵਾ ਕਰਨਾ ਕਿ ਇਹ ਸਰਵ-ਵਿਗਿਆਨੀ ਹੈ। ( ਓਪਨਏਆਈ ; ਟਰਨਿਟਿਨ )
-
ਡੋਮੇਨ ਜਾਗਰੂਕਤਾ : ਆਮ ਬਲੌਗਾਂ 'ਤੇ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਡਿਟੈਕਟਰ ਅਕਸਰ ਅਕਾਦਮਿਕ ਟੈਕਸਟ ਨਾਲ ਸੰਘਰਸ਼ ਕਰਦੇ ਹਨ ਅਤੇ ਇਸਦੇ ਉਲਟ। ( LLM-ਜਨਰੇਟਿਡ ਟੈਕਸਟ ਡਿਟੈਕਸ਼ਨ 'ਤੇ ਇੱਕ ਸਰਵੇਖਣ )
-
ਛੋਟੇ-ਟੈਕਸਟ ਹੈਂਡਲਿੰਗ : ਚੰਗੇ ਟੂਲ ਛੋਟੇ ਨਮੂਨਿਆਂ 'ਤੇ ਬਹੁਤ ਜ਼ਿਆਦਾ ਆਤਮਵਿਸ਼ਵਾਸੀ ਸਕੋਰਾਂ ਤੋਂ ਬਚਦੇ ਹਨ (ਇੱਕ ਪੈਰਾਗ੍ਰਾਫ ਇੱਕ ਬ੍ਰਹਿਮੰਡ ਨਹੀਂ ਹੈ)। ( OpenAI ; Turnitin )
-
ਸੋਧ ਸੰਵੇਦਨਸ਼ੀਲਤਾ : ਇਸਨੂੰ ਮਨੁੱਖੀ ਸੰਪਾਦਨ ਨੂੰ ਤੁਰੰਤ ਬਕਵਾਸ ਨਤੀਜਿਆਂ ਵਿੱਚ ਡਿੱਗਣ ਤੋਂ ਬਿਨਾਂ ਸੰਭਾਲਣਾ ਚਾਹੀਦਾ ਹੈ। ( LLM-ਜਨਰੇਟਿਡ ਟੈਕਸਟ ਡਿਟੈਕਸ਼ਨ 'ਤੇ ਇੱਕ ਸਰਵੇਖਣ )
ਮੈਂ ਜਿਨ੍ਹਾਂ ਸਭ ਤੋਂ ਵਧੀਆ ਲੋਕਾਂ ਨੂੰ ਦੇਖਿਆ ਹੈ ਉਹ ਥੋੜ੍ਹੇ ਜਿਹੇ ਨਿਮਰ ਹੁੰਦੇ ਹਨ। ਸਭ ਤੋਂ ਭੈੜੇ ਲੋਕ ਇਸ ਤਰ੍ਹਾਂ ਕੰਮ ਕਰਦੇ ਹਨ ਜਿਵੇਂ ਉਹ ਮਨ ਪੜ੍ਹ ਰਹੇ ਹੋਣ 😬
4) ਤੁਲਨਾ ਸਾਰਣੀ - ਆਮ AI ਡਿਟੈਕਟਰ "ਕਿਸਮਾਂ" ਅਤੇ ਉਹ ਕਿੱਥੇ ਚਮਕਦੇ ਹਨ 🧾
ਹੇਠਾਂ ਇੱਕ ਵਿਹਾਰਕ ਤੁਲਨਾ ਦਿੱਤੀ ਗਈ ਹੈ। ਇਹ ਬ੍ਰਾਂਡ ਨਾਮ ਨਹੀਂ ਹਨ - ਇਹ ਉਹ ਮੁੱਖ ਸ਼੍ਰੇਣੀਆਂ ਹਨ ਜਿਨ੍ਹਾਂ ਵਿੱਚ ਤੁਸੀਂ ਆਓਗੇ। ( LLM-ਜਨਰੇਟਿਡ ਟੈਕਸਟ ਡਿਟੈਕਸ਼ਨ 'ਤੇ ਇੱਕ ਸਰਵੇਖਣ )
| ਟੂਲ ਕਿਸਮ (is) | ਸਭ ਤੋਂ ਵਧੀਆ ਦਰਸ਼ਕ | ਕੀਮਤ ਦਾ ਅਹਿਸਾਸ | ਇਹ ਕਿਉਂ ਕੰਮ ਕਰਦਾ ਹੈ (ਕਈ ਵਾਰ) |
|---|---|---|---|
| ਪੇਚਸ਼ ਜਾਂਚਕਰਤਾ ਲਾਈਟ | ਅਧਿਆਪਕ, ਜਲਦੀ ਜਾਂਚ ਕਰੋ | ਫ੍ਰੀ-ਇਸ਼ | ਭਵਿੱਖਬਾਣੀ 'ਤੇ ਤੇਜ਼ ਸੰਕੇਤ - ਪਰ ਇਹ ਬੇਚੈਨੀ ਭਰਿਆ ਹੋ ਸਕਦਾ ਹੈ.. |
| ਕਲਾਸੀਫਾਇਰ ਸਕੈਨਰ ਪ੍ਰੋ | ਸੰਪਾਦਕ, ਐਚਆਰ, ਪਾਲਣਾ | ਗਾਹਕੀ | ਲੇਬਲ ਕੀਤੇ ਡੇਟਾ ਤੋਂ ਪੈਟਰਨ ਸਿੱਖਦਾ ਹੈ - ਦਰਮਿਆਨੀ ਲੰਬਾਈ ਵਾਲੇ ਟੈਕਸਟ 'ਤੇ ਢੁਕਵਾਂ |
| ਸਟਾਈਲੋਮੈਟਰੀ ਐਨਾਲਾਈਜ਼ਰ | ਖੋਜਕਰਤਾ, ਫੋਰੈਂਸਿਕ ਲੋਕ | $$$ ਜਾਂ ਸਥਾਨ | ਲਿਖਣ ਵਾਲੇ ਫਿੰਗਰਪ੍ਰਿੰਟਸ ਦੀ ਤੁਲਨਾ ਕਰਦਾ ਹੈ - ਅਜੀਬ ਪਰ ਲੰਬੇ ਰੂਪ ਵਿੱਚ ਸੌਖਾ |
| ਵਾਟਰਮਾਰਕ ਖੋਜੀ | ਪਲੇਟਫਾਰਮ, ਅੰਦਰੂਨੀ ਟੀਮਾਂ | ਅਕਸਰ ਬੰਡਲ ਕੀਤਾ ਜਾਂਦਾ ਹੈ | ਜਦੋਂ ਵਾਟਰਮਾਰਕ ਮੌਜੂਦ ਹੋਵੇ ਤਾਂ ਮਜ਼ਬੂਤ - ਜੇ ਇਹ ਨਹੀਂ ਹੈ, ਤਾਂ ਇਹ ਮੂਲ ਰੂਪ ਵਿੱਚ ਮੋਢੇ ਹਿਲਾਉਣ ਵਾਲਾ ਹੈ |
| ਹਾਈਬ੍ਰਿਡ ਐਂਟਰਪ੍ਰਾਈਜ਼ ਸੂਟ | ਵੱਡੇ ਸੰਗਠਨ | ਪ੍ਰਤੀ-ਸੀਟ, ਇਕਰਾਰਨਾਮੇ | ਕਈ ਸਿਗਨਲਾਂ ਨੂੰ ਜੋੜਦਾ ਹੈ - ਬਿਹਤਰ ਕਵਰੇਜ, ਟਿਊਨ ਕਰਨ ਲਈ ਹੋਰ ਨੌਬ (ਅਤੇ ਗਲਤ ਸੰਰਚਨਾ ਕਰਨ ਦੇ ਹੋਰ ਤਰੀਕੇ, ਓਹ) |
"ਕੀਮਤ ਮਹਿਸੂਸ" ਕਾਲਮ ਵੱਲ ਧਿਆਨ ਦਿਓ। ਹਾਂ, ਇਹ ਵਿਗਿਆਨਕ ਨਹੀਂ ਹੈ। ਪਰ ਇਹ ਸਪੱਸ਼ਟ ਹੈ 😄
5) ਕੋਰ ਸਿਗਨਲ ਡਿਟੈਕਟਰ ਲੱਭਦੇ ਹਨ - "ਦੱਸਦਾ ਹੈ" 🧠
ਇੱਥੇ ਬਹੁਤ ਸਾਰੇ ਡਿਟੈਕਟਰ ਹੁੱਡ ਦੇ ਹੇਠਾਂ ਮਾਪਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦੇ ਹਨ:
ਭਵਿੱਖਬਾਣੀ (ਟੋਕਨ ਸੰਭਾਵਨਾ)
ਭਾਸ਼ਾ ਮਾਡਲ ਸੰਭਾਵਿਤ ਅਗਲੇ ਟੋਕਨਾਂ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਕੇ ਟੈਕਸਟ ਤਿਆਰ ਕਰਦੇ ਹਨ। ਇਹ ਇਹ ਬਣਾਉਂਦਾ ਹੈ:
-
ਨਿਰਵਿਘਨ ਤਬਦੀਲੀਆਂ
-
ਘੱਟ ਹੈਰਾਨੀਜਨਕ ਸ਼ਬਦ ਵਿਕਲਪ
-
ਘੱਟ ਅਜੀਬ ਸਪਰਸ਼ (ਜਦੋਂ ਤੱਕ ਪੁੱਛਿਆ ਨਾ ਜਾਵੇ)
-
ਇਕਸਾਰ ਸੁਰ ( ਬੋਸਟਨ ਯੂਨੀਵਰਸਿਟੀ - ਪੇਚੀਦਗੀ ਪੋਸਟਾਂ ; ਡਿਟੈਕਟਜੀਪੀਟੀ )
ਦੂਜੇ ਪਾਸੇ, ਮਨੁੱਖ ਅਕਸਰ ਜ਼ਿਆਦਾ ਜ਼ਿਗ-ਜ਼ੈਗ ਕਰਦੇ ਹਨ। ਅਸੀਂ ਆਪਣੇ ਆਪ ਦਾ ਵਿਰੋਧ ਕਰਦੇ ਹਾਂ, ਅਸੀਂ ਬੇਤਰਤੀਬ ਸਾਈਡ ਟਿੱਪਣੀਆਂ ਜੋੜਦੇ ਹਾਂ, ਅਸੀਂ ਥੋੜ੍ਹਾ ਜਿਹਾ ਅਲੰਕਾਰਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਾਂ - ਜਿਵੇਂ ਕਿ ਇੱਕ AI ਡਿਟੈਕਟਰ ਦੀ ਤੁਲਨਾ ਇੱਕ ਟੋਸਟਰ ਨਾਲ ਕਰਦੇ ਹਾਂ ਜੋ ਕਵਿਤਾ ਦਾ ਨਿਰਣਾ ਕਰਦਾ ਹੈ। ਉਹ ਅਲੰਕਾਰ ਬੁਰਾ ਹੈ, ਪਰ ਤੁਸੀਂ ਸਮਝ ਜਾਂਦੇ ਹੋ।.
ਦੁਹਰਾਓ ਅਤੇ ਬਣਤਰ ਦੇ ਪੈਟਰਨ
ਏਆਈ ਲਿਖਣਾ ਸੂਖਮ ਦੁਹਰਾਓ ਦਿਖਾ ਸਕਦਾ ਹੈ:
-
ਦੁਹਰਾਏ ਗਏ ਵਾਕ ਸਕੈਫੋਲਡ ("ਨਤੀਜੇ ਵਜੋਂ...", "ਇਸ ਤੋਂ ਇਲਾਵਾ...", "ਇਸ ਤੋਂ ਇਲਾਵਾ...")
-
ਸਮਾਨ ਪੈਰੇ ਦੀ ਲੰਬਾਈ
-
ਇਕਸਾਰ ਰਫ਼ਤਾਰ ( LLM-ਜਨਰੇਟਿਡ ਟੈਕਸਟ ਡਿਟੈਕਸ਼ਨ 'ਤੇ ਇੱਕ ਸਰਵੇਖਣ )
ਪਰ ਇਹ ਵੀ - ਬਹੁਤ ਸਾਰੇ ਲੋਕ ਇਸ ਤਰ੍ਹਾਂ ਲਿਖਦੇ ਹਨ, ਖਾਸ ਕਰਕੇ ਸਕੂਲ ਜਾਂ ਕਾਰਪੋਰੇਟ ਸੈਟਿੰਗਾਂ ਵਿੱਚ। ਇਸ ਲਈ ਦੁਹਰਾਓ ਇੱਕ ਸੁਰਾਗ ਹੈ, ਸਬੂਤ ਨਹੀਂ।.
ਬਹੁਤ ਜ਼ਿਆਦਾ ਸਪੱਸ਼ਟਤਾ ਅਤੇ "ਬਹੁਤ ਸਾਫ਼" ਗੱਦ ✨
ਇਹ ਇੱਕ ਅਜੀਬ ਗੱਲ ਹੈ। ਕੁਝ ਡਿਟੈਕਟਰ "ਬਹੁਤ ਸਾਫ਼ ਲਿਖਤ" ਨੂੰ ਸ਼ੱਕੀ ਮੰਨਦੇ ਹਨ। ( OpenAI )
ਜੋ ਕਿ ਅਜੀਬ ਹੈ ਕਿਉਂਕਿ:
-
ਚੰਗੇ ਲੇਖਕ ਮੌਜੂਦ ਹਨ।
-
ਸੰਪਾਦਕ ਮੌਜੂਦ ਹਨ
-
ਸਪੈਲਚੈਕ ਮੌਜੂਦ ਹੈ
ਇਸ ਲਈ ਜੇਕਰ ਤੁਸੀਂ ਸੋਚ ਰਹੇ ਹੋ ਕਿ AI ਡਿਟੈਕਟਰ ਕਿਵੇਂ ਕੰਮ ਕਰਦੇ ਹਨ , ਤਾਂ ਜਵਾਬ ਦਾ ਇੱਕ ਹਿੱਸਾ ਇਹ ਹੈ: ਕਈ ਵਾਰ ਉਹ ਖੁਰਦਰੇਪਨ ਨੂੰ ਇਨਾਮ ਦਿੰਦੇ ਹਨ। ਜੋ ਕਿ... ਥੋੜ੍ਹਾ ਉਲਟਾ ਹੈ।
ਅਰਥ ਘਣਤਾ ਅਤੇ ਆਮ ਵਾਕਾਂਸ਼
ਡਿਟੈਕਟਰ ਉਸ ਟੈਕਸਟ ਨੂੰ ਫਲੈਗ ਕਰ ਸਕਦੇ ਹਨ ਜੋ ਇਹ ਮਹਿਸੂਸ ਕਰਦਾ ਹੈ:
-
ਬਹੁਤ ਜ਼ਿਆਦਾ ਆਮ
-
ਖਾਸ ਜੀਵਨ ਵੇਰਵਿਆਂ 'ਤੇ ਘੱਟ
-
ਸੰਤੁਲਿਤ, ਨਿਰਪੱਖ ਕਥਨਾਂ 'ਤੇ ਭਾਰੀ ( LLM-ਜਨਰੇਟਿਡ ਟੈਕਸਟ ਡਿਟੈਕਸ਼ਨ 'ਤੇ ਇੱਕ ਸਰਵੇਖਣ )
AI ਅਕਸਰ ਅਜਿਹੀ ਸਮੱਗਰੀ ਤਿਆਰ ਕਰਦਾ ਹੈ ਜੋ ਸੁਣਨ ਵਿੱਚ ਵਾਜਬ ਲੱਗਦੀ ਹੈ ਪਰ ਥੋੜ੍ਹੀ ਜਿਹੀ ਹਵਾਦਾਰ ਹੁੰਦੀ ਹੈ। ਜਿਵੇਂ ਇੱਕ ਹੋਟਲ ਦਾ ਕਮਰਾ ਜੋ ਦੇਖਣ ਵਿੱਚ ਵਧੀਆ ਲੱਗਦਾ ਹੈ ਪਰ ਉਸਦੀ ਸ਼ਖਸੀਅਤ ਜ਼ੀਰੋ ਹੁੰਦੀ ਹੈ 🛏️
6) ਵਰਗੀਕਰਣ ਪਹੁੰਚ - ਇਸਨੂੰ ਕਿਵੇਂ ਸਿਖਲਾਈ ਦਿੱਤੀ ਜਾਂਦੀ ਹੈ (ਅਤੇ ਇਹ ਕਿਉਂ ਟੁੱਟਦਾ ਹੈ) 🧪
ਇੱਕ ਵਰਗੀਕਰਣ ਡਿਟੈਕਟਰ ਨੂੰ ਆਮ ਤੌਰ 'ਤੇ ਇਸ ਤਰ੍ਹਾਂ ਸਿਖਲਾਈ ਦਿੱਤੀ ਜਾਂਦੀ ਹੈ:
-
ਮਨੁੱਖੀ ਟੈਕਸਟ (ਲੇਖ, ਲੇਖ, ਫੋਰਮ, ਆਦਿ) ਦਾ ਡੇਟਾਸੈਟ ਇਕੱਠਾ ਕਰੋ।
-
AI ਟੈਕਸਟ ਤਿਆਰ ਕਰੋ (ਕਈ ਪ੍ਰੋਂਪਟ, ਸਟਾਈਲ, ਲੰਬਾਈ)
-
ਨਮੂਨਿਆਂ ਨੂੰ ਲੇਬਲ ਕਰੋ
-
ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਜਾਂ ਏਮਬੈਡਿੰਗਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਉਹਨਾਂ ਨੂੰ ਵੱਖ ਕਰਨ ਲਈ ਇੱਕ ਮਾਡਲ ਨੂੰ ਸਿਖਲਾਈ ਦਿਓ।
-
ਇਸਨੂੰ ਰੋਕੇ ਹੋਏ ਡੇਟਾ 'ਤੇ ਪ੍ਰਮਾਣਿਤ ਕਰੋ
-
ਇਸਨੂੰ ਭੇਜੋ...ਅਤੇ ਫਿਰ ਹਕੀਕਤ ਇਸਨੂੰ ਮੂੰਹ 'ਤੇ ਮੁੱਕਾ ਮਾਰਦੀ ਹੈ ( LLM-ਜਨਰੇਟਿਡ ਟੈਕਸਟ ਡਿਟੈਕਸ਼ਨ 'ਤੇ ਇੱਕ ਸਰਵੇਖਣ )
ਹਕੀਕਤ ਇਸਨੂੰ ਕਿਉਂ ਮੁੱਕਾ ਮਾਰਦੀ ਹੈ:
-
ਡੋਮੇਨ ਸ਼ਿਫਟ : ਸਿਖਲਾਈ ਡੇਟਾ ਅਸਲ ਉਪਭੋਗਤਾ ਲਿਖਤ ਨਾਲ ਮੇਲ ਨਹੀਂ ਖਾਂਦਾ
-
ਮਾਡਲ ਸ਼ਿਫਟ : ਨਵੀਂ ਪੀੜ੍ਹੀ ਦੇ ਮਾਡਲ ਡੇਟਾਸੈੱਟ ਵਿੱਚ ਮੌਜੂਦ ਮਾਡਲਾਂ ਵਾਂਗ ਵਿਵਹਾਰ ਨਹੀਂ ਕਰਦੇ।
-
ਸੰਪਾਦਨ ਪ੍ਰਭਾਵ : ਮਨੁੱਖੀ ਸੰਪਾਦਨ ਸਪੱਸ਼ਟ ਪੈਟਰਨਾਂ ਨੂੰ ਹਟਾ ਸਕਦੇ ਹਨ ਪਰ ਸੂਖਮ ਪੈਟਰਨਾਂ ਨੂੰ ਰੱਖ ਸਕਦੇ ਹਨ।
-
ਭਾਸ਼ਾ ਭਿੰਨਤਾ : ਉਪਭਾਸ਼ਾਵਾਂ, ESL ਲਿਖਣਾ, ਅਤੇ ਰਸਮੀ ਸ਼ੈਲੀਆਂ ਨੂੰ ਗਲਤ ਪੜ੍ਹਿਆ ਜਾਂਦਾ ਹੈ ( LLM-ਜਨਰੇਟਿਡ ਟੈਕਸਟ ਡਿਟੈਕਸ਼ਨ 'ਤੇ ਇੱਕ ਸਰਵੇਖਣ ; ਲਿਆਂਗ ਅਤੇ ਹੋਰ (arXiv) )
ਮੈਂ ਡਿਟੈਕਟਰ ਦੇਖੇ ਹਨ ਜੋ ਆਪਣੇ ਡੈਮੋ ਸੈੱਟ 'ਤੇ "ਸ਼ਾਨਦਾਰ" ਸਨ, ਫਿਰ ਅਸਲ ਕੰਮ ਵਾਲੀ ਥਾਂ 'ਤੇ ਲਿਖਣ 'ਤੇ ਟੁੱਟ ਗਏ। ਇਹ ਇੱਕ ਸੁੰਘਣ ਵਾਲੇ ਕੁੱਤੇ ਨੂੰ ਸਿਰਫ਼ ਇੱਕ ਬ੍ਰਾਂਡ ਦੀਆਂ ਕੂਕੀਜ਼ 'ਤੇ ਸਿਖਲਾਈ ਦੇਣ ਅਤੇ ਇਹ ਉਮੀਦ ਕਰਨ ਵਰਗਾ ਹੈ ਕਿ ਉਹ ਦੁਨੀਆ ਦਾ ਹਰ ਸਨੈਕ ਲੱਭ ਲਵੇਗਾ 🍪
7) ਉਲਝਣ ਅਤੇ ਬੇਚੈਨੀ - ਗਣਿਤ ਦਾ ਸ਼ਾਰਟਕੱਟ 📉
ਡਿਟੈਕਟਰਾਂ ਦਾ ਇਹ ਪਰਿਵਾਰ ਭਾਸ਼ਾ-ਮਾਡਲ ਸਕੋਰਿੰਗ 'ਤੇ ਨਿਰਭਰ ਕਰਦਾ ਹੈ:
-
ਉਹ ਤੁਹਾਡੇ ਟੈਕਸਟ ਨੂੰ ਇੱਕ ਮਾਡਲ ਰਾਹੀਂ ਚਲਾਉਂਦੇ ਹਨ ਜੋ ਅੰਦਾਜ਼ਾ ਲਗਾਉਂਦਾ ਹੈ ਕਿ ਹਰੇਕ ਅਗਲੇ ਟੋਕਨ ਦੀ ਕਿੰਨੀ ਸੰਭਾਵਨਾ ਹੈ।.
-
ਉਹ ਸਮੁੱਚੇ "ਹੈਰਾਨੀ" (ਉਲਝਣ) ਦੀ ਗਣਨਾ ਕਰਦੇ ਹਨ। ( ਬੋਸਟਨ ਯੂਨੀਵਰਸਿਟੀ - ਉਲਝਣ ਵਾਲੀਆਂ ਪੋਸਟਾਂ )
-
ਉਹ ਇਹ ਦੇਖਣ ਲਈ ਕਿ ਕੀ ਤਾਲ ਮਨੁੱਖੀ ਮਹਿਸੂਸ ਹੁੰਦਾ ਹੈ, ਪਰਿਵਰਤਨ ਮੈਟ੍ਰਿਕਸ ("ਬਰਸਟੀਨੇਸ") ਜੋੜ ਸਕਦੇ ਹਨ। ( GPTZero )
ਇਹ ਕਈ ਵਾਰ ਕਿਉਂ ਕੰਮ ਕਰਦਾ ਹੈ:
-
ਕੱਚਾ AI ਟੈਕਸਟ ਬਹੁਤ ਹੀ ਨਿਰਵਿਘਨ ਅਤੇ ਅੰਕੜਾਤਮਕ ਤੌਰ 'ਤੇ ਅਨੁਮਾਨ ਲਗਾਉਣ ਯੋਗ ਹੋ ਸਕਦਾ ਹੈ ( DetectGPT )
ਇਹ ਅਸਫਲ ਕਿਉਂ ਹੁੰਦਾ ਹੈ:
-
ਛੋਟੇ ਨਮੂਨੇ ਸ਼ੋਰ ਵਾਲੇ ਹਨ।
-
ਰਸਮੀ ਲਿਖਤ ਅਨੁਮਾਨਯੋਗ ਹੈ
-
ਤਕਨੀਕੀ ਲਿਖਤ ਅਨੁਮਾਨਯੋਗ ਹੈ
-
ਗੈਰ-ਮੂਲ ਲਿਖਤ ਅਨੁਮਾਨਯੋਗ ਹੋ ਸਕਦੀ ਹੈ
-
ਭਾਰੀ ਸੰਪਾਦਿਤ AI ਟੈਕਸਟ ਮਨੁੱਖੀ ਲੱਗ ਸਕਦਾ ਹੈ ( OpenAI ; Turnitin )
ਤਾਂ, AI ਡਿਟੈਕਟਰ ਕਿਵੇਂ ਕੰਮ ਕਰਦੇ ਹਨ, ਇਹ ਕਈ ਵਾਰ ਇੱਕ ਸਪੀਡ ਗਨ ਵਰਗਾ ਹੁੰਦਾ ਹੈ ਜੋ ਸਾਈਕਲਾਂ ਅਤੇ ਮੋਟਰਸਾਈਕਲਾਂ ਨੂੰ ਉਲਝਾ ਦਿੰਦਾ ਹੈ। ਇੱਕੋ ਸੜਕ, ਵੱਖ-ਵੱਖ ਇੰਜਣ 🚲🏍️
8) ਵਾਟਰਮਾਰਕਸ - "ਸਿਆਹੀ ਵਿੱਚ ਉਂਗਲੀਆਂ ਦੇ ਨਿਸ਼ਾਨ" ਦਾ ਵਿਚਾਰ 🖋️
ਵਾਟਰਮਾਰਕਿੰਗ ਸਾਫ਼ ਹੱਲ ਵਾਂਗ ਜਾਪਦੀ ਹੈ: ਪੀੜ੍ਹੀ ਦੇ ਸਮੇਂ AI ਟੈਕਸਟ ਨੂੰ ਚਿੰਨ੍ਹਿਤ ਕਰੋ, ਫਿਰ ਇਸਨੂੰ ਬਾਅਦ ਵਿੱਚ ਖੋਜੋ। ( ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਲਈ ਇੱਕ ਵਾਟਰਮਾਰਕ ; ਸਿੰਥਆਈਡੀ ਟੈਕਸਟ )
ਅਭਿਆਸ ਵਿੱਚ, ਵਾਟਰਮਾਰਕ ਨਾਜ਼ੁਕ ਹੋ ਸਕਦੇ ਹਨ:
-
ਵਿਆਖਿਆ ਉਹਨਾਂ ਨੂੰ ਕਮਜ਼ੋਰ ਕਰ ਸਕਦੀ ਹੈ
-
ਅਨੁਵਾਦ ਉਹਨਾਂ ਨੂੰ ਤੋੜ ਸਕਦਾ ਹੈ।
-
ਅੰਸ਼ਕ ਹਵਾਲਾ ਉਹਨਾਂ ਨੂੰ ਹਟਾ ਸਕਦਾ ਹੈ
-
ਕਈ ਸਰੋਤਾਂ ਨੂੰ ਮਿਲਾਉਣ ਨਾਲ ਪੈਟਰਨ ਧੁੰਦਲਾ ਹੋ ਸਕਦਾ ਹੈ ( ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਲਈ ਵਾਟਰਮਾਰਕਸ ਦੀ ਭਰੋਸੇਯੋਗਤਾ 'ਤੇ )
ਨਾਲ ਹੀ, ਵਾਟਰਮਾਰਕ ਖੋਜ ਸਿਰਫ਼ ਤਾਂ ਹੀ ਕੰਮ ਕਰਦੀ ਹੈ ਜੇਕਰ:
-
ਇੱਕ ਵਾਟਰਮਾਰਕ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ
-
ਡਿਟੈਕਟਰ ਜਾਣਦਾ ਹੈ ਕਿ ਇਸਨੂੰ ਕਿਵੇਂ ਚੈੱਕ ਕਰਨਾ ਹੈ।
-
ਟੈਕਸਟ ਨੂੰ ਜ਼ਿਆਦਾ ਬਦਲਿਆ ਨਹੀਂ ਗਿਆ ਹੈ ( OpenAI ; SynthID ਟੈਕਸਟ )
ਤਾਂ ਹਾਂ, ਵਾਟਰਮਾਰਕ ਸ਼ਕਤੀਸ਼ਾਲੀ ਹੋ ਸਕਦੇ ਹਨ, ਪਰ ਇਹ ਇੱਕ ਯੂਨੀਵਰਸਲ ਪੁਲਿਸ ਬੈਜ ਨਹੀਂ ਹਨ।.
9) ਝੂਠੇ ਸਕਾਰਾਤਮਕ ਅਤੇ ਉਹ ਕਿਉਂ ਹੁੰਦੇ ਹਨ (ਦੁਖਦਾਈ ਹਿੱਸਾ) 😬
ਇਹ ਆਪਣੇ ਵੱਖਰੇ ਭਾਗ ਦਾ ਹੱਕਦਾਰ ਹੈ ਕਿਉਂਕਿ ਇਹ ਉਹ ਥਾਂ ਹੈ ਜਿੱਥੇ ਜ਼ਿਆਦਾਤਰ ਵਿਵਾਦ ਰਹਿੰਦੇ ਹਨ।.
ਆਮ ਝੂਠੇ ਸਕਾਰਾਤਮਕ ਟਰਿੱਗਰ:
-
ਬਹੁਤ ਰਸਮੀ ਸੁਰ (ਅਕਾਦਮਿਕ, ਕਾਨੂੰਨੀ, ਪਾਲਣਾ ਲਿਖਤ)
-
ਗੈਰ-ਮੂਲ ਅੰਗਰੇਜ਼ੀ (ਸਧਾਰਨ ਵਾਕ ਬਣਤਰ "ਮਾਡਲ ਵਰਗੀ" ਲੱਗ ਸਕਦੀ ਹੈ)
-
ਟੈਂਪਲੇਟ-ਅਧਾਰਤ ਲਿਖਤ (ਕਵਰ ਲੈਟਰ, SOP, ਲੈਬ ਰਿਪੋਰਟਾਂ)
-
ਛੋਟੇ ਟੈਕਸਟ ਨਮੂਨੇ (ਕਾਫ਼ੀ ਸਿਗਨਲ ਨਹੀਂ)
-
ਵਿਸ਼ੇ ਦੀਆਂ ਪਾਬੰਦੀਆਂ (ਕੁਝ ਵਿਸ਼ੇ ਦੁਹਰਾਉਣ ਵਾਲੇ ਵਾਕਾਂਸ਼ਾਂ ਨੂੰ ਮਜਬੂਰ ਕਰਦੇ ਹਨ) ( ਲਿਆਂਗ ਅਤੇ ਹੋਰ (arXiv) ; ਟਰਨਿਟਿਨ )
ਜੇ ਤੁਸੀਂ ਕਦੇ ਕਿਸੇ ਨੂੰ ਬਹੁਤ ਵਧੀਆ ਲਿਖਣ ਲਈ ਝੰਡੀ ਦਿੱਤੀ ਹੈ... ਹਾਂ। ਅਜਿਹਾ ਹੁੰਦਾ ਹੈ। ਅਤੇ ਇਹ ਬੇਰਹਿਮ ਹੁੰਦਾ ਹੈ।.
ਇੱਕ ਡਿਟੈਕਟਰ ਸਕੋਰ ਨੂੰ ਇਸ ਤਰ੍ਹਾਂ ਮੰਨਿਆ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ:
-
ਸਮੋਕ ਅਲਾਰਮ, ਅਦਾਲਤ ਦਾ ਫੈਸਲਾ ਨਹੀਂ 🔥
ਇਹ ਤੁਹਾਨੂੰ "ਸ਼ਾਇਦ ਜਾਂਚ" ਦੱਸਦਾ ਹੈ, "ਕੇਸ ਬੰਦ" ਨਹੀਂ। ( OpenAI ; Turnitin )
10) ਇੱਕ ਵੱਡੇ ਵਾਂਗ ਡਿਟੈਕਟਰ ਸਕੋਰਾਂ ਦੀ ਵਿਆਖਿਆ ਕਿਵੇਂ ਕਰੀਏ 🧠🙂
ਨਤੀਜੇ ਪੜ੍ਹਨ ਦਾ ਇੱਕ ਵਿਹਾਰਕ ਤਰੀਕਾ ਇਹ ਹੈ:
ਜੇਕਰ ਟੂਲ ਇੱਕ ਪ੍ਰਤੀਸ਼ਤ ਦਿੰਦਾ ਹੈ
ਇਸਨੂੰ ਇੱਕ ਮੋਟੇ ਜੋਖਮ ਦੇ ਸੰਕੇਤ ਵਜੋਂ ਸਮਝੋ:
-
0-30%: ਸ਼ਾਇਦ ਮਨੁੱਖੀ ਜਾਂ ਬਹੁਤ ਜ਼ਿਆਦਾ ਸੰਪਾਦਿਤ
-
30-70%: ਅਸਪਸ਼ਟ ਜ਼ੋਨ - ਕੁਝ ਵੀ ਨਾ ਮੰਨੋ
-
70-100% : AI ਵਰਗੇ ਪੈਟਰਨ ਦੀ ਜ਼ਿਆਦਾ ਸੰਭਾਵਨਾ ਹੈ, ਪਰ ਫਿਰ ਵੀ ਸਬੂਤ ਨਹੀਂ ਹੈ ( ਟਰਨਿਟਿਨ ਗਾਈਡਜ਼ )
ਉੱਚ ਸਕੋਰ ਵੀ ਗਲਤ ਹੋ ਸਕਦੇ ਹਨ, ਖਾਸ ਕਰਕੇ ਇਹਨਾਂ ਲਈ:
-
ਮਿਆਰੀ ਲਿਖਤ
-
ਕੁਝ ਸ਼ੈਲੀਆਂ (ਸਾਰਾਂਸ਼, ਪਰਿਭਾਸ਼ਾਵਾਂ)
-
ESL ਲਿਖਣਾ ( ਲਿਆਂਗ ਅਤੇ ਹੋਰ (arXiv) )
ਸਿਰਫ਼ ਅੰਕੜੇ ਹੀ ਨਹੀਂ, ਸਗੋਂ ਵਿਆਖਿਆਵਾਂ ਦੀ ਭਾਲ ਕਰੋ
ਬਿਹਤਰ ਡਿਟੈਕਟਰ ਪ੍ਰਦਾਨ ਕਰਦੇ ਹਨ:
-
ਹਾਈਲਾਈਟ ਕੀਤੇ ਸਪੈਨ
-
ਫੀਚਰ ਨੋਟਸ (ਭਵਿੱਖਬਾਣੀ, ਦੁਹਰਾਓ, ਆਦਿ)
-
ਵਿਸ਼ਵਾਸ ਅੰਤਰਾਲ ਜਾਂ ਅਨਿਸ਼ਚਿਤਤਾ ਭਾਸ਼ਾ ( LLM-ਜਨਰੇਟਿਡ ਟੈਕਸਟ ਡਿਟੈਕਸ਼ਨ 'ਤੇ ਇੱਕ ਸਰਵੇਖਣ )
ਜੇਕਰ ਕੋਈ ਔਜ਼ਾਰ ਕੁਝ ਵੀ ਸਮਝਾਉਣ ਤੋਂ ਇਨਕਾਰ ਕਰਦਾ ਹੈ ਅਤੇ ਤੁਹਾਡੇ ਮੱਥੇ 'ਤੇ ਇੱਕ ਨੰਬਰ ਮਾਰਦਾ ਹੈ... ਤਾਂ ਮੈਨੂੰ ਇਸ 'ਤੇ ਭਰੋਸਾ ਨਹੀਂ ਹੈ। ਤੁਹਾਨੂੰ ਵੀ ਨਹੀਂ ਕਰਨਾ ਚਾਹੀਦਾ।.
11) ਏਆਈ ਡਿਟੈਕਟਰ ਕਿਵੇਂ ਕੰਮ ਕਰਦੇ ਹਨ: ਇੱਕ ਸਧਾਰਨ ਮਾਨਸਿਕ ਮਾਡਲ 🧠🧩
ਜੇਕਰ ਤੁਸੀਂ ਇੱਕ ਸਾਫ਼-ਸੁਥਰਾ ਟੇਕਅਵੇਅ ਚਾਹੁੰਦੇ ਹੋ, ਤਾਂ ਇਸ ਮਾਨਸਿਕ ਮਾਡਲ ਦੀ ਵਰਤੋਂ ਕਰੋ:
-
ਏਆਈ ਡਿਟੈਕਟਰ ਮਸ਼ੀਨ ਦੁਆਰਾ ਤਿਆਰ ਕੀਤੇ ਟੈਕਸਟ ਵਿੱਚ ਆਮ ਅੰਕੜਾਤਮਕ ਅਤੇ ਸ਼ੈਲੀਗਤ ਪੈਟਰਨਾਂ ਐਲਐਲਐਮ-ਜਨਰੇਟ ਕੀਤੇ ਟੈਕਸਟ ਡਿਟੈਕਸ਼ਨ 'ਤੇ ਇੱਕ ਸਰਵੇਖਣ )
-
ਉਹ ਉਹਨਾਂ ਪੈਟਰਨਾਂ ਦੀ ਤੁਲਨਾ ਸਿਖਲਾਈ ਉਦਾਹਰਣਾਂ ਤੋਂ ਸਿੱਖੀਆਂ ਗਈਆਂ ਗੱਲਾਂ ਨਾਲ ਕਰਦੇ ਹਨ। ( ਐਲਐਲਐਮ-ਜਨਰੇਟਿਡ ਟੈਕਸਟ ਡਿਟੈਕਸ਼ਨ 'ਤੇ ਇੱਕ ਸਰਵੇਖਣ )
-
ਉਹ ਇੱਕ ਸੰਭਾਵਨਾ ਵਰਗਾ ਅਨੁਮਾਨ , ਨਾ ਕਿ ਇੱਕ ਅਸਲ ਮੂਲ ਕਹਾਣੀ। ( OpenAI )
-
ਅੰਦਾਜ਼ਾ ਸ਼ੈਲੀ, ਵਿਸ਼ਾ, ਲੰਬਾਈ, ਸੰਪਾਦਨਾਂ, ਅਤੇ ਡਿਟੈਕਟਰ ਦੇ ਸਿਖਲਾਈ ਡੇਟਾ । ( ਐਲਐਲਐਮ-ਜਨਰੇਟਿਡ ਟੈਕਸਟ ਡਿਟੈਕਸ਼ਨ 'ਤੇ ਇੱਕ ਸਰਵੇਖਣ )
ਦੂਜੇ ਸ਼ਬਦਾਂ ਵਿੱਚ, ਏਆਈ ਡਿਟੈਕਟਰ ਕਿਵੇਂ ਕੰਮ ਕਰਦੇ ਹਨ ਇਹ ਹੈ ਕਿ ਉਹ "ਸਮਾਨਤਾ ਦਾ ਨਿਰਣਾ ਕਰਦੇ ਹਨ," ਲੇਖਕਤਾ ਨਹੀਂ। ਜਿਵੇਂ ਕਿ ਇਹ ਕਹਿਣਾ ਕਿ ਕੋਈ ਆਪਣੇ ਚਚੇਰੇ ਭਰਾ ਵਰਗਾ ਦਿਖਦਾ ਹੈ। ਇਹ ਡੀਐਨਏ ਟੈਸਟ ਵਰਗਾ ਨਹੀਂ ਹੈ... ਅਤੇ ਡੀਐਨਏ ਟੈਸਟਾਂ ਵਿੱਚ ਵੀ ਕੁਝ ਖਾਸ ਮਾਮਲੇ ਹੁੰਦੇ ਹਨ।
12) ਦੁਰਘਟਨਾ ਵਾਲੇ ਝੰਡਿਆਂ ਨੂੰ ਘਟਾਉਣ ਲਈ ਵਿਹਾਰਕ ਸੁਝਾਅ (ਗੇਮਾਂ ਖੇਡੇ ਬਿਨਾਂ) ✍️✅
"ਡਿਟੈਕਟਰਾਂ ਨੂੰ ਕਿਵੇਂ ਧੋਖਾ ਦੇਣਾ ਹੈ" ਨਹੀਂ। ਇਹ ਇਸ ਤਰ੍ਹਾਂ ਹੈ ਜਿਵੇਂ ਕਿ ਇਸ ਤਰੀਕੇ ਨਾਲ ਕਿਵੇਂ ਲਿਖਣਾ ਹੈ ਜੋ ਅਸਲ ਲੇਖਕਤਾ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ ਅਤੇ ਅਜੀਬ ਗਲਤ ਪੜ੍ਹਨ ਤੋਂ ਬਚਦਾ ਹੈ।.
-
ਠੋਸ ਵੇਰਵੇ ਸ਼ਾਮਲ ਕਰੋ: ਉਹਨਾਂ ਸੰਕਲਪਾਂ ਦੇ ਨਾਮ ਜੋ ਤੁਸੀਂ ਅਸਲ ਵਿੱਚ ਵਰਤੇ ਸਨ, ਤੁਹਾਡੇ ਦੁਆਰਾ ਚੁੱਕੇ ਗਏ ਕਦਮ, ਤੁਹਾਡੇ ਦੁਆਰਾ ਵਿਚਾਰੇ ਗਏ ਬਦਲਾਓ
-
ਕੁਦਰਤੀ ਭਿੰਨਤਾ ਦੀ ਵਰਤੋਂ ਕਰੋ: ਛੋਟੇ ਅਤੇ ਲੰਬੇ ਵਾਕਾਂ ਨੂੰ ਮਿਲਾਓ (ਜਿਵੇਂ ਕਿ ਮਨੁੱਖ ਸੋਚਦੇ ਸਮੇਂ ਕਰਦੇ ਹਨ)
-
ਅਸਲ ਪਾਬੰਦੀਆਂ ਸ਼ਾਮਲ ਕਰੋ: ਸਮਾਂ ਸੀਮਾਵਾਂ, ਵਰਤੇ ਗਏ ਔਜ਼ਾਰ, ਕੀ ਗਲਤ ਹੋਇਆ, ਤੁਸੀਂ ਵੱਖਰੇ ਢੰਗ ਨਾਲ ਕੀ ਕਰੋਗੇ
-
ਟੈਂਪਲੇਟ ਸ਼ਬਦਾਂ ਦੀ ਜ਼ਿਆਦਾ ਵਰਤੋਂ ਤੋਂ ਬਚੋ: "ਇਸ ਤੋਂ ਇਲਾਵਾ" ਨੂੰ ਉਸ ਚੀਜ਼ ਨਾਲ ਬਦਲੋ ਜੋ ਤੁਸੀਂ ਅਸਲ ਵਿੱਚ ਕਹਿਣਾ ਚਾਹੁੰਦੇ ਹੋ।
-
ਡਰਾਫਟ ਅਤੇ ਨੋਟਸ ਰੱਖੋ: ਜੇਕਰ ਕਦੇ ਕੋਈ ਵਿਵਾਦ ਹੁੰਦਾ ਹੈ, ਤਾਂ ਪ੍ਰਕਿਰਿਆ ਸਬੂਤ ਦਿਲ ਦੀ ਭਾਵਨਾ ਨਾਲੋਂ ਜ਼ਿਆਦਾ ਮਾਇਨੇ ਰੱਖਦੇ ਹਨ।
ਸੱਚ ਵਿੱਚ, ਸਭ ਤੋਂ ਵਧੀਆ ਬਚਾਅ ਸਿਰਫ਼... ਸੱਚਾ ਹੋਣਾ ਹੈ। ਅਪੂਰਣ ਤੌਰ 'ਤੇ ਸੱਚਾ, "ਸੰਪੂਰਨ ਬਰੋਸ਼ਰ" ਸੱਚਾ ਨਹੀਂ।.
ਸਮਾਪਤੀ ਨੋਟਸ 🧠✨
ਏਆਈ ਡਿਟੈਕਟਰ ਕੀਮਤੀ ਹੋ ਸਕਦੇ ਹਨ, ਪਰ ਉਹ ਸੱਚਾਈ ਵਾਲੀਆਂ ਮਸ਼ੀਨਾਂ ਨਹੀਂ ਹਨ। ਉਹ ਪੈਟਰਨ ਮੈਚਰ ਹਨ ਜੋ ਅਪੂਰਣ ਡੇਟਾ 'ਤੇ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਹਨ, ਇੱਕ ਅਜਿਹੀ ਦੁਨੀਆਂ ਵਿੱਚ ਕੰਮ ਕਰਦੇ ਹਨ ਜਿੱਥੇ ਲਿਖਣ ਦੀਆਂ ਸ਼ੈਲੀਆਂ ਲਗਾਤਾਰ ਓਵਰਲੈਪ ਹੁੰਦੀਆਂ ਹਨ। ( ਓਪਨਏਆਈ ; ਐਲਐਲਐਮ-ਜਨਰੇਟਿਡ ਟੈਕਸਟ ਡਿਟੈਕਸ਼ਨ 'ਤੇ ਇੱਕ ਸਰਵੇਖਣ )
ਸੰਖੇਪ ਵਿੱਚ:
-
ਡਿਟੈਕਟਰ ਵਰਗੀਕਰਣ, ਉਲਝਣ/ਫਟਣ, ਸਟਾਈਲੋਮੈਟਰੀ, ਅਤੇ ਕਈ ਵਾਰ ਵਾਟਰਮਾਰਕਸ 'ਤੇ ਨਿਰਭਰ ਕਰਦੇ ਹਨ 🧩 ( LLM-ਜਨਰੇਟਿਡ ਟੈਕਸਟ ਡਿਟੈਕਸ਼ਨ 'ਤੇ ਇੱਕ ਸਰਵੇਖਣ )
-
ਉਹ "AI-ਸਮਾਨਤਾ" ਦਾ ਅੰਦਾਜ਼ਾ ਲਗਾਉਂਦੇ ਹਨ, ਨਿਸ਼ਚਤਤਾ ਨਹੀਂ ( OpenAI )
-
ਰਸਮੀ, ਤਕਨੀਕੀ, ਜਾਂ ਗੈਰ-ਮੂਲ ਲਿਖਤਾਂ ਵਿੱਚ ਗਲਤ ਸਕਾਰਾਤਮਕ ਬਹੁਤ ਜ਼ਿਆਦਾ ਹੁੰਦੇ ਹਨ 😬 ( ਲਿਆਂਗ ਅਤੇ ਹੋਰ (arXiv) ; ਟਰਨਿਟਿਨ )
-
ਡਿਟੈਕਟਰ ਨਤੀਜਿਆਂ ਨੂੰ ਸਮੀਖਿਆ ਲਈ ਇੱਕ ਪ੍ਰੋਂਪਟ ਵਜੋਂ ਵਰਤੋ, ਫੈਸਲੇ ਵਜੋਂ ਨਹੀਂ ( ਟਰਨਿਟਿਨ )
ਅਤੇ ਹਾਂ... ਜੇਕਰ ਕੋਈ ਦੁਬਾਰਾ ਪੁੱਛੇ, AI ਡਿਟੈਕਟਰ ਕਿਵੇਂ ਕੰਮ ਕਰਦੇ ਹਨ , ਤਾਂ ਤੁਸੀਂ ਉਨ੍ਹਾਂ ਨੂੰ ਦੱਸ ਸਕਦੇ ਹੋ: "ਉਹ ਪੈਟਰਨਾਂ ਦੇ ਆਧਾਰ 'ਤੇ ਅਨੁਮਾਨ ਲਗਾਉਂਦੇ ਹਨ - ਕਈ ਵਾਰ ਸਮਾਰਟ, ਕਈ ਵਾਰ ਮੂਰਖ, ਹਮੇਸ਼ਾ ਸੀਮਤ।" 🤖
ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ
AI ਡਿਟੈਕਟਰ ਅਭਿਆਸ ਵਿੱਚ ਕਿਵੇਂ ਕੰਮ ਕਰਦੇ ਹਨ?
ਜ਼ਿਆਦਾਤਰ AI ਡਿਟੈਕਟਰ ਲੇਖਕਤਾ ਨੂੰ "ਸਾਬਤ" ਨਹੀਂ ਕਰਦੇ। ਉਹ ਅੰਦਾਜ਼ਾ ਲਗਾਉਂਦੇ ਹਨ ਕਿ ਤੁਹਾਡਾ ਟੈਕਸਟ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਦੁਆਰਾ ਆਮ ਤੌਰ 'ਤੇ ਤਿਆਰ ਕੀਤੇ ਗਏ ਪੈਟਰਨਾਂ ਨਾਲ ਕਿੰਨਾ ਮਿਲਦਾ-ਜੁਲਦਾ ਹੈ, ਫਿਰ ਇੱਕ ਸੰਭਾਵਨਾ-ਵਰਗੇ ਸਕੋਰ ਨੂੰ ਆਉਟਪੁੱਟ ਕਰਦੇ ਹਨ। ਹੁੱਡ ਦੇ ਹੇਠਾਂ, ਉਹ ਵਰਗੀਕਰਣ ਮਾਡਲ, ਪੇਚੀਦਗੀ-ਸ਼ੈਲੀ ਦੀ ਭਵਿੱਖਬਾਣੀ ਸਕੋਰਿੰਗ, ਸਟਾਈਲੋਮੈਟਰੀ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ, ਜਾਂ ਵਾਟਰਮਾਰਕ ਜਾਂਚਾਂ ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦੇ ਹਨ। ਨਤੀਜੇ ਨੂੰ ਇੱਕ ਜੋਖਮ ਸੰਕੇਤ ਵਜੋਂ ਸਭ ਤੋਂ ਵਧੀਆ ਮੰਨਿਆ ਜਾਂਦਾ ਹੈ, ਇੱਕ ਨਿਸ਼ਚਿਤ ਫੈਸਲਾ ਨਹੀਂ।.
AI ਡਿਟੈਕਟਰ ਲਿਖਤੀ ਰੂਪ ਵਿੱਚ ਕਿਹੜੇ ਸਿਗਨਲਾਂ ਦੀ ਭਾਲ ਕਰਦੇ ਹਨ?
ਆਮ ਸੰਕੇਤਾਂ ਵਿੱਚ ਭਵਿੱਖਬਾਣੀਯੋਗਤਾ (ਇੱਕ ਮਾਡਲ ਤੁਹਾਡੇ ਅਗਲੇ ਸ਼ਬਦਾਂ ਤੋਂ ਕਿੰਨਾ "ਹੈਰਾਨ" ਹੁੰਦਾ ਹੈ), ਵਾਕ ਸਕੈਫੋਲਡ ਵਿੱਚ ਦੁਹਰਾਓ, ਅਸਧਾਰਨ ਤੌਰ 'ਤੇ ਇਕਸਾਰ ਰਫ਼ਤਾਰ, ਅਤੇ ਘੱਟ ਠੋਸ ਵੇਰਵੇ ਦੇ ਨਾਲ ਆਮ ਵਾਕਾਂਸ਼ ਸ਼ਾਮਲ ਹਨ। ਕੁਝ ਟੂਲ ਵਾਕ ਦੀ ਲੰਬਾਈ, ਵਿਰਾਮ ਚਿੰਨ੍ਹ ਆਦਤਾਂ, ਅਤੇ ਫੰਕਸ਼ਨ-ਸ਼ਬਦ ਬਾਰੰਬਾਰਤਾ ਵਰਗੇ ਸਟਾਈਲੋਮੈਟਰੀ ਮਾਰਕਰਾਂ ਦੀ ਵੀ ਜਾਂਚ ਕਰਦੇ ਹਨ। ਇਹ ਸੰਕੇਤ ਮਨੁੱਖੀ ਲਿਖਤ ਨਾਲ ਓਵਰਲੈਪ ਕਰ ਸਕਦੇ ਹਨ, ਖਾਸ ਕਰਕੇ ਰਸਮੀ, ਅਕਾਦਮਿਕ, ਜਾਂ ਤਕਨੀਕੀ ਸ਼ੈਲੀਆਂ ਵਿੱਚ।.
ਏਆਈ ਡਿਟੈਕਟਰ ਮਨੁੱਖੀ ਲਿਖਤ ਨੂੰ ਏਆਈ ਵਜੋਂ ਕਿਉਂ ਦਰਸਾਉਂਦੇ ਹਨ?
ਗਲਤ ਸਕਾਰਾਤਮਕ ਉਦੋਂ ਹੁੰਦੇ ਹਨ ਜਦੋਂ ਮਨੁੱਖੀ ਲਿਖਤ ਅੰਕੜਾਤਮਕ ਤੌਰ 'ਤੇ "ਨਿਰਵਿਘਨ" ਜਾਂ ਟੈਂਪਲੇਟ ਵਰਗੀ ਦਿਖਾਈ ਦਿੰਦੀ ਹੈ। ਰਸਮੀ ਸੁਰ, ਪਾਲਣਾ-ਸ਼ੈਲੀ ਦੀ ਸ਼ਬਦਾਵਲੀ, ਤਕਨੀਕੀ ਵਿਆਖਿਆਵਾਂ, ਛੋਟੇ ਨਮੂਨੇ, ਅਤੇ ਗੈਰ-ਮੂਲ ਅੰਗਰੇਜ਼ੀ ਸਭ ਨੂੰ AI-ਵਰਗੇ ਵਜੋਂ ਗਲਤ ਪੜ੍ਹਿਆ ਜਾ ਸਕਦਾ ਹੈ ਕਿਉਂਕਿ ਇਹ ਭਿੰਨਤਾ ਨੂੰ ਘਟਾਉਂਦੇ ਹਨ। ਇਸੇ ਲਈ ਇੱਕ ਸਾਫ਼, ਚੰਗੀ ਤਰ੍ਹਾਂ ਸੰਪਾਦਿਤ ਪੈਰਾਗ੍ਰਾਫ ਉੱਚ ਸਕੋਰ ਨੂੰ ਚਾਲੂ ਕਰ ਸਕਦਾ ਹੈ। ਇੱਕ ਡਿਟੈਕਟਰ ਸਮਾਨਤਾ ਦੀ ਤੁਲਨਾ ਕਰ ਰਿਹਾ ਹੈ, ਮੂਲ ਦੀ ਪੁਸ਼ਟੀ ਨਹੀਂ ਕਰ ਰਿਹਾ ਹੈ।.
ਕੀ ਉਲਝਣ ਅਤੇ "ਫਟਣ" ਵਾਲੇ ਡਿਟੈਕਟਰ ਭਰੋਸੇਯੋਗ ਹਨ?
ਉਲਝਣ-ਅਧਾਰਿਤ ਤਰੀਕੇ ਉਦੋਂ ਕੰਮ ਕਰ ਸਕਦੇ ਹਨ ਜਦੋਂ ਟੈਕਸਟ ਕੱਚਾ ਹੋਵੇ, ਬਹੁਤ ਜ਼ਿਆਦਾ ਅਨੁਮਾਨਯੋਗ AI ਆਉਟਪੁੱਟ। ਪਰ ਉਹ ਨਾਜ਼ੁਕ ਹੁੰਦੇ ਹਨ: ਛੋਟੇ ਪੈਰੇ ਸ਼ੋਰ-ਸ਼ਰਾਬੇ ਵਾਲੇ ਹੁੰਦੇ ਹਨ, ਅਤੇ ਬਹੁਤ ਸਾਰੀਆਂ ਜਾਇਜ਼ ਮਨੁੱਖੀ ਸ਼ੈਲੀਆਂ ਕੁਦਰਤੀ ਤੌਰ 'ਤੇ ਅਨੁਮਾਨਯੋਗ ਹੁੰਦੀਆਂ ਹਨ (ਸਾਰਾਂਸ਼, ਪਰਿਭਾਸ਼ਾਵਾਂ, ਕਾਰਪੋਰੇਟ ਈਮੇਲਾਂ, ਮੈਨੂਅਲ)। ਸੰਪਾਦਨ ਅਤੇ ਪਾਲਿਸ਼ ਕਰਨ ਨਾਲ ਵੀ ਸਕੋਰ ਨਾਟਕੀ ਢੰਗ ਨਾਲ ਬਦਲ ਸਕਦਾ ਹੈ। ਇਹ ਔਜ਼ਾਰ ਤੇਜ਼ ਟ੍ਰਾਈਏਜ ਵਿੱਚ ਫਿੱਟ ਹੁੰਦੇ ਹਨ, ਨਾ ਕਿ ਆਪਣੇ ਆਪ ਵਿੱਚ ਉੱਚ-ਦਾਅ ਵਾਲੇ ਫੈਸਲਿਆਂ ਵਿੱਚ।.
ਵਰਗੀਕਰਣ ਡਿਟੈਕਟਰਾਂ ਅਤੇ ਸਟਾਈਲੋਮੈਟਰੀ ਟੂਲਸ ਵਿੱਚ ਕੀ ਅੰਤਰ ਹੈ?
ਵਰਗੀਕ੍ਰਿਤ ਖੋਜਕਰਤਾ ਮਨੁੱਖੀ ਬਨਾਮ AI (ਅਤੇ ਕਈ ਵਾਰ ਹਾਈਬ੍ਰਿਡ) ਟੈਕਸਟ ਦੇ ਲੇਬਲ ਕੀਤੇ ਡੇਟਾਸੈੱਟਾਂ ਤੋਂ ਸਿੱਖਦੇ ਹਨ ਅਤੇ ਭਵਿੱਖਬਾਣੀ ਕਰਦੇ ਹਨ ਕਿ ਤੁਹਾਡਾ ਟੈਕਸਟ ਕਿਸ ਬਕੇਟ ਨਾਲ ਸਭ ਤੋਂ ਵੱਧ ਮਿਲਦਾ-ਜੁਲਦਾ ਹੈ। ਸਟਾਈਲੋਮੈਟਰੀ ਟੂਲ ਸ਼ਬਦ-ਚੋਣ ਪੈਟਰਨ, ਫੰਕਸ਼ਨ ਸ਼ਬਦ, ਅਤੇ ਪੜ੍ਹਨਯੋਗਤਾ ਸਿਗਨਲ ਵਰਗੇ "ਫਿੰਗਰਪ੍ਰਿੰਟ" ਲਿਖਣ 'ਤੇ ਕੇਂਦ੍ਰਤ ਕਰਦੇ ਹਨ, ਜੋ ਲੰਬੇ-ਫਾਰਮ ਵਿਸ਼ਲੇਸ਼ਣ ਵਿੱਚ ਵਧੇਰੇ ਜਾਣਕਾਰੀ ਭਰਪੂਰ ਹੋ ਸਕਦੇ ਹਨ। ਦੋਵੇਂ ਪਹੁੰਚ ਡੋਮੇਨ ਸ਼ਿਫਟ ਤੋਂ ਪੀੜਤ ਹਨ ਅਤੇ ਜਦੋਂ ਲਿਖਣ ਸ਼ੈਲੀ ਜਾਂ ਵਿਸ਼ਾ ਉਨ੍ਹਾਂ ਦੇ ਸਿਖਲਾਈ ਡੇਟਾ ਤੋਂ ਵੱਖਰਾ ਹੁੰਦਾ ਹੈ ਤਾਂ ਸੰਘਰਸ਼ ਕਰ ਸਕਦੇ ਹਨ।.
ਕੀ ਵਾਟਰਮਾਰਕ AI ਖੋਜ ਨੂੰ ਹਮੇਸ਼ਾ ਲਈ ਹੱਲ ਕਰਦੇ ਹਨ?
ਵਾਟਰਮਾਰਕ ਉਦੋਂ ਮਜ਼ਬੂਤ ਹੋ ਸਕਦੇ ਹਨ ਜਦੋਂ ਕੋਈ ਮਾਡਲ ਉਹਨਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ ਅਤੇ ਡਿਟੈਕਟਰ ਵਾਟਰਮਾਰਕ ਸਕੀਮ ਨੂੰ ਜਾਣਦਾ ਹੈ। ਅਸਲੀਅਤ ਵਿੱਚ, ਸਾਰੇ ਪ੍ਰਦਾਤਾ ਵਾਟਰਮਾਰਕ ਨਹੀਂ ਹੁੰਦੇ, ਅਤੇ ਆਮ ਪਰਿਵਰਤਨ - ਪੈਰਾਫ੍ਰੇਸਿੰਗ, ਅਨੁਵਾਦ, ਅੰਸ਼ਕ ਹਵਾਲਾ, ਜਾਂ ਸਰੋਤਾਂ ਨੂੰ ਮਿਲਾਉਣਾ - ਪੈਟਰਨ ਨੂੰ ਕਮਜ਼ੋਰ ਜਾਂ ਤੋੜ ਸਕਦੇ ਹਨ। ਵਾਟਰਮਾਰਕ ਖੋਜ ਸੰਕੁਚਿਤ ਮਾਮਲਿਆਂ ਵਿੱਚ ਸ਼ਕਤੀਸ਼ਾਲੀ ਹੁੰਦੀ ਹੈ ਜਿੱਥੇ ਪੂਰੀ ਚੇਨ ਲਾਈਨਾਂ ਵਿੱਚ ਹੁੰਦੀ ਹੈ, ਪਰ ਇਹ ਯੂਨੀਵਰਸਲ ਕਵਰੇਜ ਨਹੀਂ ਹੈ।.
ਮੈਨੂੰ "X% AI" ਸਕੋਰ ਦੀ ਵਿਆਖਿਆ ਕਿਵੇਂ ਕਰਨੀ ਚਾਹੀਦੀ ਹੈ?
ਇੱਕ ਪ੍ਰਤੀਸ਼ਤ ਨੂੰ "AI-ਸਮਾਨਤਾ" ਦੇ ਮੋਟੇ ਸੂਚਕ ਵਜੋਂ ਮੰਨੋ, AI ਲੇਖਕਤਾ ਦੇ ਸਬੂਤ ਵਜੋਂ ਨਹੀਂ। ਮੱਧ-ਰੇਂਜ ਦੇ ਸਕੋਰ ਖਾਸ ਤੌਰ 'ਤੇ ਅਸਪਸ਼ਟ ਹੁੰਦੇ ਹਨ, ਅਤੇ ਇੱਥੋਂ ਤੱਕ ਕਿ ਉੱਚ ਸਕੋਰ ਵੀ ਮਿਆਰੀ ਜਾਂ ਰਸਮੀ ਲਿਖਤ ਵਿੱਚ ਗਲਤ ਹੋ ਸਕਦੇ ਹਨ। ਬਿਹਤਰ ਟੂਲ ਹਾਈਲਾਈਟ ਕੀਤੇ ਸਪੈਨ, ਵਿਸ਼ੇਸ਼ਤਾ ਨੋਟਸ ਅਤੇ ਅਨਿਸ਼ਚਿਤਤਾ ਭਾਸ਼ਾ ਵਰਗੇ ਸਪੱਸ਼ਟੀਕਰਨ ਪ੍ਰਦਾਨ ਕਰਦੇ ਹਨ। ਜੇਕਰ ਕੋਈ ਡਿਟੈਕਟਰ ਆਪਣੇ ਆਪ ਨੂੰ ਨਹੀਂ ਸਮਝਾਉਂਦਾ, ਤਾਂ ਸੰਖਿਆ ਨੂੰ ਅਧਿਕਾਰਤ ਨਾ ਸਮਝੋ।.
ਸਕੂਲਾਂ ਜਾਂ ਸੰਪਾਦਕੀ ਵਰਕਫਲੋ ਲਈ ਇੱਕ ਚੰਗਾ AI ਡਿਟੈਕਟਰ ਕੀ ਬਣਾਉਂਦਾ ਹੈ?
ਇੱਕ ਠੋਸ ਡਿਟੈਕਟਰ ਕੈਲੀਬਰੇਟ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਗਲਤ ਸਕਾਰਾਤਮਕਤਾਵਾਂ ਨੂੰ ਘੱਟ ਕਰਦਾ ਹੈ, ਅਤੇ ਸੀਮਾਵਾਂ ਨੂੰ ਸਪਸ਼ਟ ਤੌਰ 'ਤੇ ਸੰਚਾਰਿਤ ਕਰਦਾ ਹੈ। ਇਸਨੂੰ ਛੋਟੇ ਨਮੂਨਿਆਂ 'ਤੇ ਬਹੁਤ ਜ਼ਿਆਦਾ ਆਤਮਵਿਸ਼ਵਾਸੀ ਦਾਅਵਿਆਂ ਤੋਂ ਬਚਣਾ ਚਾਹੀਦਾ ਹੈ, ਵੱਖ-ਵੱਖ ਡੋਮੇਨਾਂ (ਅਕਾਦਮਿਕ ਬਨਾਮ ਬਲੌਗ ਬਨਾਮ ਤਕਨੀਕੀ) ਨੂੰ ਸੰਭਾਲਣਾ ਚਾਹੀਦਾ ਹੈ, ਅਤੇ ਜਦੋਂ ਮਨੁੱਖ ਟੈਕਸਟ ਨੂੰ ਸੋਧਦੇ ਹਨ ਤਾਂ ਸਥਿਰ ਰਹਿਣਾ ਚਾਹੀਦਾ ਹੈ। ਸਭ ਤੋਂ ਜ਼ਿੰਮੇਵਾਰ ਔਜ਼ਾਰ ਨਿਮਰਤਾ ਨਾਲ ਵਿਵਹਾਰ ਕਰਦੇ ਹਨ: ਉਹ ਦਿਮਾਗੀ ਪਾਠਕਾਂ ਵਾਂਗ ਕੰਮ ਕਰਨ ਦੀ ਬਜਾਏ ਸਬੂਤ ਅਤੇ ਅਨਿਸ਼ਚਿਤਤਾ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦੇ ਹਨ।.
ਮੈਂ ਸਿਸਟਮ ਨੂੰ "ਗੇਮ" ਕੀਤੇ ਬਿਨਾਂ ਦੁਰਘਟਨਾ ਵਾਲੇ AI ਫਲੈਗ ਨੂੰ ਕਿਵੇਂ ਘਟਾ ਸਕਦਾ ਹਾਂ?
ਚਾਲਾਂ ਦੀ ਬਜਾਏ ਪ੍ਰਮਾਣਿਕ ਲੇਖਕਤਾ ਸੰਕੇਤਾਂ 'ਤੇ ਧਿਆਨ ਕੇਂਦਰਤ ਕਰੋ। ਠੋਸ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ (ਤੁਹਾਡੇ ਦੁਆਰਾ ਚੁੱਕੇ ਗਏ ਕਦਮ, ਪਾਬੰਦੀਆਂ, ਵਪਾਰ) ਸ਼ਾਮਲ ਕਰੋ, ਵਾਕ ਦੀ ਲੈਅ ਨੂੰ ਕੁਦਰਤੀ ਤੌਰ 'ਤੇ ਬਦਲੋ, ਅਤੇ ਬਹੁਤ ਜ਼ਿਆਦਾ ਟੈਂਪਲੇਟ ਕੀਤੇ ਪਰਿਵਰਤਨ ਤੋਂ ਬਚੋ ਜੋ ਤੁਸੀਂ ਆਮ ਤੌਰ 'ਤੇ ਨਹੀਂ ਵਰਤਦੇ। ਡਰਾਫਟ, ਨੋਟਸ ਅਤੇ ਸੰਸ਼ੋਧਨ ਇਤਿਹਾਸ ਰੱਖੋ - ਪ੍ਰਕਿਰਿਆ ਸਬੂਤ ਅਕਸਰ ਵਿਵਾਦਾਂ ਵਿੱਚ ਇੱਕ ਡਿਟੈਕਟਰ ਸਕੋਰ ਨਾਲੋਂ ਵੱਧ ਮਾਇਨੇ ਰੱਖਦੇ ਹਨ। ਟੀਚਾ ਸ਼ਖਸੀਅਤ ਨਾਲ ਸਪਸ਼ਟਤਾ ਹੈ, ਸੰਪੂਰਨ ਬਰੋਸ਼ਰ ਗਦ ਨਹੀਂ।.
ਹਵਾਲੇ
-
ਐਸੋਸੀਏਸ਼ਨ ਫਾਰ ਕੰਪਿਊਟੇਸ਼ਨਲ ਲਿੰਗੁਇਸਟਿਕਸ (ACL ਐਂਥੋਲੋਜੀ) - LLM-ਜਨਰੇਟਿਡ ਟੈਕਸਟ ਡਿਟੈਕਸ਼ਨ 'ਤੇ ਇੱਕ ਸਰਵੇਖਣ - aclanthology.org
-
ਓਪਨਏਆਈ - ਏਆਈ-ਲਿਖਤ ਟੈਕਸਟ ਨੂੰ ਦਰਸਾਉਣ ਲਈ ਨਵਾਂ ਏਆਈ ਵਰਗੀਕਰਣ - openai.com
-
ਟਰਨੀਟਿਨ ਗਾਈਡਾਂ - ਕਲਾਸਿਕ ਰਿਪੋਰਟ ਵਿਊ ਵਿੱਚ AI ਲਿਖਣ ਦੀ ਖੋਜ - guides.turnitin.com
-
ਟਰਨੀਟਿਨ ਗਾਈਡਾਂ - ਏਆਈ ਲਿਖਣ ਦਾ ਪਤਾ ਲਗਾਉਣ ਵਾਲਾ ਮਾਡਲ - guides.turnitin.com
-
ਟਰਨਿਟਿਨ - ਸਾਡੀਆਂ AI ਲਿਖਣ ਖੋਜ ਸਮਰੱਥਾਵਾਂ ਦੇ ਅੰਦਰ ਗਲਤ ਸਕਾਰਾਤਮਕਤਾਵਾਂ ਨੂੰ ਸਮਝਣਾ - turnitin.com
-
arXiv - ਡਿਟੈਕਟਜੀਪੀਟੀ - arxiv.org
-
ਬੋਸਟਨ ਯੂਨੀਵਰਸਿਟੀ - ਉਲਝਣ ਵਾਲੀਆਂ ਪੋਸਟਾਂ - cs.bu.edu
-
GPTZero - ਉਲਝਣ ਅਤੇ ਫਟਣ: ਇਹ ਕੀ ਹੈ? - gptzero.me
-
ਪਬਮੇਡ ਸੈਂਟਰਲ (NCBI) - ਸਟਾਈਲੋਮੈਟਰੀ ਅਤੇ ਫੋਰੈਂਸਿਕ ਵਿਗਿਆਨ: ਇੱਕ ਸਾਹਿਤ ਸਮੀਖਿਆ - ncbi.nlm.nih.gov
-
ਕੰਪਿਊਟੇਸ਼ਨਲ ਭਾਸ਼ਾ ਵਿਗਿਆਨ ਲਈ ਐਸੋਸੀਏਸ਼ਨ (ACL ਸੰਗ੍ਰਹਿ) - ਲੇਖਕ ਵਿਸ਼ੇਸ਼ਤਾ ਵਿੱਚ ਫੰਕਸ਼ਨ ਸ਼ਬਦ - aclanthology.org
-
arXiv - ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਲਈ ਇੱਕ ਵਾਟਰਮਾਰਕ - arxiv.org
-
ਡਿਵੈਲਪਰਾਂ ਲਈ ਗੂਗਲ ਏਆਈ - ਸਿੰਥਆਈਡੀ ਟੈਕਸਟ - ai.google.dev
-
arXiv - ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਲਈ ਵਾਟਰਮਾਰਕਸ ਦੀ ਭਰੋਸੇਯੋਗਤਾ 'ਤੇ - arxiv.org
-
ਓਪਨਏਆਈ - ਅਸੀਂ ਜੋ ਦੇਖਦੇ ਅਤੇ ਸੁਣਦੇ ਹਾਂ ਉਸ ਦੇ ਸਰੋਤ ਨੂੰ ਸਮਝਣਾ - openai.com
-
ਸਟੈਨਫੋਰਡ ਐੱਚਏਆਈ - ਏਆਈ ਡਿਟੈਕਟਰ ਗੈਰ-ਮੂਲ ਅੰਗਰੇਜ਼ੀ ਲੇਖਕਾਂ ਵਿਰੁੱਧ ਪੱਖਪਾਤੀ - hai.stanford.edu
-
arXiv - ਲਿਆਂਗ ਅਤੇ ਹੋਰ - arxiv.org