هل لاحظت كيف أصبحت أصوات الروبوتات مُتشابهة؟ 🤖 صوت سيري، أليكسا، وجيميني بات عتيقًا، وذلك بفضل الذكاء الاصطناعي الذي يُقلِّد الكلام البشري بدقة، بما في ذلك اللهجات الإقليمية. 🗣️ أصبح بإمكان الذكاء الاصطناعي الآن نسخ صوتك في بضع ثوانٍ! 😲
هل تعلم أن الذكاء الاصطناعي سيحل محل البشر في بعض المجالات؟ دعم العملاء الآلي سيُوفر المال، وسيُجري وكلاء الذكاء الاصطناعي المكالمات نيابةً عنا بلغة طبيعية. هذا سيصبح شائعًا قريبًا. 📞
ولكن، هناك فرق جوهري بين التحدث مع إنسان وصديق، وبين التحدث مع روبوت. هل نستطيع الوثوق بالذكاء الاصطناعي؟ 🤔 الذكاء الاصطناعي هو أداة، وقد يُستخدم لأغراض سيئة. يجب أن نتمكن من تمييز الروبوت عن البشر. 🤖
لا نستطيع تسمية الكلام المُولَّد بالذكاء الاصطناعي. 🤨 لذلك، نحتاج إلى طريقة للتعرف على الروبوت، بغض النظر عن الوسيلة المستخدمة، سواءً كانت طويلة أو قصيرة، وبأي لغة أو سياق ثقافي. لا نريد تقييد تعقيد النظام أو تعقيد اللغة. 🤔
إليك اقتراحًا بسيطًا: يجب على جميع الروبوتات والذكاء الاصطناعي المُتحدث استخدام مُعدّل حلقيّ. 🔄 في منتصف القرن العشرين، استُخدمت مُعدّلات الحلقة لجعل أصوات الممثلين تبدو آلية. الآن، يمكننا استخدام نفس التكنولوجيا لجعل الكلام الآلي يبدو آليًا، مميزًا عن الصوت البشري. 🎤
يُعد مُعدّل الحلقة مُتعدّد المزايا: بسيط من الناحية الحسابية، يمكن تطبيقه في الوقت الفعلي، ولا يؤثر على وضوح الصوت، والأهم من ذلك، يتميز بصوت “آليّ” واضح بسبب استخدامه في تصوير الروبوتات سابقًا. ⚙️
تُنصح شركات الذكاء الاصطناعي بإضافة مُعدّل حلقيّ بتردد قياسي (مثل 30-80 هرتز) وبمقدار أدنى من السعة (مثل 20 بالمائة) لأصوات مساعدي الصوت بالذكاء الاصطناعي. 🙂 سيتمكن الناس من فهم الأمر سريعًا.
هنا بعض الأمثلة التي يمكنك الاستماع إليها لفهم ما نقترحه: الجزء الأول هو بودكاست مُولّد بالذكاء الاصطناعي أنتجته محرك دفتر ملاحظات جوجل. الأجزاء التالية تُظهر نفس البودكاست مع أصوات مُعدّلة بواسطة مُعدّل حلقي. 🔊
تمكنا من توليد تأثير الصوت باستخدام برنامج نصي بايثون مُتضمّن 50 سطر. 👨💻 نأمل أن يُحقق قطاع الذكاء الاصطناعي توازنًا جيدًا من هذه المعلمات والإعدادات. ⚖️ هذا يبرز مدى بساطة تحقيق ذلك.
بالتأكيد، سيكون هناك استخدامات سيئة للصوت الاصطناعي، مثل الاحتيال. لكن هذا صحيح دائمًا بالنسبة للأمن. 🛡️ نعتقد أن الجزء الأكبر من الاستخدامات سيكون مع واجهات برمجة التطبيقات الصوتية الشهيرة من الشركات الكبرى. 💻
المصدر: رابط المقال الأصلي