
لقد تخلى جافين ماكنمارا عن لوحة المفاتيح الخاصة به ويقضي اليوم كله في التحدث بدلاً من الكتابة.
يتحدث لساعات باستخدام جهاز الكمبيوتر والهاتف الخاص به، ويرسل رسائل البريد الإلكتروني، ويكتب العروض التقديمية، وينشر على LinkedIn، وحتى يقوم بالترميز من خلال المحادثات باستخدام تطبيق الإملاء AI من شركة Wispr Flow الناشئة في سان فرانسيسكو.
يقوم الذكاء الاصطناعي بتنقيط وتنسيق وتكييف تجوله في نسخة متماسكة. يبلغ متوسط سرعة ماكنمارا 125 كلمة في الدقيقة، وهو ضعف متوسط سرعة الكتابة.
وقال مؤسس وكالة البرمجيات Why Not Us، البالغة من العمر 32 عاماً: “في هذه المرحلة، أي شيء يمكن القيام به عن طريق الكتابة، أفعله عن طريق التحدث”. “أنا أتحدث فقط.”
ومن خلال 77 تطبيقًا، قام بإملاء ما يقرب من 300 ألف كلمة في الأشهر الخمسة الماضية – وهذا يعادل كتابة ثلاث روايات.
يتصدر عمالقة التكنولوجيا والشركات الناشئة في كاليفورنيا حركة استخدام الذكاء الاصطناعي ونماذج اللغة الكبيرة التي يعتمدون عليها لدفع الناس إلى التفاعل مع التكنولوجيا باستخدام أصواتهم بدلاً من أصابعهم.
قال سي جيه بايس، مبتكر تطبيق الإملاء الصوتي المجاني Handy ومقره سان دييغو: “لقد غيّر الذكاء الاصطناعي والماجستير في إدارة الأعمال الديناميكية”. “استخدام صوتك أسرع بكثير من الكتابة.”
لقد ظهر مزيج من المطورين المستقلين والشركات الناشئة، بما في ذلك Handy وWispr Flow وWillow في سان فرانسيسكو وغيرها، لتقديم تفاعل صوتي دقيق مع الذكاء الاصطناعي.
تعمل أكبر الأسماء في مجال التكنولوجيا أيضًا على إنشاء طرق جديدة للأشخاص للدخول في شراكة مع الذكاء الاصطناعي. تعتمد أحدث نظارات ميتا الذكية على الصوت. لقد صممت OpenAI وMeta شخصيات مميزة للمحادثات الصوتية الخاصة ببرامج الروبوت الخاصة بهما. وحتى Alexa من Amazon وSiri من Apple يخضعان لترقيات الذكاء الاصطناعي، والتي تتوقع الشركات أن تجعل الجميع يتحدثون إلى تقنياتهم أكثر من ذلك بكثير.
وقد اجتذبت هذه الأساليب المجانية والمدفوعة لاستخدام الكلمات المنطوقة مع أجهزة الكمبيوتر ملايين المستخدمين، بما في ذلك المبرمجون والمساعدون التنفيذيون والمحامون ومنشئو المحتوى والممارسون الطبيون. يعتقد بعض المتفائلين أن لوحة المفاتيح قد تصبح قديمة.
وقال آلان جو، مؤسس شركة Willow، في منشور على موقع “يسعدني أن أعلن أننا قمنا بإزالة لوحات المفاتيح من جوائز التلفزيون المرموقة في العالم”. ينكدينمشيرة إلى أن فريق جوائز إيمي استخدم الإملاء الصوتي لـ Willow لإرسال رسائل Slack ومسح البريد الوارد بشكل أسرع استعدادًا لجوائز 2026.
على مر السنين، قامت شركات التكنولوجيا الكبرى بذلك متكيف تتميز العديد من منتجاتها بميزات الصوت أولاً – من أجل الراحة. ابتعد اليوم عن الصوت كميزة إمكانية الوصول إلى أداة الإنتاجية.
في أواخر عام 2022، تم إنشاء ChatGPT بدأت في التخلي عن الوصول غير المقيد إلى نموذج التعرف التلقائي على الكلام المسمى Whisper، والذي تم تدريبه على 680.000 ساعة من البيانات متعددة اللغات. شاركت OpenAI تقنية النسخ الصوتي الدقيق، والتي كانت ذات يوم سرًا تقنيًا كبيرًا يخضع لحراسة مشددة. يمكن لأي شخص الآن تنزيل وتشغيل النسخ عالي الجودة بتقنية الذكاء الاصطناعي مجانًا على أجهزة الكمبيوتر المحمول الخاصة بهم.
تستخدم الموجة الجديدة من تطبيقات الإملاء المدعمة بالذكاء الاصطناعي Whisper كأساس وتبني عليها لتقديم الإملاء المباشر. على الرغم من وجود بدائل مجانية، فإن تكلفة الاشتراك المدفوع تتراوح بين 8 و12 دولارًا شهريًا.
يكتسب الإملاء المدعوم بالذكاء الاصطناعي الآن موطئ قدم بين المبرمجين والمستخدمين العاديين، ويجعل الناس يتحدثون إلى أجهزة الكمبيوتر المحمولة الخاصة بهم. سواء كان ذلك كتابة رسائل بريد إلكتروني، أو إرسال رسائل نصية قصيرة، أو تصميم موقع ويب، أو تكليف مهام الذكاء الاصطناعي، يقول المتبنون الأوائل إن الإملاء يسمح لهم بالعمل بشكل أسرع، والتفكير بشكل أكثر وضوحًا، وأن يكونوا أكثر إنتاجية.
قال نافين نايدو، المدير العام لتطبيق مونولوج للإملاء الصوتي ومقره نيويورك: “الأشخاص الذين اعتمدوا الصوت بشكل كبير لن يعودوا. بمجرد أن تتحدث لمدة 20 ساعة أسبوعيًا إلى جهاز الكمبيوتر المحمول الخاص بك، فإن الكتابة تبدو وكأنها احتكاك”. “ما أعتقد أنه يتجه إليه: يصبح الصوت هو طبقة التفويض. أنت تتحدث عن نيتك، وتحدث الأشياء “.
تستفيد تطبيقات الإملاء الجديدة المستندة إلى الذكاء الاصطناعي من تطبيقات Apple رقائق متقدمة على أجهزة iPhone وMac لتشغيل الإملاء الخاص على الجهاز.
تحول جيفري هنتلي، وهو مطور برمجيات مستقل، بشكل شبه كامل إلى استخدام الصوت في العمل في شهر يونيو.
غالبًا ما يبدأ المشاريع عن طريق فتح مطالبة صوتية ومطالبة الذكاء الاصطناعي بإجراء مقابلة معه حول مخاوفه ومتطلبات المشروع قبل إنشاء أي كود.
قال هنتلي: “أتحدث إليها كما لو كنت أعزف في فرقة جاز، إلى الخلف، إلى الأمام، إلى الخلف، إلى الأمام”. تساعد هذه الرقصة الصوتية على تحسين المواصفات، ثم يتولى الذكاء الاصطناعي القيادة، ويبني البرمجيات.
إلى جانب البرمجة، يستخدم هنتلي الصوت “للسماح له بالنسخ” عند التقاط أفكار منشورات المدونة أو الرسائل، باستخدام تطبيقات مثل سوبرويسبر أو Wispr Flow للحصول على “التفريغ الأول” للأفكار قبل الانتقال إلى لوحة المفاتيح للتحرير النهائي.
يقوم عدد متزايد من مطوري البرامج في وادي السيليكون بإملاء تعليمات البرمجة لساعات في المرة الواحدة بدلاً من الكتابة. مزيج من عوامل الذكاء الاصطناعي سريعة التقدم والتي يمكنها البرمجة ساعات، مع المدخلات الصوتية التي تلتقط الأفكار بشكل أسرع من الكتابة، عززت إنتاجيتهم.
قام McNamara، الذي يصف نفسه بـ “مبرمج الحيوية”، ببناء أكثر من 25 تطبيق ويب في بضعة أشهر، وهي سرعة تطوير كانت مستحيلة بدون تعليمات صوتية.
“لا أعتقد ذلك [typing]قال ماكنمارا: “بأي حال من الأحوال، سيكون من الكفاءة والفعالية الوصول إلى هناك بالسرعة التي فعلتها في التحدث”.
لقد استخدم محادثة متعرجة وبضع ساعات للحصول على الذكاء الاصطناعي للبناء هدايا تنبت، وسجل هدايا للأطفال، وتطبيق ل تقييم أي عناصر عن طريق الصور.
من المؤكد أن الذكاء الاصطناعي يمكن أن يرتكب أخطاء، ويجب التحقق من عمله.
وفي الوقت نفسه، أدى الاعتماد على نطاق واسع إلى ظهور مضايقات جديدة، حيث يشعر حتى المستخدمون المتميزون بالحرج عند التحدث إلى أجهزة الكمبيوتر المحمولة الخاصة بهم. المكاتب المفتوحة المزدحمة ليست مصممة للعديد من الأشخاص للتحدث مع أجهزة الكمبيوتر الخاصة بهم في نفس الوقت.
قال أحدهم: “أحب الصوت، ولكن ليس في المكتب”. مستخدم على X. “أنا لا أحب التحدث مع الآخرين. سأفعل ذلك في مكتب مغلق، أو أذهب للعمل في سيارتي.”
يستخدم ماكنمارا سماعات الرأس حتى يفترض الناس أنه يجري مكالمة.
قال: “إنه مثل الاختراق الاجتماعي الذي أمتلكه”.
وقال ديلان فوكس، مؤسس شركة AssemblyAI ومقرها سان فرانسيسكو، والتي تقدم نماذج صوتية للشركات، إنه في حين أنه من السابق لأوانه معرفة ما إذا كانت لوحة مفاتيح Qwerty ستتبع الشريط وأجهزة الفاكس إلى التقادم، ومتى، فإن السرعة تجاه الصوت تتسارع.
وقال: “نحن بالتأكيد في بداية ما نعتقد أنه مثل هذه الزيادة في الطلب على الصوت وتطبيقات الذكاء الاصطناعي والواجهات بنسبة 10 إلى 100 مرة”.
بالنسبة للمبرمج، ماكنمارا، فإن التحدث أكثر إلى برامج الدردشة الآلية جعله صديقًا أفضل.
اعتاد أن يكون سيئا في الرد على النصوص. الآن يعود إلى الأصدقاء على الفور.
وقال: “أنا سريع جدًا في الرد، فيتساءلون: من هذا الرجل؟”.
