محققان گوگل، هوش مصنوعی جدیدی را ساختهاند که میتواند از پیامهای متنی مختلف، قطعات موسیقی چند دقیقهای تولید کند! جالبتر آنکه این هوش مصنوعی عجیب میتواند ملودیهای سوت یا زمزمه شده را هم به سازهای دیگر تبدیل میکند! این کار به نحوه تولید تصاویر توسط سیستمهایی مانند DALL-E (از طریق TechCrunch) شباهت زیادی دارد.
این هوش مصنوعی جدید (MusicLM) نام دارد. هرچند که در حال حاضر امکان استفاده از این ابزار برای عموم کاربران وجود ندارد؛ اما گوگل برای آشنایی بیشتر کاربران با سازوکار این هوش مصنوعی نمونهای از موسیقیهای تولید شده توسط آن را در اینترنت آپلود کرده است.
باید اعتراف کنیم نمونههای موسیقی این ابزار، شگفتانگیز هستند! در میان نمونهها، قطعههای 30 ثانیهای وجود دارند که کاملا به یک قطعه آهنگ واقعی شبیه هستند. این قطعات حال و هوا و ژانر مخصوص خود را دارند. همچنین قطعات 5 دقیقهای هم وجود دارند که تنها از یک یا دو کلمه مانند «تکنو ملودیک» تولید شدهاند. ن را آپلود کرده
قطعه مورد علاقه من نیز یک نسخه نمایشی از (حالت داستانی) است. در این مدل برای تغییر شکل بین دستوران از یک اسکریپت استفاده کردهاند. (اسکریپت یک زبان برنامهنویسی است. متخصصان با استفاده از این زبان، بعضی از وظایف طولانی یا تکراری را به طور خودکار و بدون تکرار مداوم انجام میدهند) ممکن است برای همه اینطور نباشد اما من در حین گوش دادن به این قطعه میتوانستم موجودی که یک انسان ساخته ببینم!! (حتی در حین نوشتن این مقاله دهها بار به آن گوش دادم)
(MusicLM) حتی میتواند آواز انسان را شبیهسازی کند. البته باید قبول کنیم در هنگام انجام این کار، آواز و لحن صدای کلی، یکی است اما کیفیت خوبی در آن وجود ندارد. بهتر است اینطور بگوییم که گویی هر قطعه جدا از دیگر قطعات خوانده شده و کیفیت مناسبی ندارد.
حتی گاهی ممکن است فکر کنید که اشعار کاملا مزخرف هستند! البته اگر به معانی آن توجه زیادی نشان ندهید، لزوما به مزخرف بودن اشعار پی نمیبرید. برای مثال باید تصور کنید آهنگی از یک زبانی به غیر از زبان مادریتان میشنوید! در این صورت همه چیز برایتان راحتتر میشود.
من به طور دقیق نمیدانم گوگل چطور توانسته به این نتایج جالب دست یابد. البته خود گوگل مقاله تحقیقاتی منتشر کرده و در آن به تفضیل درباره این موضوع توضیح داده است.
تولید موسیقی با هوش مصنوعی یک سابقه دیرینه و مربوط به چندین سال قبل دارد. در حال حاضر سیستمهایی وجود دارند که به ساخت انواع آهنگ پاپ، همراهی اجرای زنده و غیره میپردازند. برای مثال یکی از ابزارهای اخیر با استفاده از هوش مصنوعی (StableDiffusion) تصاویر را به پیام متنی و سپس موسیقی تبدیل میکند. گوگل در مقاله تحقیقاتی خود بیان کرده که (MusicLM) از نظر کیفیت و پایبندی به عنوان، و نحوه کپی کردن صداها و تبدیل آنها به ملودی، از سایر هوش مصنوعیهای تولید موسیقی، عملکردی بهتر دارد. این هوش مصنوعی به کاربران اجازه میدهد تا یک صدا را پخش کنند، سپس صدا را به یک لید مصنوعی الکترونیکی، کوارتت زهی، تک نوازی گیتار و غیره تبدیل میکند. این قابلیت یکی از جالبترین دموهایی است که تا به حال محققان در یک ابزار تولید مصنوعی موسیقی ارائه کردهاند.
گوگل درباره این ابزار هوش مصنوعی بسیار از محتاطتر از سایر ابزارهای مشابه عمل میکند. حتی خود گوگل در مقاله تحقیقاتیاش بیان کرده، برای جلوگیری از سرقت ادبی این سیستم، فعلا قصد انتشار آن را نداریم!
هر لحظه امکان انتشار این برنامه و شرکت آن در یکی از آزمایشهای سرگرم کننده موسیقی گوگل وجود دارد، با این حال هیچ کس از زمان آن با خبر نیست. در حال حاضر نیز تنها افرادی که سایر هوش مصنوعیهای مرتبط با موسیقی را میسازند امکان استفاده از (MusicLM) را دارند. گوگل قصد دارد به زودی مجموعه از 5500 داده از موسیقیهای تولید شده توسط این ابزار را منتشر کند تا بتواند با استفاده از این دادهها به ارزیابی موسیقی سایر سیستمها بپردازد.